Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.25K photos
112 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Это #дайджест для всех, кто работает с искусственным интеллектом

👾 TokenCost
Это библиотека для простого подсчёта токенов при работе с большими языковыми моделями.

👾 Почему модель не работает?
Это перевод статьи о распространённой проблеме: на обучении модель выглядит хорошо, но на реальных данных отрабатывает плохо.

👾 Анализ производительности моделей YOLOv8
Автор делал замеры производительности и точности работы моделей YOLOv8 на разных устройствах с различными оптимизациями и без них.

👾 Transcendence: Generative Models Can Outperform The Experts That Train Them
Интересная статья про то, что если модель обучить на ходах «слабых игроков», то она будет играть лучше, чем лучшие шахматисты датасета.

👾 NVIDIA Warp
Это Python-фреймворк, компилирующий обычные функции в эффективный код ядра, который может выполняться как на CPU, так и на GPU.
🔥4👍1
Привет, друзья! 👋
Мы готовим статью о типичных ошибках начинающих разработчиков. И нам очень нужна ваша помощь! 🙏
Поделитесь своим опытом и мнением в комментариях:
С какими сложностями вы сталкивались в начале своего пути в разработке?
Какие ошибки допускали и как их исправляли?
Что помогло вам быстрее расти профессионально?
Самые интересные и полезные советы мы обязательно включим в статью, а их авторов упомянем в публикации! 😊
🔥2
👾 Дуэт для старта в Data Science

Когда все казалось потерянным и надежда на карьеру в DS и аналитики исчезала. Он часами изучал возможности, но так и не находил выхода.

Но появилась она, с предложением, которое изменит всё…

...до 30 июня курс по математике за полцены и курс по Machine Learning в подарок

🛍14 990 ₽ (вместо 29 990 ₽)🛍

Что ждёт вас на курсе:

⭐️Полугодовая программа от преподавателей ВМК МГУ

⭐️47 видеолекций и 150 практических заданий

⭐️Бессрочный доступ ко всем материалам курса

⭐️Развернутая обратная связь по всем домашним заданиям и ссылки на полезные дополнительные материалы

🫶 Воспользуйтесь шансом, чтобы начать свой путь в Data Science – https://proglib.io/w/13f7fde5
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1
👶 Новичок в компании: 18 советов, как быстро адаптироваться и освоить новые навыки

Начало работы в новой компании может быть волнующим и сложным, особенно если вы новичок в отрасли. Как быстро освоиться, произвести хорошее впечатление и стать ценным сотрудником?


Читать статью

#туториал
👍2
🚢 Как освоить Streamlit для Data Science

Streamlit — это библиотека для создания интерактивных веб-приложений. Поддерживает различные виды визуализаций и интегрируется с Matplotlib, Plotly и другими инструментами.

На «Хабре» опубликовали перевод статьи про использование Streamlit для Data Science. В ней описаны основные принципы работы с фрйемворком, включая установку, создание простого приложения, использование виджетов, структурирование и развёртывание приложений. Есть также примеры кода.

🔗 Читать статью
👍7
Forwarded from Библиотека программиста | программирование, кодинг, разработка
👋 Slack уходит из России: чем заменить зарубежный сервис

15 июня стало известно, что корпоративный мессенджер Slack уходит из России. Мы подготовили коллекцию аналогов Slack и других зарубежных сервисов, которые больше недоступны в России. Сохраняйте в заметки!

#новости
🥱5🥰2
⚒️ 10 незаменимых плагинов для VS Code в 2024 году

Огромная популярность Visual Studio Code во многом связана с его расширяемостью: функциональность редактора можно существенно нарастить за счет установки дополнительных плагинов.

В этой статье мы рассмотрим 10 суперполезных расширений, которые значительно упростят работу с кодом и повысят вашу продуктивность.

🔗 Читать статью
🔗 Зеркало
👏11🥱1
This media is not supported in your browser
VIEW IN TELEGRAM
⤴️Посмотрите на этот шедевр от модели Luma⤴️

Да, вас зарикроллили
Please open Telegram to view this post
VIEW IN TELEGRAM
😁20🔥6👏2
📧 Отклик на вакансию по email: как сделать так, чтобы ваше письмо выделялось

Вы отправляете десятки откликов на вакансии, но не получаете ответа? Возможно, дело в том, как вы пишете свои письма. Узнайте, какие ошибки могут стоить вам работы мечты и как их избежать.

👉 Статья
🔥6👏32
👶 Старт карьеры в Data Science (5 вещей, которые я хотел бы знать...)

В новом ролике сеньор дата-сайентист Анастасия Никулина рассуждает об ошибках и заблуждениях тех, кто только изучает DS и ML. Мы перечислили их ниже:

1️⃣ Изучение нейросетей до классического машинного обучения;

2️⃣ Отказ от изучения математики;

3️⃣ Мысль о том, что после обучения вы можете работать только дата-сайентистом;

4️⃣ Перечисление учебных проектов в резюме;

5️⃣ Убеждённость в том, что теоретических знаний достаточно для поиска работы.

🔗 Более подробно — в ролике Анастасии

💬 А вы согласны с автором?
1👍1😢1
🤖 Создание собственного ИИ-бота на Python за 33 строчки кода

В статье рассказываем, как создать собственный чат-бот на Python с помощью языковой модели falcon-7b-instruct, которая следует инструкциям. Доступ к модели мы получаем благодаря Hugging Face.

🔗 Читать статью
🔗 Зеркало
6
Всего три слова: последний день распродажи

До конца дня вы можете воспользоваться скидкой 50% на один из наших флагманских курсов по вышмату и получить курс по ML В ПОДАРОК!

🗯️14 990 ₽ (вместо 29 990 ₽)🗯️

Для кого предназначен курс:
➡️для новичков и тех, кто хочет начать карьеру в IT;
➡️для опытных разработчиков, которые хотят буст в карьере.

Что ждёт вас на курсе:
⭐️полугодовая программа от преподавателей ВМК МГУ;
⭐️47 видеолекций и 150 практических заданий;
⭐️бессрочный доступ ко всем материалам курса;
⭐️развернутая обратная связь по всем домашним заданиям и ссылки на полезные дополнительные материалы.

Нужно ли хорошо знать математику, чтобы начать учиться?
Нет. В состав курса входит блок «Школьная математика», который позволит вам погрузиться в тему с основ.

Скорее за скидкой!
Please open Telegram to view this post
VIEW IN TELEGRAM
2👾2👍1🔥1
Коллекция гайдов и примеров использования Google Gemma

Gemma — это семейство легковесных языковых моделей. Недавно была представлена опенсорсная Gemma-2, которая в размере 9B превосходит Llama 3 8B в тестах, а в размере 27В — Llama 3 70В.

В GitHub-репозитории Gemma Cookbook вы можете найти примеры использования этих моделей. Гайды будут в принципе полезны всем, кто хочет работать с LLM и строить приложения на их основе.

Вот некоторые интересные примеры:

🔸Игра по угадыванию слов с Gemma и Keras
🔸Использование LLM для перевода корейской литературы
🔸Деплой модели Gemma с помощью vLLM
🔸Создание системы RAG с ChromaDB
🔸Файн-тюнинг Gemma с использованием Axolotl
2👏2
🐍📦 Ваш код достоин PyPI: как правильно опубликовать Python-пакет

Это краткая инструкция по публикации Python-пакетов на PyPI. Узнайте, как структурировать проект, настроить метаданные и загрузить свой пакет в репозиторий.

🔗 Читать статью
🔗 Зеркало
😁4👍32
🧠 Исследователи придумали, как обучать большие языковые модели (LLM) без матричных умножений

Матричные умножения — ключевая операция, использующаяся в обучении LLM, так как входные данные тут представлены тензорами. Однако матричные умножения требуют много вычислительных ресурсов. Авторы новой статьи Scalable MatMul-free Language Modeling предложили решить эту проблему следующим образом:

▪️Использовать аддитивные операции и произведения Адамара в self-attention.
▪️Применять в весах числа из набора {-1, 0, +1}.

Авторы утверждают, что модели без матричного умножения показывают высокую производительность в задачах обработки естественного языка, демонстрируя конкурентоспособные результаты.

🔗 Читать статью
🔗 Ссылка на код
👍9🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
👆Классическая ситуация, когда следуешь туториалам по машинному обучению👆
😁20🎉2🤔1
Инструменты для работы c ML-моделями и обзор MLOps от CERN

В дайджесте много интересных обзоров по инструментам — как говорится, ни ClearML и Airflow едиными. Рынок решений стремительно развивается, и подборки помогут вам держать руку на пульсе.

Читать дайджест
🔥4🤩2👍1
❗️Вакансии «Библиотеки программиста» — ждем вас в команде!

Мы постоянно растем и развиваемся, поэтому создали отдельную страницу, на которой будут размещены наши актуальные вакансии. Сейчас мы ищем:
👉авторов в наше медиа proglib.io
👉контент-менеджеров для ведения телеграм-каналов

Подробности тут.

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Ждем ваших откликов 👾
Please open Telegram to view this post
VIEW IN TELEGRAM