PyMagic
6.09K subscribers
232 photos
4 videos
10 files
251 links
Data Science / ML / Deep Learning
VK group https://vk.com/club211095898
Download Telegram
Forwarded from WB Space
#мнение_эксперта
В конце февраля DeepSeek устроили неделю опенсорса и 5 дней публиковали репозитории с кодом их проектов ⚙️

FlashMLA — механизм декодирования для больших языковых моделей.
DeepEP — коммуникационная библиотека, специально разработанная для MoE и EP.
DeepGEMM — библиотека для эффективных вычислений General Matrix Multiplications.
DualPipe — инновационный алгоритм двунаправленного конвейерного параллелизма.
Fire-Flyer File System (3FS) — высокопроизводительная распределенная файловая система.

Остальные подробности про каждый проект читайте на карточках!

———
Спасибо за разбор Павлу Дмитриеву, Machine Learning Engineer в CoreCV
🌟 @wb_space
📹 @wb_tech
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍2
🚀 Подкаст Data Breakfast с Анастасией Никулиной. Часть вторая — Курсы в Data Science

🎙 О чём спросили?
▫️ Как создать курс, который меняет карьеру?
▫️ Платные vs бесплатные курсы: когда и зачем платить?
▫️ Почему YouTube-лекции — не всегда достаточно?
▫️ Как не стать «инфоцыганом» и заслужить доверие аудитории?
▫️ Pet-проекты: как превратить их в козырь для резюме?
▫️ Университет vs онлайн: что выбрать новичку?

🎧 Слушайте там, где удобно:
▫️ Telegram-плеер
▫️ Яндекс.Музыка
▫️ Страница выпуска

➡️ Первый выпуск можно посмотреть в группе ODS Piter, для этого необходимо добавиться туда и зайти на этот пост 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17
Собираемся на Data Fusion! 🚀

16-17 апреля в Москве в кластере Ломоносов пройдет крупнейшая конференция Data Fusion по BigDate и AI. Программа конференции каждый год достаточно насыщенная, и этот год не исключение: в расписании как бизнес-, так и технические треки. В этом году будут выступления ведущих ученых, разбор кейсов ML в различных отраслях, дебаты «наука vs бизнес», а также узкопрофильные сессии по DataOps, CV, RAG и нейротехнологиям.

В прошлом году я лично была на площадке, мне конференция очень понравилась: организация, интересные доклады, сессии. А ещё была супер возможность поддержать коллегу, который рассказывал о рекомендательных системах в маркетплейсе 🌿

В этом году, к сожалению, не смогу присутствовать лично, поэтому буду следить за трансляцией. Но если у вас есть возможность прийти и послушать доклады вживую — очень рекомендую! Это отличный шанс пообщаться с коллегами, которых давно не видели, и задать спикерам вопросы напрямую.

Кстати, как вам идея выпустить новый ролик на ютубе с разбором докладов и статей из конференции с моими комментариями? В том числе как такие технологии работают на практике) Если ждешь, то ставь 🔥

Ссылка на регистрацию: https://data-fusion.reg.events/guest/?&erid=2VtzqvwUtXT
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥36👍6
➡️Обзор докладов по рекомендательным системам

Недавно завершилась ежегодная конференция Data Fusion. В этом году она особенно порадовала разнообразием секций, однако ключевое внимание было уделено теме данных — важнейшему компоненту любой модели, который, к сожалению, часто остаётся в тени.

Я решила попробовать новый формат и подготовила обзор на часть докладов из секции, посвящённой рекомендательным системам. На самом деле интересных выступлений было гораздо больше, и многие из них заслуживают отдельного внимания.

Что из этого получилось — смотрите в новом ролике! 😉

https://youtu.be/0S3e1iXR9Vs?si=eNxMR40cQ08n3pi9
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍5💅4💋1
➡️Обучение Data Science для начинающих 3.0

Друзья, мы запустили новую версию курса по машинному обучению! Теперь вы можете проходить материалы в удобное для вас время и в собственном темпе — независимо от графика других студентов.

❗️Мы снизили стоимость курса, поскольку формат стал ориентированным на самообучение. Тем не менее, у вас будет доступ к чату студентов, где можно общаться, обмениваться мнениями и задавать вопросы другим студентам!

Что вы изучите:
Математику для Data Science
Как проводить АБ-тестирование
Классические ML-алгоритмы с полным разбором архитектуры и применения алгоритмов на практике: от линейных моделей до бустингов
NLP: от TF-IDF до LLM
Deep Learning: основные тренды, база по нейросетям
Computer Vision: примеры из области
MLOps: production code, FastAPI, Streamlit, линтеры
Дополнительно: Airflow, MLFlow, многопоточность, мультипроцессинг, временные ряды, Superset и пр.

В расширенном тарифе Grandmaster доступно 2 больших продвинутых блока:

➡️NLP — от базовой обработки текста (токенизация, лемматизация, regex и др.) до LLM. Научитесь дообучать модели с Hugging Face и применять их для анализа тональности, диалогов и кода (GraphCodeBERT, CodeT5 и др.)

➡️Рекомендательные системы — коллаборативная, контентная и гибридная фильтрация. Изучите ключевые алгоритмы (User/ItemKNN, ALS, NCF, SVD++), метрики (включая beyond accuracy) и продвинутые методы: нейросети, автоэнкодеры, графовые и контекстно-адаптивные рекомендации.

📎 Всю актуальную информацию можно найти на сайте PyMagic
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍6😭2🤓211🤩1
Рады приветствовать всех новых участников!

Здесь мы обсуждаем машинное обучение: алгоритмы, новинки из мира ML, а также делимся реальным опытом, который редко можно встретить в учебниках. Кроме того, на канале появляются анонсы образовательных курсов, которые уже завершили более 2000 студентов.

➡️Что почитать?

Многорукие бандиты в музыкальных рекомендациях
Почему лосс не падает, и модель не обучается?
Оптимизируем размер памяти DataFrame в 3 раза
В каких случаях использовать деревья решений?
Ключевые научные работы по NLP
Что такое контрастирование обучение?
Полезные книги по ML
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍93