ML — это ОК
2.07K subscribers
83 photos
45 videos
1 file
149 links
Канал ML-команды ОК. 12 лет делаем крутые вещи и делимся ими здесь

Контакты: @anokhinn
Download Telegram
Media is too big
VIEW IN TELEGRAM
🎬Запись ридинг-группы от 19 декабря. Обсудили объяснение рекомендаций. Ведущим был Николай Анохин.
4🔥4👏3👍2
🎉 Редакция канала очень спешит уйти на каникулы, поэтому ниже в двух словах о том, что мы делали в этом году, кроме работы:

1️⃣ Провели 21 публичную ридинг-группу.

2️⃣ Провели эпический разбор конференции RecSys 2024, на котором выступали авторы статей.

3️⃣ Выступали с докладами
- про инференс больших рекомендательных нейросеток
- про MLOps и инфраструктуру
- про удержание пользователей
- про науку и жизнь.

В этом году у нас многое менялось: проекты и продукты, инфраструктура, подходы и даже команды. Изменения — это сложно, но без них не бывает развития (кажется, биологи давно это поняли). Желаем вам, чтобы в 2025 году ваши изменения вели к росту метрик (по A/B), зарплат (после вычета налогов), скилов (которые не стыдно писать в резюме) и долгосрочного счастья. Специалисты по рекомендательным системам знают, что его нельзя измерить, а можно только почувствовать. Несмотря на все изменения, кое-что остается неизменным: мы продолжим делать крутые штуки и обязательно об этом расскажем.🎁🎄🥂
🔥3413🤩10😁1
Forwarded from AI VK Hub
Data Ёлку в январе заказывали?🎄

Продлеваем праздничное настроение после Нового Года — 18 января вместе с ODS проведем настоящую Data Ёлку в офисе VK.

Что в программе:

📌подведение итогов года по самым разным направлениям современного DS/ML
📌разбор лучших решений соревнования VK RecSys Challenge
📌церемония ODS Awards: узнаем, чьи достижения будут отмечены больше всех

И, конечно, нетворкинг, афтепати и ламповое комьюнити у елочки.

Все детали будут появляться на сайте: регистрируйтесь тут и присоединяйтесь!
🔥9👏3🙈2👍1
🧶Ридинг-группу в этом году откроет Алина Шестакова, разработчик Центра Технологий VK, рассказом про потоковую обработку данных в ОК. Алина написала серьёзную аннотацию к докладу, не можем не привести её:

Стриминг активно используется платформой ОК уже более 10 лет, и за это время используемый нами фреймворк успел значительно вырасти и измениться. В этом докладе я расскажу о том, как устроен стриминг в ОК, а также о всех патчах и фейлах, возникших в процессе обновления стримингового фреймворка 10-летней давности: об отсутствии обратной совместимости, проблемах с партиционированием, сложностях во взаимодействии с Apache Kafka, Apache Hadoop YARN и о том, как с этим боролись.

Ждём всех желающих 6 февраля в 18:00.

Зум:
ссылка

Идентификатор конференции: 914 0563 4217
Код доступа: 123321
🔥24🤩7👍5👏1
Media is too big
VIEW IN TELEGRAM
🎬 Запись ридинг-группы от 6 февраля 2025 года. Алина Шестакова рассказала про обновление стримового фреймворка Apache Samza
8👍8🔥5
🪬На ридинг-группе 20 февраля обсудим RWKV. Возможно, это Read-Write Key Validation — быстрый механизм проверки ключей при чтении и записи в базах данных. А может быть, Re-Weighting Kernel Vectorizer — новый способ обучения сверток для получения эмбеддингов картинок. Или даже Receptance Weighted Key Value — модель, сочетающая в себе черты трансформера и RNN. Туман этой тайны развеет Сергей Малышев, старший ML-инженер AI VK. Ждём всех любителей неоднозначных аббревиатур в 18:00.

Зум: ссылка
Номер: 934 6047 6522
Код: 3qHzSn
🔥12😁124👍3
Media is too big
VIEW IN TELEGRAM
📹 Запись ридинг-группы от 20 февраля. Сергей Малышев рассказал про RWKV – архитектуру языковых моделей, берущую лучшее от RNN и трансформеров.
7🔥6👍5👏3
⚡️На ридинг-группе 6 марта поговорим о том, как одной командой и парой сотен видеокарт закопать многолетнюю работу сотен людей. Николай Анохин, ведущий специалист по машинному обучению AI VK, расскажет о foundation model для рекомендаций, представленной в статье исследователей из LinkedIn.
Приходите обсудить, как и когда нас всех заменит LLM в этот четверг в 18 часов.

Зум: ссылка
Номер: 833 5854 4891
Код: 31337
🔥39😁6🤔5👍2
Media is too big
VIEW IN TELEGRAM
🎥Запись ридинг-группы от 6 марта 2025 года. Николай Анохин рассказал про foundation model для рекомендаций
🔥122
🎤После стольких лет (шести!) на ридинг-группе наконец-то будет полезный доклад. 20 марта Дарья Тихонович, наша гостья из МТС, представит библиотеку RecTools. Недавно библиотека получила большое обновление, в котором популярные рекомендательные трансформеры прокачаны до уровня SOTA-статей.
SASRec можно обучать из коробки в парадигме fit/recommend, а можно кастомизировать так, что даже Саша Петров не узнает. Приходите послушать Дарью в 18:00.

Зум: ссылка
Номер: 777 282 2791
Код: 1
👍16🔥7😁63👏1
Media is too big
VIEW IN TELEGRAM
🎥Запись ридинг-группы от 20 марта 2025 года. Дарья Тихонович рассказала про библиотеку RecTools.
🔥157
📖Внимание, это серьёзный пост. На ридинг-группе 3 апреля обсудим статью Deep neural networks architectures from the perspective of manifold learning. Приходите послушать, если вы интересуетесь математикой, но на работе делаете только from torch import nn. Обсудим топологический анализ данных, фрактальные размерности персистентных гомологий и другие способы отказаться от филдсовской премии. Ведущим будет Александр Тараканов, исследователь AI VK. Начало в 18:00.

Зум: ссылка
ID: 883 3177 4059 Код: 261659
🔥25🙈4
Media is too big
VIEW IN TELEGRAM
🎥 Запись ридинг-группы от 3 апреля 2025 года. Александр Тараканов рассказал об использовании топологии при анализе обучения нейронных сетей.
🔥7😁2
🍿Мало кто знает, но на китайских маркетплейсах можно найти буквально все. Как сделать так же? На ридинг-группе 17 апреля обсудим статью Explainable LLM-driven Multi-dimensional Distillation for E-Commerce Relevance Learning. Кристина Панкова, ML-инженер AI VK, расскажет о том, как дистиллировать LLM, чтобы ранжирование результатов поиска было объяснимым, а полученная модель — достаточно быстрой для развертывания в продакшене. Начало встречи в 18:00.

Зум: ссылка
ID: 332 793 6201
Код: 1
🔥22👍43
Media is too big
VIEW IN TELEGRAM
📽Запись ридинг-группы от 17 апреля 2025 года. Кристина Панкова рассказала про дистилляцию LLM в рекомендациях.
6👏3