ML — это ОК
2.07K subscribers
83 photos
45 videos
1 file
149 links
Канал ML-команды ОК. 12 лет делаем крутые вещи и делимся ими здесь

Контакты: @anokhinn
Download Telegram
Коллеги, не можем отвечать пока - наша команда на RecSys в Италии.
🔥7117😁13🤩5👏1
😁32
Media is too big
VIEW IN TELEGRAM
📹Запись ридинг-группы от 17 октября 2024 года. Роман Болозовский рассказал о методах сжатия эмбеддингов в больших рекомендательных сетках
🔥113
🪢Рекомендательные системы делятся на два типа:

- Causal рекомендеры, побуждающие пользователей к новым открытиям и расширению кругозора.

- Продакшн рекомендеры, предсказывающие неизбежное немного лучше, чем TopPop.

На ридинг-группе 31 октября помечтаем про первые вместе с Романом Логойдой, ML-инженером AI VK. Обсуждение статей (1, 2) по теме causal рекомендаций начнем в 18:00.

Зум: ссылка

Идентификатор конференции: 954 8170 2067
Код доступа: 9HrXbM
👍17😁10🔥53
Через несколько минут начинаем!
🔥9
Media is too big
VIEW IN TELEGRAM
📹Запись ридинг-группы от 31 октября 2024 года. Роман Логойда рассказал про causal рекомендеры
🔥12👍63
⚡️⚡️⚡️Йоу йоу йоу, братья и сестры в рекомендательных системах!
Позвольте зачитать вам наш скромный рэп.

На нашем разборе конференции RecSys
Авторы пейперов мощно зафлексят.
Двадцать докладов, самых лучших статей,
В честь нас называйте ваших детей.

В московском офисе, а не где-то там в Бари,
В ноябре соберёмся типа бояре.
Статейки послушаем, пиццу съедим.
Два дня —
четырнадцать, двадцать один.

Модель мульти-таргет, семантик айди,
LLM-рекомендер приди-обсуди.
К потоку докладов будь морально готов —
Это ридинг-группа выходит из берегов!

Рррраунд!

На все вопросы готовы ответить в комментариях.🦾
🔥40😁168🆒2
📄На ридинг-группе 5 декабря снова обзор конференции. На этот раз Александр Варламов сделает разбор нескольких статей с ECAI-2024. Кроме собственной статьи Александра кратко обсудим:

- Improving Calibration by Relating Focal Loss, Temperature Scaling, and Properness [ссылка]

- Is Contrasting All You Need? Contrastive Learning for the Detection and Attribution of AI-generated Text [ссылка]

- Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [ссылка]

- DataDetective: Dataset Watermarking for Leaker Identification in ML Training [ссылка]

- Reducing Texture Bias of Deep Neural Networks via Edge Enhancing Diffusion [ссылка]

Ждём всех желающих в 18:00 🌈

Зум: ссылка

Meeting ID: 824 3323 7280
Passcode: rgaivk
🔥16👍5🆒1
Media is too big
VIEW IN TELEGRAM
📹Запись ридинг-группы от 5 декабря 2024 года. Александр Варламов разобрал несколько статей с ECAI-2024
🔥91
Forwarded from VK Team
Media is too big
VIEW IN TELEGRAM
Посмотрим «Сквозь VK»? Новый подкаст про сквозные технологии в наших продуктах

Первый выпуск — о рекомендательных системах: насколько это сильное ML-колдунство, как их оценивать и тестировать, стоит ли полагаться на инструменты open source и чего ждать в будущем.

Примерами из жизни наших продуктов поделились Андрей Зимовнов, директор по ML в AI VK, и Андрей Кузнецов, ML-эксперт.

👀 Смотрите и подписывайтесь в 🍿 VK Видео и  Дзене

🎧 Слушайте на всех популярных платформах

#СквозьVK #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥8😁1
🪬⚗️Пока мы весь год запускали эксперименты, тюнили модели и двигали метрики, люди решили все проблемы рекомендательных систем раз и навсегда (но это не точно). На прямой линии ридинг-группе 19 декабря обсудим статью Interact with the Explanations: Causal Debiased Explainable Recommendation System. Ведущим будет Николай Анохин, ведущий специалист по машинному обучению AI VK. Встреча начнется в 18:00.

Зум: ссылка

Meeting ID: 882 2722 2727
Passcode: 31337
🔥147😁4👍1
Media is too big
VIEW IN TELEGRAM
🎬Запись ридинг-группы от 19 декабря. Обсудили объяснение рекомендаций. Ведущим был Николай Анохин.
4🔥4👏3👍2
🎉 Редакция канала очень спешит уйти на каникулы, поэтому ниже в двух словах о том, что мы делали в этом году, кроме работы:

1️⃣ Провели 21 публичную ридинг-группу.

2️⃣ Провели эпический разбор конференции RecSys 2024, на котором выступали авторы статей.

3️⃣ Выступали с докладами
- про инференс больших рекомендательных нейросеток
- про MLOps и инфраструктуру
- про удержание пользователей
- про науку и жизнь.

В этом году у нас многое менялось: проекты и продукты, инфраструктура, подходы и даже команды. Изменения — это сложно, но без них не бывает развития (кажется, биологи давно это поняли). Желаем вам, чтобы в 2025 году ваши изменения вели к росту метрик (по A/B), зарплат (после вычета налогов), скилов (которые не стыдно писать в резюме) и долгосрочного счастья. Специалисты по рекомендательным системам знают, что его нельзя измерить, а можно только почувствовать. Несмотря на все изменения, кое-что остается неизменным: мы продолжим делать крутые штуки и обязательно об этом расскажем.🎁🎄🥂
🔥3413🤩10😁1
Forwarded from AI VK Hub
Data Ёлку в январе заказывали?🎄

Продлеваем праздничное настроение после Нового Года — 18 января вместе с ODS проведем настоящую Data Ёлку в офисе VK.

Что в программе:

📌подведение итогов года по самым разным направлениям современного DS/ML
📌разбор лучших решений соревнования VK RecSys Challenge
📌церемония ODS Awards: узнаем, чьи достижения будут отмечены больше всех

И, конечно, нетворкинг, афтепати и ламповое комьюнити у елочки.

Все детали будут появляться на сайте: регистрируйтесь тут и присоединяйтесь!
🔥9👏3🙈2👍1
🧶Ридинг-группу в этом году откроет Алина Шестакова, разработчик Центра Технологий VK, рассказом про потоковую обработку данных в ОК. Алина написала серьёзную аннотацию к докладу, не можем не привести её:

Стриминг активно используется платформой ОК уже более 10 лет, и за это время используемый нами фреймворк успел значительно вырасти и измениться. В этом докладе я расскажу о том, как устроен стриминг в ОК, а также о всех патчах и фейлах, возникших в процессе обновления стримингового фреймворка 10-летней давности: об отсутствии обратной совместимости, проблемах с партиционированием, сложностях во взаимодействии с Apache Kafka, Apache Hadoop YARN и о том, как с этим боролись.

Ждём всех желающих 6 февраля в 18:00.

Зум:
ссылка

Идентификатор конференции: 914 0563 4217
Код доступа: 123321
🔥24🤩7👍5👏1
Media is too big
VIEW IN TELEGRAM
🎬 Запись ридинг-группы от 6 февраля 2025 года. Алина Шестакова рассказала про обновление стримового фреймворка Apache Samza
8👍8🔥5