ML — это ОК
2.08K subscribers
83 photos
45 videos
1 file
149 links
Канал ML-команды ОК. 12 лет делаем крутые вещи и делимся ими здесь

Контакты: @anokhinn
Download Telegram
ML — это ОК
Работа с popularity bias в рекомендациях — ещё одна вещь, похожая на подростковый секс: все говорят, что делали это, но это они только говорят. Поговорим и мы на ридинг-группе 24 августа в 17:00. Рассказывать про статью Countering Popularity Bias By Regularizing…
Напоминаем, через 20 минут начнется очередная ридинг группа.

Пётр Погорелов, ML-инженер в ОК, расскажет о том, как бороться проблемой popularity bias в рекомендательных системах.

Ссылка на встречу
🔥7
Приглашаем на Dark Geometry Fest

Место: БЦ Skylight, Ленинградский проспект, 39с79, Москва
Дата и время: 9 сентября, 13:00 — 20:00


Разберём, как многообразия помогают в машинном обучении, обсудим занимательное геометрическое доказательство одного известного факта из теории чисел и попробуем понять, как устроена теорема Торелли о восстановлении кривой по паре якобиан-дивизор.
От команды ОК на фестивале выступит Саша Тараканов, программист-исследователь.


Расписание фестиваля
13:00 — 14:00 - Экскурсия по офису VK (20 мест)
13:30 — 14:00 - Сбор всех участников, приветственный кофе-брейк
14:00 — 14:15 - Вступительное слово от организатора Арсения Райко
14:15 — 15:15 - Тараканов Александр (доцент ФКН НИУ ВШЭ) расскажет о многообразиях, графах и их применении в машинном обучении.
15:15 — 15:30 - Кофе-брейк
15:30 — 16:30 - Баженов Дмитрий (мехмат МГУ) представит элементарное геометрическое доказательство того, как простые числа, которые дают остаток 1 при делении на 4, могут быть представлены в виде суммы двух квадратов.
16:30 — 17:30 - Обед
17:30 — 19:45 - Анжелика Андронова (матфак НИУ ВШЭ) расскажет о теореме Торелли про восстановление кривой по паре якобиан-дивизор. Несмотря на всю сложность её формулировки, мы попробуем проникнуться этой темой и понять, что всё не так страшно, как кажется на первый взгляд.
19:45 — 20:00 - Заключительное слово

Если хотите прийти на фест, пожалуйста, зарегистрируйтесь по ссылке
🔥8
Спасибо всем, кто был с нами в прошлую пятницу на OK Tech Talk «ML в production». 

Со всеми, кто хочет посмотреть, как прошел наш митап, делимся:
- Фотографии OK Tech Talk
- Презентации и записи выступлений

До новых встреч 😊
10
Вы уже устали от статьи Methodologies for Improving Modern Industrial Recommender Systems? Мы нет.

Поэтому на ридинг-группе 7 сентября в 17:00 разберём её в подробностях. Ведущим будет Николай Рябых, руководитель команды рекомендаций ОК. Ссылку на звонок, как обычно, скинем в день встречи.
👍5🔥5
Допустим, у вас есть платформа для прослушивания подкастов. Задача: найти среди новых подкастов потенциально интересные широкой аудитории. Например, чтобы продвигать их на главной странице. Как решать такую задачу? Первое, что приходит в голову – собрать выборку с данными по “быстрым” метрикам подкастов (например, за первый день после выпуска), докинуть контентных признаков и обучить модель, которая предскажет долгосрочный успех. Исследователи из Spotify в своей статье утверждают, что такой подход не работает. Во-первых, ранние метрики дают нечестное преимущество подкастам знаменитостей и популярных блогеров, которые и так все послушают. Во-вторых, контент – слабый предиктор популярности. Намного лучше работает подход pure-exploration bandits.

Стандартные бандиты минимизируют cumulative regret, балансируя exploration и exploitation. Задача pure-exploration бандитов – найти лучшее действие, потратив фиксированный бюджет только на exploration. Предложенный в статье алгоритм ISHA не побеждает другие алгоритмы по метрикам – в экспериментах он на втором-третьем месте. Но зато ISHA лучше подходит для реальных систем: в отличие от конкурентов ему не нужно мгновенно знать награду после выбора действия. Это важно, потому что на практике между показом рекомендации и реакцией пользователя неизбежно есть задержка. Если мы готовы ждать реакцию сутки, ISHA отрабатывает за две недели, а лучшие по метрике алгоритмы SR и ECBT за год и 1000 лет соответственно. Думаю, в 3023 году людям не будут интересны перспективные подкасты из 2023. Разве что историкам.

На идею этой статьи можно посмотреть шире. Рекомендации – область, в которой мы можем не только строить модели, но и взаимодействовать с пользователями для контролируемого сбора данных. Мы делаем это в A/B экспериментах или реализуя exploration в продакшен рекомендерах. Но сегодняшняя статья подсказывает, что нужно идти дальше: механизмы работы с данными не достаточно “прикрутить сбоку” – их нужно закладывать в архитектуру системы при проектировании.
🔥7👍2
Media is too big
VIEW IN TELEGRAM
Запись ридинг-группы 07.09.23
Ведущий — Николай Рябых, руководитель команды рекомендаций ОК
🔥81
Наша ридинг-группа в последнее время какая-то неразнообразная: из пяти встреч только одна была не про рекомендательные системы (а про инфраструктуру для рекомендательных систем 😅). Мы хотели это исправить, но пока не получается – в пятницу 22 сентября в 16.00 поговорим про разнообразие в рекомендациях и алгоритм Determinantal Point Processes. Коля Анохин, ведущий специалист по машинному обучению ОК, будет эээ ведущим.
😁14🔥5
📖Ссылка на сегодняшнюю ридинг-группу в 16:00: https://shorturl.at/bcdBJ
В программе: разнообразие рекомендаций, Николас Кейдж, Вольфганг Паули, Мэйби Бэйби и Дукалис.
Приходите!
🔥7
Media is too big
VIEW IN TELEGRAM
Запись ридинг группы 2023-09-22: Practical Diversified Recommendations on YouTube with Determinantal Point Processes
🔥8
Разбираем RecSys 2023! 🧑‍🔬👩‍🔬

Проведём две сессии в слоты 16.00-18.00 5 и 6 октября. В программе уже 20 статей, помимо нашей команды рассказать про свои работы с RecSys придут сами авторы: Александр Петров, Алексей Васильев и Антон Кленицкий.

Запись как обычно будет, но онлайн всегда интереснее. Бронируйте слоты на встречу в следующий четверг и пятницу.

Зум
👍11🔥3
🤩9
Разбор RecSys 2023 уже завтра!

Стартуем завтра в 16:00 мск по плану и собираемся его придерживаться! И запись, и текстовые конспекты мы, конечно, опубликуем, но рады будем видеть всех онлайн 🤗

Зум
🔥161
Media is too big
VIEW IN TELEGRAM
Первая часть разбора RecSys 2023
🔥12👍94
Media is too big
VIEW IN TELEGRAM
Вторая часть разбора RecSys 2023
👍13🔥1
🔮Если хотите узнать подробности, приходите на ридинг-группу ОК 19 октября в 17:00. Обсудим статью Sheaf Neural Networks for Graph-based Recommender Systems. Ведущим будет Александр Тараканов, исследователь ОК.
🔥10🙈3👍1
📖Ссылка на зум нашей ридинг-группы сегодня в 17:00

Join Zoom Meeting
https://us05web.zoom.us/j/82167512039?pwd=bOPiB9Y04VHku8mu0Q1bL7p2vomF5H.1

Meeting ID: 821 6751 2039
Passcode: 5FGDD4
1