Спасибо всем, кто был с нами в прошлую пятницу на OK Tech Talk «ML в production».
Со всеми, кто хочет посмотреть, как прошел наш митап, делимся:
- Фотографии OK Tech Talk
- Презентации и записи выступлений
До новых встреч 😊
Со всеми, кто хочет посмотреть, как прошел наш митап, делимся:
- Фотографии OK Tech Talk
- Презентации и записи выступлений
До новых встреч 😊
❤10
Вы уже устали от статьи Methodologies for Improving Modern Industrial Recommender Systems? Мы нет.
Поэтому на ридинг-группе 7 сентября в 17:00 разберём её в подробностях. Ведущим будет Николай Рябых, руководитель команды рекомендаций ОК. Ссылку на звонок, как обычно, скинем в день встречи.
Поэтому на ридинг-группе 7 сентября в 17:00 разберём её в подробностях. Ведущим будет Николай Рябых, руководитель команды рекомендаций ОК. Ссылку на звонок, как обычно, скинем в день встречи.
👍5🔥5
Допустим, у вас есть платформа для прослушивания подкастов. Задача: найти среди новых подкастов потенциально интересные широкой аудитории. Например, чтобы продвигать их на главной странице. Как решать такую задачу? Первое, что приходит в голову – собрать выборку с данными по “быстрым” метрикам подкастов (например, за первый день после выпуска), докинуть контентных признаков и обучить модель, которая предскажет долгосрочный успех. Исследователи из Spotify в своей статье утверждают, что такой подход не работает. Во-первых, ранние метрики дают нечестное преимущество подкастам знаменитостей и популярных блогеров, которые и так все послушают. Во-вторых, контент – слабый предиктор популярности. Намного лучше работает подход pure-exploration bandits.
Стандартные бандиты минимизируют cumulative regret, балансируя exploration и exploitation. Задача pure-exploration бандитов – найти лучшее действие, потратив фиксированный бюджет только на exploration. Предложенный в статье алгоритм ISHA не побеждает другие алгоритмы по метрикам – в экспериментах он на втором-третьем месте. Но зато ISHA лучше подходит для реальных систем: в отличие от конкурентов ему не нужно мгновенно знать награду после выбора действия. Это важно, потому что на практике между показом рекомендации и реакцией пользователя неизбежно есть задержка. Если мы готовы ждать реакцию сутки, ISHA отрабатывает за две недели, а лучшие по метрике алгоритмы SR и ECBT за год и 1000 лет соответственно. Думаю, в 3023 году людям не будут интересны перспективные подкасты из 2023. Разве что историкам.
На идею этой статьи можно посмотреть шире. Рекомендации – область, в которой мы можем не только строить модели, но и взаимодействовать с пользователями для контролируемого сбора данных. Мы делаем это в A/B экспериментах или реализуя exploration в продакшен рекомендерах. Но сегодняшняя статья подсказывает, что нужно идти дальше: механизмы работы с данными не достаточно “прикрутить сбоку” – их нужно закладывать в архитектуру системы при проектировании.
Стандартные бандиты минимизируют cumulative regret, балансируя exploration и exploitation. Задача pure-exploration бандитов – найти лучшее действие, потратив фиксированный бюджет только на exploration. Предложенный в статье алгоритм ISHA не побеждает другие алгоритмы по метрикам – в экспериментах он на втором-третьем месте. Но зато ISHA лучше подходит для реальных систем: в отличие от конкурентов ему не нужно мгновенно знать награду после выбора действия. Это важно, потому что на практике между показом рекомендации и реакцией пользователя неизбежно есть задержка. Если мы готовы ждать реакцию сутки, ISHA отрабатывает за две недели, а лучшие по метрике алгоритмы SR и ECBT за год и 1000 лет соответственно. Думаю, в 3023 году людям не будут интересны перспективные подкасты из 2023. Разве что историкам.
На идею этой статьи можно посмотреть шире. Рекомендации – область, в которой мы можем не только строить модели, но и взаимодействовать с пользователями для контролируемого сбора данных. Мы делаем это в A/B экспериментах или реализуя exploration в продакшен рекомендерах. Но сегодняшняя статья подсказывает, что нужно идти дальше: механизмы работы с данными не достаточно “прикрутить сбоку” – их нужно закладывать в архитектуру системы при проектировании.
🔥7👍2
ML — это ОК
Вы уже устали от статьи Methodologies for Improving Modern Industrial Recommender Systems? Мы нет. Поэтому на ридинг-группе 7 сентября в 17:00 разберём её в подробностях. Ведущим будет Николай Рябых, руководитель команды рекомендаций ОК. Ссылку на звонок…
Привет! Напоминаем, что сегодня в 17:00 МСК пройдет очередная ридинг-группа. Ссылка на встречу
Идентификатор конференции:
920 3695 0643
Код доступа: 7SDKuk
Идентификатор конференции:
920 3695 0643
Код доступа: 7SDKuk
🔥1
ML — это ОК
Приглашаем на Dark Geometry Fest Место: БЦ Skylight, Ленинградский проспект, 39с79, Москва Дата и время: 9 сентября, 13:00 — 20:00 Разберём, как многообразия помогают в машинном обучении, обсудим занимательное геометрическое доказательство одного известного…
Привет!
Сегодня в офисе ВК проходит Dark Geometry Fest.
Подключайтесь к трансляции в 14:00 МСК.
Ссылка на трансляцию
Сегодня в офисе ВК проходит Dark Geometry Fest.
Подключайтесь к трансляции в 14:00 МСК.
Ссылка на трансляцию
Media is too big
VIEW IN TELEGRAM
Запись ридинг-группы 07.09.23
Ведущий — Николай Рябых, руководитель команды рекомендаций ОК
Ведущий — Николай Рябых, руководитель команды рекомендаций ОК
🔥8❤1
Наша ридинг-группа в последнее время какая-то неразнообразная: из пяти встреч только одна была не про рекомендательные системы (а про инфраструктуру для рекомендательных систем 😅). Мы хотели это исправить, но пока не получается – в пятницу 22 сентября в 16.00 поговорим про разнообразие в рекомендациях и алгоритм Determinantal Point Processes. Коля Анохин, ведущий специалист по машинному обучению ОК, будет эээ ведущим.
😁14🔥5
📖Ссылка на сегодняшнюю ридинг-группу в 16:00: https://shorturl.at/bcdBJ
В программе: разнообразие рекомендаций, Николас Кейдж, Вольфганг Паули, Мэйби Бэйби и Дукалис.
Приходите!
В программе: разнообразие рекомендаций, Николас Кейдж, Вольфганг Паули, Мэйби Бэйби и Дукалис.
Приходите!
🔥7
Media is too big
VIEW IN TELEGRAM
Запись ридинг группы 2023-09-22: Practical Diversified Recommendations on YouTube with Determinantal Point Processes
🔥8
Разбираем RecSys 2023! 🧑🔬👩🔬
Проведём две сессии в слоты 16.00-18.00 5 и 6 октября. В программе уже 20 статей, помимо нашей команды рассказать про свои работы с RecSys придут сами авторы: Александр Петров, Алексей Васильев и Антон Кленицкий.
Запись как обычно будет, но онлайн всегда интереснее. Бронируйте слоты на встречу в следующий четверг и пятницу.
Зум
Проведём две сессии в слоты 16.00-18.00 5 и 6 октября. В программе уже 20 статей, помимо нашей команды рассказать про свои работы с RecSys придут сами авторы: Александр Петров, Алексей Васильев и Антон Кленицкий.
Запись как обычно будет, но онлайн всегда интереснее. Бронируйте слоты на встречу в следующий четверг и пятницу.
Зум
👍11🔥3
🔮Если хотите узнать подробности, приходите на ридинг-группу ОК 19 октября в 17:00. Обсудим статью Sheaf Neural Networks for Graph-based Recommender Systems. Ведущим будет Александр Тараканов, исследователь ОК.
🔥10🙈3👍1
📖Ссылка на зум нашей ридинг-группы сегодня в 17:00
Join Zoom Meeting
https://us05web.zoom.us/j/82167512039?pwd=bOPiB9Y04VHku8mu0Q1bL7p2vomF5H.1
Meeting ID: 821 6751 2039
Passcode: 5FGDD4
Join Zoom Meeting
https://us05web.zoom.us/j/82167512039?pwd=bOPiB9Y04VHku8mu0Q1bL7p2vomF5H.1
Meeting ID: 821 6751 2039
Passcode: 5FGDD4
✍1
Media is too big
VIEW IN TELEGRAM
🎬 Запись ридинг-группы от 19 октября 2023 года. Александр Тараканов, исследователь в ОК, рассказывал про нейронные сети на пучках.
👍4🆒4👏3
🏗️🏠Иногда на ридинг-группе мы выходим за рамки обычной тематики: машинного обучения, рекомендательных систем, анализа данных. Следующая встреча – именно такой случай. Настало время обсудить выбор напольных покрытий! Профессиональный строитель дата-платформ, прораб разработчик ОК Владимир Ермаков расскажет про паркет: плюсы, минусы, укладку на большие кластеры. Приглашаем послушать Володю 2 ноября в 17:00.
Зум:
https://us05web.zoom.us/j/81901499743?pwd=SYI7UTEbPI8BbkqhQGpv4JwaY4d5ju.1
Meeting ID: 819 0149 9743
Passcode: 3ASKmt
Зум:
https://us05web.zoom.us/j/81901499743?pwd=SYI7UTEbPI8BbkqhQGpv4JwaY4d5ju.1
Meeting ID: 819 0149 9743
Passcode: 3ASKmt
😁20🔥5🤩2🙈1
В октябре мы провели традиционный разбор конференции RecSys’23. В этот раз на разборе выступали не только ребята из ОК и VK, но и авторы оригинальных статей. Мы думаем, что получилось отлично. Следующие полтора месяца будем дважды в неделю публиковать текстовые версии разборов статей. Делаем для себя, не обращайте внимания ❤️ #recsys23
❤4😁4👍1