Media is too big
VIEW IN TELEGRAM
«Быть или не быть?», «А судьи кто?» и другие экзистенциальные вопросы будут в следующих выпусках, а сегодня — про то, как и зачем векторизовать посты. Дима Решетников на открытии офиса VK в Минске в своём выступлении рассказал, как мы делаем это в ОК. Смотрим запись.
🔥8👏4❤2
☁️☁️☁️ Миша Марюфич написал отличную статью про то, как мы в ОК мигрировали наш огромный кластер Hadoop в облако. Не всё шло по плану, но в итоге получилось всё так, как задумывали. К чтению предлагаем трек от нашего музыкального рекоммендера: Браво — Дорога в облака.
Хабр
Hadoop в Облаке: история миграции сотен петабайт
Миграция с «железа» в облако в большинстве случаев уже не кажется чем-то сложным или удивительным — тенденция на развертывание решений в облаке общая и устоявшаяся. Но если с переносом в облачную...
🔥15👍4👏1
🎩Мы заметили, что если список авторов статьи занимает столько же места, сколько и abstract, то в ней расскажут про обучение на кластере GPU, который мог бы обогреть пару городов за полярным кругом. Именно так обстоят дела в пропитанной духом богатства статье Software-Hardware Co-design for Fast and Scalable Training of Deep Learning Recommendation Models. Мы обсудим её на ридинг-группе 1 февраля в 18:00. Ведущим будет Роман Болозовский, ML-инженер OK.
Ссылка на зум
Ссылка на зум
🔥12✍5👨💻3❤1🆒1
Media is too big
VIEW IN TELEGRAM
🎬Запись ридинг-группы от 1 февраля. Роман Болозовский рассказал об обучении огромных рекомендательных нейросетей.
✍3
Вот и настал момент, ради которого создавался этот канал (на самом деле нет): мы ищем ML-инженера в команду, которая занимается развитием сервисов дискавери (рекомендации неподписного контента). Очень хочется найти кого-то, кто понимает принципы построения рекомендательных систем и умеет в бигдату. Надо будет разрабатывать новые и совершенствовать старые рекомендательные модели, реализовывать батчевые и стриминговые (это важно!) пайплайны для сбора признаков, обработки данных и инференса. Из очень желательного: Java/Scala, Hadoop, Spark, Apache Samza или Spark Streaming, Kafka, классический ML. У нас есть много-много данных для анализа, большой кластер в облаке с GPU, налаженные процессы по сбору данных, обучению и инференсу моделей, проведению А/В-экспериментов.
Ссылка на полный текст вакансии: https://spb.hh.ru/vacancy/92823789
Откликнуться можно по ссылке выше, а задать вопросы (и тоже откликнуться) — в личке https://t.iss.one/nriabykh
Ссылка на полный текст вакансии: https://spb.hh.ru/vacancy/92823789
Откликнуться можно по ссылке выше, а задать вопросы (и тоже откликнуться) — в личке https://t.iss.one/nriabykh
👍13🔥6❤2
🤖Сергей Шнуров поёт: «Мамба, мамба – $#ямба». На ридинг-группе 15 февраля попробуем подтвердить или опровергнуть это утверждение. Представлять статью Mamba: Linear-Time Sequence Modeling with Selective State Spaces будет Андрей Кузнецов, директор по ML ОК. Ждём всех желающих в 18:00.
Зум: ссылка на звонок
Зум: ссылка на звонок
😁19🔥7👍4
ML — это ОК
🤖Сергей Шнуров поёт: «Мамба, мамба – $#ямба». На ридинг-группе 15 февраля попробуем подтвердить или опровергнуть это утверждение. Представлять статью Mamba: Linear-Time Sequence Modeling with Selective State Spaces будет Андрей Кузнецов, директор по ML ОК.…
⚡️Сегодняшняя ридинг-группа переносится на 14 марта по причинам, которые мы хотели бы оставить в тайне.
🤔10✍7👨💻2🙈2
🧙На ридинг-группе ОК 29 февраля гостевой доклад. Виталий Занкин из института Skoltech представит свою статью Sparse online variational Bayesian regression. Приглашаем всех неравнодушных к байесовскому подходу послушать Виталия в 18:00.
Зум: https://us05web.zoom.us/j/87668326572?pwd=oObrhSa4idAGnKpg2YCIdFPr0aZfHl.1
Meeting ID: 876 6832 6572
Passcode: 31337
Зум: https://us05web.zoom.us/j/87668326572?pwd=oObrhSa4idAGnKpg2YCIdFPr0aZfHl.1
Meeting ID: 876 6832 6572
Passcode: 31337
🔥11🆒1
Media is too big
VIEW IN TELEGRAM
🤟Запись ридинг-группы от 29 февраля 2024 года. Виталий Занкин рассказал про онлайн обучение байесовской регрессии.
✍8
ML — это ОК
🤖Сергей Шнуров поёт: «Мамба, мамба – $#ямба». На ридинг-группе 15 февраля попробуем подтвердить или опровергнуть это утверждение. Представлять статью Mamba: Linear-Time Sequence Modeling with Selective State Spaces будет Андрей Кузнецов, директор по ML ОК.…
🐍14 марта в 18:00 Андрей Кузнецов проведет встречу ридинг-группы, на которой обсудим новую языковую модель – Mamba. Если хотите подготовиться ко встрече, рекомендуем заранее посмотреть вводные статьи про Mamba и State Space Models, например:
- A Visual Guide to Mamba and State Space Models
- Mamba: The Easy Way
Ждём вас в четверг!
Зум: ссылка
Идентификатор конференции: 762 7685 4669
Код доступа: okrg
- A Visual Guide to Mamba and State Space Models
- Mamba: The Easy Way
Ждём вас в четверг!
Зум: ссылка
Идентификатор конференции: 762 7685 4669
Код доступа: okrg
🔥14👍1
💯Вам нравится наша ридинг-группа? Грустите, что она бывает только раз в две недели? Советуем обратить внимание на семинар по кластеризации текста с помощью LLM, который организует VK Lab. Ребята занимаются наукой, поэтому будет интересно и глубоко.
Подключайтесь к семинару 19 марта в 19:00. Его проведёт старший программист-разработчик департамента AI, контентных и рекомендательных сервисов VK Антон Земеров. Он разберёт три разных подхода к кластеризации текста на основе LLM. Вы узнаете, какие проблемы они решают и в каких ситуациях их лучше всего использовать.
Антон будет опираться на статьи, рекомендуем заранее с ними познакомиться:
— Goal-Driven Explainable Clustering via Language Descriptions
— ClusterLLM: Large Language Models as a Guide for Text Clustering
— Large Language Models Enable Few-Shot Clustering
Посмотреть трансляцию и задать вопросы можно будет по ссылке: https://vk.com/lab?w=wall-187376020_364
Подключайтесь к семинару 19 марта в 19:00. Его проведёт старший программист-разработчик департамента AI, контентных и рекомендательных сервисов VK Антон Земеров. Он разберёт три разных подхода к кластеризации текста на основе LLM. Вы узнаете, какие проблемы они решают и в каких ситуациях их лучше всего использовать.
Антон будет опираться на статьи, рекомендуем заранее с ними познакомиться:
— Goal-Driven Explainable Clustering via Language Descriptions
— ClusterLLM: Large Language Models as a Guide for Text Clustering
— Large Language Models Enable Few-Shot Clustering
Посмотреть трансляцию и задать вопросы можно будет по ссылке: https://vk.com/lab?w=wall-187376020_364
🔥13🥰2❤1
💰На ридинг-группе 28 марта обсудим, как выбрать слоты для рекламы в ленте, чтобы и денег заработать, и пользователей не расстроить. Алгоритм сидения на двух стульях представит Николай Анохин, ведущий специалист по машинному обучению OK. Будем опираться на статью Ad-load Balancing via Off-policy Learning in a Content Marketplace с конференции WSDM 2024. Начало встречи в 18:00.
Зум: https://us05web.zoom.us/j/89763772406?pwd=e3xoXL1xNr2HchasKKAGxhqbyKPdez.1
Meeting ID: 897 6377 2406
Passcode: 31337
Зум: https://us05web.zoom.us/j/89763772406?pwd=e3xoXL1xNr2HchasKKAGxhqbyKPdez.1
Meeting ID: 897 6377 2406
Passcode: 31337
🤩8🔥4😁2
📹Запись ридинг-группы от 28 марта 2024 года. Николай Анохин рассказал про подход к распределению рекламной нагрузки в ленте социальной сети. https://vk.com/video/@lab?list=7fa39bef8d9f40d9a2&preview=&screen=&webcast=&z=video-187376020_456239071
VK Видео
Разбор статьи «Ad-load Balancing via Off-policy Learning in a Content Marketplace»
Watch Разбор статьи «Ad-load Balancing via Off-policy.. 59 min 45 s from 28 March 2024 online in HD for free in the VK catalog without signing up! Views: 1393. Likes: 17.
❤8👏3
Мы любим автоэнкодерные рекомендеры не только за то, что они дают хорошее качество, но и за самые крутые аббревиатуры (SLIM! EASE!). На ридинг-группе 11 апреля обсудим новую модель из этого семейства — SANSA. Статью с конференции RecSys 2023 будет представлять Сергей Ермилов, ML-инженер ОК. Начало встречи в 18:00.
Ссылка на звонок: зум
Идентификатор конференции: 997 5281 5267
Код доступа: 2JAg34
Ссылка на звонок: зум
Идентификатор конференции: 997 5281 5267
Код доступа: 2JAg34
🔥15😁7
ML — это ОК
Мы любим автоэнкодерные рекомендеры не только за то, что они дают хорошее качество, но и за самые крутые аббревиатуры (SLIM! EASE!). На ридинг-группе 11 апреля обсудим новую модель из этого семейства — SANSA. Статью с конференции RecSys 2023 будет представлять…
Media is too big
VIEW IN TELEGRAM
Запись РГ про SANSA от Сергея Ермилова
👍7🔥4
🎤🎧На ридинг-группе 25 апреля обсудим алгоритм удаления шума из речи в аудиопотоке с помощью лёгких генеративных состязательных сетей (GAN). Ведущим будет Макс Каледин из ВШЭ. Ждём вас в 18:00.
Зум: https://us05web.zoom.us/j/81356812687?pwd=zWXaFnJptvDu5EMKS4gLFrHknDjSAr.1
Meeting ID: 813 5681 2687
Passcode: 123
Зум: https://us05web.zoom.us/j/81356812687?pwd=zWXaFnJptvDu5EMKS4gLFrHknDjSAr.1
Meeting ID: 813 5681 2687
Passcode: 123
🔥8✍2