ICLR — топ-2 среди мировых конференций по AI, ML и DS. Мы уже делились собственными публикациями, а в этом посте коротко расскажем о самых запоминающихся материалах.
P. S. А вот ссылки на все статьи, упомянутые в карточках:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14❤7🔥1
и рекомендации без кандидатогенерации — всё это в новом ML-дайджесте
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍6🔥3
С нами связался Александр Зевайкин, руководитель группы разработки ядра распределённой отказоустойчивой базы данных YDB. Недавно ребята добавили туда поиск по векторным индексам. Это очень важная, но сложная в реализации фича: чтобы выкатить её в прод, нужно решить проблемы с производительностью и масштабируемостью.
Недавно Александр выступил с докладом, в котором подробно показал, какие варианты архитектуры ребята успели перепробовать, прежде чем всё завелось. Посмотреть его можно здесь.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16👍6🔥2🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
На складах многих крупных компаний трудятся роботы Яндекса: наши железные друзья помогают быстро проводить инвентаризацию, собирать посылки и перемещать заказы. Чтобы всё работало как надо, специалисты Яндекс Роботикс постоянно улучшают софт устройств. Именно об этом они расскажут на митапе:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8
big tech night — «Ночь музеев» в мире IT. Яндекс, Сбер, X5, Т-Банк и Lamoda 12 сентября в Москве откроют двери своих офисов для тех, кто любит технологии.
Присоединяйтесь, чтобы увидеть новые разработки, обменяться экспертизой, найти единомышленников и просто хорошо провести время. В программе — доклады, экскурсии-погружения, лаборатория софт-скилов, роботы, гик-вечеринка и многое другое.
Всего будет 5 треков докладов, каждый привязан к конкретной площадке:
Как зарегистрироваться:
Но помните, что первая локация — ключевая. Начать обязательно нужно будет с неё. Здесь вы получите велком-пак big tech night с бейджем и браслетом участника. Он позволит пройти на остальные площадки. Второй и третий офисы можно будет поменять местами, если потребуется.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍7👀5
В 2024 году большие языковые модели начали дешифровать хаос реального мира: распознавать объекты, объяснять намерения и даже писать код для микроконтроллеров. В эволюции роботов это примерно то же самое, что литийионные аккумуляторы в индустрии ноутбуков.
Раньше всё приходилось делать вручную. LLM же открыли окно возможностей: робот понимает команду (даже в свободной форме), раскладывает её на план действий, анализирует свои ошибки и обучается в прямом эфире. Та же модель, которая распознаёт кота на фото, теперь помогает роботу опознать чашку и понять, что с ней делать.
В статье рассказываем:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🔥6👏3
Media is too big
VIEW IN TELEGRAM
В прошлом году на Practical ML Conf было много крутых выступлений. Например, доклад Степана Комкова из службы синтеза речи Яндекса о том, как ребята разрабатывали виртуального рассказчика для Букмейта.
Степан рассказал, как родилась эта идея, как команда её воплотила и какие у службы синтеза планы на будущее. В видео показываем принцип устройства базовой модели, а о предыстории и деталях написали ниже
За год до начала нашего проекта пользователи прослушали около 4 миллионов часов аудиокниг через обычную читалку в браузере. Мы восприняли это как сигнал: нужно дать людям возможность слушать как можно больше книжек в хорошем качестве.
Профессиональные дикторы — удовольствие дорогое, а базовый синтез речи требует ручной полировки. Поэтому мы решили разработать автоматизированного виртуального рассказчика, который сэкономит нам как время, так и деньги.
Поэтому перед нами встало сразу несколько задач: научить виртуального рассказчика читать немонотонно, с паузами, имитацией дыхания и разнообразными интонациями и эмоциями. В общем, синтез должен быть по-человечески неидеальным.
В прошлом году мы запустили виртуального рассказчика. Сначала использовали Tacotron с контекстным контролем через PnG BERT, который помогал согласовывать интонацию между предложениями и избегать монотонности. Сейчас же мы переходим на next-gen-методы: модель Tortoise, где GPT-подобная архитектура генерирует токены звука, а кодек превращает их в аудиодорожку.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13👍2