BaseLine
477 subscribers
212 photos
19 videos
1 file
156 links
Канал Алексей Ковалёва – PhD, тимлид команды Embodied agents в AIRI, доцент ЦКМ МФТИ. Занимаюсь Embodied AI 🤖, LLM Planning, RL

Моё хобби – читать научпоп лекции по ИИ

Здесь делюсь событиями, мыслями, новостями
Download Telegram
Forwarded from Институт AIRI
Исследователи AIRI на ICLR 2025 ⚡️

На этой неделе в Сингапуре стартовала конференция ICLR — одно из важнейших мероприятий в мире машинного обучения. В этом году от AIRI туда приехали сразу 32 исследователя. Они подготовили 9 статей на основном треке:

⚫️XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning
⚫️POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation
⚫️Tight Time Complexities in Parallel Stochastic Optimization with Arbitrary Computation Dynamics
⚫️Robust Barycenter Estimation using Semi-Unbalanced Neural Optimal Transport
⚫️Associative memory and dead neurons
⚫️A3D: Does Diffusion Dream about 3D Alignment?
⚫️Learning Successor Features with Distributed Hebbian Temporal Memory
⚫️Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax
⚫️On the Fourier analysis in the SO (3) space: EquiLoPO Network

Кроме того, наши исследователи представляют 14 докладов на воркшопах.

Делимся фотографиями с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥3
Sergey Levine рассказывает постер на 7th Robot Learning Workshop
7❤‍🔥1
Forwarded from Институт AIRI
Продлеваем дедлайн подачи заявок на «Лето с AIRI» до 7 мая включительно ⚡️

В этом году программа пройдёт в Томске — городе студентов, науки и белых ночей. С 30 июня по 10 июля вас ждут лекции и семинары по ИИ, проектная работа, постерная сессия и внеучебные активности — от тёплых вечеров в историческом центре до сапов на реке. Отличная возможность прокачать навыки, найти единомышленников и вдохновение для новых исследований.

Если вам нужно будет приглашение от университета (например, чтобы вуз помог с оплатой билетов), мы можем его оформить — просто напишите нам. У многих авиакомпаний есть студенческие скидки, уточняйте при бронировании. Также будет организован трансфер из Новосибирска до Томска.

Подавайте заявку и рассказывайте друзьям — это лето может стать ярким! Если у вас остались вопросы, пишите нам на [email protected] 📌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍2
🦾Продолжается набор в бакалавриат, магистратуру и аспирантуру ФПМИ МФТИ по искусственному интеллекту и робототехнике!

Поступление проходит в:
— Бакалавриат для студентов 2 курса ФПМИ | программа и подача заявки
— Магистратуру по программе «Методы и технологии искусственного интеллекта» | программа и подача заявки
— Аспирантуру по направлению «Информатика и вычислительная техника» | подача заявки

Для поступления необходимо:
1⃣ Заполнить заявку на нашем сайте и пройти собеседование в Центре. Или пройти летнюю стажировку и поступить к нам без собеседования!
2⃣ Поступающим в магистратуру и аспирантуру подать документы на сайте приёмной комиссии МФТИ и успешно пройти вступительные испытания.

В Центре под руководством ведущих специалистов в своих областях вы сможете заниматься написанием статей на передовые конференции А* (NeurIPS, ICLR, ICML, IJCAI и др.), а также работать над прикладными проектами по тематикам:

🔵Обучение с подкреплением для задач робототехники (манипуляция, навигация)
🔵Мультимодальные карты знаний в компьютерном зрении и робототехнике
🔵Компьютерное зрение для задач робототехники и беспилотного транспорта
🔵Большие языковые и мультимодальные модели для генерации действий в роботототехнике
🔵Мультимодальные среды и модели в обучении с подкреплением

Дедлайны:
Бакалавриат:
8 сентября: заявка на поступление
Магистратура и аспирантура:
18 мая: стажировка
1 июня: заявка на поступление

Информация для поступающих на сайте программы и приемной комиссии.

Прямые эфиры о поступлении можно посмотреть тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🏆43
Первая 10ка
🔥37🥰6🤗1
🎓 — Семинар 30. Роль памяти в обучении с подкреплением: определение, реализация и оценка | Егор Черепанов

Наличие памяти у RL-агентов всё чаще рассматривается как необходимое условие для успешного решения сложных задач. Методы интеграции памяти в архитектуры агентов активно развиваются. Но что именно следует считать памятью, как её формализовать и как оценивать?

На семинаре будет представлена систематизация типов памяти и классов задач, требующих её использования.

Так же Егор рассмотрит подходы к реализации памяти и бенчмарки, предназначенные для оценки эффективности соответствующих механизмов в RL, включая новый бенчмарк MIKASA-Robo, предназначенный для тестирования памяти робота в задачах настольной манипуляции.

Статьи:
https://arxiv.org/abs/2412.06531
https://arxiv.org/abs/2502.10550
https://arxiv.org/abs/2306.09459

👉🏻 Дата: 05.06.25, четверг в 17:00
📹 Трансляция Youtube или ВК

Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!

#семинары #RL #agents
🔥10👍3
🔥Пора рассказать про майские новости 🔥

Нашу статью «AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment» приняли на main track ACL 2025 🦾

Можно почитать на архиве препринт и апвотнуть на HF 😉
🔥16👍5🫡21
🪼 — Начинаем вторую волну поступления в нашу магистратуру «Методы и технологии ИИ»!

В ЦКМ мы учим создавать и работать с системами ИИ, которые интегрируют в себе последние достижения в области нейросетей, языковых моделей и робототехники.

С нами вы сможете обучаться на актуальной программе, выезжать на международные конференции, работать над коммерческими и научными проектами, получать высокую стипендию.

Для поступления необходимо:
🪼Заполнить заявку в форме до 23 июня и пройти собеседование в Центре;
🪼Подать документы на сайте приёмной комиссии и успешно пройти вступительные испытания на ФПМИ МФТИ.

В ответ на заявку мы напишем вам на указанную почту с приглашением на собеседование, где вы расскажете о себе и сможете обсудить ваши ожидания с менторами Центра.

Больше про поступление читайте в нашем посте и на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥5
Приходите послушать! 🤗
Forwarded from Институт AIRI
В эту пятницу, 27 июня, встречаемся в парке «Сад Эрмитаж»⤵️

Исследователи AIRI примут участие в программе фиджитал-фестиваля «Мир глазами ИИ», который проводится в рамках проекта «Лето в Москве». Делимся расписанием:

⚫️16:00 — открытая дискуссия: «Тренды в сфере ИИ: наука и жизнь»

Участники:
— Владислав Куренков, руководитель научной группы «Адаптивные агенты» AIRI
— Алексей Ковалёв, кандидат компьютерных наук, руководитель группы «Воплощённые агенты» лаборатории «Когнитивные системы ИИ» AIRI, доцент Центра когнитивного моделирования МФТИ
— Егор Алёшин, исполнительный директор и владелец продукта GigaChat B2B, Сбер
— Модерирует дискуссию Александра Бройтман, директор по маркетингу и коммуникациям AIRI

⚫️17:00 — лекция «Искусственный интеллект — от настоящего к будущему»

— Алексей Ковалёв представит научно-популярную лекцию о текущих достижениях в области искусственного интеллекта и перспективах его развития.

Вход свободный, подробнее о мероприятии читайте на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥4
Forwarded from iMapDAY
Сегодня провели защиты дипломов магистров Научно-образовательного Центра когнитивного моделирования МФТИ. Появилось 14 новых магистров по профилю подготовки «Методы и технологии искусственного интеллекта». Мои поздравления и пожелания дальнейших успехов защитившимся! Среди них было шестеро моих дипломников и про них я напишу чуть позже отдельные посты, открыв рубрику «Отзыв научного руководителя» 😊

А также большая благодарность членам комиссии, в которую я входил и которая собралась на Физтехе и задавала дельные вопросы: В.В. Борисову, Д.В. Виноградову, К.С. Яковлеву, А.К. Ковалёву и А.И. Панову, который нас всех собрал.

А также отдельное спасибо Анфисе Мухиной, которая обеспечила техническую сторону защиты и делает большую работу в новой приемной кампании!

PS. Запись защиты дипломов доступна в ВК.

#Activities
14🔥5👏2
Как понять, что в статье—которую приходиться рецензировать—использовали LLM для редактирования текста?😅
😁6
ИИ-ЗАМАН: научная конференция по ИИ в рамках Kazan Digital Week 2025

18 сентября в Казани пройдет конференция ИИ-ЗАМАН, на которой я руковожу секцией «Воплощенный ИИ и робототехника» 🤖

Исследуешь локализацию, навигацию, манипуляцию, взаимодействие роботов с человеком или другие задачи объединяющие ИИ и робототехнику?
Тогда это отличная возможность поделиться своими результатами и для нетворкинга!

Занимаешься ИИ, но не занимаешься робототехникой? Участвуй в других секциях:

⚫️Компьютерное зрение — Андрей Кузнецов (Институт AIRI, Университет Иннополис)
⚫️Обработка естественного языка — Елена Тутубалина (Институт AIRI, ИСП РАН)
⚫️Воплощенный ИИ и робототехника — Алексей Ковалёв (Институт AIRI, МФТИ)
⚫️ИИ в науке — Алексей Шпильман (Сбербанк)
⚫️ИИ в молекулярных и биологических исследованиях — Павел Яковлев (Биокад)

📍18 сентября — Казань, Россия

📝 Дедлайн подачи статей — 20 июля

📚 Статьи будут опубликованы в «Электронных библиотеках», лучшие работы рекомендованы для Springer LNCS

💸 Если ты студент или аспирант и твоя статья будет отобрана — ты можешь получить финансовую поддержку на проезд до Казани. Заявка подаётся вместе со статьёй

🔗 Подробнее: aizaman.ru
📲 Канал конференции: @aizaman_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
4
qwen_ft.gif
37.2 MB
EmbRACE-3K или VirtualHome на стероидах

Довольно сырая, но вызывающая интерес работа

Авторы подметили, что VLMки, неплохо справляющиеся с задачами по картинкам и видео, не умеют из коробки в embodied задачи. Связывают это со способом обучения (что неудивительно) и выделяют три проблемы:

⚫️VLMки не умеют в эксплорэйшн — модели больше обращают внимание на текущие визуальные наблюдения и плохо справляются с долгосрочным планированием
⚫️VLMки не умеют учитывать позу — модели начинают плохо работать с пространственными отношениями, если агент двигается
⚫️VLMки забывают цель — модели часто не переносят намерение (intent) за пределы текущего фрейма

Для того чтобы тестировать способности VLMок авторы собрали 3000 траектории с языковыми инструкциями в симуляторе на движке Unreal Engine. Протестировали GPT-4o, Gemini 2.5 Pro и Qwen2.5-VL-7B в zero-shot и показали, что справляются они с задачами плохо, но дообучение в формате SFT+GRPO на собранных данных дает хороший прирост

Из плюсов: траектории размечены так, что к каждому действию есть «рассуждение» почему это действие было выполнено

Из минусов: дискретная среда с небольшим набором действий (WASD + Open, Pick, Drop)

На гифке демо с дообученной Qwen2.5-VL-7B

#vlm #embodied
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👏21👍1