AAAI — ведущая международная научная конференция по искусственному интеллекту, поддерживаемая Ассоциацией по развитию искусственного интеллекта. В этом году свой 40-й юбилей она встретит в выставочном центре Singapore Expo.
У нашего коллектива целых 4 акцепта. Примечательно, что первые имена авторов статей 1, 2 и 3 принадлежат студентам бакалавриата и магистратуры, среди них один — наш студент, а остальные работали в команде с сотрудниками и преподавателями ЦКМ.
Работы:
Поздравляем студентов с первыми статьями на крупной конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤8👍1
🎓 — Семинар 12. Ускорение и стабилизация обучения трансформерных архитектур в задаче Online RL | Даниил Зелезецкий
На данном семинаре аспирантом нашего Центра будет рассмотрена работа Accelerating Transformers in Online RL, в которой предложен метод обучения трансформера, сочетающий в себе как Behavior Clonning (BC) на данных эксперта, так и обновление по Online RL loss-функции.
Данный двухэтапный Teacher-Student алгоритм разгоняет трансформера на экспертных данных с помощью BC loss-функции в рамках первого этапа, а затем переходит к Online RL обучению на втором этапе. Не смотря на BC компоненту, алгоритм не требует заранее подготовленных данных эксперта, а использует траектории Акселератора в онлайн режиме, тем самым снимая важное ограничение методов, упомянутых выше.
👉🏻 Дата: 20.11.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#RL #transformers
Архитектура трансформера показала свою высокую результативность на большом классе задач, начиная от моделирования естественного языка и заканчивая обработкой изображений. Во многом, хорошая применимость данной архитектуры обусловлена тем, что подходы Supervised Learning и Self-Supervised Learning на заранее подготовленных данных являются достаточно стабильными, хорошо изученными и имеют уже проверенные техники, обеспечивающие качественное обучение.
В свою очередь, обучение трансформера в Online RL хоть и позволяет применять эти модели в задачах с частичной наблюдаемостью или дефицитом оффлайн данных, однако является нестабильным и медленным. Попытки преодоления этих трудностей во многом сводятся либо к переходу в оффлайн режим (Decision Transformer), либо к
к смешиванию оффлайн и онлайн обучения (Online Decision Transformer). Хотя эти методы и обеспечивают искомую стабилизацию и повышение производительности, они также обременены важным прикладным ограничением в виде необходимого набора экспертных тректорий.
На данном семинаре аспирантом нашего Центра будет рассмотрена работа Accelerating Transformers in Online RL, в которой предложен метод обучения трансформера, сочетающий в себе как Behavior Clonning (BC) на данных эксперта, так и обновление по Online RL loss-функции.
Данный двухэтапный Teacher-Student алгоритм разгоняет трансформера на экспертных данных с помощью BC loss-функции в рамках первого этапа, а затем переходит к Online RL обучению на втором этапе. Не смотря на BC компоненту, алгоритм не требует заранее подготовленных данных эксперта, а использует траектории Акселератора в онлайн режиме, тем самым снимая важное ограничение методов, упомянутых выше.
👉🏻 Дата: 20.11.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#RL #transformers
❤8🔥6❤🔥2
11:15-11:30 AI Frontiers
Как большие языковые модели учатся планировать и рассуждать с помощью поисковых алгоритмов, Алексей Скрынник от AIRI
Современные большие языковые модели могут значительно расширять возможности автоматического рассуждения и планирования, если их дополнить стратегиями поиска. В докладе рассматриваются три основных подхода: неструктурированный поиск, эволюционный поиск и дерево поиска. Эти методы позволяют моделям исследовать несколько альтернативных траекторий рассуждений, корректировать ошибки на промежуточных шагах и выбирать наиболее перспективные решения.
11:55 - 12:15 Live studio
Рассуждающие модели воплощённого ИИ, Александр Панов
В докладе будет представлен обзор вариантов реализации рассуждений в нейросетевых моделях, используемых в задачах воплощенного ИИ - навигации и манипуляции. Обсудим, как связаны планирование действий и рассуждения, а также ограничения в современных поведенческих моделях (VLA). Разберем также последние работы нашей лаборатории в области интеграции обучаемых и классических подходов для повышения эффективности методов планирования и рассуждений в задачах воплощенного ИИ.
13:00-14:30 Главный зал
Форсайт: каким будет ИИ через 10 лет, Дмитрий Юдин среди участников
15:15-15:30 AI Frontiers
Применение больших языковых и визуально-языковых моделей в робототехнике, Алексей Ковалёв
Большие языковые и визуально-языковые модели (LLM и VLM) получили широкое распространение во множестве приложений и все активнее используются в робототехнике. На лекции мы обсудим, как такие модели помогают роботам распознавать неоднозначные инструкции, формировать планы действий и исправлять ошибки, возникающие при их выполнении.
15:30-15:45 AI Frontiers
Как большие языковые модели понимают 3D-пространство, Дмитрий Юдин
Развитие технологий пространственного ИИ — одно из важнейших современных направлений в робототехнике и беспилотном транспорте. В этом докладе мы рассмотрим концепции пространственного понимания, пространственных рассуждений и связанные с ними задачи. Обсудим потенциал современных MLLM для решения задач, связанных с визуальными ответами на вопросы, поиском трёхмерных объектов, генерацией графов трёхмерных сцен, созданием описаний 3D-сцен и др. Мы также обсудим ограничения популярных LLM в случае описания трёхмерной сцены только текстом. Рассмотрим современные решения для пространственного понимания, использующие модальности изображений, текста, облаков точек и графов. Кратко рассмотрим недавние разработки команд AIRI и МФТИ в этой области. Кроме того, мы обсудим перспективные нерешённые проблемы для дальнейшего развития.
Переходите по ссылкам и смотрите нас онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9🔥2
Наши сотрудники представляют сразу три трансформерные модели на стенде под общим названием Фундаментальные поведенческие модели:
Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, Alexey Kovalev, Aleksandr Panov
Egor Cherepanov, Nikita Kachaev, Alexey Kovalev, Aleksandr Panov
Maria Nesterova, Mikhail Kolosov, Anton Andreychuk, Egor Cherepanov, Oleg Bulichev, Alexey Kovalev, Konstantin Yakovlev, Aleksandr Panov, Alexey Skrynnik
Для MARL-GPT Олег Буличев создал стенд с джетботами, на котором можно было наглядно увидеть работу модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥7
Третью лабораторию в Центре возглавит Алексей Ковалёв, к.ф.-м.н., старший научный сотрудник, руководитель группы “Embodied agents” CAIS AIRI,
доцент ЦКМ МФТИ, куратор нашей магистерской программы.
Тема исследований: фундаментальные и прикладные исследования в ИИ для робототехники и агентных систем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤3🔥2
RoboJobs — проводит аналитические исследования, создает медиа-проекты, помогает компаниям развиваться на международном рынке, а также размещает вакансии и резюме соискателей.
Знает все о российском и мировом рынке робототехники. Находит специалистов, партнеров, подрядчиков и клиентов в России и за рубежом, создавая успешные и эффективные сотрудничества.
Подписывайтесь на RoboJobs, здесь вы найдете лучшие вакансии по робототехнике, в том числе и наши
#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
Оплачиваемая стажировка будет длиться 4-6 месяцев, в процессе работы вам будет помогать ментор. Больше 20 проектов на выбор, в том числе и от AIRI, с которыми мы заключили соглашение на совместную работу, на страницах которых вы сможете найти описание и требования.
Два шага для подачи заявки:
Стажировку можно совмещать с написанием диплома, но нельзя совмещать с другой работой. А после успешного окончания возможно трудоустройство в лаборатории Центра, продолжение работы в компаниях-партнерах.
Вопросы можно задать в сообщениях @fissun.
#стажировка
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥4
🎓 — Семинар 13. Интеграция языковых моделей и графов сцены для планирования действий в физической среде | Анатолий Онищенко
Создание универсальных роботов-помощников невозможно без надежных механизмов понимания естественного языка в контексте реального физического мира. Интеллектуальный агент должен корректно интерпретировать и исполнять инструкции в различных средах.
В рамках семинара аспирант нашего Центра обсудит актуальные методы внедрения больших языковых моделей в задачи интерпретации и планирования действий, с акцентом на использование графовых представлений сцены.
Особое внимание будет уделено разработанному нами методу LookPlanGraph, объединяющему LLM с динамическим графовым представлением сцены. Будет продемонстрировано, как симуляция среды в графовом пространстве и механизмы аугментации позволяют решать задачи навигации и манипуляции в условиях изменяющегося окружения.
🪼 Страница проекта
👉🏻 Дата: 27.11.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#LLM
Создание универсальных роботов-помощников невозможно без надежных механизмов понимания естественного языка в контексте реального физического мира. Интеллектуальный агент должен корректно интерпретировать и исполнять инструкции в различных средах.
В рамках семинара аспирант нашего Центра обсудит актуальные методы внедрения больших языковых моделей в задачи интерпретации и планирования действий, с акцентом на использование графовых представлений сцены.
Особое внимание будет уделено разработанному нами методу LookPlanGraph, объединяющему LLM с динамическим графовым представлением сцены. Будет продемонстрировано, как симуляция среды в графовом пространстве и механизмы аугментации позволяют решать задачи навигации и манипуляции в условиях изменяющегося окружения.
👉🏻 Дата: 27.11.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥5
21 ноября начался отборочный этап по направлению "Искусственный интеллект" для пользователей, прошедших регистрацию на олимпиаду. Он заканчивается 1 декабря в 23:59 по московскому времени.
Если вы ещё не приступили к заданию, советуем поторопиться. На выполнение у вас будет 48 часов, если вы начнёте решение не позднее 23:59 29 ноября.
Напоминаем, что победителям и призёрам предоставляются льготы при поступлении, в том числе и в МФТИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3
В Центре мы создаем работающие технологии для ведущих российских компаний и публикуемся в сильных международных журналах и на топовых конференциях по ИИ и робототехнике.
Наша работа охватывает проекты по обучению больших моделей, робототехнические системы, когнитивные архитектуры и методы эффективного взаимодействия человека и машины.
Вакансии:
В наших проектах — свобода в исследованиях и нетривиальные задачи. Смотрите подробности по ссылкам выше или на нашем сайте и откликайтесь!
#вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤6
🎓 — Семинар 14. Объектно-центричный RL | Денис Васильев
Изучению объектно-центричных представлений уделено много внимания в рамках задач компьютерного зрения. В случае обучения с подкреплением, много внимания уделяется применению объектно-центричных представлений в рамках моделей мира. Однако в случае model-free подходов, большинство методов используют объектно-центричные представления, полученные с помощью замороженных энкодеров.
Дообучение энкодера, в теории, должно обеспечивать ускоренную сходимость алгоритмов обучения с подкреплением и добавлять адаптивности к out-of-distribution сценам. На семинаре аспирантом нашего Центра будет представлен алгоритм для дообучения энкодеров в рамках RL-задач.
👉🏻 Дата: 04.12.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#RL
Изучению объектно-центричных представлений уделено много внимания в рамках задач компьютерного зрения. В случае обучения с подкреплением, много внимания уделяется применению объектно-центричных представлений в рамках моделей мира. Однако в случае model-free подходов, большинство методов используют объектно-центричные представления, полученные с помощью замороженных энкодеров.
Дообучение энкодера, в теории, должно обеспечивать ускоренную сходимость алгоритмов обучения с подкреплением и добавлять адаптивности к out-of-distribution сценам. На семинаре аспирантом нашего Центра будет представлен алгоритм для дообучения энкодеров в рамках RL-задач.
👉🏻 Дата: 04.12.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#RL
🔥4👍2❤1
🎓 — Семинар 15. Оффлайн и онлайн RL для робототехнической манипуляции с трансформерными моделями | Дмитрий Поярков
Современные подходы к обучению трансформерных нейросетей для задач манипуляции в робототехнике преимущественно базируются на оффлайн-обучении с использованием заранее собранных датасетов. Однако, несмотря на удобство и стабильность такого подхода, он демонстрирует ограниченные возможности в достижении высокой производительности в реалистичных условиях.
На семинаре аспирант нашего Центра расскажет о исследовании потенциала применения онлайн-обучения с подкреплением, которое позволяет агенту адаптироваться к среде в процессе взаимодействия и постепенно улучшать поведение на основе вновь собранных данных.
Несмотря на высокую вычислительную стоимость и сложность настройки такого обучения, его интеграция способна существенно повысить эффективность трансформеров в задачах манипуляции.
🪼 Статья
👉🏻 Дата: 11.12.25, четверг в 17:00
📹 Трансляция Youtube и ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #RL #robotics
Современные подходы к обучению трансформерных нейросетей для задач манипуляции в робототехнике преимущественно базируются на оффлайн-обучении с использованием заранее собранных датасетов. Однако, несмотря на удобство и стабильность такого подхода, он демонстрирует ограниченные возможности в достижении высокой производительности в реалистичных условиях.
На семинаре аспирант нашего Центра расскажет о исследовании потенциала применения онлайн-обучения с подкреплением, которое позволяет агенту адаптироваться к среде в процессе взаимодействия и постепенно улучшать поведение на основе вновь собранных данных.
Несмотря на высокую вычислительную стоимость и сложность настройки такого обучения, его интеграция способна существенно повысить эффективность трансформеров в задачах манипуляции.
👉🏻 Дата: 11.12.25, четверг в 17:00
📹 Трансляция Youtube и ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #RL #robotics
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍2🔥2