BaseLine
477 subscribers
212 photos
19 videos
1 file
156 links
Канал Алексей Ковалёва – PhD, тимлид команды Embodied agents в AIRI, доцент ЦКМ МФТИ. Занимаюсь Embodied AI 🤖, LLM Planning, RL

Моё хобби – читать научпоп лекции по ИИ

Здесь делюсь событиями, мыслями, новостями
Download Telegram
Forwarded from Институт AIRI
В эту пятницу, 27 июня, встречаемся в парке «Сад Эрмитаж»⤵️

Исследователи AIRI примут участие в программе фиджитал-фестиваля «Мир глазами ИИ», который проводится в рамках проекта «Лето в Москве». Делимся расписанием:

⚫️16:00 — открытая дискуссия: «Тренды в сфере ИИ: наука и жизнь»

Участники:
— Владислав Куренков, руководитель научной группы «Адаптивные агенты» AIRI
— Алексей Ковалёв, кандидат компьютерных наук, руководитель группы «Воплощённые агенты» лаборатории «Когнитивные системы ИИ» AIRI, доцент Центра когнитивного моделирования МФТИ
— Егор Алёшин, исполнительный директор и владелец продукта GigaChat B2B, Сбер
— Модерирует дискуссию Александра Бройтман, директор по маркетингу и коммуникациям AIRI

⚫️17:00 — лекция «Искусственный интеллект — от настоящего к будущему»

— Алексей Ковалёв представит научно-популярную лекцию о текущих достижениях в области искусственного интеллекта и перспективах его развития.

Вход свободный, подробнее о мероприятии читайте на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥4
Forwarded from iMapDAY
Сегодня провели защиты дипломов магистров Научно-образовательного Центра когнитивного моделирования МФТИ. Появилось 14 новых магистров по профилю подготовки «Методы и технологии искусственного интеллекта». Мои поздравления и пожелания дальнейших успехов защитившимся! Среди них было шестеро моих дипломников и про них я напишу чуть позже отдельные посты, открыв рубрику «Отзыв научного руководителя» 😊

А также большая благодарность членам комиссии, в которую я входил и которая собралась на Физтехе и задавала дельные вопросы: В.В. Борисову, Д.В. Виноградову, К.С. Яковлеву, А.К. Ковалёву и А.И. Панову, который нас всех собрал.

А также отдельное спасибо Анфисе Мухиной, которая обеспечила техническую сторону защиты и делает большую работу в новой приемной кампании!

PS. Запись защиты дипломов доступна в ВК.

#Activities
14🔥5👏2
Как понять, что в статье—которую приходиться рецензировать—использовали LLM для редактирования текста?😅
😁6
ИИ-ЗАМАН: научная конференция по ИИ в рамках Kazan Digital Week 2025

18 сентября в Казани пройдет конференция ИИ-ЗАМАН, на которой я руковожу секцией «Воплощенный ИИ и робототехника» 🤖

Исследуешь локализацию, навигацию, манипуляцию, взаимодействие роботов с человеком или другие задачи объединяющие ИИ и робототехнику?
Тогда это отличная возможность поделиться своими результатами и для нетворкинга!

Занимаешься ИИ, но не занимаешься робототехникой? Участвуй в других секциях:

⚫️Компьютерное зрение — Андрей Кузнецов (Институт AIRI, Университет Иннополис)
⚫️Обработка естественного языка — Елена Тутубалина (Институт AIRI, ИСП РАН)
⚫️Воплощенный ИИ и робототехника — Алексей Ковалёв (Институт AIRI, МФТИ)
⚫️ИИ в науке — Алексей Шпильман (Сбербанк)
⚫️ИИ в молекулярных и биологических исследованиях — Павел Яковлев (Биокад)

📍18 сентября — Казань, Россия

📝 Дедлайн подачи статей — 20 июля

📚 Статьи будут опубликованы в «Электронных библиотеках», лучшие работы рекомендованы для Springer LNCS

💸 Если ты студент или аспирант и твоя статья будет отобрана — ты можешь получить финансовую поддержку на проезд до Казани. Заявка подаётся вместе со статьёй

🔗 Подробнее: aizaman.ru
📲 Канал конференции: @aizaman_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
4
qwen_ft.gif
37.2 MB
EmbRACE-3K или VirtualHome на стероидах

Довольно сырая, но вызывающая интерес работа

Авторы подметили, что VLMки, неплохо справляющиеся с задачами по картинкам и видео, не умеют из коробки в embodied задачи. Связывают это со способом обучения (что неудивительно) и выделяют три проблемы:

⚫️VLMки не умеют в эксплорэйшн — модели больше обращают внимание на текущие визуальные наблюдения и плохо справляются с долгосрочным планированием
⚫️VLMки не умеют учитывать позу — модели начинают плохо работать с пространственными отношениями, если агент двигается
⚫️VLMки забывают цель — модели часто не переносят намерение (intent) за пределы текущего фрейма

Для того чтобы тестировать способности VLMок авторы собрали 3000 траектории с языковыми инструкциями в симуляторе на движке Unreal Engine. Протестировали GPT-4o, Gemini 2.5 Pro и Qwen2.5-VL-7B в zero-shot и показали, что справляются они с задачами плохо, но дообучение в формате SFT+GRPO на собранных данных дает хороший прирост

Из плюсов: траектории размечены так, что к каждому действию есть «рассуждение» почему это действие было выполнено

Из минусов: дискретная среда с небольшим набором действий (WASD + Open, Pick, Drop)

На гифке демо с дообученной Qwen2.5-VL-7B

#vlm #embodied
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👏21👍1
Наш проект по RL агентам с памятью занял второе место на летней школе 🥳

Ребята мощно потрудились 🦾
9🔥5
Forwarded from Неискусственный интеллект (Илья Склюев)
Наука, молодость, хардкор

Пока мы рассуждаем о текущем, в Томске создают грядущее. На этой неделе в городе завершилась летняя школа «Лето с AIRI», организованная Институтом AIRI и Томским государственным университетом при поддержке «Авито», «Сбера», фонда «Интеллект» и Cloud.ru.

Молодые учёные из более чем 10 регионов представили 28 проектов по искусственному интеллекту. Всего в смене приняли участие 80 студентов — в течение 11 дней они работали с учёными из AIRI, ТГУ, МГУ, МФТИ, ВШЭ, МТУСИ, Сколтеха и других научно-исследовательских организаций, вузов и компаний.


Лучшую оценку научной комиссии получили:

1️⃣ Социально-ориентированный проект студентов из Москвы, Воронежа и Нижнего Новгорода по анализу изображений домашних питомцев

2️⃣ Работа по исследованию агентов с памятью в обучении с подкреплением

3️⃣ Кейс по по переводу 3D-представления молекул (конформаций) в записи упрощённого вида (SMILES). Такая модель позволяет быстро перевести трёхмерное представление в привычный для химика вид и оценить валидность кандидата на лекарственный препарат

Среди проектов также были представлены улучшения:

▪️ обобщающей способности моделей голосовой биометрии;
▪️ альтернатив трансформерным архитектурам;
▪️ обучения с подкреплением, мультимодальности;
▪️ генеративных моделей для параметрических данных.

А также применения ИИ в химии, промышленности и фармацевтике.

В рамках программы участники провели карьерный день с HR-специалистами «Авито» и получили консультации по профессиональному росту, а также прослушали тематические лекции от исследователей-практиков из «Сбера».

«За 4 года проведения школы Лето с AIRI было собрано более двух с половиной тысяч заявок на участие в программе со всей России. В этом году мы с Томским университетом приняли решение усложнить критерии отбора и, несмотря на это, получили заявки от участников из Москвы, Санкт-Петербурга, Кабардино-Балкарской Республики, Самарской, Свердловской, Томской, Новосибирской, Воронежской, Тульской областей, Республик Башкортостан и Татарстан, Приморского края. Это показывает, что качество подготовки научных кадров в стране растёт».

Иван Оселедец, генеральный директор AIRI, профессор РАН


Эти ребята не просто на передовой ИИ-индустрии — они уже формируют её будущее в России. Удачи им! А мы будем следить и брать пример...

@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11
🔥Очередная отличная новость!🔥

Две наши работы приняли на топовую конференцию по робототехнике — IROS 2025
🥳

⚫️LERa: Replanning with Visual Feedback in Instruction Following — предложили подход к перепланированию на основе VLM, анализирующий визуальное наблюдение робота и предлагающий способ корректировки исходного плана. Работу проводили вместе с Центром робототехники Сбера

⚫️VerifyLLM: LLM-Based Pre-Execution Task Plan Verification for Robots — объединили линейную временную логику и способность LLMок к рассуждению для верификации плана робота
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👏43
🦾🔥👩‍🚀Объявляем набор на стажировку в области искусственного интеллекта и робототехники (Robotics, LLM, RL, CV, Planning)!

Оплачиваемая стажировка в Центре когнитивного моделирования Института ИИ МФТИ предполагает работу над прикладными или поисковыми проектами в составе опытной команды, написание статей в ведущие конференции и журналы.

На выбор предоставляется 14 проектов, которые включают в себя:
🔹обучение с подкреплением
🔹компьютерное зрение
🔹планирование поведения и управление
🔹большие языковые модели
🔹и другое

Два шага для подачи заявки:
1️⃣ выбрать подходящий проект на сайте
2️⃣ заполнить форму

Стажировку можно совмещать с написанием диплома, но нельзя совмещать с другой работой или стажировкой. А после успешного окончания возможно трудоустройство в лаборатории Центра, продолжение работы в компаниях-партнерах.

Прием заявок до 11 августа 2025 включительно!

Вопросы можно задать в сообщениях @fissun.

#стажировка
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4🏆3👎1🥰1💩1
Больше суток в дороге по занимательному маршруту Москва➡️Дубай➡️Мадрид➡️Франкфурт➡️Вена и я добрался до ACL 2025 😅

Баннеры встречают уже в аэропорту 🛬

Основная движуха начнётся завтра, а сегодня день туториалов

Рекомендую туториал коллег по
Uncertainty Quantification for Large Language Models 🔥

#ACL2025
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥194🥰1
Forwarded from Институт AIRI
ACL 2025 стартовала в Вене⤵️

В этом году на конференции широкая тематическая программа — от вычислительных социальных наук до распознавания речи. Заявлена и специальная тема: генерализация NLP-моделей.

Исследователи AIRI представляют 11 статей на основных треках конференции:

⚫️AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment

⚫️CLEAR: Character Unlearning in Textual and Visual Modalities

⚫️CrafText Benchmark: Advancing Language Grounding in Complex Multimodal Open-Ended World

⚫️Adaptive Retrieval Without Self-Knowledge? Bringing Uncertainty Back Home

⚫️BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages

⚫️Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

⚫️Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

⚫️Run LoRA Run: Faster and Lighter LoRA Implementations

⚫️HatePRISM: Policies, Platforms, and Research Integration. Advancing NLP for Hate Speech Proactive Mitigation

⚫️How to Compare Things Properly? A Study on Answering Comparative Questions using Argument Summarization

⚫️ATGen: A Framework for Active Text Generation


Вчера прошёл туториал по оценке неопределенностей для LLM в задачах генерации текста Uncertainty Quantification for Large Language Models, организованный исследователями AIRI. Учёные также планируют показать свои исследования на нескольких воркшопах.

Делимся фото с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍1👏1
Презентовали AmbiK 🥳
🔥28🥰6👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Social event ACL 2025

А лингвисты умеют отдыхать😁
🔥12👍1
Forwarded from Институт AIRI
Рассказываем про конференцию, которая пройдет в Казани 17 сентября ⤵️

Конференция «ИИ–ЗАМАН» станет отдельным научным треком на международном форуме Kazan Digital Week 2025.

Исследователи AIRI выступают кураторами трех направлений:
⚫️Андрей Кузнецов — Компьютерное зрение
⚫️Елена Тутубалина — Обработка естественного языка
⚫️Алексей Ковалёв — Воплощённый ИИ и робототехника


Подать статью можно до 20 августа  — публикации планируются в Springer LNCS и в журнале «Электронные библиотеки». Отобранные статьи будут также рекомендованы в журнал Optical Memory and Neural Networks. Подать можно как новые статьи, так и ранее опубликованные работы.

Подробнее про подачу статей — по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥2