Universal Autonomy Initiative
121 subscribers
11 photos
4 videos
18 links
Memetic robotics research
https://robotsilike.substack.com/
Download Telegram
Тем временем, приближается важное для российской робототехники мероприятие — Russian ROS Meetup!

ROS Meetup изначально был посвящен фреймворку Robot Operating System (ROS) – одной из главных платформ для разработки робототехнического ПО. С годами масштаб и скоуп мероприятия сильно увеличились: от железа и embedded-приколов до RL и LLM. Отдельным представителям UAI доводилось принимать участие в самых первых итерациях мероприятия, так что мы сами видели, как оно эволюционировало из полулокального митапа до места сбора cutting-edge разработчиков и рисерчеров отечественной робототехники (хотя в этом году обещают ещё и доклады от коллег из Китая).

В этот раз, помимо основной конференции, пройдет целая серия воркшопов и мастер-классов — от хакатона по сборке робота до туториалов по RL и хардварным AI-ускорителям. Выглядит как идеально для тех, кто хочет вкатиться в роботикс!

Регистрация и программа воркшопов (4-6 апреля, дедлайн по регистрации — до 2 апреля!)

Регистрация и программа основной конференции (26 апреля)
1
ШОК!!!!!
Помните песню Man Who Sold the World из концовки Metal Gear Solid 5 ? Так вот, оказывается, если продать модель мира по низкой цене, то можно достичь AGI!!!!
Не верите?? А ведь гении теории управления показали это ещё в конце XX века, представив миру Model Predictive Control (MPC).

Но если серьезно, то мы подготовили для вас лонгрид про MPC. Из него вы узнаете, как строят эффективные и безопасные системы управления, как их подружить с нейросетями, а также причем здесь world models, Ян Лекун, и главное, смысл отсылки на Кодзиму выше.
База по SLAM

Пока готовим для вас лонгриды и рассказы про наши текущие эксперименты, разбавим тишину образовательными материалами. В этот раз — entry point и более продвинутые материалы по теме Simultaneous Localization and Mapping (SLAM).


1. SLAM for Dummies. Мини-книжечка про совсем основы SLAM-а: постановка задачи, проблемы и простейшие реализации. Пожалуй, лучшая вещь для тех, кто ещё не в теме и хочет вкатиться, но не знает, с чего начать.

2. SLAM Book. Уже ставшая классикой open source-книжка от одного профессора Xiang Gao из Китая. Полноценное учебное пособие с кучей матеши, как раз для тех, кому интересно освоить тему на более глубоком уровне. Упор идёт по большей части на Visual SLAM, но половина материала, а то и более, важна как основа для SLAM-а в целом.

3. SLAM Handbook. Узнал о ней совсем недавно из этого поста. По духу выглядит как что-то близкое к SLAM Book, но более свежее — часть топиков, судя по ридми, всё ещё в процессе добавления. Обещают завести также главы про современные методы т.н. Spatial AI. Материал сам ещё не чекал, но выглядит вкусно. Также один из авторов в репе — профессор Frank Dellaert — один из главных исследователей в области SLAM-а, известен как автор Square Root SAM — очень важной работы по сабжу.

4. Курс Perception in Robotics Сколтеха. Читает мой научный руководитель — профессор Gonzalo Ferrer. Курс с упором на матешу и теоретические аспекты. Основан по большей части на классической для области книге Probabilistic Robotics.

5. Цикл семинаров Tartan SLAM от CMU. В своё время (2022 год) позиционировался как обзор современных и перспективных методов SLAM-а, но поскольку область развивается не столь быстрыми шагами, как те же языковые модели, контент, думаю, вполне актуальный.


Делитесь в комментариях другими полезными ресурсами, о которых знаете!
👍42
Сотрудники UAI спешат представить вам новейшую разработку на стыке робототехники, биологии и брейнрота — Svinino Terminatino. Многофункциональный мобильный доспех с интерфейсом мозг-компьютер для оператора класса "свинья" позволяет решать широкий спектр задач в самых разных сферах: от охраны гражданских объектов (видео 1) до автономной парковки (видео 2).
😁1
Universal Autonomy Initiative pinned «А увидеть это чудо вживую и послушать про наш реальный рисерч вы сможете на дне открытых дверей по робототехнике в Сколтехе уже 24 апреля!»
Тем временем, приглашаем поддержать наших коллег из сколтеховской Евробот-команды RESET (а на самом деле — соревнование в целом и, как следствие, всю отечественную робототехнику) на отборочном этапе!
https://t.iss.one/CDE_Skoltech/1408
🔥1
В конце мая пройдёт одно из главных мероприятий для российского AI-сообщества — DataFest 2025!

DataFest — это серия онлайн и офлайн митапов, посвящённая, пожалуй, почти всем аспектам AI-индустрии: от жёсткой матеши до карьерных вопросов. Карьерных в плане профессии, а не тех, что роют. Хотя не в первый год слышу про AI-проекты в горнодобывающей промышленности, так что и им там найдется место...

Уже не в первый год на фесте представлен трек по робототехнике (см. доклады прошлого года), и в этому году мы планируем залететь туда с несколькими докладами — stay tuned.

Так что приглашаем вас посетить сие мероприятие, причём не только роботикс трек! Также, если нас читают коллеги-робототехники, предлагаем вам присоединиться к подаче докладов (дедлайн на подачу темы — 7 мая)!
👍1
Forwarded from rizzearch
π0.5: a VLA with Open-World Generalization

so, физикал интеллиженс сделал следующую версию своей general-purpose роботик модели

в качестве модификаций над первой версией авторы объединили свои идеи в плане токенизации пространства действий и добавления иерархичности над текстовыми описаниями комманд и действий (задача “приготовить омлет” разбивается на более мелкие задачи по типу “взять прибор”, “включить плиту” и тд)

для данных они взяли еще больше материала для претрена - чтобы расшириться до адекватного перформанса в неизвестных ситуациях (новых кухнях или спальнях) - включая предикшн подтасок на основе более общей задачи, детекцию и задачи с интернета как QA & img captioning . по размеру тяжело судить, ибо авторы не раскрывают ни датасета, ни хотя бы примерные числа в некоторых местах. разве что прибавляют к открытым датасетам и свои данные (которых больше 400 часов), как это может соотноситься со скейлом от, например, нвидиа или стэнфорда - неизвестно (либо просто я невнимательный)

важный момент еще есть в комбинации обучения между действиями на уровне токенов (1) и через флоу матчинг (2) - фаст (1) позволяет модели сойтись заметно быстрее и в принципе легче тренируется, в то время как (2) на инференсе в данном сетапе авторов будет быстрее. решили это довольно прямолинейно - через гиперпараметр, который контролирует значимость флоу матчинг лосса во время обучения. начинается с 0, и затем постепенно увеличивается → мульти-модальный трансформер в начале обучения фиттится на маппинг из токена в токены, а затем и постепенно вливается консерн на непосредственное предсказание непрерывных действий. может выглядеть довольно топорно, but it works for them though

демки как обычно залипательные и прикольные, особенно момент, когда все не ломается если посреди процесса встрянет человек и что-то изменит в окружении

пока авторы назвали это версией 0.5 → можно предположить судя по размышлениям авторов, что версия 1.0 будет решать задачи о помощи во время выполнения задачи (хотя что-то такое уже было решено в Hi Robot но видимо не до конца) или большей агентности в плане меньшего количества супервайзд данных, as an example

или это будет версия 0.7 если им нравятся нейминги от антропиков

👀 link, demo, код отсутствует
3