Всем привет!🔥
📆 В эту пятницу (29.08) в 17:00 Егор Черепанов расскажет про то
Как на самом деле тестировать память у RL-агентов
Сегодня в исследованиях RL почти каждая новая модель включает какой-то механизм памяти, но насколько хорошо мы умеем проверять, действительно ли агент её использует?
Для обсуждения мы возьмём три свежих работы:
⚫️ POBAX предлагает систематический набор задач, где частичная наблюдаемость делает память ключевым фактором. Эти задачи подобраны так, чтобы простое «увеличение модели» не помогало, и действительно требовалось хранить историю
⚫️ Synthetic POMDPs идут ещё дальше: авторы формализуют понятие Memory Demand Structure и показывают, как синтетически конструировать среды с заранее известной «нагрузкой на память». Это позволяет строить тесты для конкретных гипотез
⚫️ POPGym Arcade фокусируется на практической стороне: пиксельные среды с MDP/POMDP-близнецами, GPU-ускорение и уникальные инструменты для визуализации, какие именно наблюдения агент запомнил и как они влияют на будущее поведение
Обсудим, как такие инструменты можно использовать для выбора архитектуры, настройки агентов и выявления слабых мест памяти
Статьи:
1. Benchmarking Partial Observability in Reinforcement Learning with a Suite of Memory-Improvable Domains
2. Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
3. POPGym Arcade: Parallel Pixelated POMDPs
🍿 Ссылка на подключение
Подписаться⤵️
Embodied AI Reading Club
Как на самом деле тестировать память у RL-агентов
Сегодня в исследованиях RL почти каждая новая модель включает какой-то механизм памяти, но насколько хорошо мы умеем проверять, действительно ли агент её использует?
Для обсуждения мы возьмём три свежих работы:
Обсудим, как такие инструменты можно использовать для выбора архитектуры, настройки агентов и выявления слабых мест памяти
Статьи:
1. Benchmarking Partial Observability in Reinforcement Learning with a Suite of Memory-Improvable Domains
2. Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
3. POPGym Arcade: Parallel Pixelated POMDPs
Подписаться
Embodied AI Reading Club
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤3👎1🤮1💩1🥴1