Agents 2.0: от примитивных циклов к глубокомыслящим агентам
Год назад ИИ-агент был простым while-циклом: промпт → LLM → инструмент → повтор. Решало обычные быстрые задачи типа "какая погода в Токио", но на задачах в 50 шагов, который могут выполняться несколько дней агент терялся, зацикливался, галлюцинировал.
Сейчас архитектура меняется. Deep Agents не просто реагируют, они планируют, делегируют работу специализированным саб-агентам и хранят память вне контекста.
В заметке выделяется четыре ключевые составляющие:
- Явное детальное планирование через цепочку размышлений с сохранением в markdown to-do с отслеживанием прогресса
- Иерархическая оркестрация с распределенением задач между узкими специалистами под-агентами (researcher, coder, writer) и именно они уже вызывают инструменты. Оркестратору возвращается только резальтат
- Внешняя память в файловой системе или векторных БД вместо переполненного контекста. Причём часть под-агентов могут только писать в память, а часть - только читать!
- Промпты на тысячи токенов с детальными инструкциями и указанием структур доступных инструментов и когда стоит подключить человека.
Интересное краткое отражение факта эволюции развития агентских систем.
Полезно и для понимания архитектуры и для презентаций.
#DeepAgents #Orchestrator #SubAgents
———
@tsingular
Год назад ИИ-агент был простым while-циклом: промпт → LLM → инструмент → повтор. Решало обычные быстрые задачи типа "какая погода в Токио", но на задачах в 50 шагов, который могут выполняться несколько дней агент терялся, зацикливался, галлюцинировал.
Сейчас архитектура меняется. Deep Agents не просто реагируют, они планируют, делегируют работу специализированным саб-агентам и хранят память вне контекста.
В заметке выделяется четыре ключевые составляющие:
- Явное детальное планирование через цепочку размышлений с сохранением в markdown to-do с отслеживанием прогресса
- Иерархическая оркестрация с распределенением задач между узкими специалистами под-агентами (researcher, coder, writer) и именно они уже вызывают инструменты. Оркестратору возвращается только резальтат
- Внешняя память в файловой системе или векторных БД вместо переполненного контекста. Причём часть под-агентов могут только писать в память, а часть - только читать!
- Промпты на тысячи токенов с детальными инструкциями и указанием структур доступных инструментов и когда стоит подключить человека.
Интересное краткое отражение факта эволюции развития агентских систем.
Полезно и для понимания архитектуры и для презентаций.
#DeepAgents #Orchestrator #SubAgents
———
@tsingular
⚡6❤2✍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
ROMA: фреймворк для рекурсивных мультиагентных систем
Sentient AGI выпустили ROMA — opensource фреймворк для построения мультиагентных систем.
Работает через рекурсивный цикл plan-execute: задача разбивается на параллельные подзадачи, каждая решается отдельным агентом, результаты собираются обратно.
В комплекте три демо-агента:
- поисковый на базе ChatGPT Search
- исследовательский для сложных запросов
- финансовый аналитик с фокусом на DeFi
Фреймворк работает с любыми моделями - с OpenAI, Anthropic, Google, локальными моделями.
Встроена интеграция с E2B песочницами для безопасного выполнения кода (~150ms старт).
Поисковый агент протестировали на бенчмарках SEAL-0, FRAMES и SimpleQA - показал сильные результаты, например на SEALQA - занял 1 место обойдя Кими Исследователя аж на 9.6% ( 45.6% vs 36%). это тест, в котом у гугла и грока и openai по 20% примерно!
см. таблицу
SIMPLE QA - 93.9% - SOTA
Лицензия Apache 2.0.
В общем рекурсивные агенты рулят.
Изучаем, ставим себе.
Китай и opensource уже слова-синонимы.
#ROMA #MultiAgent #рекурсия #Китай
———
@tsingular
Sentient AGI выпустили ROMA — opensource фреймворк для построения мультиагентных систем.
Работает через рекурсивный цикл plan-execute: задача разбивается на параллельные подзадачи, каждая решается отдельным агентом, результаты собираются обратно.
В комплекте три демо-агента:
- поисковый на базе ChatGPT Search
- исследовательский для сложных запросов
- финансовый аналитик с фокусом на DeFi
Фреймворк работает с любыми моделями - с OpenAI, Anthropic, Google, локальными моделями.
Встроена интеграция с E2B песочницами для безопасного выполнения кода (~150ms старт).
Поисковый агент протестировали на бенчмарках SEAL-0, FRAMES и SimpleQA - показал сильные результаты, например на SEALQA - занял 1 место обойдя Кими Исследователя аж на 9.6% ( 45.6% vs 36%). это тест, в котом у гугла и грока и openai по 20% примерно!
см. таблицу
SIMPLE QA - 93.9% - SOTA
Лицензия Apache 2.0.
В общем рекурсивные агенты рулят.
Изучаем, ставим себе.
Китай и opensource уже слова-синонимы.
#ROMA #MultiAgent #рекурсия #Китай
———
@tsingular
⚡6👍2🔥1
Интересный обзор opensourse ИИ моделей вообще и китайских в частности.
В комментарии файл.
#Китай #Qwen #отчеты
------
@tsingular
В комментарии файл.
#Китай #Qwen #отчеты
------
@tsingular
✍3
Race between global innovation
Main stage
Как ИИ помог увеличить экономический эффект в не нефтяных областях.
77% экономики уже не нефть
В следующие 5 лет планируют дорастить до 85%
ИИ это вопрос суверенитета для каждой страны.
На одном уровне с обороной и кибербезопасностью.
Эмираты запустили университет ИИ, предоставляют золотые визы для ИИ специалистов.
G42 строит крупнейший датацентр.
Эмираты занимают 2 место с точки зрения талантов в ИИ.
Мы планируем использовать ИИ в правительстве: для анализа документов в департаментах.
Вы можете например загрузить запрос на торговую марку на сайте правительства и ИИ поможет мгновенно оценить конфликт с другими марками.
Люди делают ошибки и это занимает несколько дней.
ИИ делает это мгновенно.
ИИ помогает обосновать инвестиции для строительства например больниц или отелей.
Расчитывя ёмкость койкомест и размещение по отношению к соседним подобным объектам.
Мы приглашаем всех инвесторов, кто готов строить энергетику для ИИ.
Эмираты это мост между востоком и западом и мы рады всем, кто поможет строить экосистему.
Привлечение талантов:
Мы верим в людей. Люди это нефть для экономики. Без людей не будет роста.
Технология не может развиваться сама. Люди должны ее развивать.
Мы строим открытую платформу для желающих развивать технологии.
Эмираты в своём роде лаборатория для развития технологий будущего.
Приходите с самыми смелыми идеями и тестируйте гипотезы.
#gitex #Dubai
------
@tsingular
Main stage
Как ИИ помог увеличить экономический эффект в не нефтяных областях.
77% экономики уже не нефть
В следующие 5 лет планируют дорастить до 85%
ИИ это вопрос суверенитета для каждой страны.
На одном уровне с обороной и кибербезопасностью.
Эмираты запустили университет ИИ, предоставляют золотые визы для ИИ специалистов.
G42 строит крупнейший датацентр.
Эмираты занимают 2 место с точки зрения талантов в ИИ.
Мы планируем использовать ИИ в правительстве: для анализа документов в департаментах.
Вы можете например загрузить запрос на торговую марку на сайте правительства и ИИ поможет мгновенно оценить конфликт с другими марками.
Люди делают ошибки и это занимает несколько дней.
ИИ делает это мгновенно.
ИИ помогает обосновать инвестиции для строительства например больниц или отелей.
Расчитывя ёмкость койкомест и размещение по отношению к соседним подобным объектам.
Мы приглашаем всех инвесторов, кто готов строить энергетику для ИИ.
Эмираты это мост между востоком и западом и мы рады всем, кто поможет строить экосистему.
Привлечение талантов:
Мы верим в людей. Люди это нефть для экономики. Без людей не будет роста.
Технология не может развиваться сама. Люди должны ее развивать.
Мы строим открытую платформу для желающих развивать технологии.
Эмираты в своём роде лаборатория для развития технологий будущего.
Приходите с самыми смелыми идеями и тестируйте гипотезы.
#gitex #Dubai
------
@tsingular
🔥13✍4⚡2
Система жидкостного охлаждения для видеокарт от NVent
Отводит 1 Мегаватт тепла.
Горячая замена насосов с резервным контуром.
#nvent #охлаждение
------
@tsingular
Отводит 1 Мегаватт тепла.
Горячая замена насосов с резервным контуром.
#nvent #охлаждение
------
@tsingular
🔥13🤯7❤1⚡1
🔥9⚡5🤣3❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Робот от Etisalat.
На демо его к облаку подключили, поэтому отвечает очень быстро.
Но, как объяснили на стенде - можно установить и локальные модели.
#etisalat #gitex
------
@tsingular
На демо его к облаку подключили, поэтому отвечает очень быстро.
Но, как объяснили на стенде - можно установить и локальные модели.
#etisalat #gitex
------
@tsingular
👍23⚡7✍5🤔4👾3❤2🔥1🥰1😍1
This media is not supported in your browser
VIEW IN TELEGRAM
n8n 1.115: AI Workflow Builder
n8n выкатила AI Workflow Builder - теперь можно генерить рабочие автоматизации из промпта на естественном языке.
Система сама добавляет ноды, настраивает логику, соединяет всё между собой. Дальше дорабатываешь руками.
Пока в бете поэтапно раскатывают в облаке.
Когда будет доступно в онпреме, - не пишут. Но обещают.
Теперь промптом можно накидать воркфлоу.
Самое прикольное что этот промпт тоже можно написать агентом.
Рекурсивный ноукод агентострой получается.
#n8n #агенты
------
@tsingular
n8n выкатила AI Workflow Builder - теперь можно генерить рабочие автоматизации из промпта на естественном языке.
Система сама добавляет ноды, настраивает логику, соединяет всё между собой. Дальше дорабатываешь руками.
Пока в бете поэтапно раскатывают в облаке.
Когда будет доступно в онпреме, - не пишут. Но обещают.
Теперь промптом можно накидать воркфлоу.
Самое прикольное что этот промпт тоже можно написать агентом.
Рекурсивный ноукод агентострой получается.
#n8n #агенты
------
@tsingular
🔥15⚡3✍2❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Мы же не верили в Матрицу в 1999м, - ведь просчитать все детали мира невозможно, - их так много.
А оказывается не надо все считать, достаточно шлифануть финальный кадр нейрорендером.
А под капотом у тебя может быть всё та же графика из 2000х.
Тут народ использует Wan 2.2 - т.е. локальную, оуперсорсную модель внутри ComfyUI, - ссылка
Т.е. при достаточном ресурсе уже сейчас можно собрать процесс, который стиминговые игры будет апскелить нейрорендером в реальном времени.
#wan #comfyui #upscale #GTA #нейрорендер
———
@tsingular
А оказывается не надо все считать, достаточно шлифануть финальный кадр нейрорендером.
А под капотом у тебя может быть всё та же графика из 2000х.
Тут народ использует Wan 2.2 - т.е. локальную, оуперсорсную модель внутри ComfyUI, - ссылка
Т.е. при достаточном ресурсе уже сейчас можно собрать процесс, который стиминговые игры будет апскелить нейрорендером в реальном времени.
#wan #comfyui #upscale #GTA #нейрорендер
———
@tsingular
🔥26👀9
This media is not supported in your browser
VIEW IN TELEGRAM
а это тоже роботы в своем роде.
Китайский порт использует для логистики автономные самоходные грузовые машины в проекте от Huawei.
Сама по себе технология не новая уже, амазон, например, таких роботов на складах использует достаточно давно, но тут в масштабах порта и с такими грузами, - выглядит впечатляюще!
Надо сказать, что это не только в Китае, - в LA тоже такие работают пару лет как уже. Можно много кейсов найти по теме AGV - Autonomous Guided Vehicles
Они разные есть,
- kumatech
- asseco CEIT
а у Huawei полная платформа управления флотом AGV плюс вся необходимая инфра под это.
Сначала они заменили грузовики, затем заменят грузчиков-людей на гуманоидных роботов.
Причем уже, похоже, не когда-то в далёком будущем, а в ближайшие пару лет.
#роботы #vehicles #Китай
———
@tsingular
Китайский порт использует для логистики автономные самоходные грузовые машины в проекте от Huawei.
Сама по себе технология не новая уже, амазон, например, таких роботов на складах использует достаточно давно, но тут в масштабах порта и с такими грузами, - выглядит впечатляюще!
Надо сказать, что это не только в Китае, - в LA тоже такие работают пару лет как уже. Можно много кейсов найти по теме AGV - Autonomous Guided Vehicles
Они разные есть,
- kumatech
- asseco CEIT
а у Huawei полная платформа управления флотом AGV плюс вся необходимая инфра под это.
Сначала они заменили грузовики, затем заменят грузчиков-людей на гуманоидных роботов.
Причем уже, похоже, не когда-то в далёком будущем, а в ближайшие пару лет.
#роботы #vehicles #Китай
———
@tsingular
🔥23👍8🤔7❤2
🧠 ReasoningBank от Google: как AI учится на своих ошибках
Как работает ReasoningBank:
1. Структурированная память (не просто логи, а выводы)
Вместо сохранения "задача провалилась на шаге 3" система извлекает стратегию в виде структуры:
Заголовок: "Приоритет проверки учётных данных"
Описание: "При работе с персональными данными сначала проверяй разделы пользовательского аккаунта"
Содержание: конкретные шаги рассуждения + почему предыдущий подход не сработал
2. Цикл обучения:
3. Обучение на ошибках:
Анализирует почему провалилось и создаёт правило "не делать так"
MaTTS: масштабирование через опыт
Система запускает 5 попыток параллельно и дальше сравнивает их и выявляет общие паттерны успешных решений.
В последовательном режиме агент решает задачу, критикует себя и переделывает, а промежуточные заметки тоже сохраняются в память.
Результаты:
Без памяти масштабирование даёт минимальный прирост с 39% до 40.6%.
С ReasoningBank результат растёт с 49.7% до 55.1%. Хорошая память направляет исследование в правильном направлении, а больше попыток повышают качество памяти.
В итоге система показывает рост успешности на 34% и сокращение шагов на 16% без дообучения модели.
Получается в итоге, что система самостоятельно эволюционирует от простых правил до сложных композитных стратегий с перекрёстной проверкой требований.
Отлично дополняет новость про китайский ROMA
#Google #Reasoning #Memory
———
@tsingular
Как работает ReasoningBank:
1. Структурированная память (не просто логи, а выводы)
Вместо сохранения "задача провалилась на шаге 3" система извлекает стратегию в виде структуры:
Заголовок: "Приоритет проверки учётных данных"
Описание: "При работе с персональными данными сначала проверяй разделы пользовательского аккаунта"
Содержание: конкретные шаги рассуждения + почему предыдущий подход не сработал
2. Цикл обучения:
Новая задача → Поиск похожих кейсов в памяти →
Применение найденных стратегий → Выполнение →
Самооценка (успех/провал) → Извлечение урока →
Добавление в ReasoningBank
3. Обучение на ошибках:
Анализирует почему провалилось и создаёт правило "не делать так"
MaTTS: масштабирование через опыт
Система запускает 5 попыток параллельно и дальше сравнивает их и выявляет общие паттерны успешных решений.
В последовательном режиме агент решает задачу, критикует себя и переделывает, а промежуточные заметки тоже сохраняются в память.
Результаты:
Без памяти масштабирование даёт минимальный прирост с 39% до 40.6%.
С ReasoningBank результат растёт с 49.7% до 55.1%. Хорошая память направляет исследование в правильном направлении, а больше попыток повышают качество памяти.
В итоге система показывает рост успешности на 34% и сокращение шагов на 16% без дообучения модели.
Получается в итоге, что система самостоятельно эволюционирует от простых правил до сложных композитных стратегий с перекрёстной проверкой требований.
Отлично дополняет новость про китайский ROMA
#Google #Reasoning #Memory
———
@tsingular
🔥7✍4⚡1
Что может быть хуже жаворонка?
Только жаворонок поехавшийна восток
Доброе утро, кстати.
:)
#gitex #Dubai #утро
------
@tsingular
Только жаворонок поехавший
Доброе утро, кстати.
:)
#gitex #Dubai #утро
------
@tsingular
😁9🔥5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Помянем программистов.
На подходе Gemini 3.0 Pro
Народ сливает результаты тестов.
Вот один из примеров что может накодить ИИ самостоятельно.
Лет 30 назад это уже называлось операционкой.
Исходник
#Google #Gemini #dev
------
@tsingular
На подходе Gemini 3.0 Pro
Народ сливает результаты тестов.
Вот один из примеров что может накодить ИИ самостоятельно.
Лет 30 назад это уже называлось операционкой.
Исходник
#Google #Gemini #dev
------
@tsingular
⚡33🤯22🤣10❤6❤🔥1👍1😢1