Технозаметки Малышева
8.59K subscribers
3.83K photos
1.43K videos
40 files
4K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Agents 2.0: от примитивных циклов к глубокомыслящим агентам

Год назад ИИ-агент был простым while-циклом: промпт → LLM → инструмент → повтор. Решало обычные быстрые задачи типа "какая погода в Токио", но на задачах в 50 шагов, который могут выполняться несколько дней агент терялся, зацикливался, галлюцинировал.

Сейчас архитектура меняется. Deep Agents не просто реагируют, они планируют, делегируют работу специализированным саб-агентам и хранят память вне контекста.

В заметке выделяется четыре ключевые составляющие:
- Явное детальное планирование через цепочку размышлений с сохранением в markdown to-do с отслеживанием прогресса
- Иерархическая оркестрация с распределенением задач между узкими специалистами под-агентами (researcher, coder, writer) и именно они уже вызывают инструменты. Оркестратору возвращается только резальтат
- Внешняя память в файловой системе или векторных БД вместо переполненного контекста. Причём часть под-агентов могут только писать в память, а часть - только читать!
- Промпты на тысячи токенов с детальными инструкциями и указанием структур доступных инструментов и когда стоит подключить человека.

Интересное краткое отражение факта эволюции развития агентских систем.
Полезно и для понимания архитектуры и для презентаций.

#DeepAgents #Orchestrator #SubAgents
———
@tsingular
622🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
ROMA: фреймворк для рекурсивных мультиагентных систем

Sentient AGI выпустили ROMA — opensource фреймворк для построения мультиагентных систем.

Работает через рекурсивный цикл plan-execute: задача разбивается на параллельные подзадачи, каждая решается отдельным агентом, результаты собираются обратно.

В комплекте три демо-агента:
- поисковый на базе ChatGPT Search
- исследовательский для сложных запросов
- финансовый аналитик с фокусом на DeFi

Фреймворк работает с любыми моделями - с OpenAI, Anthropic, Google, локальными моделями.
Встроена интеграция с E2B песочницами для безопасного выполнения кода (~150ms старт).

Поисковый агент протестировали на бенчмарках SEAL-0, FRAMES и SimpleQA - показал сильные результаты, например на SEALQA - занял 1 место обойдя Кими Исследователя аж на 9.6% ( 45.6% vs 36%). это тест, в котом у гугла и грока и openai по 20% примерно!
см. таблицу

SIMPLE QA - 93.9% - SOTA

Лицензия Apache 2.0.

В общем рекурсивные агенты рулят.
Изучаем, ставим себе.
Китай и opensource уже слова-синонимы.

#ROMA #MultiAgent #рекурсия #Китай
———
@tsingular
6👍2🔥1
Интересный обзор opensourse ИИ моделей вообще и китайских в частности.

В комментарии файл.

#Китай #Qwen #отчеты
------
@tsingular
3
Race between global innovation
Main stage

Как ИИ помог увеличить экономический эффект в не нефтяных областях.

77% экономики уже не нефть
В следующие 5 лет планируют дорастить до 85%

ИИ это вопрос суверенитета для каждой страны.
На одном уровне с обороной и кибербезопасностью.

Эмираты запустили университет ИИ, предоставляют золотые визы для ИИ специалистов.

G42 строит крупнейший датацентр.

Эмираты занимают 2 место с точки зрения талантов в ИИ.

Мы планируем использовать ИИ в правительстве: для анализа документов в департаментах.
Вы можете например загрузить запрос на торговую марку на сайте правительства и ИИ поможет мгновенно оценить конфликт с другими марками.
Люди делают ошибки и это занимает несколько дней.
ИИ делает это мгновенно.

ИИ помогает обосновать инвестиции для строительства например больниц или отелей.
Расчитывя ёмкость койкомест и размещение по отношению к соседним подобным объектам.

Мы приглашаем всех инвесторов, кто готов строить энергетику для ИИ.
Эмираты это мост между востоком и западом и мы рады всем, кто поможет строить экосистему.

Привлечение талантов:
Мы верим в людей. Люди это нефть для экономики. Без людей не будет роста.
Технология не может развиваться сама. Люди должны ее развивать.
Мы строим открытую платформу для желающих развивать технологии.
Эмираты в своём роде лаборатория для развития технологий будущего.
Приходите с самыми смелыми идеями и тестируйте гипотезы.

#gitex #Dubai
------
@tsingular
🔥1342
Система жидкостного охлаждения для видеокарт от NVent

Отводит 1 Мегаватт тепла.
Горячая замена насосов с резервным контуром.

#nvent #охлаждение
------
@tsingular
🔥13🤯711
Media is too big
VIEW IN TELEGRAM
Доклад по Datwyler - BI с AI проводит Unitree.

#datwyler #gitex #роботы #Unitree
------
@tsingular
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Вездеход от Autogo

Поразило, что не падает, когда спускается.

#autogo #gitex
------
@tsingular
🔥7👍54
Воздушный флот Etisalat и их аналог кибертрака,- GAC

GAC выше меня получается.

#Etisalat #gitex
------
@ tsingular
🔥95🤣3❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Робот от Etisalat.
На демо его к облаку подключили, поэтому отвечает очень быстро.

Но, как объяснили на стенде - можно установить и локальные модели.

#etisalat #gitex
------
@tsingular
👍2375🤔4👾32🔥1🥰1😍1
This media is not supported in your browser
VIEW IN TELEGRAM
n8n 1.115: AI Workflow Builder

n8n выкатила AI Workflow Builder - теперь можно генерить рабочие автоматизации из промпта на естественном языке.
Система сама добавляет ноды, настраивает логику, соединяет всё между собой. Дальше дорабатываешь руками.

Пока в бете поэтапно раскатывают в облаке.
Когда будет доступно в онпреме, - не пишут. Но обещают.

Теперь промптом можно накидать воркфлоу.

Самое прикольное что этот промпт тоже можно написать агентом.

Рекурсивный ноукод агентострой получается.

#n8n #агенты
------
@tsingular
🔥15322
This media is not supported in your browser
VIEW IN TELEGRAM
Мы же не верили в Матрицу в 1999м, - ведь просчитать все детали мира невозможно, - их так много.
А оказывается не надо все считать, достаточно шлифануть финальный кадр нейрорендером.
А под капотом у тебя может быть всё та же графика из 2000х.

Тут народ использует Wan 2.2 - т.е. локальную, оуперсорсную модель внутри ComfyUI, - ссылка

Т.е. при достаточном ресурсе уже сейчас можно собрать процесс, который стиминговые игры будет апскелить нейрорендером в реальном времени.

#wan #comfyui #upscale #GTA #нейрорендер
———
@tsingular
🔥26👀9
This media is not supported in your browser
VIEW IN TELEGRAM
а это тоже роботы в своем роде.

Китайский порт использует для логистики автономные самоходные грузовые машины в проекте от Huawei.


Сама по себе технология не новая уже, амазон, например, таких роботов на складах использует достаточно давно, но тут в масштабах порта и с такими грузами, - выглядит впечатляюще!

Надо сказать, что это не только в Китае, - в LA тоже такие работают пару лет как уже. Можно много кейсов найти по теме AGV - Autonomous Guided Vehicles

Они разные есть,
- kumatech
- asseco CEIT

а у Huawei полная платформа управления флотом AGV плюс вся необходимая инфра под это.

Сначала они заменили грузовики, затем заменят грузчиков-людей на гуманоидных роботов.
Причем уже, похоже, не когда-то в далёком будущем, а в ближайшие пару лет.

#роботы #vehicles #Китай
———
@tsingular
🔥23👍8🤔72
🧠 ReasoningBank от Google: как AI учится на своих ошибках

Как работает ReasoningBank:
1. Структурированная память (не просто логи, а выводы)
Вместо сохранения "задача провалилась на шаге 3" система извлекает стратегию в виде структуры:

Заголовок: "Приоритет проверки учётных данных"
Описание: "При работе с персональными данными сначала проверяй разделы пользовательского аккаунта"
Содержание: конкретные шаги рассуждения + почему предыдущий подход не сработал

2. Цикл обучения:

Новая задача → Поиск похожих кейсов в памяти → 
Применение найденных стратегий → Выполнение →
Самооценка (успех/провал) → Извлечение урока →
Добавление в ReasoningBank


3. Обучение на ошибках:
Анализирует почему провалилось и создаёт правило "не делать так"

MaTTS: масштабирование через опыт
Система запускает 5 попыток параллельно и дальше сравнивает их и выявляет общие паттерны успешных решений.

В последовательном режиме агент решает задачу, критикует себя и переделывает, а промежуточные заметки тоже сохраняются в память.

Результаты:
Без памяти масштабирование даёт минимальный прирост с 39% до 40.6%.
С ReasoningBank результат растёт с 49.7% до 55.1%. Хорошая память направляет исследование в правильном направлении, а больше попыток повышают качество памяти.

В итоге система показывает рост успешности на 34% и сокращение шагов на 16% без дообучения модели.

Получается в итоге, что система самостоятельно эволюционирует от простых правил до сложных композитных стратегий с перекрёстной проверкой требований.

Отлично дополняет новость про китайский ROMA

#Google #Reasoning #Memory
———
@tsingular
🔥741
Что может быть хуже жаворонка?
Только жаворонок поехавший на восток


Доброе утро, кстати.
:)

#gitex #Dubai #утро
------
@tsingular
😁9🔥52
This media is not supported in your browser
VIEW IN TELEGRAM
Помянем программистов.

На подходе Gemini 3.0 Pro
Народ сливает результаты тестов.

Вот один из примеров что может накодить ИИ самостоятельно.

Лет 30 назад это уже называлось операционкой.

Исходник

#Google #Gemini #dev
------
@tsingular
33🤯22🤣106❤‍🔥1👍1😢1