Технозаметки Малышева

Microsoft представила Magentic-One: мульти-агентную систему следующего поколения

Microsoft Research анонсировала передовую мульти-агентную систему на базе AutoGen framework.
Ключевая особенность - пять специализированных агентов под управлением главного оркестратора.
Система демонстрирует state-of-the-art результаты в тестах GAIA, AssistantBench и WebArena.
Архитектура включает работу с файлами, веб-навигацию, программирование и выполнение кода.

Оркестратор: главный агент, который разбивает задачи на части, планирует работу, руководит остальными агентами и следит, чтобы всё шло по плану. Если что-то идёт не так - вносит исправления.
WebSurfer: агент на базе LLM, который умеет управлять браузером на основе Chromium. Когда получает запрос - выполняет действие в браузере и докладывает, что изменилось на странице. Что умеет делать:
- переходить по ссылкам и искать в интернете
- кликать и печатать на страницах
- читать контент (делать краткие выжимки, отвечать на вопросы)
Для работы использует дерево доступности браузера и специальные промпты с метками.
FileSurfer: агент на базе LLM, который работает с программой просмотра файлов в формате markdown. Может читать почти любые локальные файлы. Умеет просматривать содержимое папок и перемещаться между ними.
Coder: агент на базе LLM, заточенный на написание кода. Анализирует информацию от других агентов и создаёт новые файлы/программы.
ComputerTerminal: дает команде доступ к консоли, где можно запускать программы от Coder'а и ставить новые библиотеки.

Task Ledger и Progress Ledger обеспечивают отслеживание задач и прогресса.
Поддерживает различные LLM модели, включая GPT-4o и OpenAI o1-preview.
Особое внимание уделено безопасности - система работает в изолированных контейнерах с проверкой.

Выглядит очень интересно. Пробуем.

#Microsoft #MagenticOne #AutoGen
-------
@tsingular

🔥3

932 viewsedited 05:11

About

Blog

Apps

Platform