Microsoft представила Magentic-One: мульти-агентную систему следующего поколения
Microsoft Research анонсировала передовую мульти-агентную систему на базе AutoGen framework.
Ключевая особенность - пять специализированных агентов под управлением главного оркестратора.
Система демонстрирует state-of-the-art результаты в тестах GAIA, AssistantBench и WebArena.
Архитектура включает работу с файлами, веб-навигацию, программирование и выполнение кода.
Оркестратор: главный агент, который разбивает задачи на части, планирует работу, руководит остальными агентами и следит, чтобы всё шло по плану. Если что-то идёт не так - вносит исправления.
WebSurfer: агент на базе LLM, который умеет управлять браузером на основе Chromium. Когда получает запрос - выполняет действие в браузере и докладывает, что изменилось на странице. Что умеет делать:
- переходить по ссылкам и искать в интернете
- кликать и печатать на страницах
- читать контент (делать краткие выжимки, отвечать на вопросы)
Для работы использует дерево доступности браузера и специальные промпты с метками.
FileSurfer: агент на базе LLM, который работает с программой просмотра файлов в формате markdown. Может читать почти любые локальные файлы. Умеет просматривать содержимое папок и перемещаться между ними.
Coder: агент на базе LLM, заточенный на написание кода. Анализирует информацию от других агентов и создаёт новые файлы/программы.
ComputerTerminal: дает команде доступ к консоли, где можно запускать программы от Coder'а и ставить новые библиотеки.
Task Ledger и Progress Ledger обеспечивают отслеживание задач и прогресса.
Поддерживает различные LLM модели, включая GPT-4o и OpenAI o1-preview.
Особое внимание уделено безопасности - система работает в изолированных контейнерах с проверкой.
Выглядит очень интересно. Пробуем.
#Microsoft #MagenticOne #AutoGen
-------
@tsingular
Microsoft Research анонсировала передовую мульти-агентную систему на базе AutoGen framework.
Ключевая особенность - пять специализированных агентов под управлением главного оркестратора.
Система демонстрирует state-of-the-art результаты в тестах GAIA, AssistantBench и WebArena.
Архитектура включает работу с файлами, веб-навигацию, программирование и выполнение кода.
Оркестратор: главный агент, который разбивает задачи на части, планирует работу, руководит остальными агентами и следит, чтобы всё шло по плану. Если что-то идёт не так - вносит исправления.
WebSurfer: агент на базе LLM, который умеет управлять браузером на основе Chromium. Когда получает запрос - выполняет действие в браузере и докладывает, что изменилось на странице. Что умеет делать:
- переходить по ссылкам и искать в интернете
- кликать и печатать на страницах
- читать контент (делать краткие выжимки, отвечать на вопросы)
Для работы использует дерево доступности браузера и специальные промпты с метками.
FileSurfer: агент на базе LLM, который работает с программой просмотра файлов в формате markdown. Может читать почти любые локальные файлы. Умеет просматривать содержимое папок и перемещаться между ними.
Coder: агент на базе LLM, заточенный на написание кода. Анализирует информацию от других агентов и создаёт новые файлы/программы.
ComputerTerminal: дает команде доступ к консоли, где можно запускать программы от Coder'а и ставить новые библиотеки.
Task Ledger и Progress Ledger обеспечивают отслеживание задач и прогресса.
Поддерживает различные LLM модели, включая GPT-4o и OpenAI o1-preview.
Особое внимание уделено безопасности - система работает в изолированных контейнерах с проверкой.
Выглядит очень интересно. Пробуем.
#Microsoft #MagenticOne #AutoGen
-------
@tsingular
🔥3