Силиконовый Мешок

Как в старом анекдоте «что нужно поменять в машине, чтобы она реже ломалась — прокладку между рулем и сиденьем», думают и в компании «General Agents»— давайте заменим человека в работе с компьютером.

А то слишком медленно он на кнопочки нажимает и мышкой клацает. Хотя давно было понятно, куда ветер дует и ясно, что Computer use это первый шаг к автоматизации работы за компьютером.

Буквально вчера, бывший исследователь в DeepMind и Tesla Шержил Озайр, анонсировал свой новый продукт — Ace, это ИИ-Агент который взаимодействует с твоим компьютером через стандартные интерфейсы: мышку и клавиатуру. Но делает это намного оперативнее, например бронирует жилье быстрее, чем обычный человек успевает прочитать описание квартиры. Вот что они заявляют:

1. Обучен на поведении, а не просто на текстах. Он смотрит, как человек выполняет задачу, и запоминает шаги.

2. Супербыстрый: предсказывает действия с минимальной задержкой.

3. Ничему учить не нужно: ты просто делаешь задачу как обычно — а Ace наблюдает и учится.

4. Масштабируемый: с каждым новым пользователем он становится умнее, потому что переобучается на новых паттернах поведения.

Как я понял, они используют рызные LLM’ки, как и Manus, но в отличие от него, обучили еще и свою модель на большом количестве скринкастов из интерфейсов пользователей. Вот что пишут General Agents:

- Формат данных для обучения: скринкасты, логи мыши и клавиатуры.

- Подход к обучению: imitation learning (обучение по демонстрации).

- Количество обучающих сессий: более 1 миллиона задач, выполненных специалистами по ПО и экспертами в разных сферах.

- Модель Ace-control: используется для вывода в реальном времени, доступна партнёрам через платформу General Agents.

- Инфраструктура: пока Ace использует значительно меньше вычислительных ресурсов, чем LLM вроде GPT, но с каждым этапом масштабирования он становится точнее.

- Производительность: по сравнению с существующими “desktop agent”-решениями, Ace существенно быстрее, точнее и ближе к реальному взаимодействию с интерфейсами.

Видимо, если вы все еще не освоили коммерческую разработку ИИ-Агентов на n8n, можно не торопиться, а подождать выхода Ace. Этот ИИ-Агент будет весь день двигать блоки за вас, а ночью искать клиентов.
Кстати, попросить ранний доступ в сервис можно тут.

А ну и ждем китайцев с их ответом, опенсорсным и бесплатным, конечно же.

20🔥16❤12👍7💯2😁1💊1

7.79K viewsedited 13:30