Forwarded from Уставший техдир
12 Factor Agents - принципы разработки агентов
По следам от 12 Factor Apps, Декстер Хорти собрал ключевые принципы по разработке агентов, делюсь!
1) Преобразование естественного языка в вызовы инструментов. Агент интерпретирует команды в формализованные вызовы функций, а исполняет их — детерминированный код
2) Владей своими промптами (как кодом). Промпт — это артефакт. Его надо хранить, версионировать, тестировать и относиться к нему не как к важной части кода.
3) Управляй контекстом агента. Активно контролируй, что попадает в это окно. Убирай уже не нужное, суммаризируй, оставляй важное, выделяй ограниченные слоты под фичи — внимание модели ограниченно.
4) Вызов тулинга — это просто JSON. LLM генерирует название тула и параметры, остальное должен делать ваш детерминированный вход. Модель решает "что делать", а ваше приложение "как делать"
5) Держи тех.состояние и бизнес состояние вместе. Каждый шаг агента — это и логика, и данные. Всё в одном состоянии, чтобы потом не ковыряться по логам в поисках, где оно сломалось
6) API для управление циклом агента. Агент должен иметь простой API для запуска, приостановки и возобновления работы, уметь вставать на паузу и возвращаться к работе спустя время на каждом этапе жизненного цикла
7) Запрос к человеку — как инструмент. Любое обращение в процессе работы к человеку должно быть представлено агенту, как инструмент
8) Явно контролируйте логику исполнения. Модель лишь "говорит" что, а твой код решает стоит ли выполнять, когда и как.
9) Добавляйте ошибки исполнения инструментов в контекст. Если что-то упало, сократи информацию и добавь это в контекст агента. Пусть модель сама догадается, что дальше: повторить, спросить или изменить стратегию
10) Используйте малых специализированных агентов. Лучше много маленьких агентов, решающих узконаправленные задачи, чем один перегруженный агент всего
11) Доставляй агентов в любые интерфейсы, удобные пользователю. Slack, Telegram, веб, CLI — неважно. Главное — единый API и омниканальность. Пользователь не должен думать, где общаться с агентом. Он просто должен это делать.
12) Агент как Stateless Reducer. На входе — состояние и запрос. На выходе — новое состояние и ответ. Всё как в хорошем Redux. Никакого собственного внутреннего состояния, он должен работать как чистая функция
Бонус:
13) Предзагрузи все необходимое. Агент не должен постоянно дёргать одни и те же данные. Наполняй контекст тем, что почти наверняка пригодится.
Репа: https://github.com/humanlayer/12-factor-agents
Доклад: https://www.youtube.com/watch?v=8kMaTybvDUw
По следам от 12 Factor Apps, Декстер Хорти собрал ключевые принципы по разработке агентов, делюсь!
1) Преобразование естественного языка в вызовы инструментов. Агент интерпретирует команды в формализованные вызовы функций, а исполняет их — детерминированный код
2) Владей своими промптами (как кодом). Промпт — это артефакт. Его надо хранить, версионировать, тестировать и относиться к нему не как к важной части кода.
3) Управляй контекстом агента. Активно контролируй, что попадает в это окно. Убирай уже не нужное, суммаризируй, оставляй важное, выделяй ограниченные слоты под фичи — внимание модели ограниченно.
4) Вызов тулинга — это просто JSON. LLM генерирует название тула и параметры, остальное должен делать ваш детерминированный вход. Модель решает "что делать", а ваше приложение "как делать"
5) Держи тех.состояние и бизнес состояние вместе. Каждый шаг агента — это и логика, и данные. Всё в одном состоянии, чтобы потом не ковыряться по логам в поисках, где оно сломалось
6) API для управление циклом агента. Агент должен иметь простой API для запуска, приостановки и возобновления работы, уметь вставать на паузу и возвращаться к работе спустя время на каждом этапе жизненного цикла
7) Запрос к человеку — как инструмент. Любое обращение в процессе работы к человеку должно быть представлено агенту, как инструмент
requestClarification(message:string)8) Явно контролируйте логику исполнения. Модель лишь "говорит" что, а твой код решает стоит ли выполнять, когда и как.
9) Добавляйте ошибки исполнения инструментов в контекст. Если что-то упало, сократи информацию и добавь это в контекст агента. Пусть модель сама догадается, что дальше: повторить, спросить или изменить стратегию
10) Используйте малых специализированных агентов. Лучше много маленьких агентов, решающих узконаправленные задачи, чем один перегруженный агент всего
11) Доставляй агентов в любые интерфейсы, удобные пользователю. Slack, Telegram, веб, CLI — неважно. Главное — единый API и омниканальность. Пользователь не должен думать, где общаться с агентом. Он просто должен это делать.
12) Агент как Stateless Reducer. На входе — состояние и запрос. На выходе — новое состояние и ответ. Всё как в хорошем Redux. Никакого собственного внутреннего состояния, он должен работать как чистая функция
Бонус:
13) Предзагрузи все необходимое. Агент не должен постоянно дёргать одни и те же данные. Наполняй контекст тем, что почти наверняка пригодится.
Репа: https://github.com/humanlayer/12-factor-agents
Доклад: https://www.youtube.com/watch?v=8kMaTybvDUw
YouTube
12-Factor Agents: Patterns of reliable LLM applications — Dex Horthy, HumanLayer
Hi, I'm Dex. I've been hacking on AI agents for a while.
I've tried every agent framework out there, from the plug-and-play crew/langchains to the "minimalist" smolagents of the world to the "production grade" langraph, griptape, etc.
I've…
I've tried every agent framework out there, from the plug-and-play crew/langchains to the "minimalist" smolagents of the world to the "production grade" langraph, griptape, etc.
I've…
✍9❤3⚡2👍2❤🔥1🫡1
Гайд по безопасности MCP от Semgrep
Semgrep выпустили руководство по уязвимостям MCP с детальными схемами атак, примерами и чеклистом для сервера и клиента.
Рассмотрены угрозы:
Tool Poisoning - вредоносные инструкции в описании инструментов, которые манипулируют поведением AI без ведома пользователя
Tool Shadowing - конфликт имён инструментов от разных серверов. AI может выбрать не тот инструмент или использовать невидимые символы для приоритезации выбора тулов
Rug-Pulling - валидный сервер заменяется вредоносным уже после прохождения одобрения потому, что спецификация не требует уведомлять об изменениях
Плюс классика Web 2.0:
Все старые добрые уязвимости актуальны: path traversal, SQL injection, request smuggling — только в новом контексте AI-агентов.
#MCP #Semgrep #cybersecurity
———
@tsingular
Semgrep выпустили руководство по уязвимостям MCP с детальными схемами атак, примерами и чеклистом для сервера и клиента.
Рассмотрены угрозы:
Tool Poisoning - вредоносные инструкции в описании инструментов, которые манипулируют поведением AI без ведома пользователя
Tool Shadowing - конфликт имён инструментов от разных серверов. AI может выбрать не тот инструмент или использовать невидимые символы для приоритезации выбора тулов
Rug-Pulling - валидный сервер заменяется вредоносным уже после прохождения одобрения потому, что спецификация не требует уведомлять об изменениях
Плюс классика Web 2.0:
Все старые добрые уязвимости актуальны: path traversal, SQL injection, request smuggling — только в новом контексте AI-агентов.
#MCP #Semgrep #cybersecurity
———
@tsingular
1👍4✍1
ArtCraft - новый генератор видео на базе редактора 3Д сцен
Интересный проект, который позволяет построить в редакторе полную 3Д или 2Д сцену и дальше по ней прогнать нейрорендер, получив на выходе максимально точную к замыслу реализацию, а не бесконечный перебор промптов.
Более того, товарищи обещают выложить все это в оупенсорс.
Получится такой вариант нейроБлендера.
Пока есть приложения для винды и для мака.
#Artcraft #нейрорендер
———
@tsingular
Интересный проект, который позволяет построить в редакторе полную 3Д или 2Д сцену и дальше по ней прогнать нейрорендер, получив на выходе максимально точную к замыслу реализацию, а не бесконечный перебор промптов.
Более того, товарищи обещают выложить все это в оупенсорс.
Получится такой вариант нейроБлендера.
Пока есть приложения для винды и для мака.
#Artcraft #нейрорендер
———
@tsingular
🔥15⚡4
This media is not supported in your browser
VIEW IN TELEGRAM
AgentBuilder - конкурент n8n от OpenAI
Сегодня в 20:00 мск смотрим презентацию на канале OpenAI
#AgentBuilder #OpenAI #n8n
------
@tsingular
Сегодня в 20:00 мск смотрим презентацию на канале OpenAI
#AgentBuilder #OpenAI #n8n
------
@tsingular
✍8🔥7
Apps SDK - OpenAI теперь запускает платформу для приложений.
С триггерами, МСР, данными и коннекторами к популярным приложениям.
- уже затянули Spotify, Coursera, Zillow, Figma, Canva
Поддерживает рендер веб страниц внешних сайтов внутри chatGPT и позволяет взаимодействовать с ними с ИИ.
Режим "диалога с приложениями"
Т.е. приложение, подключённое через МСР, превращается в своего рода агента внутри мультиагентной среды chatGPT
С точки зрения пользовательского опыта очень похоже на Comet browser от Perplexity - диалог с вебсайтами.
#OpenAi #SDK
———
@tsingular
С триггерами, МСР, данными и коннекторами к популярным приложениям.
- уже затянули Spotify, Coursera, Zillow, Figma, Canva
Поддерживает рендер веб страниц внешних сайтов внутри chatGPT и позволяет взаимодействовать с ними с ИИ.
Режим "диалога с приложениями"
Т.е. приложение, подключённое через МСР, превращается в своего рода агента внутри мультиагентной среды chatGPT
С точки зрения пользовательского опыта очень похоже на Comet browser от Perplexity - диалог с вебсайтами.
#OpenAi #SDK
———
@tsingular
👍5⚡2🔥2
AgentKit - noCode комбайн:
AgentBuilder - аналог n8n или даже langflow больше по стилю. есть работа с файлами, MCP, Guardrails, Human in the loop и циклы.
в редакторе сразу видно вывод каждого шага, - удобно для отладки (ака Flowise)
Публикация в прод сразу из окна редактора.
Сразу виден исходных код процесса.
ChatKit - виджет для быстрого создания чата с агентами
Evals - оценка действий агентов
работает прямо из AgentBuilder
#OpenAI #Agents
———
@tsingular
AgentBuilder - аналог n8n или даже langflow больше по стилю. есть работа с файлами, MCP, Guardrails, Human in the loop и циклы.
в редакторе сразу видно вывод каждого шага, - удобно для отладки (ака Flowise)
Публикация в прод сразу из окна редактора.
Сразу виден исходных код процесса.
ChatKit - виджет для быстрого создания чата с агентами
Evals - оценка действий агентов
работает прямо из AgentBuilder
#OpenAI #Agents
———
@tsingular
🔥6👍3⚡2
Codex выходит из режима Preview в режим полной доступности [GA]
Интеграция в Slack
Codex SDK - обновление
Enterprise controls
#Codex #OpenAI
———
@tsingular
Интеграция в Slack
Codex SDK - обновление
Enterprise controls
#Codex #OpenAI
———
@tsingular
👍4✍1
Sora2 доступна по API!!!
Самый дешёвый вариант - 10 секунд за $1
ну теперь можно забыть про живой интернет.
#Sora #OpenAI
———
@tsingular
Самый дешёвый вариант - 10 секунд за $1
ну теперь можно забыть про живой интернет.
#Sora #OpenAI
———
@tsingular
🤯9🔥4❤2
Media is too big
VIEW IN TELEGRAM
Вот уже пол года как Figure по 10 часов в день пашут на заводах собирая BMW X3.
#Figure #роботы
------
@tsingular
#Figure #роботы
------
@tsingular
🔥43🤨6⚡4❤4👍3👾3🤔1
AMD подписала контракт с OpenAI на поставку чипов с возможностью выкупа до 10% акций
OpenAI заключила многолетний контракт с AMD на поставку чипов на десятки миллиардов долларов ежегодно, с планами построить гигаваттный дата-центр на чипах MI450.
На фоне новости цены на акции AMD взлетели на 34% до $226.
Схема все интереснее и интереснее: сначала Nvidia вложила в OpenAI, а OpenAI сдала мощности обратно NVidia.
Теперь OpenAI инвестирует в AMD.
GPUroboros прирастает
#AMD #OpenAI
———
@tsingular
OpenAI заключила многолетний контракт с AMD на поставку чипов на десятки миллиардов долларов ежегодно, с планами построить гигаваттный дата-центр на чипах MI450.
На фоне новости цены на акции AMD взлетели на 34% до $226.
Схема все интереснее и интереснее: сначала Nvidia вложила в OpenAI, а OpenAI сдала мощности обратно NVidia.
Теперь OpenAI инвестирует в AMD.
GPUroboros прирастает
#AMD #OpenAI
———
@tsingular
🔥5⚡2👏2❤1🤔1🕊1
This media is not supported in your browser
VIEW IN TELEGRAM
К концу следующего года Grok будет генерить игры премиум качества в реальном времени.
В принципе это уже практически Матрица.
#Grok #нейрорендер
———
@tsingular
В принципе это уже практически Матрица.
#Grok #нейрорендер
———
@tsingular
😁8👍4💯2⚡1🔥1🕊1🫡1
Media is too big
VIEW IN TELEGRAM
Еще один пример который нейрорендер пока не сможет повторить достоверно.
началось все с
https://x.com/Jaenam97/status/1974927996898390144
продолжилось:
https://www.shadertoy.com/view/t3fcW7
Исходник html в комментарии
#dev #shaders
———
@tsingular
началось все с
https://x.com/Jaenam97/status/1974927996898390144
for(float d,i,s,w,l;++i<120.;o+=25.*d/s){vec3 p,q;q=p=vec3((FC.xy-r.xy/2.)/r.y*d,d-.5);p.yz*=rotate2D(t*.1),p.xz*=rotate2D(t*.1);w=8.;for(int i;i++<5;w*=l)p*=l=1.8/dot(p=sin(p),p);d+=s=max(length(q)-.3,length(p.xz)/w);}o=tanh((vec4(1,2,3,1)*o)/2e7);продолжилось:
https://www.shadertoy.com/view/t3fcW7
Исходник html в комментарии
#dev #shaders
———
@tsingular
👍8🔥7⚡3
Forwarded from КОМПЬЮТЕРРА
Deloitte призналась в использовании ИИ-инструментов и согласилась вернуть деньги правительству Австралии из-за «галлюцинаций» в отчете
В декабре прошлого года Министерство занятости и трудовых отношений Австралии поручило Deloitte провести независимую аудиторскую проверку за 439 тыс. австралийских долларов (около 24 млн рублей).
Консалтинговый гигант должен был оценить проблемы в системе социального обеспечения, связанные с автоматическим наказанием соискателей.
В августе издание Australian Financial Review сообщило, что документ содержит множество ошибок. Например, в нем оказались ссылки на несуществующие научные работы Сиднейского и Лундского университетов, а также вымышленные рекомендации «профессоров».
После внутренней проверки Deloitte признала факт использования генеративного ИИ и согласилась вернуть правительству последнюю часть гонорара.
«В наших проектах по-прежнему ключевую роль играет человек. Автоматизация применяется точечно и только там, где это действительно оправдано. Мы не против ИИ — мы за разумный баланс. Автоматизация — да, полная замена аудитора — категорически нет. Ошибки в отчетах по ИБ могут привести к серьезным последствиям», — резюмирует эксперт.
☁️ Главное о технологическом бизнесе
В декабре прошлого года Министерство занятости и трудовых отношений Австралии поручило Deloitte провести независимую аудиторскую проверку за 439 тыс. австралийских долларов (около 24 млн рублей).
Консалтинговый гигант должен был оценить проблемы в системе социального обеспечения, связанные с автоматическим наказанием соискателей.
В августе издание Australian Financial Review сообщило, что документ содержит множество ошибок. Например, в нем оказались ссылки на несуществующие научные работы Сиднейского и Лундского университетов, а также вымышленные рекомендации «профессоров».
После внутренней проверки Deloitte признала факт использования генеративного ИИ и согласилась вернуть правительству последнюю часть гонорара.
«Сегодня многие бездумно внедряют ИИ — особенно в консалтинге. Это понятно, ведь сокращение сроков и кастов выглядит как мечта, которую можно реализовать «по щелчку». Не исключение и ИБ-консалтинг. Проблема в том, что ответственность за результат при этом размывается, а отчеты, созданные с помощью ИИ, часто вычитываются поверхностно и людьми, не знакомыми с фактурой проекта».
Александр Зубриков, CEO ITG Security
«В наших проектах по-прежнему ключевую роль играет человек. Автоматизация применяется точечно и только там, где это действительно оправдано. Мы не против ИИ — мы за разумный баланс. Автоматизация — да, полная замена аудитора — категорически нет. Ошибки в отчетах по ИБ могут привести к серьезным последствиям», — резюмирует эксперт.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥5👏5❤3🤣3🏆2
Sora2 и Sora2-pro появились в aitunnel.ru
Оперативно товарищи подсуетились и теперь новый ИИ генератор доступен по API с оплатой рублями без необходимости менять геолокацию.
Цены, понятное дело, чуть дороже, чем напрямую, но зато удобно.
#Sora #aitunnel
------
@tsingular
Оперативно товарищи подсуетились и теперь новый ИИ генератор доступен по API с оплатой рублями без необходимости менять геолокацию.
Цены, понятное дело, чуть дороже, чем напрямую, но зато удобно.
#Sora #aitunnel
------
@tsingular
✍9🔥4⚡2🆒2
This media is not supported in your browser
VIEW IN TELEGRAM
Google выпустил Gemini 2.5 Computer Use - модель для управления браузером
Gemini 2.5 теперь умеет самостоятельно работать в браузере: кликает, скроллит, заполняет формы.
Модель выпущена через Project Mariner и доступна в API.
По словам Google, обходит конкурентов на бенчмарках веб-автоматизации.
Есть детальная карточка модели, с описаниями гардрэйлов и методов обеспечения безопасности.
Попробовать можно тут
Итого у нас уже Comet от Перплексити, Соннет 4.5 и OpenAI CU и вот теперь Gemini CU
#Gemini #BrowserAutomation
———
@tsingular
Gemini 2.5 теперь умеет самостоятельно работать в браузере: кликает, скроллит, заполняет формы.
Модель выпущена через Project Mariner и доступна в API.
По словам Google, обходит конкурентов на бенчмарках веб-автоматизации.
Есть детальная карточка модели, с описаниями гардрэйлов и методов обеспечения безопасности.
Попробовать можно тут
Итого у нас уже Comet от Перплексити, Соннет 4.5 и OpenAI CU и вот теперь Gemini CU
#Gemini #BrowserAutomation
———
@tsingular
✍10⚡3👍2🔥2
О пользе просвещения.
82% пользователей chatGPT не используют никакие другие ИИ решения.
только 2.5% пробовали другие пару сайтов.
Интерция мышления у людей делает необходимым рассказы о том как вскипятить воду. :)
#statistic #similarweb
———
@tsingular
82% пользователей chatGPT не используют никакие другие ИИ решения.
только 2.5% пробовали другие пару сайтов.
Интерция мышления у людей делает необходимым рассказы о том как вскипятить воду. :)
#statistic #similarweb
———
@tsingular
👍7⚡3✍3
Интересное исследование от МФТИ по рынку ИИ в России.
Оценка рынка ИИ в РФ превысила 1 трлн.
Обработка естественного языка. -63% решений. Главный тренд.
ИИ агенты - новый тренд.
По факту исследование фиксирует статус на конец 2024го года.
Сейчас, в конце 2025го выглядит немного устаревшим.
Уже и новые тренды сформировались и про увольнения из-за ИИ говорят меньше - в основном происходит замещение ролей, а тех, кого уволили, пытаются вернуть :).
Т.е. в целом штатка количественно не меняется.
Ну и по остальным пунктам тренды уже скорректировались, но как срез на 2024 посмотреть интересно.
Опять же полезно изучить перечень инициатив, компаний и гос. программ.
Само исследование в комментарии.
Сайт-источник данных - https://airussia.online
#airussia #отчеты
———
@tsingular
Оценка рынка ИИ в РФ превысила 1 трлн.
Обработка естественного языка. -63% решений. Главный тренд.
ИИ агенты - новый тренд.
По факту исследование фиксирует статус на конец 2024го года.
Сейчас, в конце 2025го выглядит немного устаревшим.
Уже и новые тренды сформировались и про увольнения из-за ИИ говорят меньше - в основном происходит замещение ролей, а тех, кого уволили, пытаются вернуть :).
Т.е. в целом штатка количественно не меняется.
Ну и по остальным пунктам тренды уже скорректировались, но как срез на 2024 посмотреть интересно.
Опять же полезно изучить перечень инициатив, компаний и гос. программ.
Само исследование в комментарии.
Сайт-источник данных - https://airussia.online
#airussia #отчеты
———
@tsingular
❤7👍7⚡2🔥1
Media is too big
VIEW IN TELEGRAM
🚀 RF-DETR от Roboflow - новый лидер анализа видео в реальном времени
Roboflow выкатили трансформер, который переплюнул все YOLO по точности при сопоставимой скорости.
RF-DETR-M на 576x576 даёт 54.7 AP при 4.52ms скорости - это новый потолок для real-time детекторов.
Плюс превью сегментации: RF-DETR Seg в 3 раза быстрее самой большой YOLO при большей точности.
Техническая начинка:
- Четыре размера: Nano, Small, Medium
- Apache 2.0 лицензия — берите и дообучайте под себя
- optimize_for_inference() даёт 2x буст скорости из коробки
- Обучение на кастомных датасетах через rfdetr package
- Интеграция с Roboflow Inference для деплоя
Зачем это нам:
- Производственные линии: контроль качества в реальном времени с минимальной задержкой
- Розница: счётчики товаров на полках с точностью enterprise-уровня
- Автономныемирные системы: детекция объектов там, где каждая миллисекунда критична
Код предельно простой — 10 строк и у вас работающая детекция.
Если нужна сегментация — меняете модель на rfdetr-seg-preview.
Короче пока вы тут в генИИ развлекаетесь, - ML ускакал далеко вперёд и выглядит как реально полезная штука в любых сценариях использования.
Как в гражданских, так и в не.
#RFDETR #ComputerVision #Roboflow #ObjectDetection
———
@tsingular
Roboflow выкатили трансформер, который переплюнул все YOLO по точности при сопоставимой скорости.
RF-DETR-M на 576x576 даёт 54.7 AP при 4.52ms скорости - это новый потолок для real-time детекторов.
Плюс превью сегментации: RF-DETR Seg в 3 раза быстрее самой большой YOLO при большей точности.
Техническая начинка:
- Четыре размера: Nano, Small, Medium
- Apache 2.0 лицензия — берите и дообучайте под себя
- optimize_for_inference() даёт 2x буст скорости из коробки
- Обучение на кастомных датасетах через rfdetr package
- Интеграция с Roboflow Inference для деплоя
Зачем это нам:
- Производственные линии: контроль качества в реальном времени с минимальной задержкой
- Розница: счётчики товаров на полках с точностью enterprise-уровня
- Автономные
Код предельно простой — 10 строк и у вас работающая детекция.
Если нужна сегментация — меняете модель на rfdetr-seg-preview.
Короче пока вы тут в генИИ развлекаетесь, - ML ускакал далеко вперёд и выглядит как реально полезная штука в любых сценариях использования.
Как в гражданских, так и в не.
#RFDETR #ComputerVision #Roboflow #ObjectDetection
———
@tsingular
🔥10✍4⚡2❤1
Посмотрим что есть для ML&AI
Online: https://techday.selectel.ru/
#Selectel #конференции
------
@tsingular
Online: https://techday.selectel.ru/
#Selectel #конференции
------
@tsingular
✍5⚡3👍2