FastNews | Никита Пастухов
783 subscribers
63 photos
1 video
118 links
Привет! Я - Никита Пастухов: автор FastStream, опенсорсер, python (и не только) разработчик

Здесь я пишу обо всем, что мне интересно:
- создание продуктов
- личная эффективность
- программирование
- Open Source

Чатик по FastStream: @python_faststream
Download Telegram
И вот я снова спотыкаюсь о то, что так и не прочитал талмуд по теории конечных автоматов😢

Не совершайте моих ошибок, читайте классику
7🫡6💯2
Я не знаю, что это за говно, но кто-то выложил копию репы нашего проекта dishka-faststream

Все ссылки в README ведут на скачивание архива, который забит вредоносным говном

ОСТОРОЖНО, ССЫЛКА НА ВРЕДОНОСНУЮ РЕПУ

⚠️⚠️⚠️ https://github.com/techverseitbd/dishka-faststream ⚠️⚠️⚠️

И сам репорт о содержимом архива в ней - https://www.virustotal.com/gui/file/87011908d0f82a2ce0676a2f82a8f202bb0f1fa83fbf60e05b59a3f96d466b3a?nocache=1

Прошу всех накидать репортов на этого юзера на Github, чтобы его скорее забанили, а репу снесли
😁13🤯10🫡7🤬2😱1🙏1👌1🤡1
FastNews | Никита Пастухов
Наконец-то в AG2 вышел первый крупный релиз, который подготовил я! Всего каких-то 6 недель работы😎 Это 0.10.0 релиз с поддержкой A2A протокола взаимодействия между распределенными агентами - теперь мультиагентные системы можно разносить по разным хостам …
Кажется, сейчас не очень много людей понимает, что такое агенты, агентные приложения, мультиагентные системы и тд

Раз уж я сейчас сильно погружен в эту сферу, то постараюсь накидать вам контекста, чтобы мы были на одной волне

В ближайшее время расскажу про:
1. Агентные системы и чем они отличаются от обычных
2. Как устроен констекст агента
3. Сабагенты и мультиагенты
4. Распределенные агентные системы и зачем они нужны

Выкатываю анонс просто чтобы было обязательство перед вами😅

Но вообще - киньте 👍 если надо про такое рассказывать или 🤡 если агенты никому не уперлись
👍125🤡64🔥3🍌2🗿2❤‍🔥1🌭1🤝1🫡1
Как и обещал, начинаю серию постов про AI-агентов. Давайте разберемся, чем "агентная система" отличается от привычных нам приложений.

Чтобы было понятнее, разделим весь софт на три категории.

1️⃣ Традиционные приложения (Жесткая логика)

Это 99% кода, который мы писали до недавнего времени.

- Как работает: if-then-else. Поведение программы полностью детерминировано и захардкожено разработчиком. Получили запрос -> сходили в базу -> отдали JSON. Каждый шаг заранее известен.
- Пример: Ваш интернет-банк, git, большинство веб-сервисов.

Программа — это исполнитель четких инструкций. Она не может сделать ничего, что разработчик не предусмотрел.

2️⃣ Приложения с LLM (LLM как "фича")

Это то, что мы видим сейчас повсеместно. Берем обычное приложение и вкручиваем в него LLM для решения конкретной, узкой задачи.

- Как работает: Основная логика все еще жесткая, но в определенный момент мы делаем вызов к LLM. "Суммаризируй этот текст", "Переведи это на английский", "Сгенерируй описание товара по характеристикам".
- Пример: Чат-бот поддержки на сайте, который отвечает на вопросы по базе знаний. Функция "AI-рерайт" в вашем текстовом редакторе.

LLM здесь — это просто очень умная функция, которую мы вызываем. Она не управляет процессом, она просто выполняет свою часть работы и возвращает результат в основную, все еще детерминированную, программу.

3️⃣ Агентные системы (LLM-"мозг" + руки-"инструменты")

А вот тут начинается самое интересное. В агентной системе LLM — это уже не просто функция, а ядро, принимающее решения

Как работает: Агент получает от пользователя не инструкцию, а цель. Например, "Забронируй мне столик на двоих в итальянском ресторане в центре на завтрашний вечер". Дальше агент сам решает, что делать исходя из цели и своих возможностей ("инструментов"):
- Cначала мне нужно найти итальянские рестораны в центре. Для этого я воспользуюсь инструментом 'поиск в Yandex Maps'
- Теперь мне нужно проверить их рейтинг и отзывы. Я вызову инструмент 'просмотр карточки организации'
- Отлично, я выбрал 'La Bella Vita'. Теперь мне нужно забронировать столик.Я вызову инструмент 'API бронирования' с параметрами: 2 человека, дата, время
- Бронирование подтверждено. Сообщу результат пользователю
- Создам событие в календаре используя инструмент 'API календаря' с параметрами: название, дата, время, место.

Обратите внимание, что разработчик такой системы не определял последовательность шагов заранее. Агент сам решил, что и в каком порядке делать чтобы достичь поставленной цели.

Агент — это автономная система, которая имеет цель, доступ к набору инструментов (API, функции, другие агенты) и цикл принятия решений (ReAct). Он сам строит план, выполняет его по шагам, анализирует результаты и корректирует план, пока не достигнет цели.

Ключевое отличие: в приложении с LLM вы говорите, что делать. В агентной системе вы говорите, чего хотите достичь, а агент сам решает, как это сделать.

Почему за этим будущее?

- Для пользователя: Это удобнее. Можно ставить задачи в свободной форме, не задумываясь о деталях.
- Для разработчика: Это проще в долгосрочной перспективе. Вместо того чтобы реализовывать все возможные user flow, мы даем агенту набор "кубиков" (инструментов), из которых он сам строит решение.

К тому же, агентные системы легко собираются из уже существующих сервисов. Просто заворачиваешь свой API в MCP-совместимую обертку - и весь его функционал становится доступен агентам.

Так, например, уже делает AWS: чтобы вы могли не париться с terraform, а просто запустить ChatGPT с доступом к AWS API и он сам будет создавать инфраструктуру для вас потратит все ваши бабки😂

#AI #LLM #агенты
1🔥23👍54😢1💩1
Если кто не слышал, Google дропнули сегодня Gemini-3-Pro-Preview - ее уже можно попробовать в Google AI Studio, Cursor и где-то там еще

А утекшая карточка с бенчмарками модели говорит, что моделька на голову лучше текущих флагманов...

И - это ПРАВДА. До этого я старался все "тяжелые" запросы в Cursor прогонять через Claude 4.5-sonnet, но сегодня я весь вечер сижу за Gemini-3 - и это совсем другой уровень🤯

Модель буквально с первого промпта точно понимает, что нужно сделать, как, и отлично ориентируется в развесистой кодовой базе. Я еще не бенчил ее на сложных проектах с TDD, но на реальном рабочем CRUDо-подобном проекте она показывает себя просто великолепно. Я закрыл все свои задачи на сегодня не переходя в режим IDE😅

Блин, если бы не лимиты Cursor, я бы все время сидел на этой модели. Чтож, замена кодеров становится все ближе каждый месяц

К слову, Google дропнули еще и свою AI-IDE. Не знаю, есть ли там ограничения на Gemini3, но пока раздают бесплатно- https://antigravity.google/
🔥12💩52👍1😢1
Контекст агента: почему LLM "тупит"

В прошлый раз мы выяснили, что агент — это "мозг" (LLM) + "руки" (инструменты). На самом деле мне хочется плакать от такого упрощения😢
Но чтобы этот мозг работал, ему нужна память. А то он забудет, что вообще просили его сделать. В мире LLM эта память называется контекстом.

Контекст - это всё, что модель видит в одном-единственном API-запросе. Когда вы "продолжаете диалог" с ChatGPT, на самом деле ваше приложение каждый раз отправляет ему всю предыдущую историю заново. И именно от того, что и как мы положим в этот контекст, зависит, будет ли агент умным или не очень помощником

Из чего состоит "контекст" агента?

Когда агент решает задачу, в его "голову" (промпт) загружается целый набор данных:

1️⃣ System Prompt (Личность и инструкция): "Ты — AI-ассистент для разработчиков. Твоя задача — помогать с кодом. Будь краток и точен". Это его внутренний устав
2️⃣ Инструменты: Спецификации всех доступных ему "рук". "Ты можешь вызвать file_system.read_file(path: str) для чтения файла..." и тд
3️⃣ Цель (User-prompt): Исходная задача от пользователя. "Найди все использования функции process_user в проекте"
4️⃣ История диалога и вызовов: Все предыдущие шаги. "Я уже вызывал find_usages и получил вот такой результат..."
5️⃣ План/Мысли: "Внутренний монолог" агента. "Окей, я нашел два файла. Теперь мне нужно их прочитать, чтобы понять контекст использования"

Все это склеивается в один гигантский текстовый промпт и отправляется в LLM.

Проблема №1: Перегрузка инструментами

А теперь представьте, что вы дали агенту 1000 инструментов. Спецификация каждого из них — это, по сути, кусок документации. И каждый этот кусок длиннее исходного промпта пользователя. В итоге 99% контекста будет забито этим "справочником", и на сам диалог, историю и мысли агента просто не останется места.

Я лично видел, когда агенту давали 150 MCP инструментов и он вообще не понимал, что пользователь его попросил. Он просто начал вызывать инструменты по кругу без всякой системы. Просто потому что знает, как это делать😎

Вывод: Эффективный агент — это не тот, у кого больше инструментов, а тот, кому в нужный момент дают только релевантные.

На практике: я вообще не использую MCP инструменты при работе с Cursor / ChatGPT. Я вручную указываю какие инструменты будут доступны агенту как часть промпта при необходимости.

Проблема №2: "Потеря в середине" (Lost in the Middle)

Но даже если контекст не перегружен, есть еще одна фундаментальная проблема. Исследователи из Стэнфорда выяснили, что LLM лучше всего обращают внимание на начало и конец контекста, а информация в середине часто "теряется" или игнорируется.

Это похоже на то, как мы читаем длинную статью: вступление и выводы мы запоминаем хорошо, а вот детали из середины — уже смутно.

В своем исследовании они наглядно показали этот эффект. Модель должна была найти нужный факт в длинном документе. Когда факт находился в начале или в конце — точность была >90%. Когда тот же факт перемещали в середину — точность падала до 60-70%.

Что это значит для нас?

При проектировании агентов мы должны быть хитрее. Самую важную информацию (например, последнюю цель пользователя или критически важный результат вызова инструмента) нужно размещать в конце контекста, прямо перед тем, как попросить модель сделать следующий шаг.

Управление контекстом — это ключевой навык в создании агентов. Это не просто "запихнуть все в промпт", а организация информации так, чтобы "мозг" всегда имел под рукой то, что нужно, и не отвлекался на мусор.

В общем-то поэтому иногда проще дропнуть чат и начать заново с другого промпта, чем пытаться "вырулить" в правильном направлении.

#AI #LLM #агенты
🔥8👍41
Сиолошная
Вышел Cursor 2.0, и переход к новой мажорной версии сделан не просто так. Теперь вдобавок к режиму IDE (среде разработки) добавлен режим Agent. Он сфокусирован и изначально задизайнен с акцентом на агентов, а не на файлы. Когда вам необходимо погрузиться…
Изначально я не оценил встроенный в Cursor 2 браузер. У меня были большие сомнения, что в маленьком окошке IDE получится нормально работать с сайтом (у меня 14' мак). Но оказалось - работает и правда удобно🤯

Можно просто выбрать нужный элемент прям на сайте и тегнуть его в задаче. Оч удобно, чтобы объяснить агенту, что именно ты хочешь поправить на фронте. А если тегать визуальный элемент + компонент его реализации - то вообще пушка. В общем, рекомендую👍

#cursor
8👍5
Убил пару часов залипая на карту Github: https://anvaka.github.io/map-of-github/

Какой-то чувак спарсил все проекты и построил зависимости между ними по общим людям, которые поставили звезды. Очень удобно, когда ты выбираешь альтернативный инструмент - можно ткнуть в него и посмотреть, какие +- аналоги лайкают люди.

Например, я узнал, что на FastStream поставили звездочки 3 категории людей:
1. подписчики Соболева❤️
2. любители смузи-стека - Robyn, polyfactory, msgspec, litestar, granian
3. Те, кто реально искал очереди - Faust, taskiq, arq

А еще раскопал 100500 некро-DI проектов для python😅

В общем, рекомендую позалипать - мб тоже что интересное найдете.

А ссылку стащил с канала человека, который на меня подписался - https://t.iss.one/dotrubic/218
Да, я иногда сталкерю всех подписчиков и отписчиков тоже🌚
👍18🔥104🌚1
FastNews | Никита Пастухов
Если кто не слышал, Google дропнули сегодня Gemini-3-Pro-Preview - ее уже можно попробовать в Google AI Studio, Cursor и где-то там еще А утекшая карточка с бенчмарками модели говорит, что моделька на голову лучше текущих флагманов... И - это ПРАВДА. До…
Антропик не отстают и дропнули Claude 4.5 Opus - https://www.anthropic.com/news/claude-opus-4-5

Забавно, но по их бенчам Claude 4.5 Sonnet показывает себя лучше Gemini 3 Pro (которым я восторгаюсь всю последнюю неделю). Там даже GPT 5.1 себя лучше показывает😑

По моим субъективным оценкам, Gemini 3 - топ прямо сейчас. Хотя, модель заметно деграднула с момента релиза.

В общем, все крупные игроки сделали свой ход - Gemini-3, GPT-5.1, Claude 4.5 Opus. Теперь очередь за опенсорсными моделями, правда ведь?😢

Btw, спешу напомнить, что в том году Цукерберг схантили около 20ти топ-ресечеров OpenAI (которые работали над релизом GPT 4), чтобы делать собственные тир-1 модельки... Кто-нибудь в курсе, чем история закончилась? А то не видно ничего
👍4🔥31
FastNews | Никита Пастухов
Антропик не отстают и дропнули Claude 4.5 Opus - https://www.anthropic.com/news/claude-opus-4-5 Забавно, но по их бенчам Claude 4.5 Sonnet показывает себя лучше Gemini 3 Pro (которым я восторгаюсь всю последнюю неделю). Там даже GPT 5.1 себя лучше показывает😑
А еще Anthropic продолжают развивать MCP (если кто не знал, они его и придумали)

Например, теперь они предлагают вместо указания всех MCP инструментов в контексте, указать только 1 инструмент - Tool Search Tool

When Claude needs specific capabilities, it searches for relevant tools. The Tool Search Tool returns references to matching tools, which get expanded into full definitions in Claude's context.

У меня, конечно, большой вопрос к качеству такой систему - насколько эффективно агент будет угадывать, что в Tool Search Tool будет нужный ему инструмент... Вангую, что агент начнет ходить в него на каждый вызов чисто на всякий случай. А это замедлит работу агента и приведет к доп тратам токенов...

В любом случае круто, что агенты продолжают развиваться и улучшения попадают именно в наиболее критичные места

А вот полная статья (там еще приколы есть): https://www.anthropic.com/engineering/advanced-tool-use
👍6🔥3
Сегодня утром мою девушку "приятно" удивила СМС-ка от Госуслуг с попыткой входа в аккаунт. Насколько я понял, чтобы эта СМС пришла, нужно чтобы злоумышленник уже знал ваш пароль.

Из плюсов Госуслуг:
- можно посмотреть все авторизованные сессии
- можно посмотреть историю входов в акаунт
- можно посмотреть историю действий в аккаунте

Так что мы зашли, увидели, что злоумышленник в ЛК так и не попал, и чутка успокоились. Потом по стандарту пошли менять пароль (и на всех аккаунтах, где оказался такой же пароль), а потом я увидел, что Госуслуги позволяют привязать TOTP вместо СМС-ки в качестве второго фактора!!! В удивительном мире технологий теперь живем😎

В общем, мы оба привязали в Госуслугах TOTP, а потом прошлись по всем остальным учеткам на всех возможных сервисах - и тоже врубили TOTP везде, где можно. Хорошо, что технологии добрались почти до всех соцсетей, мессенджеров и сервисов - можно больше не ждать дурацкие письма, смски или пуши. И меньше бояться, что аккаунт уведут - в похищенные СМС я верю больше, чем в украденный секрет от TOTP.

Рекомендую всем тоже подключить себе второй фактор в виде TOTP (и отключить СМС), а разработчикам сервисов - подумать о безопасности и внедрить его поддержку + показывать пользователям историю входов в аккаунт.
🔥16👍4😱1
Ребят, Дуров выпустил СЛОП^2 - это БЛОКЧЕЙН для ИИ - https://cocoon.org/😎

Очень странная попытка реабилитировать TON. Не уверен, что держатели видюх готовы будут сдавать свои железяки в аренду за тг-кибер-фантики. Но наблюдать за его активностями как минимум интересно

Как минимум идея анонимных запросов к AI звучит неплохо
1🤯9👏1🥴1
У меня тоже есть SLOP-дроп для вас😎

AG2 анонсит свой первый коммерческий продукт для массового пользователя

Когда-нибудь я смогу объяснить в 2ух словах, как это работает😢 А пока надо дописать пост про мультиагенты, чтобы подвести к этой мысли
👍91🔥1
AI для Всех
С момента: «Давайте люди точно смогут убежать от роботов» до «Оно бежит быстрее человека» прошло меньше 2х лет. На видео можно полюбоваться на Optimus 2.5 от Tesla и на новенького Figure 3. Welcome to the age of robots
Я не понимаю, какого черта половина компаний делает мозги для роботов, а вторая половина - ТЕЛА!? Они что-то знают, чего не знаем мы?

Btw, помнится года 2 назад кричать об AI-safety было модно. И Маск был одним из первых. А теперь вон, роботов штампует😕
😁5🌚1
Это какой-то жесткий булинг опенсорсеров от Orable😭

https://oracle.github.io/agent-spec/25.4.1/changelog.html
🤣16😁3🤡3
Если вы пользуетесь TopNotch на MacOS, чтобы спрятать этот гребаный статус-бар, то у вас он наверняка тоже сломался при обновлении на LiquidAss. Меня это порядком задолбало - и я потратил час своего времени, чтобы настроить эту шляпу. Или снести, ведь все равно не работает🗿

Long story short - оказалось, что приложуха в целом работает, но как-то через раз. Если вы используете динамические MacOS обои (даже если вы их переключили в статику) - оно сходит с ума. Лично у меня стояли Monterey static dark обои - и TopNotch скрывал мне только половину статус-бара. НО!!! С кастомными обоями приложуха работает замечательно. Поэтому что? Качаем свои же Monterey обои картинкой - ставим "кастомную" обоину - и радуемся рабочему TopNotch

Если я помог хоть одному такому же мученику - я счастлив☺️
А если кто сидит на MacOS без TopNotch - крайне рекомендую поставить
👍5😱2
Если кто-то занимается разработкой агентных приложений (или просто LLM-based) и волнуется на тему безопасности, то у меня для вас есть полезный сканер от NVIDIA

https://github.com/NVIDIA/garak/

Это штука неплохо находит prompt injection, system prompt leaking, jailbreak'и и прочие радости AI-based приложений. И - оно правда работает (парочку уязвимостей мы им нашли😢)

Только не надо его натравливать на приложения вайбкодеров... Пожалуйста
3👍16😁32🔥1
Linux Foundation запустили отдельную ветку - Agentic AI Foundation (AAIF)

https://www.linuxfoundation.org/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation

Туда уже задонатили MCP, goose и AGENTS.md (кто-нибудь вообще знал, что это не просто рандомное соглашение об именовании файла, а ФОРМАТ!?). Странно, что A2A не попал в этот список, хотя он тоже часть Linux Foundation. Мб просто не успели.

В общем, агентный хайптреин продолжает набирать ход. Очень хочется уже увидеть тот момент, когда мы наконец-то выработаем практики и технологии разработки агентных систем и телепортируемся в дивный новый мир AI ассистентов - правда, я уже более скептически отношусь к этой идее. А пока горбатимся дальше...
🤨3🗿2😢1
FastNews | Никита Пастухов
Изначально я не оценил встроенный в Cursor 2 браузер. У меня были большие сомнения, что в маленьком окошке IDE получится нормально работать с сайтом (у меня 14' мак). Но оказалось - работает и правда удобно🤯 Можно просто выбрать нужный элемент прям на сайте…
Cursor прошел фронтенд. Теперь точно🥳🎉

Ребята добавили в свой браузер возможность редактировать код через UI. Ты просто открываешь страницу, двигаешь кнопки туда-сюда, потом просишь нейронку применить изменения - и все взрывается работает...

https://cursor.com/blog/browser-visual-editor

Осталось найти фронтенд-проект, чтобы это потыкать. В общем, теперь ждем, когда backend заменят. Скорее, пожалуйста😢

#cursor
👍83🍾1