Вчера гугл сделал очень крутой релиз, выложив новую модель Gemini Flash для картинок. Я на ней залип, это очень крутая штука. А полученный тест-драйв упаковал в пост на хабре.
https://habr.com/ru/articles/941290/
https://habr.com/ru/articles/941290/
Хабр
Тест-драйв Nano Banana (Gemini 2.5 Flash Image): новый фотошоп и революция в редактировании изображений от Google
Вчера вышла модель Gemini 2.5 Flash Image (промо название Nano Banana), которая, возможно, изменит мир работы с изображениями так, как это сделал своим появлением фотошоп. В посте — много классных...
🔥11🍌2🦄2
Так как я сейчас занимаюсь по большей части агентами, то переименовал канальчик в Agentic World, планирую писать больше коротких, но интересных заметок про агентов, LLM, продукты и людей. А в качестве примера — бекстейдж того, как я подбирал аватарку.
Сначала хотелось сделать какой-то привычный мир, в котором часть работы взяли на себя агенты. Почему-то пришла в голову булочная. Но так как агенты работу забирают, но часто делают кривовасто, то хотелось отразить и это.
Сначала показалась удачная аналогия с симпсонами, как аналог перепопсованному миядзаки. Но не пошло.
Потом вспомнилось, как в генерашки удачно передается советский треш-колорит, но мой привычный генератор с этим не справился и вышла шляпа. Да и убитая общага — как будто бы чуть не то.
Полет мысли дальше — а что если взять атмосферу безнадеги ранних 90х и поместить туда роботов? Ведь чисто в теории, если они заберут у нас работу (хаха), то чисто гипотетически такое возможно?
Вышли две крутые картинки, не смог между ними выбрать и сгенерировал третью — чисто под аву. По-моему, вышло весело, доволен 😀
Сначала хотелось сделать какой-то привычный мир, в котором часть работы взяли на себя агенты. Почему-то пришла в голову булочная. Но так как агенты работу забирают, но часто делают кривовасто, то хотелось отразить и это.
Сначала показалась удачная аналогия с симпсонами, как аналог перепопсованному миядзаки. Но не пошло.
Потом вспомнилось, как в генерашки удачно передается советский треш-колорит, но мой привычный генератор с этим не справился и вышла шляпа. Да и убитая общага — как будто бы чуть не то.
Полет мысли дальше — а что если взять атмосферу безнадеги ранних 90х и поместить туда роботов? Ведь чисто в теории, если они заберут у нас работу (хаха), то чисто гипотетически такое возможно?
Вышли две крутые картинки, не смог между ними выбрать и сгенерировал третью — чисто под аву. По-моему, вышло весело, доволен 😀
👍3💅3❤1🤪1
Написал ещё одну статейку, на этот раз про то, как собрать browser-use на голой LLM 🤗
https://habr.com/ru/articles/943692/
https://habr.com/ru/articles/943692/
Хабр
Порулить браузером через LLM: пишем AI-агента в стиле «browser-use» на ванильной LLM без фреймворков
Привет! Не успел мир договориться, что вообще подразумевать под агентами, как в инфополе обычные агенты заменились аж сразу мультиагентными системами. Обычно большинство статей про агентов начинаются...
👍5🔥3👻1
С самого начала года у меня было желание забенчмаркать фреймворки для агентов. Но оказалось, что сравнить их все вместе не самая простая задачка. Ее я и попытался решить в новой статейке на хабре, где описана задача, сложности и в конце — большой обзор на все более-менее известные на сейчас фреймворки.
https://habr.com/ru/articles/953226/
https://habr.com/ru/articles/953226/
Хабр
Зоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение
Привет! В этой статье я детально разберу основные фреймворки для AI-агентов, попробую их побенчить и детально распишу их плюсы и минусы. Если вы подступались к агентам, то первым вопросом наверняка...
👍6👀2🔥1
Неделю назад OpenAI выкатили свой новый протокол Agentic Commerce Protocol, который позволяет продавцам сгружать товары в ChatGPT, а пользователя этим товары нативно покупать.
Сам протокол достаточно понятен: есть товарные фиды, есть три эндпоинта, которые фиксируют заказ, выдают rich-state-cart (то есть всю инфу о транзакции за раз), есть интересный момент про одноразовые токены, жестко привязанные к продавцу и товару.
Штука интересна даже не столько сама по себе, сколько тем, что очень похожую вещь в середине сентября выкатил Google, а значит американский бигтех очень верит в агентный/LLMный еком и это неизбежно отразится на всех нас.
Больше деталей в статье на хабре:
https://habr.com/ru/articles/953640/
Сам протокол достаточно понятен: есть товарные фиды, есть три эндпоинта, которые фиксируют заказ, выдают rich-state-cart (то есть всю инфу о транзакции за раз), есть интересный момент про одноразовые токены, жестко привязанные к продавцу и товару.
Штука интересна даже не столько сама по себе, сколько тем, что очень похожую вещь в середине сентября выкатил Google, а значит американский бигтех очень верит в агентный/LLMный еком и это неизбежно отразится на всех нас.
Больше деталей в статье на хабре:
https://habr.com/ru/articles/953640/
Хабр
ChatGPT как главный маркетплейс планеты: разбираем OpenAI Agentic Commerce Protocol
Не так давно OpenAI анонсировала Instant Checkout и затем опубликовала Agentic Commerce Protocol — два важных изменения, которые могут качественно повлиять на то, как будет выглядеть еком в ближайшие...
👍4❤1👏1
Пока ночью курсор пыхтел над моим одним интересным проектом, параллельно прочитал хорошую статью о методах оценки LLM, которую захотелось перевести на русский. Если вы так или иначе занимаетесь оценкой или разработкой LLM (а у меня половина окружения плюс-минус такое), то прям экстра-нового в ней ничего не будет, но как хорошая систематизация — вполне неплохо.
Но если тема оценок (или как модно говорить evals) интересна или хочется-таки на уровне фундамента понять как подбирать LLMку под себя, то может быть очень интересно.
https://habr.com/ru/articles/953684/
Но если тема оценок (или как модно говорить evals) интересна или хочется-таки на уровне фундамента понять как подбирать LLMку под себя, то может быть очень интересно.
https://habr.com/ru/articles/953684/
Хабр
Понимание оценки LLM: детальный разбор 4 основных подходов
Привет! Вчера вышла отличная статья от Себастьяна Рашки, которая детально разбирает основные способы оценки LLM-моделей. Глобально их можно разделить на 4 категории: оценка по бенчмаркам,...
👍4❤1
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Чот аж в голосину порвался с этой олимпиады
😁9👨💻2
Всегда было интересно насколько много накладных расходов генерит MCP. Поигрался на выходных с замерами и оформил статейку на хабре:
https://habr.com/ru/articles/956150/
Короткие выводы: протокол достаточно неплох и совершенно не такой пожиратель токенов, как про него поговаривают
https://habr.com/ru/articles/956150/
Короткие выводы: протокол достаточно неплох и совершенно не такой пожиратель токенов, как про него поговаривают
Хабр
Пожиратель токенов (или нет): анатомия протокола MCP для ИИ-агентов
Поводом написания этой статьи послужил подслушанный диалог: — А на чем у вас агенты написаны? — У нас на MCP! Для меня MCP всегда был просто протоколом , то есть именно способом отправки и обработки...
👍4🔥3
LangChain 🦜 — самый популярный и узнаваемый фреймворк для агентизации и LLM-based проектов. Но вокруг него настолько много других Lang-что-то-там проектов, что сходу непонятно как их отличать (легко, на самом деле).
Написал фундаментальную статейку, в которой покопался внутри LangChain, сравнил его по архитектурке с LangGraph и кратко прошелся по другим важным проектам экосистемы.
Надеюсь, после статьи не останется вопросов а чем же все это друг от друга отличается 🤗
Приятного чтения!👍
https://habr.com/ru/articles/956940/
Написал фундаментальную статейку, в которой покопался внутри LangChain, сравнил его по архитектурке с LangGraph и кратко прошелся по другим важным проектам экосистемы.
Надеюсь, после статьи не останется вопросов а чем же все это друг от друга отличается 🤗
Приятного чтения!
https://habr.com/ru/articles/956940/
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
От LangChain к LangGraph: детально разбираемся с фреймворками и всей Lang-экосистемой
LangChain или LangGraph? Какой фреймворк для ии-агентов выбрать? А может быть LangSmith? Или LangFuse? LangFlow? Если вы сходу не отличаете все эти Lang между собой или просто хочется побольше узнать...
👍9
И еще один разбор фреймворка, на этот раз CrewAI. Самый простой, компактный, продуманный и заточенный под множество агентов. И эта мультиагентность реально за 20 строк кода (потом, правда, начинаются скучные вопросы про эффективность, evals и всякое разное агентное, но все же).
https://habr.com/ru/articles/957384/
https://habr.com/ru/articles/957384/
Хабр
Мультиагентный фреймворк CrewAI: разбор архитектуры и внутренностей
CrewAI — фреймворк интересный. Он похож на самый быстрый способ удивить своего босса: легкий, у него очень низкий порог входа, он по дизайну нацелен на мультиагентность и из него можно очень быстро...
👍6👀1💅1
