Applied AI
252 subscribers
47 photos
2 videos
2 files
27 links
блог merkulov.ai, с постами о AI Agents, next-year trends и стартапах (иногда моих)

Я 23 y.o. hao.vc Founder, ex CTO @ VC fund, Ex AI Архитектор @ YandexGPT team, магистрант философского МГУ
Download Telegram
Channel created
Channel name was changed to «AI Spaceships»
Улучшение поиска с помощью LLM в интернет-магазине

🔍 Цель: Повысить конверсию поиска, чтобы пользователи быстрее находили нужные товары и чаще их покупали. Применение GPT может увеличить конверсию в покупку на 1.1%.

Сценарий:
Пользователь вводит запрос, например, "хочу сладкого", но не получает подсказок. Мы исправим это с помощью GPT.

Архитектура:
1. Пользователь вводит запрос.
2. Запрос направляется в сервис поисковых подсказок.
3. Если подсказок нет или их меньше, чем \( k \), запрашиваем у LLM.
4. Отображаем подсказки.

Пример:
Запрос: "хочу сладкого"
Подсказки от YandexGPT 4 lite:
- шоколад
- конфеты
- печенье
- торты
- мармелад

Теперь пользователь видит релевантные подсказки! 🎉

Статья, код, live-демка

Внутри есть прототип на opensearch, streamlit & openai/yandex
🔥1
Как агентские подходы влияют на качество написания кода, visual-servey

Стоит обратить внимание на магнитуду уменьшения ошибки, которую дает традиционный скейлинг модели
И на магнитуду уменьшения ошибки, которую дает inference-скейлинг модели

Для многих потенциал инференс-скейлинга & агентских подходов был очевиден еще в 2023 (например, для Эндрю Ына и Ли Куна)
Сейчас для того, чтобы быть "в теме", приходится всё время читать десятки тг-каналов и других источников, неистого ресерчить информацию разными инструментами. Это занимает кучу времени, наполняет жизнь цифровым шумом, иногда выдергивает из флоу. Было бы очень удобно иметь свой собственный эйай, который бы помогал справиться с этой проблемой - брал новости с уже существующих новостных каналов и фильтровал/углублялся/пруфчекал их за меня. Хочу разработать сий эйай, буду учавствовать с ним на хаке ogon.ai, должно получится инетерсное..

По итогу должен появиться AI-powered "дворецкий", который тщательно отбирает новую информацию из ваших любимых и глобальных источников, сам проводит исследования и пруф-чекинг, бэтка планируется в виде тг бота или тг минаппа, про которых сейчас так хайпят микро-предприниматели. Записаться на клозед бэту
🔥4
Вдохновился последними постами e/acc, решил сформировать свой whishlist с предсказаниями на 2025:

(первые пункты привязаны к 5 levels of AI by OpenAI)
- хочу увидеть как openai/anthropic будет добивать тему с агентами. Кажется сейчас всё еще довольно много проблем, которые хоть и решаются архитектурными выкрутасами, но пока не ощущаются нативно решенными. К примеру, если я хочу дать своему агенту 100 инструментов, мне уже нужно выдумывать tool memory. Верю, что на смену этой и многим другим головным болям в Applied AI в следующие годы будут приходить готовые решения от llm-провайдеров
- первые шаги в сторону креативности и фантазирования; без этого не получится достичь шага автономного исследователя
- все начнут говорить про память. Это невероятно важный компонент любого b2c сервиса, которому сейчас уделяется недостаточно внимания. Сервис, который человек будет использовать годами, глубоко интегрируется в личность, будет привязывать пользователя и значительно улучшать UX. Long-term memory в текущей реализации в агентах не в счет, нужны новые подходы.
- агенты должны начать использовать людей. Например, экспертов как источник информации. Или агент, организующий в одном из своих шагов перевозку товара/еды через апи в FedEx/я.еде. Перед появлением 100% AI-powered организации должны появиться гибридные.
- асинхронных AI агентов (сделаю отдельный пост)

- экосистема для хайпующих Large Contept Models ("убийца о1", пост) на всех слоях: быстрый инференс, интерпретация: логи, аналитика, тюнинг, алайнмент сжатых представлений
- появление большого количества стартапов "X для AI агентов" (заменить X на facebook/uber/tinder/doordash). Амазон вертикальных агентов существуют уже больше года. Где фейсбук для агентов? (постараюсь сделать сам)
- официальные агенты компаний, с которыми можно взаимодействовать в чате для c и по апи для b: единые интерфейсы для всех входящих запросов клиентов, компаний, организаций и других агентов
- продолжение anthropic computer use, но для телефонов! гугл/аппле давно внедряют хардкод фичи вроде голосового управления "открой ютуб, сделай звук тише". Хочу сказать "тапай хомяка тысячу раз", - и чтобы тапал. Играй за меня в шарики, пока я еду в метро. Повтори мой последний заказ в ВкусВилле 👀

- 100% новостных каналов пропустили RL-tuning у openai, видево. Очень интересно, куда эта микрореволюция приведет коммунити
- вообще жду больше папир и промышленных решений агентов с самостоятельным sft/rlft, а не убогим добавлением информации текстом в long-term memory (кстати недавно в langGraph появилась RAG-имплементация long-term memory 🤡). Реклама статьи Ильи Зисмана по теме
- появление AutoSFT webUI инструмента для тюнинга ассистентов и агентов для тех, кто не может сам в сбор/анализ данных/обучение. Например, чтобы при обращении к llm я указывал свой uuid проекта, относил сервису фидбек пользователя, внутри происходили автоматические улучшения, и я смог бы посмотреть до/после

- OpenAI и другие провайдеры продолжат подминать под себя самых популярных вертикальных агентов.
- глубокое проникновение LLM-агентов в гуманитарные социальные институты - суды, elections, создание законов. книжка про тему
- выйдет первый в мире AI-native курс
👍2
Large Language Model Agents, Stanford MOOC

В августе я к сожалению не смог попасть в очень крутой курс по ии агентам от стенфорда. Сейчас все их лекции можно посмотреть на ютубе (!!!), также есть открытый дискорд. In Stanford we trust.

Сегодня они стартанули набор на advanced продолжение первого фундаментального курса, записаться можно тут в большой форме. Отправляем заявочки) Только не пишите, что вы из рф.

1 курс охватывает следующие фундаментальные темы:

- Размышления LLM: Исследование цепочки размышлений и их влияние на выводы моделей.
- История и обзор LLM-агентов: Обзор развития агентов на основе языковых моделей и их применения.
- Агентные AI-структуры: Модели взаимодействия и многомодальные помощники.
- Тенденции в генеративном AI: Ключевые компоненты для успешного создания приложений и агентов.
- Комплексные AI-системы: Оптимизация инструкций и демонстраций для многоступенчатых программ.
- Агенты для разработки ПО: Автоматизация процессов разработки с помощью AI.
- AI-агенты для рабочих процессов: Решение задач в области знаний с помощью агентов.
- Объединенные модели принятия решений: Синтез нейронных и символических подходов.
- Общая робототехника: Проект GR00T и его применение в робототехнике.
- Открытые источники и наука: Оценка возможностей и рисков языковых моделей.
- Измерение возможностей агентов: Политики ответственного масштабирования.
- Безопасные и надежные AI-агенты: Политики и подходы к обеспечению доверия и прозрачности AI.

Очень хороший набор для фундаментального вката в агентов. Думаю, в 2025 каждый может их освоить, найти работу от 60к$/год как entry-lvl / от 120к$/год с мл-опытом.
👍3❤‍🔥1🙈1
Для разогрева можно полистать слайды к исторической лекции. А это, кстати, лекторы курса. 🗿🗿🗿
🗿4
Ухожу из Яндекса на х5 денег в AI Agents 🥳🎉. Чего и всем желаю)
Крайне негативное впечатление сложилось о процессах в компании, как для движевого челика.

work/life - да.
строить будущее - нет.

Публично ставлю, что компания не успеет адаптироваться к изменениям, которые грядут из-за ai. Через 5 лет компания потеряет 90-99% маркеткапа, скриньте.

wow, it's literally me
видос попал в меня и всех моих знакомых на 100%
🍌3🔥1
Forwarded from KNADCORE (Max Kreslavsky)
This media is not supported in your browser
VIEW IN TELEGRAM
Собеседование в Яндекс
😁11👍1👎1🤡1
Media is too big
VIEW IN TELEGRAM
oxisai.com

- генерация 3д ассетов
- генерация мира
- генерация сцен
- анимации персонажей и сцен
🔥6
Comparison of Agent Communication Protocols

> 2026 will be the year of distributed multi-agent internet and cyber-economy development.
> For the last 2 weeks, I've been actively researching agent-to-agent communication protocols with the goal of launching/funding one.
> Everyone wants to create their own HTTPS rn xd.
> Here's a huge comparison of already existing protocols by changgaowei, pic by me:

Notes:
- MCP focuses on LLM tool integration
- ANP aims to create a decentralized agent network
- agents.json is an auxiliary standard for the web environment
- LMOS provides a full-stack platform
- AITP specializes in secure interactions and economic transactions
- Agora represents the direction of future adaptive communication

Also want to mention:
AIXP, mcp-agent !!, agent-protocol and The Almanac // fetch.ai, part of ASA
🔥12👍4