Machine head - Александр О.
391 subscribers
24 photos
1 video
24 links
Канал для техногиков, программистов и ит-предпринимателей о технологиях в бизнесе и бизнесе на технологиях.

Платформа для ускорения закрытия лидов в "длинных циклах" сделки. @prospectguide

Написать в личку @spaceguest
Download Telegram
Коузианская сингулярность

Сейчас в интернетах широко обсуждают академическую статью (оригинал в комментах) "Коузианская сингулярность? Спрос, предложение и дизайн рынков с AI-агентами"

Рональд Коуз, в честь которого названа сингулярность, в своей знаменитой работе 1937 года “Природа фирмы” объяснил, почему фирмы существуют как организационная форма. Его ключевая идея заключалась в том, что структура нашей экономики определяется транзакционными издержками — затратами на использование рыночных механизмов для координации экономической активности. Когда транзакционные издержки высоки, экономически выгоднее организовать производство внутри фирмы (“делать”), а когда низки — покупать на рынке (“покупать”)


Авторы предполагают, что AI-агенты могут привести к радикальному снижению транзакционных издержек до уровней, близких к нулю, что станет точкой перегиба в экономической организации — своего рода “сингулярностью”. Это потенциально может фундаментально переписать границы между фирмами и рынками, которые существовали веками.

Транзакционные издержки как издержки человеческого труда
Можно утверждать, что многое в том, как мы структурируем нашу экономику и фирмы, может быть объяснено транзакционными издержками, часто издержками человеческого труда.


Поиск и сравнение предложений на рынке, переговоры об условиях, согласование контрактных деталей, контрактования и формализация договоренностей, контроль выполнения обязательств, все эти задачи исторически требовали человеческого труда, что делало их дорогими. AI-агенты могут выполнять эти функции при очень низких предельных издержках, поскольку программное обеспечение можно копировать без затрат, а единственная предельная стоимость — это стоимость вычислений, которая постоянно снижается.

Сдвиг границ “делать или покупать”
Если агенты действительно могут эффективно и дешево выполнять эти функции, мы можем стать свидетелями значительных сдвигов в традиционных границах "делать или покупать", которые определяют организацию фирм и структуру рынка.


Это означает, что многие виды деятельности, которые сейчас выполняются внутри фирм из-за высоких транзакционных издержек на рынке, могут быть вынесены вовне. Например:

- Углубление на конкретной специфике — если координация через рынок становится практически бесплатной, фирмы могут сосредоточиться на узких компетенциях.

- Вертикальная интеграция — зачем владеть всей цепочкой поставок, если агенты могут эффективно координировать множество поставщиков?

- Новые рыночные структуры — ранее невыполнимые из-за координационных издержек формы организации.

Выводы

Коуз также утверждал, что изменение подходов не обязано сделать экономику эффективней, вроде того, как ИИ должен был заменить программистов, но в итоге привел к росту их числа и разнообразия. Однако, я считаю, что экономика ИИ агентов может спровоцировать фундаментальный сдвиг в парадигме взаимоотношений между акторами рынка: гранулярной фрагментации отвественности, увеличению доверия, скорости принятия решений, точному прогнозированию спроса/выручки в координации с внешним миром и много других вещей, делающих бизнес устойчивей в наши турбулентные времена.

Делитесь с коллегами и подписывайтесь на Machine Head
1👍10🔥4🤯2
🚫 Не начнинай свой стартап пока не поймешь эти 5 неочевидных вещей

Долго не мог придумать заголовок. На самом деле, таких вещей гораздо больше. Но эти 5 совершенно особенные. Заблуждения в них ведут к предпринимательской фрустрации и выгоранию. Конечно, всё зависит от ваших амбиций, если вы строите что-то в логике пет-проекта, то можете смело игнорировать этот пост.

1. MVP

Никто в реальности не знает где граница минимальной жизнеспособности. Иногда продукт нежизнеспособен из-за нюанса. Чаще нюансов десятки. Может пройти год-два разработки прежде, чем наступит долгожданная жизнеспособность. Многие говорят: «мы сделали MVP, а теперь ищем market fit”. Все наоборот. Продукт, который не нашел свой рынок нежизнеспособен.

2. Ценность продукта

Тонкая динамичная субстанция. Как послевкусие от блюда, раскрывающееся с определенным соусом. Когда встречается со знатоком дарит неподдельную радость создателю. Но абсолютное большинство пользователей ищет ценность не во вкусе, а в красивом фасаде, стильном интерьере и любезном обслуживании. Что само по себе редкость, а потому большая ценность. Только совокупность всех деталей превращает программный код в бизнес. Но многие продолжают убеждать себя, что реализованная функция и есть главная ценность бизнеса.

3. Ожидания.

Пересечение предпринимательских амбиций, скорости отдачи, помноженной на объем вложенных средств и усилий. Реальность обычно на противоположной стороне оси. Сверяйте ожидания с реальностью как можно чаще. Без сверки ожидания порождают иллюзию, а иллюзия усиливает боль неизбежной встречи с реальностью.

4. Фокус.

«Я начну строить свой стартап по выходным, а когда буду уверен, что полетит уволюсь» Знакомо? Только честно, полетело? Дробление внимания критично. Чтобы бизнес взлетел нужен фокус на 150%. Стартап - олимпийская дисциплина. Тут нет опции победить туристам и «наполшишечникам». Даже 100% фокуса реализуют только 50% возможного результата. 50% фокуса не дают его вовсе.

5. Сейчас еще немного и деньги пойдут

Не пойдут. Точнее пойдут, но не тогда когда расчитываешь. Вероятность успеха обусловлена исключительно способностью продолжать движение при длительном отсутствии значимых результатов. Через немогу. Хотя бы строчку кода. Хотя бы 1 звонок/сообщение клиенту. Каждый день. Без выходных. Без оправданий. Где-то в процессе появятся деньги. Если всё еще хочется зацепиться за веху, смотри пункт 3.

Поделитесь со знакомыми стартаперами и подписывайтесь на Machine Head

#стартаперские_инсайты@machine_head_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥8👍643
А это очень интересно 🧐

Попросил Perplexity проанализировать логи и собственное окружение.

Что примечательно:

Perplexity может сгенерировать python код, выполнить его и отрефлексировать свое окружение 😁

Похоже что каждый запрос выполняется в собственном Sandbox контейнере, там особо не набедокуришь, но исследовательский интерес зашкаливает.

В потрохах: FastAPI, Jupyter, рассыпуха python и npm пакетов, буду исследовать дальше, Perplexity весьма откровенен )

Посмотреть и вдохновиться можно здесь

Update: Sandbox это не просто docker контейнер-песочница, а E2BSandbox - инструменты для запуска ресерч агентов. О дивный новый мир, я каждый день узнаю о новой ИИ тулзе. 🤪
1🤯8🔥73👍2
Друзья, нас уже больше 3️⃣0️⃣0️⃣!

Мне, честно говоря, самому не верилось, что это возможно. Огромное спасибо 🙏 каждому за внимание (самый ценный ресурс нашего времени), оказанное доверие и интерес.

Это событие застало меня врасплох, заставило хорошенько задуматься, чем я хочу быть полезен, находясь в публичном поле. Поэтому я окончательно принял для себя стратегию делиться фундаментальными мыслями, артефактами деятельности и инсайтами сквозь призму практического опыта. Именно поэтому тут не будет ежедневного постинга, обсуждения событий или новостей, о которых говорят из каждого утюга.

Это то, чего лично мне не хватает в авторских каналах - редких, но основательных мыслей, вместо бесконечного потока сознания.

Пока я заканчиваю материал по эффективному программированию с ИИ в больших проектах (контента получилось неожиданно много), хочу попросить в небольшом опросе поделиться, какие темы вас интересуют больше всего. (Опрос в следующем сообщении)
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥1775
Анатомия ИИ-агентов. Вступление

Книга Антонио Гулли очень хороша для старта в понимании агентских ИИ-систем, но оказалась слишком поверхностна, а темы разрозненны, чтобы покрыть спектр практического понимания, а как же на самом деле строить эти системы.

Я испробовал почти всё популярное: LangChain/LangGraph для python и typescript, CrewAI, ADK, даже Koog для Kotlin и yaml-ориентированный Composio. Каждый фреймоворк предлагает свои особенности и уровень простоты. Чем проще инструмент, тем меньше остается контроля над происходящим. Наш путь - заглянуть под капот, разобраться в нюансах и сделать для себя правильный выбор.

План такой:

1️⃣ Сначала разберемся, а из чего же состоит AI-агент и что, собственно, его делает агентом.
2️⃣ Исследуем, какие подходы предлагают фреймворки для смешивания детерминированной бизнес-логики c тем бардаком, что генерируют LLM
3️⃣ Столкнемся главным вызовом разработчика агентской системы - как заставить группу агентов работать совместно, защититься от галлюцинаций, таск-дрифта и других побочных эффектов работы систем с нечеткой логикой
4️⃣ В конце, обсудим плюсы и минусы, сделаем наметки на будущие шаги, возможно даже построим свой агентский фреймворк, обсуждая его дизайн в прямом эфире.

Мой собственный кейс зачем я полез с этим разбираться - создание AI-плейбука менеджера по продажам. Важнейший шаг плейбука - глубокое исследование клиентской компании. Суть задачи в том, чтобы взять целевую компанию, коммерческое предложение продавца, обойти интернет и скомпилировать отчет, который подскажет менеджеру как правильно зайти в хату компанию, с кем говорить, какие правильные вопросы задавать, выявить и соединить стратегические цели компании с предложением.

Это отличная задача для ИИ, но со звездочкой. Я для себя разделил целевое использование ИИ-агентов на 2 части:

- Исследовательское - компиляция данных, с LLM-верификацией источника. Мы не знаем заранее куда пойдет Агент и мы не можем полагаться на достоверность источника.
- Функциональное - компиляция данных из заранее верифицированного источника. Агент ходит в базы данных или в документы и предоставляет результат, которому мы, в целом, можем доверять.

Моя задача исследовательская, однако к результату особые требования. В отличие результатов, которые дают Deep Research режимы популярных вендоров, нам нужна строгая форма отчета + структурированный вывод, соблюдение акцентов на специфике оффера, переносимость workflow между разными LLM, достоверность и верификации найденных данных на уровне процесса, восставливаемость при сбое в точке остановки. И вот какие проблемы вылезли по дороге:

👻 Галлюцинации

OSS модели (а именно такие являются приритетными для российских реалий) легко выдумывают людей, факты, гипотезы ценности. Понижение температуры и требование “НИКОГДА НЕ ВЫДУМЫВАЙ …” в большом контексте не дает ожидаемого результата.

🏎️ Дрифт задачи

По мере заполнения контекстного окна агент отклоняется от исходной задачи и возвращает ответ, косвенно связанный с целевым.

🥵 Переполнение контекста

Контекстное окно в 1М токенов - привилегия проприетарных моделей, но такой объем драматически удорожает исследование. Стандартные подходы к сжатию режут массу полезных данных, а значит хорошо бы знать как сжимать контекст избегая потерь

💾 Сохранение состояния

Когда агентов в коллаборации много, результат работы каждого нужно держать в структурированном виде в виде обычной структуры данных в коде, учить одного из агентов управлять этим состоянием, выстраивать циклы обратной связи если возврат одного из агентов по какой-то причине не смог сохраниться.

... продолжение ниже
1👍11🔥53
… начало в предыдущем сообщении

🧠 Reasoning

Одна из мощнейших возможностей LLM после включения кратно снизила качество отчета и услила дрифт задачи уже на 3-4 итерации. Вот пример, ищу данные по компании “Ит1-Холдинг”:
Модель на 3 итерации размышляет: “Отлично, я получил последние новости по “ИТ-холдинг Т1”, этих данных мне хватит для понимания приоритетов развития на ближайший год. В тексте также упоминается ****ов Антон, который вероятно занимает пост директора по инновациям, поищу его цитаты и выступления за последний год“. Далее идет в гугл, получает лавину информации скрейпит ее и вместо 3-5 стратегических целей одной компании, выдает факты из высказываний совершенного другого человека из совершенно другой компании. Вывод: пойдем разбираться, как нам сделать Планирование и Размышление предсказуемым (и нет, примеры в промпте, zero-learning не помогут)

Помимо этих проблем: нюансы работы с краткросрочной и долгосрочной памятью, стриминг процесса в UI, sandboxing deep research агента и многое другое.

Мне кажется из этого может выйти довольно интересная серия постов. Начнем мы, как видно из заголовка, с препарирования ИИ-агента. Поделюсь тем, что уже знаю, а потом будем копать вместе. Надеюсь вам тоже будет интересно.

Подписывайтесь на MachineHead и делитесь с друзьями.

#анатомияииагентов
3👍16🔥92
Вопрос года:

- Чем вы занимаетесь?
- ИИ пинаю

Не успел я наиграться с ACP, который позиционируют как протокол для скрещивания редакторов текста и AI, который я вообще-то хотел скрестить с другими интерфейсами, Google берет и выкатывает A2UI - протокол, устремляющийся именно к этим целям, который тут же именуют стандартом.

Когда-то нам показывали лабораторные эксперименты где прототипы Gemini OS по требованию в реалтаме генерируют интерфейсы с директориями, файлами и другими функциями ОС. Но идея оказалась черезчур хороша, чтобы с двух ног запрыгнуть в будущее, одним махом отменив индустрию разработки графических приложений.

В новой итерации, передовики из гугл спустились на грешную землю и предлагают нам агентскую обертку, которая проследит, чтобы модель генерировала JSON с описанием интерфейсного виджета, который можно будет отрисовать в любой из сред: Web, Flutter, Jetpack Compose, SwiftUI и тд.

Звучит как «мы бы и сами что-то такое сделали с помощью ACP 😁», но у этого протокола нашлась полезная фича: стриминг потока изменений в отрисованный элемент.

На странице с описанием транспортных протоколов для A2UI меня ждало странное - среди привычных REST и Websocket нашелся зверь под названием AG-UI, который сам является протоколом агентско-пользовательского взаимодействия (больше агентских протоколов богу агентских протоколов) но более низкого уровня, если можно так выразиться.

Идти и пробовать находку рано. Там пока есть клиенты только для Flutter и Angular. Да и бекенд на питоне, что в целом такое себе.

Выводы.

На мой взгляд в гонке протоколов корпорации пытаются застолбить место для своих решений, чтобы в будущем силком затянуть нас в свои феодальные облачные вотчины. Я бы не торопился называть такие библиотеки протоколами и уж тем более стандартами. Нет никаких проблем заставить LLM генерить именно тот output, который можно распарсить и отрисовать виджет на манер Backend Driven UI так, как подходит именно вам. Весь UI в приложение тоже отправить не получится, речь идет об отдельных виджетах, например, на лету создавать интерактивные карточки для языковых приложений. Не то, чтобы нам нужен был для этого спец протокол, но начало положено. Эра ИИ-интерфейсов на пороге.
5👍1332
С Наступающим Новым Годом, друзья! 🎄

Подходит к концу этот непростой, вихревой год. Для многих из нас он был проверкой на прочность — в работе, в делах, в вере в себя и свои силы.

Я и сам прошел через сложный этап: запуск стартапа, первые попытки оторваться от земли, преодоление страха неизвестности, борьбы с неопределенностью. Но именно в такие моменты понимаешь, что ценнее всего — поддержка близких, честность с собой и упрямая готовность сделать ещё один шаг.

Пусть в наступающем году у нас у всех будет чуть больше ясности и спокойствия. Не гнаться за всем сразу, а сосредоточиться на том, что по-настоящему важно.

Желаю вам в 2026 году устойчивости. Твёрдой почвы под ногами. Верных решений. И надежной команды — на работе и в жизни — которая будет рядом, создавая надежную опору в движении к общей цели.

Спасибо, что остаётесь здесь. Ваша поддержка и внимание значат для меня очень много.

С наступающим! Берегите себя и своих близких. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥16👍431
Анатомия ИИ-агентов. Часть 1 - Истоки и архитектура. [1/2]

Подходит концу первая рабочая неделя этого года. Дабы провести выходные с пищей для ума, самое время с двух ног запрыгнуть в устройство ИИ-агентов. Начнем с истоков. ⚡️

Первыми практическими предшественниками современных ИИ-агентов стали экспертные системы, появившиеся в 1960-х годах. Экспертная система — это система искусственного интеллекта (весьма ограниченного), которая на основании знаний и опыта эксперта-человека может решать задачи в определенной области. В 1965 году в Стэнфордском университете Эдвард Фейгенбаум создал DENDRAL — первую в истории экспертную систему для определения структуры химических веществ.

Прорыв в понимании ИИ-агентов произошел в 1973 году, когда Карл Хьюитт разработал модель актора — подход, позволяющий создавать системы, где независимые агенты взаимодействуют друг с другом через обмен сообщениями. Одной из первых таких систем стала Distributed Problem Solver, созданная в 1981 году. В 1986 году Марвин Минский в книге “Society of Mind” предложил представлять сложные задачи как результат взаимодействия множества отдельных агентов, работающих в “сообществе”. Почему это важно? Модель актора обеспечила сдвиг ментальной модели программирования от систем с общей памятью и блокировками к архитектуре, основанной на передаче сообщений и изоляции состояния.

Современный ИИ-агент, следуя принципам акторной модели и построенный поверх большой лингвистической модели, отличителен 3-мя ключевыми свойствами:

Свойство 1. Автономность и независимое выполнение задач.

Многие проводят равенство между автономностью и самостоятельностью, мол, агент живет сам по себе и делает работу, как человек, то нет. Самостоятельность - способность не только выполнять действия без надзора, но и ставить подцели, адаптироваться к неизвестным заранее условиям. Дело не в технических ограничениях. Самостоятельность (и его объем) - производное от доверия, а доверие - краеугольный камень любых внешних, не только агентских систем.


В понимании современных ИИ-агентов речь идет о способности агента к планированию следующего шага. В отличие от “голой” LLM, где мы работаем в режиме “запрос-ответ”, агент действует в, так называемом, агентском цикле: Наблюдение → Планирование → Действие. Агентский цикл конечен. Независимо от его сложности, агент на вход получает запрос, запускает цикл и его цель вернуть ожидаемый результат. Вот, что делают шаги цикла:

1. Наблюдение. Агент анализирует результаты своих предыдущих действий, собирает данные из окружения, выполняет контекстное обогащение.

2. Планирование. Агент использует различные методы рассуждений для определения наилучшего способа действий. Модель начинает думать над решением запроса пользователя, разрабатывает план для дальнейших действий и определяет, какие инструменты можно использовать.

3. Действие. Агент выбирает необходимые инструменты и начинает их использовать в соответствии с задачами, сформулированными на этапе планирования.

Свойство 2. Интеграция с инструментами и окружением

В шаге планирования и действия агенту доступно мета-описание его окружения: команд, которые может выбрать LLM, для взаимодействия с окружающим миром. Между командой и LLM - тонкий слой управляющего кода, интерпретирующего текстовые ответы в вызов кода самой команды. Именно поэтому к LLM выдвигается требование к способности отвечать структурированно (Structured output). Действуя, агент делает 1 или множество запросов к LLM, получая структурированные ответы, вызывает инструменты - обычный код в функциях и классах с поведением, исполняемый процессором, выполняет работу, а также сверяется с исходным планом.

продолжение...
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍7🔥74
Анатомия ИИ-агентов. Часть 1 - Истоки и архитектура. [2/2]

В начало

Свойство 3. Память

LLM не обладает собственной памятью (или состоянием) между запросами - каждый запрос обрабатывается независимо, как в первый раз. То, что мы называем агентом, является обычной программой с собственным окружением. Как и любая другая программа, она может хранить состояние в оперативной памяти, обращаться к базам данных, собирать необходимый контекст для выполнения пользовательской задачи. Простейший вид памяти - сохранение всей последовательности запросов к LLM и ее ответов.

Так же как человеческий мозг имеет полушария и специализированные отделы, обеспечивающие нам интеллектуальные способности во всем их многообразии, ИИ-агент может быть разделен на части для пущей интеллектуальности. Программную архитектуру можно представить в виде фрактала - узора, обладающего свойством самоподобия: его части в уменьшенном масштабе повторяют структуру целого, где основной узор - агентский цикл. Агентский цикл, как архитектурная единица, в том же виде используется для создания под-модулей: планировщика, рефлексии, цензора, интерпретатора и тд. Когда и как эти подмодули-микроагенты (не путать с суб-агентами) будут вступать в работу определяет разработчик, склеивая их в процесс всё тем же обычным кодом (как, увидим в следующих статьях).

——

Подытоживая, архитектура ИИ-агента удивляет своей простотой и масштабируемостью, являясь кирпичиком системы любой сложности. Агент может быть как простейшим SingleRun-вызовом к LLM с остановкой после ответа, так и ReAct-агентом, самостоятельно принимающим решение как действовать дальше и когда заканчивать. Их и будем разбирать далее.

Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned! ✌️
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍13🔥75