Море Лаптева
137 subscribers
55 photos
28 videos
82 links
Рассказываю, как современные технологии могут повышать эффективность взаимодействия бизнеса и ИТ, и делюсь интересными событиями из жизни (спойлер: немного музыки и невыдуманных историй).

📩 Контакт для связи: @laptv
Download Telegram
⚙️ Agile перестал работать (и что с этим делать)

Провёл выходные за изучением трендов 2026: прогнозы от Gartner, IDC, Forrester плюс публикации российских компаний. Много интересного для разбора — буду постепенно делиться находками.

Но сегодня хочу начать с одного доклада McKinsey, который попал ровно в мои мысли последних месяцев.

Главный тезис: классический Agile (2‑недельные спринты, 8–10 человек в команде, жёсткие роли) не даёт раскрыть потенциал AI-агентов. Энтерпрайзы видят лишь 5–15% прироста продуктивности от AI в разработке, несмотря на яркие единичные кейсы.

Проблема не в инструментах. Проблема в том, что мы пытаемся встроить AI в процессы, придуманные 10 лет назад для «чисто человеческой» разработки.


🛠 Что ломается на практике:

Новые узкие места — неэффективное распределение задач между людьми и агентами, медленный ревью кода (агенты генерируют быстро, люди проверяют долго), лавинообразное накопление технического долга.

Описание задач не подходит — длинные документы с требованиями к продукту плохо конвертируются в задачи для агентов. Нужен переход к работе через спецификации.

Большие команды устарели — вместо команд по 8–10 человек появляются маленькие поды по 3–5 человек, каждый заточен под конкретный тип работы.


Что работает у лидеров:

Исследование 300 компаний показало: лидеры в 7 раз чаще имеют AI-native процессы по всему циклу разработки, а не точечный copilot.

Ключевые паттерны:

1. Разные задачи — разные модели

• Обновление старого кода → «фабрика агентов» с чёткой спецификацией (человек задаёт требования, делает финальную проверку)

• Новые фичи → итеративный цикл, где агенты генерируют варианты для быстрой обратной связи

2. Новые роли: product builders
Вместо жёсткого разделения на фронтенд/бэкенд/тестирование появляются люди с широким пониманием всей архитектуры, которые оркестрируют агентов

3. Продакт-менеджеры прототипируют сами
Через агентов они начинают делать прототипы в коде и работать напрямую с метриками продукта, вместо того чтобы ждать исследователей или дата-сайентистов.


📊 Кейс: международный банк

Изменили саму agile-церемонию:

• Лиды использовали агентов для назначения задач на спринт на основе исторической скорости команды.

• Продакты и агенты вместе генерировали критерии приёмки (безопасность, наблюдаемость), чтобы уменьшить переделки.

• Бэклоги разделили по типам работы (баг-фиксы vs новые фичи).

Результат: 60× рост потребления агентов, +51% к количеству слитых веток, ускорение доставки приоритетных задач.


⛳️ Почему это важно именно сейчас:

По данным того же McKinsey, 62% организаций экспериментируют с AI-агентами, но только 23% перешли к масштабированию. Основное различие — не в бюджете на инструменты, а в умении массово управлять изменениями: коммуникация, мотивация, обучение, система метрик.

Изменение в первую очередь человеческое и требует времени. Те, кто начинает перестраивать процессы сейчас, получают 5–6× ускорение вывода на рынок при лучшем качестве.

#ВолныИнноваций #КурсНаНовости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3🤝1
📉 Маленькие AI-модели проиграли войну: куда ушли пользователи (часть 1)

Вышло крупнейшее эмпирическое исследование использования LLM - OpenRouter и a16z проанализировали более 100 триллионов токенов за год работы. Это не опросы и не бенчмарки, а реальные данные от 5 миллионов разработчиков через 300+ моделей.

Главное открытие: рынок окончательно разделился на два сегмента. Примерно 70% всех токенов проходит через проприетарные модели для критичных задач, оставшиеся 30% захватили открытые модели. DeepSeek обработал 14.37 триллиона токенов, Qwen от Alibaba - 5.59 триллиона.


Парадокс цены: дешевизна не работает

Исследование выявило критическую закономерность - спрос на LLM практически не зависит от цены. Когда цену снижают на 10%, использование растёт всего на 0.5-0.7%. Даже разница в 95 раз между DeepSeek по 40 центов за миллион токенов и GPT-4 по 10 долларам не заставляет энтерпрайз переходить на дешёвые модели.

Разработчики платят за надёжность и качество, а не за токены. Если модель идеально подошла под задачу - ты заплатишь в 10 раз больше и не уйдёшь к конкуренту. Показатель удержания Claude Sonnet через 5 месяцев составил 40%, тогда как средний по рынку - 10-20%.


🤜 Маленькие модели проиграли войну

Неожиданный инсайт - полный провал малых моделей. Несмотря на обилие предложений, модели меньше 15 миллиардов параметров теряют долю рынка. Пользователи массово перешли на средние модели от 15 до 70 миллиардов - новую золотую середину между возможностями и стоимостью.

Категорию средних моделей создал выход Qwen2.5 Coder 32B в ноябре 2024 года. Сейчас рынок поляризовался: либо берёшь средние модели для большинства задач, либо платишь за топовые флагманы для самых сложных сценариев. Малым моделям не осталось места.


🦾 От чат-ботов к рабочим агентам

Модели с reasoning выросли с нуля до более 50% всех токенов за год. Переломный момент - релиз OpenAI o1 пятого декабря 2024 года. Средняя длина промпта увеличилась в четыре раза - с полутора тысяч до более шести тысяч токенов. Для программирования промпты регулярно превышают 20 тысяч токенов - пользователи загружают целые кодовые базы.

Типичный запрос больше не выглядит как вопрос-ответ. Это структурированный цикл: модель планирует действия, извлекает контекст через API, вызывает внешние инструменты, пересматривает результаты и итерирует до цели. Модель превратилась из помощника в полноценного рабочего агента.


🧑‍💻 Программирование захватило рынок

Самый драматичный рост - категория программирования с 11% до более 50% всех токенов к концу 2025 года. Anthropic Claude абсолютно доминирует - более 60% всех расходов на программирование. За ним xAI Grok с 45%, затем китайский Qwen с 40-60% в своём сегменте.

Парадокс: OpenAI занимает лишь 29% в программировании, хотя многие считают его лидером. Разработчики проголосовали деньгами и мигрировали на Claude из-за лучшего понимания кода и контекста в 200 тысяч токенов.

Интересно, что OpenAI остался единственным провайдером с заметной долей в научных исследованиях - около 15%. При этом 80% научных запросов посвящены машинному обучению и AI - мета-уровень, где AI изучает сам себя.


🐅 Ролевые игры съедают треть открытых моделей

Самый странный инсайт - 52% использования открытых моделей приходится на ролевые игры, персонажных чат-ботов и креативное письмо. Это опровергает представление о LLM как чисто продуктивных инструментах.

Почему именно в открытых моделях? Проприетарные часто отказывают в таких запросах из-за политик безопасности. DeepSeek обработал 14.37 триллиона токенов, и около 80% - ролевые сценарии. Огромный рынок развлекательного контента, невидимый для энтерпрайза.

Китайские модели показали прорыв - с 1.2% в конце 2024 года до пиковых 30% к середине 2025-го. Их преимущество - не только низкая цена, но и качественная поддержка языков кроме английского. Русский язык занял третье место с 2.47%, опередив испанский.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍1
📉 Маленькие AI-модели проиграли войну: куда ушли пользователи (часть 2)

🪃 DeepSeek и эффект бумеранга

У DeepSeek обнаружилась уникальная аномалия - эффект бумеранга. Пользователи пробуют дорогие альтернативы, но регулярно возвращаются из-за непревзойдённой экономии. При цене 28-40 центов за миллион токенов DeepSeek на 95% дешевле премиальных моделей.

Для задач, где качество не критично, а объёмы большие, возврат к DeepSeek логичен. Модели без такого foundational cohort показывают плоскую retention около 10% - хороши как рабочие лошадки, но не создают привязанности.


🌍 География и языки

Доля Азии выросла с 13% до 31% глобального использования. Сингапур стал вторым крупнейшим рынком после США - индикатор концентрации AI-разработки в регионе.

Английский язык доминирует с 83% токенов, упрощённый китайский занял второе место с 5%. Русский - третий с 2.47%, что говорит о значительном использовании LLM в нашем регионе несмотря на ограничения доступа.


🗺 Что всё это значит

Исследование зафиксировало три ключевых сдвига. Первый - рынок разделился на проприетарные модели для критичных задач и открытые для массовых сценариев. Устойчивое равновесие 70 на 30.

Второй - AI превратился из чат-бота в рабочего агента. Более половины токенов через reasoning-модели, вызовы внешних инструментов растут экспоненциально, средний промпт увеличился вчетверо.

Третий - программирование захватило половину рынка. Claude доминирует с 60% долей, определяя стандарт качества для code generation.

Исследование на 100 триллионах токенов показало реальность - не маркетинг, а то, как пользователи голосуют деньгами. Разработчики выбрали Claude для кода несмотря на хайп вокруг OpenAI. Компании остаются на дорогих моделях несмотря на дешёвые альтернативы. Малые модели проиграли средним несмотря на разговоры об эффективности.


📎 Полный отчёт OpenRouter State of AI 2025: https://openrouter.ai/state-of-ai

#ГлубокоеПогружение
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥53👍3
💡 LiteLLM: один API для всех LLM-моделей

Знакомая боль: пишете код под OpenAI, через месяц хотите попробовать Claude — и понимаете, что придётся переписывать половину интеграции. У каждого провайдера свой API, свои параметры, своя аутентификация.


💡 LiteLLM решает это просто

Это прокси-сервер, который превращает 100+ LLM-провайдеров в единый интерфейс. Написали код один раз — меняете модель одной строкой. Сегодня GPT, завтра Claude, послезавтра Gemini.


👆 Зачем это нужно

• Нет vendor lock-in — не привязаны к одному поставщику
• Контроль расходов — видите траты по командам и проектам в одном месте
• Резервирование — если OpenAI упал, запросы уходят на Anthropic автоматически
• Безопасность — RBAC, audit logs, бюджеты на команду


👉 Кейс Netflix

Раньше на интеграцию новой модели уходили часы. С LiteLLM делаем это за день после релиза



🤓 Как работает в production

Поднимаете Docker-контейнер с PostgreSQL и Redis. Описываете в конфиге, какие модели доступны и где лежат API keys. Выдаёте командам виртуальные ключи с бюджетами. Всё — дальше разработчики работают через единый endpoint.


👉 Для финтеха важно:

• Аудит логов — видите, кто какую модель использовал
• Алерты в мессенджеры, когда бюджет на исходе
• Можно настроить редактирование PII


🧐 Цифры и пользователи

32,700+ звёзд на GitHub, используют Netflix, Lemonade, Adobe. При правильной настройке можно экономить до 85% через роутинг простых задач на дешёвые модели.


🔗 https://github.com/BerriAI/litellm

В Fork-Tech сейчас тестируем для нашего AI-слоя. Пока нравится — особенно треккинг расходов.

#ШтормИдей
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥32
💪 Главный урок 2025: продажи решают не меньше, чем продукт

Я всегда знал, что маркетинг и продажи важны. Но в 2025 году понял — НАСКОЛЬКО они важны.

Это было не озарение, а медленное осознание через проекты в Fork-Tech. Мы делаем продукты и сервисы для enterprise. Техническая экспертиза сильная. Архитектура проверенная. Качество на высоком уровне.

И я видел паттерн: ключевым фактором успеха всегда были не столько технические решения, сколько продвижение и выстраивание взаимоотношений с клиентами.

🧠 Что изменилось в голове

Раньше я думал: "Продукт важнее". Процентов 70/30. Теперь понимаю: это 50/50. Или даже 40/60 в пользу продаж.

Потому что без продаж самый крутой продукт останется внутренним проектом. Без маркетинга — о нём никто не узнает. Без выстраивания отношений — клиенты не поверят в его ценность.


🤖 Почему технарям это сложно

Мы выросли на других убеждениях:
• Код говорит сам за себя
• Качество архитектуры — главное
• Если продукт хороший — его найдут

Сейчас всё наоборот: рынок переполнен продуктами, клиенты перегружены выбором, решения принимаются не только на основе технических характеристик.


🎙 О продукте нужно говорить постоянно

Главное открытие: одной хорошей коммуникации недостаточно.

Продукт нужно:
• Разложить на атомы — показать ценность для каждой роли
• Объяснять везде — на конференциях, в статьях, в личных встречах
• Повторять регулярно — люди забывают и отвлекаются
• Идти в поле — выстраивать отношения с представителями компаний

Это не про "впаривание". Это про помощь экспертам понять, зачем продукт, как использовать, какие боли закрывает и возможности открывает.


Вывод

Качество продукта — необходимое условие, но недостаточное. В 2025 я это принял. И стало легче.

#ЗапискиШтурмана


🎧 Традиционно перезагружаюсь перед выходными. Сегодня слушаю Joe Cocker. В комментариях оставил пост в рубрике #МузыкальнаяВолна.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5💯4👏2🔥1
Море Лаптева
💪 Главный урок 2025: продажи решают не меньше, чем продукт Я всегда знал, что маркетинг и продажи важны. Но в 2025 году понял — НАСКОЛЬКО они важны. Это было не озарение, а медленное осознание через проекты в Fork-Tech. Мы делаем продукты и сервисы для enterprise.…
🏆 Теория встретилась с практикой

Только написал пост про важность маркетинга и продаж, как пришла новость: PWS включён в реестр российского ПО.

Это именно тот случай, когда разбор клиентов "на атомы" приносит конкретный результат.


🔎 Что выяснили, когда углубились в потребности ЦА:

Для enterprise-клиентов в России реестр Минцифры — не формальность, а реальный фильтр на входе. Один из первых вопросов в переговорах: "А вы в реестре?"

Без этого:
• Тендеры закрыты на старте
• Госсектор не рассматривает
• Юристы тормозят из-за рисков

С реестром — разговор идёт про ценность продукта, а не про формальности.


👍 Главное

Включение в реестр — не бюрократия. Это часть продукта для нашего рынка.

Когда понимаешь, что важно клиенту на каждом уровне, видишь: реестр — это критичная часть "упаковки" для b2b в России.

#ЗапискиШтурмана
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉4🔥3👏2
📊 Технологические тренды 2026

Изучил 11 отчётов — от Gartner и McKinsey до Яндекса и Ассоциации ФинТех.

Собрал главное в один материал: AI-агенты в продакшене, кризис junior-позиций, QR vs NFC, цифровой рубль и ЦФА, почему 75% российских компаний упираются в стоимость внедрения (спойлер: дело не в деньгах).

Внутри — конкретные цифры, российская специфика и практические рекомендации по горизонтам.

👉 Технологические тренды 2026

#ВолныИнноваций
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍2
📊 Итоги 2025: от запуска PWS до роботов на заводах

Год был непростым, насыщенным и определяющим.

Для меня лично это год запуска PWS — продукта, в который мы с командой вложили душу. Инструмент, который решает боли разработчиков, ускоряет создание цифровых продуктов и позволяет конфигурировать логику любого приложения, включая ИИ.

Но это не всё. 2025 изменил правила игры: Китай доказал, что можно обойти санкции и создавать лучшее, роботы вышли из лабораторий на заводы, а государства решили взять цифровой мир под контроль.

Я подготовил 9 карточек с событиями года — от громких сделок на миллиарды до смены моих личных рабочих инструментов. События, которые показывают: мир меняется не завтра. Он изменился уже сегодня.

#ПучинаСобытий
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🎄4🍾3
🎯 Январь — время планов, не обещаний

Понедельник, 12 января. Праздники закончились, inbox разобран, и наступает момент, который я жду каждый год — время выписать все планы на ближайшие месяцы и конвертировать их в конкретные шаги с ресурсами, сроками и ожидаемыми эффектами.


💪 Почему именно сейчас — критично

Первая неделя января — единственный момент в году, когда у тебя есть и свежая голова, и чистый лист, и (главное) контекст того, что происходит в индустрии прямо сейчас. Тренды на год обозначены.

И эти тренды — не абстракция. Это входные данные для твоих планов.

Агентный ИИ — главный тренд 2026 года, который я подробно разбирал в декабре. Держим его в голове при планировании дорожных карт: какие процессы можно автоматизировать, где агенты дадут быструю отдачу, как меняется экономика проектов. Чуть позже более подробно расскажу в канале, что это такое, как работает и чем отличается от решений прошлого поколения.


😮 Что делать прямо сейчас

Берёшь любую свою цель на 2026 и прогоняешь через SMART:

🟡 Specific (конкретная) — не "улучшить процесс", а "сократить время обработки заявки с 2 часов до 30 минут"

🟡 Measurable (измеримая) — метрики до и после, чтобы понять, сработало или нет

🟡 Achievable (достижимая) — есть ли ресурсы (люди, бюджет, технологии) для реализации

🟡 Relevant (релевантная) — как это связано с бизнес-целями и трендами индустрии

🟡 Time-bound (ограниченная по времени) — не "в первом квартале", а "к 15 марта"

Первая неделя января — это когда у тебя есть карт-бланш на изменения. Через месяц будет текучка, через два — некогда. Сейчас — момент.


🐸 Коротко о том, что успело произойти в январе

CES показал переход Physical AI из лабораторий в производство: Boston Dynamics отправляет Atlas на завод Hyundai уже в Q1, роботы начинают делать реальные задачи.

DeepSeek v4 готовится к релизу в феврале с фокусом на кодирование — если повторит эффект v3.2 (снижение цен на 75%), экономика AI-проектов снова изменится.

iPhone Foldслухи о 7.8" экране во второй половине года. Если подтвердится — новая волна UI-паттернов для мобильных продуктов.


#ВолныИнноваций #КурсНаНовости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5🎉4👍31
🚨 Apple признала поражение в AI: сделка с Google

Apple и Google объявили о партнерстве. Gemini теперь будет питать iOS, iPadOS и macOS.

Тот самый AI, который Apple обещала на WWDC? Его нет.


😳 Масштаб катастрофы

Представьте: у вас $3 триллиона в кармане, лучшие инженеры планеты, репутация компании, которая "делает всё сама". И вы идёте к конкуренту просить мозги для своего флагманского продукта.

Технологический разрыв — в 8 раз:
→ Apple Intelligence: 150 млрд параметров
→ Gemini от Google: 1.2 триллиона

Это как сравнивать велосипед с Tesla. Собственная модель на триллион параметров? Будет готова к концу 2026. Может быть...


😫 Где Apple проиграла AI-гонку

Утекли мозги. Глава AI John Giannandrea ушёл после провала проекта. Meta* переманила ключевых экспертов, предлагая пакеты $200M+. OpenAI купил студию Jony Ive за $6 млрд и увёл десятки инженеров.

Почему? Apple не готова платить рыночные ставки за AI-таланты. Культура "работай за идею и опционы" перестала работать, когда конкуренты начали выписывать чеки с девятью нулями.

Нет железа для гонки. У Google и Microsoft — GPU-кластеры размером с футбольное поле. У Apple — красивые M-чипы, которые не подходят для тренировки frontier-моделей.

Privacy как проклятие. Конкуренты тренируют на петабайтах пользовательских данных. Apple ограничена своими же принципами конфиденциальности. Результат? Их модели уступают даже годовалому GPT-4o.


🫤 Экономика отчаяния

Apple платит Google ~$1 млрд в год за Gemini. Для компании, которая зарабатывает $383 млрд — копейки. Но символика убийственная.

Это классический паттерн Apple: сначала партнёр, потом своё решение. Так было с картами (Google → Apple Maps), процессорами (Intel → M1). Только вот AI-гонка идёт в 10 раз быстрее.


🤔 Вывод

Когда одна из самых богатых ИТ-компаний мира не может сделать конкурентный AI — это сигнал.

Нужны: петабайты данных, GPU-кластеры в огромном количестве и готовность платить сумасшедшие деньги лучшим умам. У Apple проблемы со всем этим.

🔗 Источник: Bloomberg


#КурсНаНовости

* Meta Platforms Inc. признана экстремистской организацией и её деятельность запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤯4
😱 Память подорожала в 4 раза за год: почему облака больше не выбор

На этой неделе анализировал динамику цен на серверное оборудование. Просто из любопытства посмотрел, как изменились цифры за последний год. Результат оказался драматичным.


💸 Что с ценами?

В сентябре 2024 модуль DDR5 16GB (новый стандарт оперативной памяти) стоил $6.84. К ноябрю 2025 — $24.83. Почти в 4 раза за 14 месяцев. В декабре был пик в $37 за одну сессию.

В России ещё жёстче: DDR4 подорожала на 1800%, DDR5 — более чем на 500%. Серверные модули на 256 ГБ стоят полмиллиона рублей за штуку.

Видеокарты: RTX 5090 (флагманская видеокарта NVIDIA) с рекомендованных $1,999 выросла до $3,500 за 12 месяцев. Прогноз к концу 2026 — $5,000. В Европе RTX 5060 Ti за пару недель подорожала с €480 до €520.

SSD? TrendForce прогнозирует +40% в 2026, но высокоёмкие модели (4-8 ТБ) могут уйти в +100%.


😮 Почему это происходит?

Мировые расходы на ИИ-инфраструктуру в 2026 достигнут $1.37 трлн — это прирост на $401 млрд за один год. Речь про серверы, дата-центры, GPU для обучения моделей. Гиперскейлеры (OpenAI/Microsoft, Google, xAI, Amazon) проводят массированные закупки.

Производители памяти (Samsung, SK Hynix, Micron) встали перед выбором: кому продавать? SK Hynix ушла в HBM3E (высокоскоростная память для AI-ускорителей, маржа ~60%). Samsung сначала следовала за ней, но потом выяснила: обычная DDR5 в условиях дефицита даёт маржу ~75%. Компания переориентировала 80,000 пластин в месяц на серверный DDR5.

Результат: потребительский рынок в очереди. NVIDIA, по слухам, сокращает производство игровых RTX 50 на 40% из-за дефицита GDDR7 (видеопамять для видеокарт) — та же память нужна для AI-ускорителей, где маржа выше.

Даже при расширении производства прирост DRAM (общий термин для оперативной памяти) в 2026 — только 23%, при спросе +35%. Это 12%-ный дефицит. Производители компенсируют его ценами, а не объёмами.


🇷🇺 Что в России?

В первом полугодии 2025 спрос на видеокарты упал на 3%, но средняя стоимость покупки выросла на 21%. Осенью продажи на Авито выросли на 64% — люди закупались до нового скачка цен.

Материнские платы: падение продаж на 40-50%. Рынок в ступоре.


К чему это ведёт?

Миграция в облака становится не просто актуальной — она становится экономически неизбежной. Когда нужно быстро расти по количеству сервисов, но не хочется разориться на железе, облако перестаёт быть одним из вариантов. Это становится единственным разумным выбором.

Покупать собственные серверы сейчас — как закупаться золотом в разгар золотой лихорадки. Можно, но зачем? Особенно когда облачные провайдеры уже закупили оборудование по "старым" ценам и амортизируют рост в течение 1-2 лет.


🤔 Странное ощущение

Технологический тренд и экономическая логика обычно движутся параллельно. Тут они наконец сошлись в одной точке. ИИ переписывает правила не только в софте, но и в инфраструктуре. Причём переписывает жёстко и надолго.

#ЗапискиШтурмана #ВолныИнноваций
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🤯1😱1