Forwarded from Entropy Talk: AI и разработка
Стрим про агентов в облаке и на своем железе. Приходите кому интересно (бесплатно).
Делаем расширенную версию докладов с ИИтоги 2025 – Рефат @nobilix с Валерой @neuraldeep, по 40 минут на каждого вместо 20, плюс Q&A.
Если строите AI агентов или планируете - будет полезно разобраться:
Облако (Рефат):
- Почему "просто поменять модель" уже не работает, про агентный API - и какая ситуация с вендор-локом
- Build vs Buy: на чем экономить время, а что строить самим
- Подробнее про кейсы file-first агентов и в этот раз будет время рассказать технические детали
Локально (Валера):
- Какие open-source модели реально тянут десятки тулов без галлюцинаций
- Как запустить агентов на своем железе, если есть требования к безопасности
- MCP в Enterprise: что работает, где грабли
21 января, 19:00
📅 Календарь - прямая ссылка на стрим появится там в день эфира
Делаем расширенную версию докладов с ИИтоги 2025 – Рефат @nobilix с Валерой @neuraldeep, по 40 минут на каждого вместо 20, плюс Q&A.
Если строите AI агентов или планируете - будет полезно разобраться:
Облако (Рефат):
- Почему "просто поменять модель" уже не работает, про агентный API - и какая ситуация с вендор-локом
- Build vs Buy: на чем экономить время, а что строить самим
- Подробнее про кейсы file-first агентов и в этот раз будет время рассказать технические детали
Локально (Валера):
- Какие open-source модели реально тянут десятки тулов без галлюцинаций
- Как запустить агентов на своем железе, если есть требования к безопасности
- MCP в Enterprise: что работает, где грабли
21 января, 19:00
GMT+3. Бесплатно.📅 Календарь - прямая ссылка на стрим появится там в день эфира
❤11🔥7👍2
Forwarded from Entropy Talk: AI и разработка
Начинаем эфир через 5 минут:
https://www.youtube.com/live/7toDgSozmEs
https://www.youtube.com/live/7toDgSozmEs
YouTube
AI engineering 2026 - LLM, RAG, AI агенты, разработка и инфраструктура
Каналы спикеров:
Рефат Аметов – https://t.iss.one/nobilix
Валерий Ковальский – https://t.iss.one/neuraldeep
Николай Шейко – https://t.iss.one/ai_grably
Остальные доклады с конференции → https://entropy.talk/iitogi25
Анонсы следующих мероприятий → https://t.iss.one/entropy_talk…
Рефат Аметов – https://t.iss.one/nobilix
Валерий Ковальский – https://t.iss.one/neuraldeep
Николай Шейко – https://t.iss.one/ai_grably
Остальные доклады с конференции → https://entropy.talk/iitogi25
Анонсы следующих мероприятий → https://t.iss.one/entropy_talk…
🔥16
Обходим главное ограничение Сodex (отсутствие субагентов)
Фан факты:
1. В недавнем исследовании от Cursor (сотня агентов неделю писали браузер) оказалось, что gpt-5.2 работает лучше на больших тасках, чем opus-4.5
2. При этом адекватные лимиты у OpenAI можно получить за 20$ против 100$ у Anthropic
3. И при этом в их Codex все еще не завезли субагентов 🙈
4. Зато OpenAI решили хайпануть на запрете Антропиков использовать свою подписку в топ-1 опенсорсном cli-агенте OpenCode – и сделали для них нативную интеграцию своей подписки
TL;DR
Теперь можно использовать субагентов в OpenCode с топовой gpt-5.2 под капотом. И все в рамках базовой подписки на ChatGPT за 20$, которая есть почти у всех
Фан факты:
1. В недавнем исследовании от Cursor (сотня агентов неделю писали браузер) оказалось, что gpt-5.2 работает лучше на больших тасках, чем opus-4.5
2. При этом адекватные лимиты у OpenAI можно получить за 20$ против 100$ у Anthropic
3. И при этом в их Codex все еще не завезли субагентов 🙈
4. Зато OpenAI решили хайпануть на запрете Антропиков использовать свою подписку в топ-1 опенсорсном cli-агенте OpenCode – и сделали для них нативную интеграцию своей подписки
TL;DR
Теперь можно использовать субагентов в OpenCode с топовой gpt-5.2 под капотом. И все в рамках базовой подписки на ChatGPT за 20$, которая есть почти у всех
2❤42👍24🔥8😁5
Кодинг-агент в телефоне (ч.1)
Частый вопрос в ИИ чатиках – как работать с ИИ агентом с телефона. Единственный стабильно рабочий совет, который я видел – ставить Claude Code на VPS и подключаться через termius.
Ниже инструкция:
1️⃣ Покупаем VPS. Топ: Hetzner, DigitalOcean. Дешман: RackNerd. В РФ – хз, посоветуйте в комментах
2️⃣ Настраиваем его с sudo доступом без пароля – чтобы агент мог делать все. VPS – по сути сэндбокс
Если вы не опытный пользователь linux, то просто открываем Claude Code локально и вставляем этот промпт для базовой настройки:
3️⃣ Скачиваем и подключаем Termius на телефон
Тут все просто – добавляем ip, пароль оставляем пустым, на плашку AI Agent можно забить. Единственная сложность – нужно сразу создать ssh ключи и прокинуть публичный на VPS
Credentials → SSH.id, Key, Certificate, FIDO2 → Generate key → ✔️
Почему-то скопировать публичный ключ прям отсюда нельзя. Поэтому сохраняем настройки, возвращаемся в главное меню Vault → Keychain → ED25519-00 → 📤 → Copy Public Key
Дальше с десктопа:
Возвращаемся в Vault → Hosts, тапаем на созданный сервер, оказываемся в командной строке, вуаля
Осталось установить Claude Code:
Дальше пишем
Из комментов (спасибо @nobilix):
Вот, теперь можно не вылезать из CC даже в туалете
@ai_grably
Частый вопрос в ИИ чатиках – как работать с ИИ агентом с телефона. Единственный стабильно рабочий совет, который я видел – ставить Claude Code на VPS и подключаться через termius.
Ниже инструкция:
1️⃣ Покупаем VPS. Топ: Hetzner, DigitalOcean. Дешман: RackNerd. В РФ – хз, посоветуйте в комментах
2️⃣ Настраиваем его с sudo доступом без пароля – чтобы агент мог делать все. VPS – по сути сэндбокс
Если вы не опытный пользователь linux, то просто открываем Claude Code локально и вставляем этот промпт для базовой настройки:
Помоги мне настроить VPS, чтобы запускать кодингового агента – проведи меня за ручку по всем важным этапам, а там где можешь выполнять команды самостоятельно (в т.ч. через SSH), делай это (но гранулярно, без огромных скриптов)
Требования:
Базовая настройка:
- Новый пользователь agent с sudo без пароля, чтобы агент мог сам запускать sudo-команды без интерактивного режима
- Доступ по ssh-ключу к новому пользователю agent (заранее сгенерируй ssh-ключи локально)
- Доступ к root-пользователю должен быть закрыт. Доступ по паролю – тоже
- Файерволл и fail2ban
Дополнительные настройки:
- Адекватная настройка bash history
- Swap 2GB
- Caddy
- uv для python и bun для javascript – через install.sh скрипты (найди в интернете)
- Docker + Compose v2 (добавить agent в группу docker)
ВАЖНО:
- Во время работы ты не должен получать доступ к секретам (пароль VPS, приватный ssh ключ, etc)
- Если что-то требует ввода секретных данных, то проси меня делать вручную
- В остальных случаях старайся использовать non-interactive режим, чтобы я участвовал в процессе минимально
- Задавай уточняющие вопросы, если есть что-то, что не прописано явно
3️⃣ Скачиваем и подключаем Termius на телефон
Тут все просто – добавляем ip, пароль оставляем пустым, на плашку AI Agent можно забить. Единственная сложность – нужно сразу создать ssh ключи и прокинуть публичный на VPS
Credentials → SSH.id, Key, Certificate, FIDO2 → Generate key → ✔️
Почему-то скопировать публичный ключ прям отсюда нельзя. Поэтому сохраняем настройки, возвращаемся в главное меню Vault → Keychain → ED25519-00 → 📤 → Copy Public Key
Дальше с десктопа:
ssh agent "printf '%s\n' 'ВСТАВЛЯЕМ СЮДА КЛЮЧ' >> ~/.ssh/authorized_keys"
Возвращаемся в Vault → Hosts, тапаем на созданный сервер, оказываемся в командной строке, вуаля
Осталось установить Claude Code:
curl -fsSL https://claude.ai/install.sh | bash
Дальше пишем
claude и получаем красоту на скрине выше.Из комментов (спасибо @nobilix):
1) без tmux никуда - соединение рвется, а с tmux - просто супер
2) в Termius важно включить галочку "Use Mosh" - будет моментальный отклик на нажатие клавиш
3) в Termius есть встроенный SFTP - оч удобно по файлам бегать и читать (использует тот же конфиг)
4) сменить дефолтный порт с 22 на другой (безопасность)
5) можно настроить пуш уведомления через хуки CC
Вот, теперь можно не вылезать из CC даже в туалете
@ai_grably
11🔥37👍19❤14🤝3
Кодинг-агент в телефоне (ч.2)
В прошлом посте расписал дефолтный подход с termius. Но консольный UX на тачскрине – достаточно сомнительный. Так что у меня давно чесались руки затестить еще одну идею, которую еще нигде не видел. И вот вчера руки наконец дошли
В чем идея:
1. Есть очень хороший кодинговый агент OpenCode. Пожалуй, ближайший к CC по плотности фич, а по качеству реализации, пожалуй, даже лучше
2. В отличие от остальных агентов, он написан в классическом клиент-серверном подходе – отдельно бэк, отдельно фронт
3. И у него есть два фронта – уже привычный нам консольный текстовый UI и веб версия
Короче, вы уже догадались – можно сервить на VPS сразу веб версию и подключаться к ней с любого устройства, где есть браузер (см. скрин выше)
Дальше – пошаговый гайд + подводные камни:
1️⃣ Берем инструкцию из предыдущего поста и настраиваем себе VPS с нуля – у агента будет полный доступ к нему
2️⃣ Ставим opencode. В любом агенте на локальном устройстве пишем:
Опционально: просим настроить в caddy Oauth через GitHub вместо багованного Basic Auth опенкода
3️⃣ Подключаем подписку
Недавно OpenAI сделали нативную интеграцию с OpenCode и обычная ChatGPT подписка за 20$ дает жирные лимиты на топовую gpt-5.2
1. Открываем только что задеплоенный opencode
2. Пишем
3. В открывшемся окне – Connect Provider справа вверху
4. Переходим по ссылке в лк OpenAI и даем доступ
❗️Тут проблема – флоу OpenAI редиректит на
Решение: перед попыткой входом временно пробрасываем порты в отдельном терминале
4️⃣ Создаем WebApp на смартфоне
Открываем адрес нашего OpenCode в Safary →
Кстати, так же можно создать WebApp и на десктопе, чтобы это было как отдельное приложение, а не одна из сотен вкладок в браузере (скрин в комментах)
———
Готово, у вас есть агент с полноценным UI, который доступен с любого устройства и поддерживает почти все современные фичи – CLAUDE.md/AGENT.md, MCP, LSP, skills, subagents
Бонус: теперь вы знаете как поднять такое для нетехнических сотрудников.
Ваш, @ai_grably
В прошлом посте расписал дефолтный подход с termius. Но консольный UX на тачскрине – достаточно сомнительный. Так что у меня давно чесались руки затестить еще одну идею, которую еще нигде не видел. И вот вчера руки наконец дошли
В чем идея:
1. Есть очень хороший кодинговый агент OpenCode. Пожалуй, ближайший к CC по плотности фич, а по качеству реализации, пожалуй, даже лучше
2. В отличие от остальных агентов, он написан в классическом клиент-серверном подходе – отдельно бэк, отдельно фронт
3. И у него есть два фронта – уже привычный нам консольный текстовый UI и веб версия
Короче, вы уже догадались – можно сервить на VPS сразу веб версию и подключаться к ней с любого устройства, где есть браузер (см. скрин выше)
Дальше – пошаговый гайд + подводные камни:
1️⃣ Берем инструкцию из предыдущего поста и настраиваем себе VPS с нуля – у агента будет полный доступ к нему
2️⃣ Ставим opencode. В любом агенте на локальном устройстве пишем:
Настрой мне opencode web на удаленной машине (подключаться через ssh agent):
1. Изучи документацию opencode
2. Установи opencode
3. Настрой caddy (с моим доменом или просто http – обсуди со мной оба варианта)
4. Настрой запуск в бэкграунде (tmux, docker, pm2, systemd – помоги мне выбрать)
5. Создай папку ~/projects
- Сначала вместе сформулируем план, а после моего аппрува пойдешь выполнять (или говорить мне, что выполнить, если нужен интерактивный ввод).
- Выполняй команды гранулярно (двигаемся step-by-step)
- Обязательно настрой доступ к OpenCode по паролю
- Не читай и не запрашивай пароли – они не должны оказаться у тебя в контексте
Опционально: просим настроить в caddy Oauth через GitHub вместо багованного Basic Auth опенкода
3️⃣ Подключаем подписку
Недавно OpenAI сделали нативную интеграцию с OpenCode и обычная ChatGPT подписка за 20$ дает жирные лимиты на топовую gpt-5.2
1. Открываем только что задеплоенный opencode
2. Пишем
/model в чате3. В открывшемся окне – Connect Provider справа вверху
4. Переходим по ссылке в лк OpenAI и даем доступ
❗️Тут проблема – флоу OpenAI редиректит на
https://localhost:1455, OpenCode ждет ответ не локально, а на VPSРешение: перед попыткой входом временно пробрасываем порты в отдельном терминале
ssh -L 1455:localhost:1455 agent -N
4️⃣ Создаем WebApp на смартфоне
Открываем адрес нашего OpenCode в Safary →
··· меню → share → добавить на домашний экран (скрины в комментах)Кстати, так же можно создать WebApp и на десктопе, чтобы это было как отдельное приложение, а не одна из сотен вкладок в браузере (скрин в комментах)
———
Готово, у вас есть агент с полноценным UI, который доступен с любого устройства и поддерживает почти все современные фичи – CLAUDE.md/AGENT.md, MCP, LSP, skills, subagents
Бонус: теперь вы знаете как поднять такое для нетехнических сотрудников.
Ваш, @ai_grably
1❤27👍18🔥11
Надиктовал промпт в CLI агенте – а он схлопнулся в [Pasted text +24 lines].
Запускаешь, а там артефакты от диктовки → в итоге агент 5 минут делает не то, что нужно
Узнали?
Не понимаю, зачем это сделали дефолтным поведением.
Короче, вот как пофиксить этот бред:
OpenCode
Codex CLI
Не лечится :(
Claude Code
Официальной настройки пока нет. Workaround: Ctrl+G перед отправкой — откроет prompt в редакторе, там видно весь текст.
Либо отправка, сразу ESC чтобы остановить, и еще раз ESC, чтобы сделать undo и вернуться к редактированию 🥴
Следить за issue: github.com/anthropics/claude-code/issues/3412
———
Заботимся о своем Developer Experience
@ai_grably
Запускаешь, а там артефакты от диктовки → в итоге агент 5 минут делает не то, что нужно
Узнали?
Не понимаю, зачем это сделали дефолтным поведением.
Короче, вот как пофиксить этот бред:
OpenCode
~/.config/opencode/opencode.json{
"experimental": {
"disable_paste_summary": true
}
}Codex CLI
Не лечится :(
Claude Code
Официальной настройки пока нет. Workaround: Ctrl+G перед отправкой — откроет prompt в редакторе, там видно весь текст.
Либо отправка, сразу ESC чтобы остановить, и еще раз ESC, чтобы сделать undo и вернуться к редактированию 🥴
Следить за issue: github.com/anthropics/claude-code/issues/3412
———
Заботимся о своем Developer Experience
@ai_grably
4👍49🤝6
Краткие сводки по hype-train:
- OpenClaw разгоняется за неделю до 150к ⭐️ на GitHub, сменив 3 названия (ex-clawdbot, ext-moltbot)
- Многие люди вне пузыря "Claude Code и ко" впервые трогают настоящих ии-агентов
- В процессе сливается огромное количество приватных данных и доступов
- Появляются твиттер и тиндер для ИИ-агентов (первый оказывается дырявым и сливает API ключи агентов)
- Но прогресс не остановить – люди теперь знают, что так можно – ждем распространение агентов вне отделов разработки (см. прогноз на 2026)
- OpenClaw разгоняется за неделю до 150к ⭐️ на GitHub, сменив 3 названия (ex-clawdbot, ext-moltbot)
- Многие люди вне пузыря "Claude Code и ко" впервые трогают настоящих ии-агентов
- В процессе сливается огромное количество приватных данных и доступов
- Появляются твиттер и тиндер для ИИ-агентов (первый оказывается дырявым и сливает API ключи агентов)
- Но прогресс не остановить – люди теперь знают, что так можно – ждем распространение агентов вне отделов разработки (см. прогноз на 2026)
🔥29❤13😁4🤨2👍1
AI и грабли
Краткие сводки по hype-train: - OpenClaw разгоняется за неделю до 150к ⭐️ на GitHub, сменив 3 названия (ex-clawdbot, ext-moltbot) - Многие люди вне пузыря "Claude Code и ко" впервые трогают настоящих ии-агентов - В процессе сливается огромное количество…
И в догонку
На гитхабе появляется nanoclaw (увидел у @syabro_notes) – минималистичная, секьюрная версия
Но тут я хочу разобрать именно подход к настройке – я такую комбинацию еще не видел:
1. Вся настройка запускается внутри Claude Code – через заранее заготовленные скиллы для агента
2. Код = Конфиг: в процессе настройки агент просто переписывает код nanoclaw !!!
3. Контрибьют в проекты: вместо изменения кода – добавление скиллов, которые меняют код. Например, уже есть два PR со скиллом
Получается такой liquid продукт – сам перестраивается под потребности пользователя
На гитхабе появляется nanoclaw (увидел у @syabro_notes) – минималистичная, секьюрная версия
Но тут я хочу разобрать именно подход к настройке – я такую комбинацию еще не видел:
1. Вся настройка запускается внутри Claude Code – через заранее заготовленные скиллы для агента
2. Код = Конфиг: в процессе настройки агент просто переписывает код nanoclaw !!!
3. Контрибьют в проекты: вместо изменения кода – добавление скиллов, которые меняют код. Например, уже есть два PR со скиллом
/add_telegramПолучается такой liquid продукт – сам перестраивается под потребности пользователя
5🔥41🤔15❤7🗿6
Протухание контента
Только собрался писать пост о том, как я его учил свою подругу маркетолога использовать OpenCode, который пару дней назад появился в форме десктопного аппа с нормальным UI,
Как сегодня выходит десктопный UI для кодекс 🤯
———
Скачать OpenCode (Mac, Windows, Linux)
Скачать Codex (Mac-only)
Обзор по фичам на картинке ниже (разбор только по десктопным фичам):
ваш, @ai_grably
Только собрался писать пост о том, как я его учил свою подругу маркетолога использовать OpenCode, который пару дней назад появился в форме десктопного аппа с нормальным UI,
Как сегодня выходит десктопный UI для кодекс 🤯
———
Скачать OpenCode (Mac, Windows, Linux)
Скачать Codex (Mac-only)
Обзор по фичам на картинке ниже (разбор только по десктопным фичам):
ваш, @ai_grably
2❤16👍12 5
Для любителей консольных агентов:
Новомодные графические оболочки для агентов обычно проигрывают консольным версиям по фичам.
За исключением разве что встроенного управления worktrees и удобной панелькой с диффами справа
До меня чет долго доходило, что есть прекрасные консольные утилиты, которые дают такой же экспириенс:
ваш, @ai_grably
Новомодные графические оболочки для агентов обычно проигрывают консольным версиям по фичам.
За исключением разве что встроенного управления worktrees и удобной панелькой с диффами справа
До меня чет долго доходило, что есть прекрасные консольные утилиты, которые дают такой же экспириенс:
brew install lazygit
ваш, @ai_grably
🔥22❤10👍8💯1 1
Организация ивентов для сообщества – та еще запара.
При этом, после того как начал, сложно перестать – хочется сделать еще больше, масшабнее, глубже
После прошлой конфы мы договорились с Максом, что если соберемся делать еще, то только если собирать самых селебных селеб ИИ-телеграма.
И постараться сделать так, чтобы на организацию ушло не больше 20 часов от каждого.
Наивно.
Даже сам набор спикеров занял больше – начиная состыковкой разных по вайбу ребят в цельную программу, заканчивая поиском теплых интро от знакомых к человеку, который сделает интро уже самому спикеру 🤯
А вы что думали – иначе многие даже не прочитают сообщение
Но, кажется, у нас получилось ↓
На этой конфе будем разбираться, как ИИ перестраивает команды и процессы в айтишке, как за всем этим успеть и какие грабли еще можно обойти стороной
Будет полезно всем, кто связан с разработкой, но особенно актуально для Senior+ позиций и менеджмента (и всем, кто туда целится)
[ Подробности тут ]
Как обычно, для действующих подписчиков – бесплатно
При этом, после того как начал, сложно перестать – хочется сделать еще больше, масшабнее, глубже
После прошлой конфы мы договорились с Максом, что если соберемся делать еще, то только если собирать самых селебных селеб ИИ-телеграма.
И постараться сделать так, чтобы на организацию ушло не больше 20 часов от каждого.
Наивно.
Даже сам набор спикеров занял больше – начиная состыковкой разных по вайбу ребят в цельную программу, заканчивая поиском теплых интро от знакомых к человеку, который сделает интро уже самому спикеру 🤯
А вы что думали – иначе многие даже не прочитают сообщение
Но, кажется, у нас получилось ↓
На этой конфе будем разбираться, как ИИ перестраивает команды и процессы в айтишке, как за всем этим успеть и какие грабли еще можно обойти стороной
Будет полезно всем, кто связан с разработкой, но особенно актуально для Senior+ позиций и менеджмента (и всем, кто туда целится)
[ Подробности тут ]
Как обычно, для действующих подписчиков – бесплатно
👍30🔥25❤21 2🗿1
Сдвиг 2025 → 2026. Забавное наблюдение с моих консультаций:
Во второй половине 25го года ко мне стали часто приходить компании с просьбой поревьюить их AI системы.
И почти всегда консультация шла по следующему сценарию:
1. Рассказывают/показывают свой сложный комбайн:
- Кастомный процессинг pdf в текст
- sparse/dence индексация
- RAG на эмбеддингах + bm25
- Всякие HyDE, context enrichment, query expansion, etc
- Каскад из вызовов LLM
- Какой-то хитрый трюк для извлечения референсов
- Опционально fuzzy мэтчинг референсов в изначальной PDF-ке для хайлайта (чтобы human-in-the-loop мог проверить)
2. Как один из советов я стабильно предлагаю попробовать Gemini Flash/Pro, которые нативно работает с PDF'ками, еще и умеют bounding boxes отдавать. В связке с правильно прописанной схемой Structured Output, весь пайплайн схлопывается в один-два запроса.
3. В 50% случаев в течение пары недель мне прилетает благодарность за кардинальное упрощение системы. Или повышение качества. Или и то и то.
Еще в ~30% – оказывается, что в проде использовать не получилось, но получили крутой внутренний baseline, об который тестируют прод систему. Еще в паре случаев рассказывают, что когда заказчик увидел разницу в качестве результата или стоимости/скорости дальнейшей разработки, требование на локальные модели – исчезало🙂
———
Так вот, я все чаще замечаю, что в 2026 у меня тоже появился универсальный совет/вопрос, который я задаю почти всем, прежде чем перейти к более специфичным:
Часто можно не городить свою AI систему, а тупо взять готовую, подсунуть нужные данные, и в некоторых случаях обернуть в веб-интерфейс, от которого не будут плеваться пользователи.
Это часто не только наиболее дешевое решение с т.з. разработки, поддержки и инференса, но и более точное за счет отточенного агентского цикла
Пользуйтесь:)
———
P.s. в связи с этим закрадываются мысли, что профессия AI engineer может законсервироваться, так и не сформировавшись. Сейчас поясню.
Ну вот, например, есть всего пара десятков известных бд и кучка инженеров, которые ими занимаются, а остальные просто их используют.
Так и небольшое количество инженеров будут создавать десяток популярных LLM агентов, а остальные просто будут интегрировать их в свои продукты, а не костылить самостоятельно.
Вы же не пишите свои бд, верно?
Ваш, @ai_grably
Во второй половине 25го года ко мне стали часто приходить компании с просьбой поревьюить их AI системы.
И почти всегда консультация шла по следующему сценарию:
1. Рассказывают/показывают свой сложный комбайн:
- Кастомный процессинг pdf в текст
- sparse/dence индексация
- RAG на эмбеддингах + bm25
- Всякие HyDE, context enrichment, query expansion, etc
- Каскад из вызовов LLM
- Какой-то хитрый трюк для извлечения референсов
- Опционально fuzzy мэтчинг референсов в изначальной PDF-ке для хайлайта (чтобы human-in-the-loop мог проверить)
2. Как один из советов я стабильно предлагаю попробовать Gemini Flash/Pro, которые нативно работает с PDF'ками, еще и умеют bounding boxes отдавать. В связке с правильно прописанной схемой Structured Output, весь пайплайн схлопывается в один-два запроса.
3. В 50% случаев в течение пары недель мне прилетает благодарность за кардинальное упрощение системы. Или повышение качества. Или и то и то.
Еще в ~30% – оказывается, что в проде использовать не получилось, но получили крутой внутренний baseline, об который тестируют прод систему. Еще в паре случаев рассказывают, что когда заказчик увидел разницу в качестве результата или стоимости/скорости дальнейшей разработки, требование на локальные модели – исчезало
———
Так вот, я все чаще замечаю, что в 2026 у меня тоже появился универсальный совет/вопрос, который я задаю почти всем, прежде чем перейти к более специфичным:
А вы пробовали тупо взять Claude Code, добавить туда все релевантные файлы, написать Skill как с ними работать, послать в него типичный user input вашей системы и посмотреть, что получится?
Часто можно не городить свою AI систему, а тупо взять готовую, подсунуть нужные данные, и в некоторых случаях обернуть в веб-интерфейс, от которого не будут плеваться пользователи.
Это часто не только наиболее дешевое решение с т.з. разработки, поддержки и инференса, но и более точное за счет отточенного агентского цикла
Пользуйтесь:)
———
P.s. в связи с этим закрадываются мысли, что профессия AI engineer может законсервироваться, так и не сформировавшись. Сейчас поясню.
Ну вот, например, есть всего пара десятков известных бд и кучка инженеров, которые ими занимаются, а остальные просто их используют.
Так и небольшое количество инженеров будут создавать десяток популярных LLM агентов, а остальные просто будут интегрировать их в свои продукты, а не костылить самостоятельно.
Вы же не пишите свои бд, верно?
Ваш, @ai_grably
Please open Telegram to view this post
VIEW IN TELEGRAM
❤50👍32🔥7💯4🤣3
Делюсь своими факапами
Недавно внедрял современные практики по AI-assisted-coding в команду разработчиков. В этот раз было в новом для меня формате – не просто консультации или полноценное обучение, а "прийти и помочь все настроить, чтобы команда пользовалась"
Первый факап – а полез сам руками переписывать CLAUDE.md. Догадываетесь, почему это плохо? Да просто у меня нет tacit knowledge – неявных знаний про процессы, код и продукт, которые есть у команды. Синки с ребятами естественно это не исправили.
К концу недели все было так плохо, что я предложил поработать с ними еще неделю бесплатно, чтобы довести до результата.
Про остальные два факапа и то, как я потом их исправлял – расскажу завтра на эфире в качестве приглашенного спикера. Формат для меня необычный – выступление всего 20 минут, прям блиц.
P.s. Будет еще минимум 2 крутых спикера, которых я сам буду слушать. Угадаете, кто?
⸻
19 февраля (четверг)
19:00–21:00 (UTC+3)
⸻
🎤 Спикеры
👤 Bayram Annakov @ProductsAndStartups
AI как операционная система для продукт-менеджера
👤 Nikolay Sheyko @oestick
Провал внедрения AI и 3 ключевые ошибки
👤 Gleb Kudryavtsev @gleb_pro_ai
Агентский кодинг и AI-assisted разработка
👤 Artem Subbotin @prompt_design
Интернет агентов и новая цифровая реальность
👤 Mike Volkov @huntermikevolkov
AI-native специалисты и будущее найма
🔗 Регистрация: @vami_eventbot
Недавно внедрял современные практики по AI-assisted-coding в команду разработчиков. В этот раз было в новом для меня формате – не просто консультации или полноценное обучение, а "прийти и помочь все настроить, чтобы команда пользовалась"
Первый факап – а полез сам руками переписывать CLAUDE.md. Догадываетесь, почему это плохо? Да просто у меня нет tacit knowledge – неявных знаний про процессы, код и продукт, которые есть у команды. Синки с ребятами естественно это не исправили.
К концу недели все было так плохо, что я предложил поработать с ними еще неделю бесплатно, чтобы довести до результата.
Про остальные два факапа и то, как я потом их исправлял – расскажу завтра на эфире в качестве приглашенного спикера. Формат для меня необычный – выступление всего 20 минут, прям блиц.
P.s. Будет еще минимум 2 крутых спикера, которых я сам буду слушать. Угадаете, кто?
⸻
19 февраля (четверг)
19:00–21:00 (UTC+3)
⸻
🎤 Спикеры
👤 Bayram Annakov @ProductsAndStartups
AI как операционная система для продукт-менеджера
👤 Nikolay Sheyko @oestick
Провал внедрения AI и 3 ключевые ошибки
👤 Gleb Kudryavtsev @gleb_pro_ai
Агентский кодинг и AI-assisted разработка
👤 Artem Subbotin @prompt_design
Интернет агентов и новая цифровая реальность
👤 Mike Volkov @huntermikevolkov
AI-native специалисты и будущее найма
🔗 Регистрация: @vami_eventbot
🔥20👍12❤6🤡4🤣3
Последнее время часто провожу воркшопы про ИИ-агентов в разработке.
Чтобы быть "на острие" и правильно раздавать советы, стал в своей работе параллельно использовать все три основных: Codex, Claude Code и OpenCode.
И чем дольше их использую, тем больше различий вижу.
Ниже – подробное сравнение важных для меня фичей с коротким описанием где они пригождаются
@ai_grably
Чтобы быть "на острие" и правильно раздавать советы, стал в своей работе параллельно использовать все три основных: Codex, Claude Code и OpenCode.
И чем дольше их использую, тем больше различий вижу.
Ниже – подробное сравнение важных для меня фичей с коротким описанием где они пригождаются
@ai_grably
2❤38🔥34👍11🆒4🐳2
По кулуарным разговорам вижу, что в айтишке сейчас у людей две головные боли:
1️⃣ Что будет с рынком через год и успеть подготовиться: нанять/уволить правильных людей, освоить инструменты, которые станут новым экселем, выбрать проект, котором не урежут финансирование.
2️⃣ Как начать внедрять ИИ уже сейчас. И в свою собственную рутину, и в команду/компанию.
Проблема в том, что знания о том как делать, чтобы работало – разбросаны по головам тех, кто уже что-то попробовал, наступил на грабли и нашел способ как сделать лучше.
Можно выцеплять эту инфу из закрытых чатиков на 20 человек, можно брать консультации, а можно прийти на конфу, которую мы организовали – разберем опыт ребят с совсем разным бэкграундом
Бтв, я в этот раз буду не только ведущим, но и спикером. Расскажу поподробнее про свои 3 факапа с внедрением ИИ в чужую команду, поделюсь фреймворком обучения и дам кулуарные инсайты про найм в 2026ом.
В этот раз смогли пробить планку в 3к зрителей. И вы приходите, и коллег зовите:)
[Подробности]
Для подписчиков, как всегда, бесплатно
P.s. если вы читаете это после конфы, то уже можно получить записи по той же ссылке
1️⃣ Что будет с рынком через год и успеть подготовиться: нанять/уволить правильных людей, освоить инструменты, которые станут новым экселем, выбрать проект, котором не урежут финансирование.
2️⃣ Как начать внедрять ИИ уже сейчас. И в свою собственную рутину, и в команду/компанию.
Проблема в том, что знания о том как делать, чтобы работало – разбросаны по головам тех, кто уже что-то попробовал, наступил на грабли и нашел способ как сделать лучше.
Можно выцеплять эту инфу из закрытых чатиков на 20 человек, можно брать консультации, а можно прийти на конфу, которую мы организовали – разберем опыт ребят с совсем разным бэкграундом
Бтв, я в этот раз буду не только ведущим, но и спикером. Расскажу поподробнее про свои 3 факапа с внедрением ИИ в чужую команду, поделюсь фреймворком обучения и дам кулуарные инсайты про найм в 2026ом.
В этот раз смогли пробить планку в 3к зрителей. И вы приходите, и коллег зовите:)
[Подробности]
Для подписчиков, как всегда, бесплатно
P.s. если вы читаете это после конфы, то уже можно получить записи по той же ссылке
2🔥36❤25👍18🆒3💩2🐳2🌚2
Дашборд по вызову
или как получать инсайты о своем продукте за 2 минуты и пару строк текста
Обычно, чтобы принять продуктовые решения, нужно либо самому писать SQL запросы и собирать дашборды, либо дергать аналитика, либо вообще действовать начуйке вайбе
Больше не нужно.
Мой сегодняшний детский восторг – ваншотнул отдельный дашборд-сервис для бота, которым мы выдаем доступ к конференциям.
Запрос пишу текстом и сразу получаю интерактивный дашборд с настройками, релевантными для этого конкретного запроса. Такой liquid UI на минималках
Чем отличается от классического text2sql, который обычно делаю клиентам:
- LLM тут генерит не SQL, а сразу python код
- Значит, можно переиспользовать модели данных SQLAlchemy/SQLModel
- Этот же код сразу занимается и отображением
- Благодаря
- Код тупо exec'ается – не повторяйте дома! (из защиты только auth в админку + read-only доступ к бд)
Но ощущения от использования – топ! За пару строк текста получаю любую аналитику
P.s. такие задачи – отличный кандидат для первых шагов внедрения ИИ в компанию – быстрая видимая польза, при этом находится "сбоку" – делается без долгих согласований и не влияет на другие части системы
@ai_grably
или как получать инсайты о своем продукте за 2 минуты и пару строк текста
Обычно, чтобы принять продуктовые решения, нужно либо самому писать SQL запросы и собирать дашборды, либо дергать аналитика, либо вообще действовать на
Больше не нужно.
Мой сегодняшний детский восторг – ваншотнул отдельный дашборд-сервис для бота, которым мы выдаем доступ к конференциям.
Запрос пишу текстом и сразу получаю интерактивный дашборд с настройками, релевантными для этого конкретного запроса. Такой liquid UI на минималках
Чем отличается от классического text2sql, который обычно делаю клиентам:
- LLM тут генерит не SQL, а сразу python код
- Значит, можно переиспользовать модели данных SQLAlchemy/SQLModel
- Этот же код сразу занимается и отображением
- Благодаря
streamlit даже достаточно сложный UI укладывается в пару десятков строк кода- Код тупо exec'ается – не повторяйте дома! (из защиты только auth в админку + read-only доступ к бд)
Но ощущения от использования – топ! За пару строк текста получаю любую аналитику
P.s. такие задачи – отличный кандидат для первых шагов внедрения ИИ в компанию – быстрая видимая польза, при этом находится "сбоку" – делается без долгих согласований и не влияет на другие части системы
@ai_grably
5🔥28❤14👍8🤯4