Учиться учиться с AI
Я уже рассказывал как NotebookLM помогает быстро вгружаться в новые темы. Сегодня покаже еще один подход, которым активно пользуюсь.
Напомню, что я вписался в курс AI Product Engineer. Уже на первом домашнем задании пришлось делать AI-агента, который обрабатывает отзывы клиентов.
Я вообще никогда раньше агентов не собирал — знания скорее теоретические, да и с кодингом отношения примерно никакие, последний раз писал код лет 6 назад, да и то недолго 😅
Но с появлением AI понял простую штуку: теперь я могу разобраться почти с чем угодно, вопрос лишь в том, сколько времени это займет.
В итоге собрал для себя такой алгоритм:
1. Отдельный проект в ChatGPT
Загружаю туда контекст и материалы курса. Так модель всегда опирается на нужные мне знания и меньше генерит чего-то усредненного
2. Выгружаю задачу голосом
Просто потому, что быстрее и проще. Важно выгрузить максимум деталей — нейросеть сама отбросить весь "речевой мусор"
3. Уточняю понимание задачи
Обязательно прошу модель пересказать, как она поняла мою задачу, и задать вопросы про то, что я мог забыть. После пары итераций получаю четко сформулированную задачу
4. Выбираю план решения
Прошу GPT предложить варианты решения, и главное — объяснить, почему именно так. Если что-то непонятно — прошу прояснить, пока в голове не сложится полная картинка
5. Формирую ТЗ
Перевожу план в понятное мне и LLM задание, отдаю его на вход уже кодинговому агенту. Если нужно — вношу правки
6. Вайбкодинг. Тут не буду подробно останавливаться, это заслуживает отдельного поста 😀
7. Утрясаю понимание кода. Когда все работает, я загружаю весь код в Gemini (он может переваривать большой контекст) и прошу объяснить какие части кода за что отвечают. На скрине пример, где я начинаю обсуждать логику работы агента
Короче, используйте нейросети как партнера по мышлению — и офигеете, насколько быстрее начнете разбираться в любых задачах 😌
Я уже рассказывал как NotebookLM помогает быстро вгружаться в новые темы. Сегодня покаже еще один подход, которым активно пользуюсь.
Напомню, что я вписался в курс AI Product Engineer. Уже на первом домашнем задании пришлось делать AI-агента, который обрабатывает отзывы клиентов.
Я вообще никогда раньше агентов не собирал — знания скорее теоретические, да и с кодингом отношения примерно никакие, последний раз писал код лет 6 назад, да и то недолго 😅
Но с появлением AI понял простую штуку: теперь я могу разобраться почти с чем угодно, вопрос лишь в том, сколько времени это займет.
В итоге собрал для себя такой алгоритм:
1. Отдельный проект в ChatGPT
Загружаю туда контекст и материалы курса. Так модель всегда опирается на нужные мне знания и меньше генерит чего-то усредненного
2. Выгружаю задачу голосом
Просто потому, что быстрее и проще. Важно выгрузить максимум деталей — нейросеть сама отбросить весь "речевой мусор"
3. Уточняю понимание задачи
Обязательно прошу модель пересказать, как она поняла мою задачу, и задать вопросы про то, что я мог забыть. После пары итераций получаю четко сформулированную задачу
4. Выбираю план решения
Прошу GPT предложить варианты решения, и главное — объяснить, почему именно так. Если что-то непонятно — прошу прояснить, пока в голове не сложится полная картинка
5. Формирую ТЗ
Перевожу план в понятное мне и LLM задание, отдаю его на вход уже кодинговому агенту. Если нужно — вношу правки
6. Вайбкодинг. Тут не буду подробно останавливаться, это заслуживает отдельного поста 😀
7. Утрясаю понимание кода. Когда все работает, я загружаю весь код в Gemini (он может переваривать большой контекст) и прошу объяснить какие части кода за что отвечают. На скрине пример, где я начинаю обсуждать логику работы агента
Короче, используйте нейросети как партнера по мышлению — и офигеете, насколько быстрее начнете разбираться в любых задачах 😌
❤10👍2
Как мы в Додо AI завозили
У меня есть коллега Вова – мы с ним одними из первых в Додо начали юзать разные AI-тулы. Для нас было супер странно: вокруг уже все активно что-то тестят, внедряют, а у нас почему-то идет медленно и воспринимается неоднозначно.
Решили, что пора с этим что-то делать. Начали максимально просто – провели открытую лекцию. Без сложных терминов и заумной теории, просто на пальцах показали, что вообще происходит на рынке и как мы сами уже используем нейросети в ежедневной работе. В итоге зашло бодро: 200+ регистраций, много живого фидбека и вопросов.
Сразу после запустили два обучающих формата:
Summer AI Camp – закрытый интенсив из 5 воркшопов для 20 человек. Минимум теории, максимум практики.
AI Case Club — регулярные открытые встречи, куда любой мог прийти с задачей и сразу получить решение с помощью AI.
На первый поток кэмпа неожиданно прилетело аж 52 заявки, пришлось делать отбор. Взяли ребят с минимальным опытом, специально из разных команд, чтобы потом знания естественным образом расходились внутри компании. Каждую неделю ребята делали что-то небольшое и конкретное: писали промпты, создавали своих первых ассистентов, делали простенькие автоматизации без кода и прототипы продуктов.
В конце было открытое демо: кто-то сделал ассистента для ведения документации, кто-то калькулятор налогов, кто-то собрал помощника для общения с юристами. Очень круто было видеть, как люди с минимальным опытом за несколько недель смогли собрать что-то полезное.
После кэмпа мы открыли записи для всех внутри компании, чтобы любой желающий мог прокачать свои AI-навыки. Сейчас думаем про второй поток и параллельно хотим запустить такой же формат для франчайзи Додо.
Короче, мораль – иногда достаточно просто начать самому, чтобы вокруг появилась новая движуха. Поэтому если у вас в компании пока не внедрили AI, возможно, самое время попробовать самостоятельно. Ну, или зовите нас с Вовой, поможем разобраться😏
У меня есть коллега Вова – мы с ним одними из первых в Додо начали юзать разные AI-тулы. Для нас было супер странно: вокруг уже все активно что-то тестят, внедряют, а у нас почему-то идет медленно и воспринимается неоднозначно.
Решили, что пора с этим что-то делать. Начали максимально просто – провели открытую лекцию. Без сложных терминов и заумной теории, просто на пальцах показали, что вообще происходит на рынке и как мы сами уже используем нейросети в ежедневной работе. В итоге зашло бодро: 200+ регистраций, много живого фидбека и вопросов.
Сразу после запустили два обучающих формата:
Summer AI Camp – закрытый интенсив из 5 воркшопов для 20 человек. Минимум теории, максимум практики.
AI Case Club — регулярные открытые встречи, куда любой мог прийти с задачей и сразу получить решение с помощью AI.
На первый поток кэмпа неожиданно прилетело аж 52 заявки, пришлось делать отбор. Взяли ребят с минимальным опытом, специально из разных команд, чтобы потом знания естественным образом расходились внутри компании. Каждую неделю ребята делали что-то небольшое и конкретное: писали промпты, создавали своих первых ассистентов, делали простенькие автоматизации без кода и прототипы продуктов.
В конце было открытое демо: кто-то сделал ассистента для ведения документации, кто-то калькулятор налогов, кто-то собрал помощника для общения с юристами. Очень круто было видеть, как люди с минимальным опытом за несколько недель смогли собрать что-то полезное.
После кэмпа мы открыли записи для всех внутри компании, чтобы любой желающий мог прокачать свои AI-навыки. Сейчас думаем про второй поток и параллельно хотим запустить такой же формат для франчайзи Додо.
Короче, мораль – иногда достаточно просто начать самому, чтобы вокруг появилась новая движуха. Поэтому если у вас в компании пока не внедрили AI, возможно, самое время попробовать самостоятельно. Ну, или зовите нас с Вовой, поможем разобраться
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍5❤4🎉2❤🔥1
Forwarded from Папа делает так
AI для общения с детьми на расстоянии
Этим летом мы с детьми оказались в разных странах. Конечно, стараемся созваниваться почаще, но удерживать внимание в таком возрасте через экран непросто. Мне даже стало немного грустно. Тогда я подумал: а что если превратить обычный звонок в игру-приключение?
Так я сделал детективную мини-игру "Кто украл метеорит?"
Как я ее сделал
Сначала пошел в ChatGPT и рассказал, какие темы сейчас увлекают Даню (в частности, там были ниндзя, космос и детективы). Нейросеть быстро набросала базовый сюжет и нарисовала картинку с местом преступления.
Потом я открыл Gemini и превратил эту задумку в интерактивную веб-игру с персонажами и уликами. Я немного адаптировал сценарий, добавил иллюстрации подозреваемых и сгенерировал короткое видео-развязку (через Veo3), показывающее, кто и как на самом деле похитил метеорит. На реализацию у меня в итоге ушло часа 2.
Сюжет игры сделан таким образом, что там нет заранее заданного ответа. Мы вместе с Даней обсуждали его гипотезы, фантазировали, рассуждали и просто весело проводили время.
Неожиданно я задал новую планку качества онлайн-общения с сыном. Теперь, когда Даня занимается португальским онлайн, он жалуется, что ему "не хватает детектива" 😅
Если вдруг окажитесь в подобной ситуации или просто захотите сделать игру для ребенка, вот что можно сделать:
1. Обсудите с нейросетью сюжет игры или квеста, рассказав какие есть интересы у ребенка
2. Переходите в Gemini или Claude (и там, и там есть удобный превью режим, чтобы сразу видеть, что получается) и шаг за шагом создавайте интерактивную историю. Просто описывайте желаемое – остальное модель сделает сама
3. Сделайте эффектную развязку: небольшое видео или анимацию (легко генерируется с помощью Veo3)
Если будут вопросы, пишите, с радостью помогу!
Этим летом мы с детьми оказались в разных странах. Конечно, стараемся созваниваться почаще, но удерживать внимание в таком возрасте через экран непросто. Мне даже стало немного грустно. Тогда я подумал: а что если превратить обычный звонок в игру-приключение?
Так я сделал детективную мини-игру "Кто украл метеорит?"
Как я ее сделал
Сначала пошел в ChatGPT и рассказал, какие темы сейчас увлекают Даню (в частности, там были ниндзя, космос и детективы). Нейросеть быстро набросала базовый сюжет и нарисовала картинку с местом преступления.
Потом я открыл Gemini и превратил эту задумку в интерактивную веб-игру с персонажами и уликами. Я немного адаптировал сценарий, добавил иллюстрации подозреваемых и сгенерировал короткое видео-развязку (через Veo3), показывающее, кто и как на самом деле похитил метеорит. На реализацию у меня в итоге ушло часа 2.
Сюжет игры сделан таким образом, что там нет заранее заданного ответа. Мы вместе с Даней обсуждали его гипотезы, фантазировали, рассуждали и просто весело проводили время.
Неожиданно я задал новую планку качества онлайн-общения с сыном. Теперь, когда Даня занимается португальским онлайн, он жалуется, что ему "не хватает детектива" 😅
Если вдруг окажитесь в подобной ситуации или просто захотите сделать игру для ребенка, вот что можно сделать:
1. Обсудите с нейросетью сюжет игры или квеста, рассказав какие есть интересы у ребенка
2. Переходите в Gemini или Claude (и там, и там есть удобный превью режим, чтобы сразу видеть, что получается) и шаг за шагом создавайте интерактивную историю. Просто описывайте желаемое – остальное модель сделает сама
3. Сделайте эффектную развязку: небольшое видео или анимацию (легко генерируется с помощью Veo3)
Если будут вопросы, пишите, с радостью помогу!
YouTube
Kids detective quest result
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
🔥10❤5
Диджитал-сувенир из 🇧🇷
Думаю, каждый хоть раз пробовал сгенерить музыку в Suno (если нет - очень рекомендую, гарантирую много фана). Кстати, в платной версии там вообще какие-то невероятные штуки можно делать, зацените этот reels.
Так вот, под конец своей поездки в Бразилию решил по приколу попросить чатджпт написать песню на основе наших с ним разговоров за это время. Чутка подтюнил текст, закинул в Suno, ну и сгенерил в gpt обложку из одной из моих фоток.
Получился такой ламповый digital-сувенир на память🎵
Думаю, каждый хоть раз пробовал сгенерить музыку в Suno (если нет - очень рекомендую, гарантирую много фана). Кстати, в платной версии там вообще какие-то невероятные штуки можно делать, зацените этот reels.
Так вот, под конец своей поездки в Бразилию решил по приколу попросить чатджпт написать песню на основе наших с ним разговоров за это время. Чутка подтюнил текст, закинул в Suno, ну и сгенерил в gpt обложку из одной из моих фоток.
Получился такой ламповый digital-сувенир на память
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤4
AI First подход
Вчера купил подписку в ElevenLabs, хотел потестить клонирование чужого голоса (в исследовательских целях!). Уперся в логичное ограничение безопасности: нужно живое подтверждение этого человека. Решил оформить возврат. И тут редкий для SaaS кайф: их AI-ассистент мгновенно дал форму, письмо пришло сразу, клик – и через пару секунд подписка отменена. От решения до результата – 5-7 минут, без ожиданий и пинг-понга с поддержкой.
Почему так? Потому что процесс изначально спроектирован как AI First: без людей в критическом пути, с нужными данными и понятной валидацией.
Подобные "умные AI-помощники" сейчас есть уже почти в каждом сервисе, но почему же не все они такие умные? Да что уж там далеко ходить, в Додо тоже пробовали с этим экспериментировать, но "не взлетело". Давайте разбираться.
В Додо мы тестировали внешнего AI-ассистента поверх своей базы знаний. На маленьком, аккуратно подготовленном юзкейсе все работало нормально. Как только скормили большой массив информации – качество рухнуло. Проблема тут была не в ассистенте и не в модели, а в контексте: дубли, противоречия, старые версии, разъехавшиеся термины. Пришлось откатиться, и начать наводить порядок в данных, чтобы продолжать дальше.
Поэтому компании, которые спроектируют процессы как AI First, определенно получат преимущества.
Чтобы было понятнее, чем AI First отличается от "прикрутить AI к чат-боту" – свежий пример с рынка. Airbnb публично заявили, что идут к приложению AI First: уже запустили AI-агента в поддержке, сокращают эскалации к людям, а дальше – персональные агенты внутри продукта, которые не просто подскажут, как отменить бронь, а сами отменят, подберут альтернативы и оформят новую поездку. И это, очевидно, не слой поверх старого процесса, а процесс заново спроектированный под AI.
Так что просто "прикрутить AI" к чатику – это косметика. Все строится на мощном фундаменте, где под капотом много нюансов:
— чистая, нормализованная база знаний и событийка (онтология, статусы, SLA, исключения)
— доступы и ограничения на уровне документов и полей (privacy, аудит, версии)
— ретривал, который действительно находит нужное (адекватные чанки, эмбеддинги, синонимы, дедупликация, актуальность)
— сквозные интеграции (биллинг, CRM, тикет-система) с правом делать действие, а не только советовать
Кстати по теме рекомендую посмотреть выступление Эльвиры Морозовой про внедрение LLM в Яндексе, в частности в кейсах поддержки.
TL;DR: кажется сейчас у новых компаний есть окно возможностей – сразу строить AI First процессы и выигрывать скоростью и отсутствием трения. Тем, у кого накоплены годы контента, сначала придется причесать его, иначе любые AI решения (не важно, свои или внешние) не дадут нужный эффект.
Ну а если у вас есть практический опыт внедрения AI в поддержке – дайте знать, было бы полезно проконсультироваться, чтобы наломать поменьше дров 🙏
Вчера купил подписку в ElevenLabs, хотел потестить клонирование чужого голоса (в исследовательских целях!). Уперся в логичное ограничение безопасности: нужно живое подтверждение этого человека. Решил оформить возврат. И тут редкий для SaaS кайф: их AI-ассистент мгновенно дал форму, письмо пришло сразу, клик – и через пару секунд подписка отменена. От решения до результата – 5-7 минут, без ожиданий и пинг-понга с поддержкой.
Почему так? Потому что процесс изначально спроектирован как AI First: без людей в критическом пути, с нужными данными и понятной валидацией.
Подобные "умные AI-помощники" сейчас есть уже почти в каждом сервисе, но почему же не все они такие умные? Да что уж там далеко ходить, в Додо тоже пробовали с этим экспериментировать, но "не взлетело". Давайте разбираться.
В Додо мы тестировали внешнего AI-ассистента поверх своей базы знаний. На маленьком, аккуратно подготовленном юзкейсе все работало нормально. Как только скормили большой массив информации – качество рухнуло. Проблема тут была не в ассистенте и не в модели, а в контексте: дубли, противоречия, старые версии, разъехавшиеся термины. Пришлось откатиться, и начать наводить порядок в данных, чтобы продолжать дальше.
Поэтому компании, которые спроектируют процессы как AI First, определенно получат преимущества.
Чтобы было понятнее, чем AI First отличается от "прикрутить AI к чат-боту" – свежий пример с рынка. Airbnb публично заявили, что идут к приложению AI First: уже запустили AI-агента в поддержке, сокращают эскалации к людям, а дальше – персональные агенты внутри продукта, которые не просто подскажут, как отменить бронь, а сами отменят, подберут альтернативы и оформят новую поездку. И это, очевидно, не слой поверх старого процесса, а процесс заново спроектированный под AI.
Так что просто "прикрутить AI" к чатику – это косметика. Все строится на мощном фундаменте, где под капотом много нюансов:
— чистая, нормализованная база знаний и событийка (онтология, статусы, SLA, исключения)
— доступы и ограничения на уровне документов и полей (privacy, аудит, версии)
— ретривал, который действительно находит нужное (адекватные чанки, эмбеддинги, синонимы, дедупликация, актуальность)
— сквозные интеграции (биллинг, CRM, тикет-система) с правом делать действие, а не только советовать
Кстати по теме рекомендую посмотреть выступление Эльвиры Морозовой про внедрение LLM в Яндексе, в частности в кейсах поддержки.
TL;DR: кажется сейчас у новых компаний есть окно возможностей – сразу строить AI First процессы и выигрывать скоростью и отсутствием трения. Тем, у кого накоплены годы контента, сначала придется причесать его, иначе любые AI решения (не важно, свои или внешние) не дадут нужный эффект.
Ну а если у вас есть практический опыт внедрения AI в поддержке – дайте знать, было бы полезно проконсультироваться, чтобы наломать поменьше дров 🙏
❤7👍5
Pay → Rest App → GCX → UAE → IMG → CVM → AI
В этих аббревиатурах зашифрован мой путь в Додо. Сейчас идет 7-ой год и вот с прошлой недели новая роль, буду развивать AI в компании.
Забавно, что чуть больше года назад я писал про win-win возможности развития в Додо, приятно, что все мои слова из того поста все еще актуальны.
Так что следите за обновлениями, астрологи объявили еще больше постов про AI в этом канале 🔮
В этих аббревиатурах зашифрован мой путь в Додо. Сейчас идет 7-ой год и вот с прошлой недели новая роль, буду развивать AI в компании.
Забавно, что чуть больше года назад я писал про win-win возможности развития в Додо, приятно, что все мои слова из того поста все еще актуальны.
Так что следите за обновлениями, астрологи объявили еще больше постов про AI в этом канале 🔮
Telegram
Борода Бориса
Win-win
Пошел 5-й год работы в Додо. Для меня это прям дофига. Обычно меня хватало максимум на год, потом становилось скучно.
Так вот, в Додо не скучно 😀
Потому что есть возможность расти куда угодно. Вот серьезно, хочешь вертикально, хочешь горизонтально.…
Пошел 5-й год работы в Додо. Для меня это прям дофига. Обычно меня хватало максимум на год, потом становилось скучно.
Так вот, в Додо не скучно 😀
Потому что есть возможность расти куда угодно. Вот серьезно, хочешь вертикально, хочешь горизонтально.…
1🔥13❤3
Внедрение AI в компанию на практике
Менять устоявшиеся процессы всегда непросто. А с AI сложнее вдвойне, потому что пока никто не знает как правильно. Самое лучшее в такой ситуации — это обмениваться опытом с теми, кто реально что-то делает на практике.
Поэтому на следующей неделе мы проведем открытый эфир про внедрение AI в компании и процессы — разберем, что у кого реально работает, а что нет.
С кем будем общаться
— Елена Хлюпова – CEO Tiburon Research
— Елена Дернова – основатель и креативный директор «Луч ИИ», Baloo — AI-агент для креатива в перфоманс-маркетинге
— Дима Соловьев – лид по развитию новых направлений и команды, «Радость Понимания», co-founder AI LAB
Когда
Вторник, 19 августа, 19:00 МСК. Ссылка появится тут за час до старта. Добавить в календарь.
Если есть вопросы или кейсы — пишите в комменты, постараемся обсудить в эфире.
Менять устоявшиеся процессы всегда непросто. А с AI сложнее вдвойне, потому что пока никто не знает как правильно. Самое лучшее в такой ситуации — это обмениваться опытом с теми, кто реально что-то делает на практике.
Поэтому на следующей неделе мы проведем открытый эфир про внедрение AI в компании и процессы — разберем, что у кого реально работает, а что нет.
С кем будем общаться
— Елена Хлюпова – CEO Tiburon Research
— Елена Дернова – основатель и креативный директор «Луч ИИ», Baloo — AI-агент для креатива в перфоманс-маркетинге
— Дима Соловьев – лид по развитию новых направлений и команды, «Радость Понимания», co-founder AI LAB
Когда
Вторник, 19 августа, 19:00 МСК. Ссылка появится тут за час до старта. Добавить в календарь.
Если есть вопросы или кейсы — пишите в комменты, постараемся обсудить в эфире.
1❤15🔥4
AI Борода Бориса
Внедрение AI в компанию на практике Менять устоявшиеся процессы всегда непросто. А с AI сложнее вдвойне, потому что пока никто не знает как правильно. Самое лучшее в такой ситуации — это обмениваться опытом с теми, кто реально что-то делает на практике. …
Начинаем эфир через 10 минут!
https://us06web.zoom.us/j/81564089792?pwd=HsBZDkFiUjl5rVpehQDj1rTGNbCwuT.1
https://us06web.zoom.us/j/81564089792?pwd=HsBZDkFiUjl5rVpehQDj1rTGNbCwuT.1
Zoom
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise cloud communications.
AI Борода Бориса
Внедрение AI в компанию на практике Менять устоявшиеся процессы всегда непросто. А с AI сложнее вдвойне, потому что пока никто не знает как правильно. Самое лучшее в такой ситуации — это обмениваться опытом с теми, кто реально что-то делает на практике. …
Запись эфира о сложностях внедрения AI
Спасибо всем, кто пришел и поделился практикой. Если пропустили – вот запись.
Главный инсайт, который я для себя вынес: те, кто сейчас с любопытством изучает AI, определенно получат конкурентное преимущество в будущем. Да, сегодня разрыв между теми, кто использует AI, и теми, кто нет, может казаться незначительным. Но он неизбежно будет расти. И хотя до полной замены людей еще далеко (и неизвестно, придем ли мы к этому вообще), уже сейчас можно автоматизировать множество процессов в самых разных профессиях.
При этом в разных компаниях отношение к AI может кардинально отличаться. Где-то инициативы спускают сверху, где-то развитие идет снизу благодаря энтузиастам, а где-то подобные инструменты и вовсе ограничивают или запрещают.
Поэтому моя рекомендация – начинайте с себя. Набивайте руку на любых кейсах, с которыми сталкиваетесь, причем лучше начинать не с рабочих задач, а с личных и бытовых. Возьмите за привычку обращаться к AI с разными вопросами, наблюдайте, где он работает хорошо, а где дает сбои – таких случаев тоже немало. Когда войдете во вкус и поймете границы возможного, можно переходить к рабочим задачам.
Если не знаете, с чего начать, рекомендую статью "Build your personal AI copilot" – довольно прикладная и универсальная инструкция по внедрению AI в повседневную жизнь. А мой коллега Вова сделал по мотивам этой статьи классный мини-курс, который пошагово проведет вас через процесс создания собственного AI-ассистента.
Спасибо всем, кто пришел и поделился практикой. Если пропустили – вот запись.
Главный инсайт, который я для себя вынес: те, кто сейчас с любопытством изучает AI, определенно получат конкурентное преимущество в будущем. Да, сегодня разрыв между теми, кто использует AI, и теми, кто нет, может казаться незначительным. Но он неизбежно будет расти. И хотя до полной замены людей еще далеко (и неизвестно, придем ли мы к этому вообще), уже сейчас можно автоматизировать множество процессов в самых разных профессиях.
При этом в разных компаниях отношение к AI может кардинально отличаться. Где-то инициативы спускают сверху, где-то развитие идет снизу благодаря энтузиастам, а где-то подобные инструменты и вовсе ограничивают или запрещают.
Поэтому моя рекомендация – начинайте с себя. Набивайте руку на любых кейсах, с которыми сталкиваетесь, причем лучше начинать не с рабочих задач, а с личных и бытовых. Возьмите за привычку обращаться к AI с разными вопросами, наблюдайте, где он работает хорошо, а где дает сбои – таких случаев тоже немало. Когда войдете во вкус и поймете границы возможного, можно переходить к рабочим задачам.
Если не знаете, с чего начать, рекомендую статью "Build your personal AI copilot" – довольно прикладная и универсальная инструкция по внедрению AI в повседневную жизнь. А мой коллега Вова сделал по мотивам этой статьи классный мини-курс, который пошагово проведет вас через процесс создания собственного AI-ассистента.
YouTube
Сложности внедрения ИИ
Честный разговор про проблемы внедрения ИИ в процессы. Разберем с практиками, которые делают это прямо сейчас.
Участники:
• Борис Герн — AI-лид в Додо
• Елена Дернова — основатель и креативный директор видео-нейропродакшена Луч ИИ, Baloo ии-агента по…
Участники:
• Борис Герн — AI-лид в Додо
• Елена Дернова — основатель и креативный директор видео-нейропродакшена Луч ИИ, Baloo ии-агента по…
❤6👍3
Месяц в новой роли: наводим порядок
Сегодня месяц как я официально в новой роли. И самая большая проблема – понять, за что браться в первую очередь. В AI каждый день что-то меняется, а за кейсами внедрения на масштабе компании типа Додо еще надо поохотиться.
Каждую неделю от коллег прилетают идеи и запросы. С одной стороны – хочется помочь и довести до результата побыстрее. С другой – ясно, что инвестировать нужно либо в системные решения, которые дают эффект сразу многим, либо в проекты с быстрым ощутимым результатом типа автоматизации поддержки.
Чтобы было удобнее, я разложил все входящие запросы и свои идеи по 5 стримам, каждый из которых наполняется своим бэклогом.
🏗 Infrastructure
Строим фундамент для AI: подготовка данных к работе с LLM, создание песочницы для экспериментов и прод-контура для масштабирования, реализация API/MCP для интеграций, настройка мониторинга.
🛠 Tools
Покупаем или разрабатываем инструменты, которые ускоряют доставку ценности: агенты для тестирования и кодинга, сервисы для ресерча и прототипирования.
🚀 Pilots
Запускаем эксперименты для конкретных процессов: фокус на проектах с ощутимой бизнес-ценностью. Каждый пилот – это проверка гипотезы с понятными метриками успеха.
🎓 Culture
Учим и вовлекаем: проводим воркшопы, мастер-классы, хакатоны, делимся кейсами и приглашаем экспертов, помогаем создавать простеньких личных ассистентов.
📊 Governance
Измеряем эффект от инициатив и управляем рисками: определяем и трекаем метрики, описываем AI-политики и процессы внедрения.
Параллельно формирую вижн того, куда может трансформироваться компания, если бы процессы в ней были AI-first. Одна из фундаментальных мыслей тут – у нас должны быть качественно описанные и всегда актуальные кластеры информации (база знаний, кодовая база, база данных), с которыми LLM могли бы легко взаимодействовать для обогащения контекста. Модели и инструменты будут постоянно меняться, но для всех них нужен будет качественный слой информации.
И вообще, контекст — это новая нефть. Кто владеет качественным контекстом и умеет его правильно "нарезать" под задачи – тот заметно преуспеет в этой AI гонке.
Если у вас есть релевантный опыт в каком-нибудь из интересующих меня стримов – пишите, буду рад пообщаться!
Сегодня месяц как я официально в новой роли. И самая большая проблема – понять, за что браться в первую очередь. В AI каждый день что-то меняется, а за кейсами внедрения на масштабе компании типа Додо еще надо поохотиться.
Каждую неделю от коллег прилетают идеи и запросы. С одной стороны – хочется помочь и довести до результата побыстрее. С другой – ясно, что инвестировать нужно либо в системные решения, которые дают эффект сразу многим, либо в проекты с быстрым ощутимым результатом типа автоматизации поддержки.
Чтобы было удобнее, я разложил все входящие запросы и свои идеи по 5 стримам, каждый из которых наполняется своим бэклогом.
🏗 Infrastructure
Строим фундамент для AI: подготовка данных к работе с LLM, создание песочницы для экспериментов и прод-контура для масштабирования, реализация API/MCP для интеграций, настройка мониторинга.
🛠 Tools
Покупаем или разрабатываем инструменты, которые ускоряют доставку ценности: агенты для тестирования и кодинга, сервисы для ресерча и прототипирования.
🚀 Pilots
Запускаем эксперименты для конкретных процессов: фокус на проектах с ощутимой бизнес-ценностью. Каждый пилот – это проверка гипотезы с понятными метриками успеха.
🎓 Culture
Учим и вовлекаем: проводим воркшопы, мастер-классы, хакатоны, делимся кейсами и приглашаем экспертов, помогаем создавать простеньких личных ассистентов.
📊 Governance
Измеряем эффект от инициатив и управляем рисками: определяем и трекаем метрики, описываем AI-политики и процессы внедрения.
Параллельно формирую вижн того, куда может трансформироваться компания, если бы процессы в ней были AI-first. Одна из фундаментальных мыслей тут – у нас должны быть качественно описанные и всегда актуальные кластеры информации (база знаний, кодовая база, база данных), с которыми LLM могли бы легко взаимодействовать для обогащения контекста. Модели и инструменты будут постоянно меняться, но для всех них нужен будет качественный слой информации.
И вообще, контекст — это новая нефть. Кто владеет качественным контекстом и умеет его правильно "нарезать" под задачи – тот заметно преуспеет в этой AI гонке.
Если у вас есть релевантный опыт в каком-нибудь из интересующих меня стримов – пишите, буду рад пообщаться!
1👍12❤10❤🔥3🔥1
Чатджпт уже не тот
После релиза GPT-5 произошла забавная штука – я стал меньше им пользоваться. Раньше был мощный перекос в его сторону, а теперь примерно поровну распределяю время между ChatGPT, Claude и Gemini.
Три гипотезы, почему так вышло
1. Контекст стал работать хуже. У меня в ChatGPT куча проектов с длинной историей. Раньше это было преимуществом, теперь – проблема. Модель часто подмешивает нерелевантный контекст и, наоборот, игнорирует важный. Приходится постоянно исправлять и направлять. Это бесит.
2. Меньше моделей = меньше гибкости. OpenAI упростили выбор моделей. Для большинства это плюс – модель 5 объективно лучше 4o, и теперь люди получают более качественный опыт из коробки, особенно когда стоит автоматический режим выбора модели и порой включается умная модель.
Но для тех, кто умел выбирать модель под задачу, это минус. Например, раньше для текстов я использовал GPT-4.5 – сейчас ее нет, а GPT-5, по ощущениям, пишет тексты похуже.
3. Разница между Plus и Pro
Какое-то время пробовал Pro за $200, потом откатился обратно на Plus за пару недель до релиза GPT-5. Сначала казалось – разницы нет. Потом начал замечать: лимиты жестче, ответы в дипресерче скуднее. Возможно, это тоже влияет на субъективное ощущение деградации.
Как у меня сейчас
Gemini внезапно стал крут – обработка транскриптов заметно лучше, документация четче, а новый генератор картинок Imagen 3 просто пушка.
В Claude нравится писать тексты и создавать артефакты. Например, делаю вместе с сыном обучающие игры. Плюс перешел на Claude Code в вайбкодинге.
ChatGPT больше всего использую для взаимодействия голосом и когда надо показать что-то в реалтайме по видео.
В общем респект конкуренции и чет грустно за OpenAI, которые в последнее время не показывают ничего прорывного.
После релиза GPT-5 произошла забавная штука – я стал меньше им пользоваться. Раньше был мощный перекос в его сторону, а теперь примерно поровну распределяю время между ChatGPT, Claude и Gemini.
Три гипотезы, почему так вышло
1. Контекст стал работать хуже. У меня в ChatGPT куча проектов с длинной историей. Раньше это было преимуществом, теперь – проблема. Модель часто подмешивает нерелевантный контекст и, наоборот, игнорирует важный. Приходится постоянно исправлять и направлять. Это бесит.
2. Меньше моделей = меньше гибкости. OpenAI упростили выбор моделей. Для большинства это плюс – модель 5 объективно лучше 4o, и теперь люди получают более качественный опыт из коробки, особенно когда стоит автоматический режим выбора модели и порой включается умная модель.
Но для тех, кто умел выбирать модель под задачу, это минус. Например, раньше для текстов я использовал GPT-4.5 – сейчас ее нет, а GPT-5, по ощущениям, пишет тексты похуже.
3. Разница между Plus и Pro
Какое-то время пробовал Pro за $200, потом откатился обратно на Plus за пару недель до релиза GPT-5. Сначала казалось – разницы нет. Потом начал замечать: лимиты жестче, ответы в дипресерче скуднее. Возможно, это тоже влияет на субъективное ощущение деградации.
Как у меня сейчас
Gemini внезапно стал крут – обработка транскриптов заметно лучше, документация четче, а новый генератор картинок Imagen 3 просто пушка.
В Claude нравится писать тексты и создавать артефакты. Например, делаю вместе с сыном обучающие игры. Плюс перешел на Claude Code в вайбкодинге.
ChatGPT больше всего использую для взаимодействия голосом и когда надо показать что-то в реалтайме по видео.
В общем респект конкуренции и чет грустно за OpenAI, которые в последнее время не показывают ничего прорывного.
❤9
Media is too big
VIEW IN TELEGRAM
MVP AI-сервиса для аналитики NPS и отзывов в Додо
На прошлой неделе закончился курс AI Product Engineer от Байрама (курс, кстати топ, рекомендую). В первом дз нужно было сделать агента для анализа отзывов. Я свой собрал еще месяц назад, нопонял, что в канале про это еще не рассказывал.
В Додо регулярно собираем фидбек и NPS. Разбирать это руками – долго и неудобно. Я навайбкодил агента: загружаешь выгрузку → на выходе интерактивная аналитика с умной категоризацией.
Что получилось
— Сначала 6000 строк обрабатывались ~60 мин, после нескольких итераций оптимизации довел ~3 мин (в 20 раз быстрее)
— В срезах видно динамику NPS, доли категорий, сегменты и примеры отзывов
— Стоимость вызово LLM снижаю за счет кэша и гибких режимов обработки
Немного про техническую начинку
Агентная архитектура
MasterCoordinator – дирижер: парсит файл, запускает классификацию, собирает метрики и финальную структуру.
ClassificationAgent – умный "свитчер": сначала простые правила (словари), если не хватает — сравнение по смыслу (эмбеддинги), при низкой уверенности – эскалация в LLM.
InsightAgent – "аналитик": по метрикам и распределениям генерит краткое резюме и рекомендации.
Все модули слабо связаны: координатор подменяемо получает «агентов» и возвращает один доменный результат, который дальше маппится во фронт.
Стек
Бэкенд: Python + FastAPI, четкие DTO на Pydantic, эндпоинты: загрузка, статус/результат, экспорт, плюс WebSocket прогресса.
Фронтенд: ванильный JS + Chart.js + Jinja2. Графики – NPS-таймлайн, категории, демография, помесячка; кликаешь по категории — видишь примеры отзывов.
Инфра и скорость
Docker Compose (web, redis), healthcheck, non-root; в деве – hot reload.
Кэш по MD5 контента (Redis/SQLite) – ускоряет повторы и экономит.
Режимы исполнения переключаются конфигом: потоковый, асинхронный с ограничением параллельности, пакетные эмбеддинги, параллельные батчи с авто-фоллбеком.
Телеметрия: время, стоимость, использование инструментов, cache hit rate, контроль памяти и авто-дауншифт, если упираемся в ресурсы.
Я прорабатывал всю логику и архитектуру, а код писал Claude Code. Одну фичу ради интереса сделал через gpt-5 в Cursor. Старался делать сразу продакшен райди.
Итог
В целом получилось сделать около боевой сервис, но все равно надо немного полировки, чтобы отпускать в свободное плавание. При этом я сейчас один, а AI инициатив в компании много. Поэтому поставил пока проект на паузу, чтобы навалиться на более денежные штуки. Как-нибудь еще обязательно вернусь, чтобы добить!
На прошлой неделе закончился курс AI Product Engineer от Байрама (курс, кстати топ, рекомендую). В первом дз нужно было сделать агента для анализа отзывов. Я свой собрал еще месяц назад, нопонял, что в канале про это еще не рассказывал.
В Додо регулярно собираем фидбек и NPS. Разбирать это руками – долго и неудобно. Я навайбкодил агента: загружаешь выгрузку → на выходе интерактивная аналитика с умной категоризацией.
Что получилось
— Сначала 6000 строк обрабатывались ~60 мин, после нескольких итераций оптимизации довел ~3 мин (в 20 раз быстрее)
— В срезах видно динамику NPS, доли категорий, сегменты и примеры отзывов
— Стоимость вызово LLM снижаю за счет кэша и гибких режимов обработки
Немного про техническую начинку
Агентная архитектура
MasterCoordinator – дирижер: парсит файл, запускает классификацию, собирает метрики и финальную структуру.
ClassificationAgent – умный "свитчер": сначала простые правила (словари), если не хватает — сравнение по смыслу (эмбеддинги), при низкой уверенности – эскалация в LLM.
InsightAgent – "аналитик": по метрикам и распределениям генерит краткое резюме и рекомендации.
Все модули слабо связаны: координатор подменяемо получает «агентов» и возвращает один доменный результат, который дальше маппится во фронт.
Стек
Бэкенд: Python + FastAPI, четкие DTO на Pydantic, эндпоинты: загрузка, статус/результат, экспорт, плюс WebSocket прогресса.
Фронтенд: ванильный JS + Chart.js + Jinja2. Графики – NPS-таймлайн, категории, демография, помесячка; кликаешь по категории — видишь примеры отзывов.
Инфра и скорость
Docker Compose (web, redis), healthcheck, non-root; в деве – hot reload.
Кэш по MD5 контента (Redis/SQLite) – ускоряет повторы и экономит.
Режимы исполнения переключаются конфигом: потоковый, асинхронный с ограничением параллельности, пакетные эмбеддинги, параллельные батчи с авто-фоллбеком.
Телеметрия: время, стоимость, использование инструментов, cache hit rate, контроль памяти и авто-дауншифт, если упираемся в ресурсы.
Я прорабатывал всю логику и архитектуру, а код писал Claude Code. Одну фичу ради интереса сделал через gpt-5 в Cursor. Старался делать сразу продакшен райди.
Итог
В целом получилось сделать около боевой сервис, но все равно надо немного полировки, чтобы отпускать в свободное плавание. При этом я сейчас один, а AI инициатив в компании много. Поэтому поставил пока проект на паузу, чтобы навалиться на более денежные штуки. Как-нибудь еще обязательно вернусь, чтобы добить!
🔥11👀2
В Gemini теперь можно шарить своих AI-ассистентов
Недавно писал, что все чаще перехожу с ChatGPT на Gemini. В ChatGPT всегда нравились GPTs – простые ассистенты, отвечающие на основе загруженных документов. Их можно было шарить, но только при платной подписке. У Gemini был аналог – GEMs, но без шаринга. Теперь завезли нормальный доступ и у Gem-ботов – прям как в Google Docs.
Что теперь можно
— Делиться по ссылке и на конкретные аккаунты (важно, чтобы у загруженных в базу знаний файлов был соответствующий доступ)
— Давать ролевой доступ: только просмотр или редактирование
— Пользоваться тем, у кого нет Pro (у меня по крайней мере работает)
— Создавать копию пошаренных ботов и тюнить под себя
Очень надеюсь, что этот инструмент забустит в Додо различные внутренние типовые процессы, например, мы так реализовали первую версию ассистента для помощи в написании статей в базу знаний.
Мини-гайд как реализовать
1. Откройте менеджер Gem-ботов и создаете бота
2. Нажимаете поделиться в карточке бота
3. Выберите уровень доступа и роли
Для примера сделал простенького бота для улучшения промптов.
Кстати, в каталоге есть готовые Gem-боты от Google, мне особенно нравится Storybook для генерации историй с иллюстрациями – рекомендую попробовать!
Недавно писал, что все чаще перехожу с ChatGPT на Gemini. В ChatGPT всегда нравились GPTs – простые ассистенты, отвечающие на основе загруженных документов. Их можно было шарить, но только при платной подписке. У Gemini был аналог – GEMs, но без шаринга. Теперь завезли нормальный доступ и у Gem-ботов – прям как в Google Docs.
Что теперь можно
— Делиться по ссылке и на конкретные аккаунты (важно, чтобы у загруженных в базу знаний файлов был соответствующий доступ)
— Давать ролевой доступ: только просмотр или редактирование
— Пользоваться тем, у кого нет Pro (у меня по крайней мере работает)
— Создавать копию пошаренных ботов и тюнить под себя
Очень надеюсь, что этот инструмент забустит в Додо различные внутренние типовые процессы, например, мы так реализовали первую версию ассистента для помощи в написании статей в базу знаний.
Мини-гайд как реализовать
1. Откройте менеджер Gem-ботов и создаете бота
2. Нажимаете поделиться в карточке бота
3. Выберите уровень доступа и роли
Для примера сделал простенького бота для улучшения промптов.
Кстати, в каталоге есть готовые Gem-боты от Google, мне особенно нравится Storybook для генерации историй с иллюстрациями – рекомендую попробовать!
1🔥7
Обновили наш внутренний формат AI-образования в Додо
Каждые 2 недели проводим открытые встречи по AI. Называли это AI-трибуна.
Чередуем 4 формата:
1. Дайджесты AI-новинок – разбираем самые интересные инструменты и смотрим, как применить их в работе
2. Мастер-классы – показываем на практике, как пользоваться конкретным AI-инструментом
3. Кейсы из Dodo – коллеги делятся реальным опытом внедрения AI в свои задачи
4. Открытый микрофон – разбираем вопросы в порядке живой очереди
Сегодня провели первый дайджест.
— Генерация контента: Nano Banana, Veo3, UGC-фабрики – доступные инструменты для ситуативного маркетинга
— Обучение с AI: NotebookLM vs встроенные режимы ChatGPT/Gemini
— Агенты меняют поиск: что такое GEO/AEO и почему это важно
— Коннекторы в ChatGPT и Claude: подключаем внешние сервисы в привычные инструменты
— Claude теперь создает настоящие файлы: docx, xlsx, pptx
— Битва кодинг-агентов: Codex (GPT-5) vs Claude Code vs новички от Amazon и Alibaba
Делюсь материалами
📹 Запись (~30 мин)
📊 Преза
Каждые 2 недели проводим открытые встречи по AI. Называли это AI-трибуна.
Чередуем 4 формата:
1. Дайджесты AI-новинок – разбираем самые интересные инструменты и смотрим, как применить их в работе
2. Мастер-классы – показываем на практике, как пользоваться конкретным AI-инструментом
3. Кейсы из Dodo – коллеги делятся реальным опытом внедрения AI в свои задачи
4. Открытый микрофон – разбираем вопросы в порядке живой очереди
Сегодня провели первый дайджест.
— Генерация контента: Nano Banana, Veo3, UGC-фабрики – доступные инструменты для ситуативного маркетинга
— Обучение с AI: NotebookLM vs встроенные режимы ChatGPT/Gemini
— Агенты меняют поиск: что такое GEO/AEO и почему это важно
— Коннекторы в ChatGPT и Claude: подключаем внешние сервисы в привычные инструменты
— Claude теперь создает настоящие файлы: docx, xlsx, pptx
— Битва кодинг-агентов: Codex (GPT-5) vs Claude Code vs новички от Amazon и Alibaba
Делюсь материалами
📹 Запись (~30 мин)
📊 Преза
🔥13👏2👍1
Персонализированный софт — новая реальность
Про вайбкодинг сейчас слышно из каждого утюга (ну ок, в моем бабле точно). И мне кайфово наблюдать, как порог входа тает на глазах. Прохожу сейчас курс по вайбкодингу от gconf и вижу, как люди без опыта кода клепают под себя ботов и мини-приложения: трекеры, тудушки, дневники и тд.
При этом часто слышу (особенно от консервативных разработчиков): "это все игрушки", "в работе не взлетит", "серьезные процессы так не ускоришь" и тп. Что ж, я думаю, это УЖЕ не так, а дальше – больше. Делюсь пруфами от Сергея, лидера команды эксплуатации в Додо.
Вот что он сделал без опыта разработки 🤯
— Telegram-бота с векторным поиском
— Платформу аналитики с автоматической генерацией PDF-отчетов
— Парсер цен конкурентов с аналитикой
— ML-систему категоризации входящих заявок
Просто открыл gpt и сделал. Достаточно любопытства и упорства.
И я уверен, что рано или поздно каждый сможет собрать под себя кастомный инструмент, это станет нормой. Мир катится туда, где менеджеры становятся немного разработчиками, маркетологи – дата-саентистами, а операционщики – автоматизаторами. Софт перестает быть одинаковым для всех и подстраивается под конкретного человека. И это, черт возьми, круто!
Ловите ссылку с нашей встречи, вдохновляйтесь кейсами Сергея и творите сами!
Про вайбкодинг сейчас слышно из каждого утюга (ну ок, в моем бабле точно). И мне кайфово наблюдать, как порог входа тает на глазах. Прохожу сейчас курс по вайбкодингу от gconf и вижу, как люди без опыта кода клепают под себя ботов и мини-приложения: трекеры, тудушки, дневники и тд.
При этом часто слышу (особенно от консервативных разработчиков): "это все игрушки", "в работе не взлетит", "серьезные процессы так не ускоришь" и тп. Что ж, я думаю, это УЖЕ не так, а дальше – больше. Делюсь пруфами от Сергея, лидера команды эксплуатации в Додо.
Вот что он сделал без опыта разработки 🤯
— Telegram-бота с векторным поиском
— Платформу аналитики с автоматической генерацией PDF-отчетов
— Парсер цен конкурентов с аналитикой
— ML-систему категоризации входящих заявок
Просто открыл gpt и сделал. Достаточно любопытства и упорства.
И я уверен, что рано или поздно каждый сможет собрать под себя кастомный инструмент, это станет нормой. Мир катится туда, где менеджеры становятся немного разработчиками, маркетологи – дата-саентистами, а операционщики – автоматизаторами. Софт перестает быть одинаковым для всех и подстраивается под конкретного человека. И это, черт возьми, круто!
Ловите ссылку с нашей встречи, вдохновляйтесь кейсами Сергея и творите сами!
1🔥12💯2🏆1
Agent Builder
Завтра об этом напишут все профильные тг-каналы, но кажется, что это действительно новая веха в AI. OpenAI демократизируют создание агентов.
Забавно, что именно сегодня я решил собрать своего первого агента в n8n, просидел полдня с Gemini, обсуждая каждый шаг настройки и наконец все заработало.
В Agent Builder аналогичный воркфлоу (типовой ассистент по базе знаний) собрал за ~7 минут, при том что интерфейс видел впервые. Ощущение — как после перехода с Android на iOS.
С первого раза правда не взлетело, но по сообщению об ошибке похоже либо на нагрузку, либо на сырость функционала. Уверен, это быстро допилят.
Думаю это мощный анлок автоматизации множества процессов, обязательно буду экспериментировать в ближайшее время. Ну и ждем ответочку от Google😏
Если не смотрели, вот видео с OpenAI DevDay 2025, где в лайве показали много нового функционала.
Завтра об этом напишут все профильные тг-каналы, но кажется, что это действительно новая веха в AI. OpenAI демократизируют создание агентов.
Забавно, что именно сегодня я решил собрать своего первого агента в n8n, просидел полдня с Gemini, обсуждая каждый шаг настройки и наконец все заработало.
В Agent Builder аналогичный воркфлоу (типовой ассистент по базе знаний) собрал за ~7 минут, при том что интерфейс видел впервые. Ощущение — как после перехода с Android на iOS.
С первого раза правда не взлетело, но по сообщению об ошибке похоже либо на нагрузку, либо на сырость функционала. Уверен, это быстро допилят.
Думаю это мощный анлок автоматизации множества процессов, обязательно буду экспериментировать в ближайшее время. Ну и ждем ответочку от Google
Если не смотрели, вот видео с OpenAI DevDay 2025, где в лайве показали много нового функционала.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥10❤3👍1
Я не знаю, как вы выживаете
Я довольно давно пользуюсь MacWhisper для транскрибации звонков. Выбрал его по разным причинам: работает локально, заплатил разово $60 вместо ежемесячной подписки, продукт постоянно обновляется.
Но есть прикол. Иногда Whisper ловит галлюцинацию и начинает повторять последнюю фразу, которую смог распознать.
Особенно забавляет когда надпись в духе[звук пива] (реальный пример)
Это происходит, когда модель сталкивается с нечеткой речью, фоновым шумом или тишиной. Она буквально "зацикливается" на последней уверенной гипотезе.
Fireflies и подобные облачные сервисы такое фиксят из коробки. Но MacWhisper – нет.
Поэтому включать записи приходятся после неловкого молчания вначале встречи 😀
Еще интересно выглядит сервис локальной транскрибации tryvoiceink, но я пока еще не пробовал. Вообще руки чешутся навайбкодить что-то под себя!
А вы чем пользуетесь?
Я довольно давно пользуюсь MacWhisper для транскрибации звонков. Выбрал его по разным причинам: работает локально, заплатил разово $60 вместо ежемесячной подписки, продукт постоянно обновляется.
Но есть прикол. Иногда Whisper ловит галлюцинацию и начинает повторять последнюю фразу, которую смог распознать.
Особенно забавляет когда надпись в духе
Это происходит, когда модель сталкивается с нечеткой речью, фоновым шумом или тишиной. Она буквально "зацикливается" на последней уверенной гипотезе.
Fireflies и подобные облачные сервисы такое фиксят из коробки. Но MacWhisper – нет.
Поэтому включать записи приходятся после неловкого молчания вначале встречи 😀
Еще интересно выглядит сервис локальной транскрибации tryvoiceink, но я пока еще не пробовал. Вообще руки чешутся навайбкодить что-то под себя!
А вы чем пользуетесь?
😁4
