NGI | Влад Корнышев про AI и создание AI-продуктов
4.09K subscribers
131 photos
32 videos
2 files
345 links
Простым языком рассказываю об AI и работе AI-продактом.

Консультирую стартапы, помогаю запускать MVP. Co-Founder EAI, ex-Skyeng, ex-Pearson.

💼 Внедрить AI: https://e-ai.solutions
🎓 Обучить команду: https://www.ngi.academy/b2b
Download Telegram
Скидки на последние места в текущем потоке моих тренингов

Друзья, сегодня последний день продаж мест на текущий поток обоих мох тренингов. Ранее про них писал вот тут.

Коротко о курсах:
ИИ для личной эффективности - для всех, кто хочет научиться не просто использовать ИИ, а понимать, как он работает, изучить продвинутые стратегии промпт-инжиниринга, научиться правильно кодить с ИИ, работать с локальными моделями и оптимизировать свой рабочий процесс

AI Продакт менеджмент - для тех, кто хочет научиться разрабатывать продукты и фичи на базе AI при этом самостоятельно применяя ИИ на ВСЕХ этапах разработки. В программу входят материалы для базового понимания AI, промпт-инжиниринга, создания прототипов с помощью ИИ, а также моя авторская методолгия AI-дизайна продукта, которая прошла через Skyeng, Pearson и сейчас применяется в нашем агентстве EAI.

В честь последнего дня продаж добавил промокод на очень вкусную скидку. Кто успеет - тому повезло и вы даже успеете на сегодняшнюю или завтрашнюю лекцию.

Промик вводить на странице заказа:
lastday


👉 Забрать последние места

P.S. также возможна оплата криптой, пишите в ЛС @vladkor97
4👍3
Про Vibe Coding

Один из развивающихся ИИ-трендов сейчас - это ИИ-программирование или, как назвал его Андрей Карпатый - Vibe Coding. Тему вайб кодинга у себя в канале я освещаю нечасто.
Моя основная сфера интереса - это AI продакт менеджмент и ИИ-этика, ведение канала для меня также способ узнавать новое, а что касается вайб кодинга - я его больше применяю, чем пишу. Просто потому что сфера настолько динамична, что еще и за этим следить я не успеваю.

При этом, вайб-кодинг помогает мне:
- В создании рабочих прототипов
- Подготовке моих тренингов (сделал сайт и несколько ботов)
- Создавать специфические, нужные мне приложения

Большее количество знаний я получаю из практики, периодически смотрю гайды на YouTube. При этом, я все-таки люблю текстовый контент и хочется еще и следить за темой через чтение.

И в этом плане мне повезло познакомиться с Костей. У Кости большой бэкграуд разработчика и тимлида, сейчас он разрабатывает ИИ агентов для корпоративного обучения в Сбере и ведет свой канал «Искусный Интеллект», в котором много пишет про вайб-кодинг.

Именно из его канала я узнал про появление бесплатного аналога Cursor - Trae, а еще он периодически разбирает интересные статьи.

Среди последних постов я бы выделил:
- Пост про дебагинг при вайб кодинге - писать код с ИИ легко, а вот дебажить 🙂
- Пост про формирование ожиданий к вайб кодингу - как не переоценить ИИ-код
- Анализ статьи по будущему вайб кодинга - заменит ли ИИ разработчиков

Помимо этого, Костя еще строит отдельное Vibe Coding Community, в которое скидывает кучу полезного материала. Поэтому кому интересна тема ИИ-программирования - очень рекомендую подписаться на канал, там много полезного.

👉🏻Ссылка на канал Кости
1👍73
Как работают иностранцы: мой опыт кросскультурной коммуникации

За время работы я неоднократно попадал в команды с иностранцами или общался с ними по работе. Работая в СНГ, привыкаешь к определенному стилю, но в международке тебя ждет другой опыт.
Дисклеймер: это исключительно мой опыт, а не характеристика всех представителей культуры.

🇵🇱Поляки
Начну с любимых — поляков. С ними я очень много работал в Pearson. Там собралась крутая команда AIC (AI capabilities), состоящая полностью из поляков. Мы вместе работали над моим тулом для создания образовательного контента. Провели кучу экспериментов, собрали бесчисленное множество прототипов. И это одна из лучших команд, среди тех, с которыми я работал. Максимально самоходные, проактивные ребята, которые знают и любят свое дело. У 2 из 3 была степень PhD. С коммуникацией тоже все замечательно: легко понимали друг друга, в сложных ситуациях всегда могли договориться. Меня не покидало ощущение, что я работаю с россиянами, просто другими :) Единственное отличие — они меньше склонны к риску, чем мы. Отдельное удовольствие — зайти к ним на звонок и услышать знаменитое "Kurwa".

🇺🇸Американцы
С этими ребятами мне также понравилось работать, но с ними атмосфера совершенно иная. Они — предприниматели, которые любят все делать быстро и не боятся рисковать. В Pearson постоянно пытались создать какой-то стартап внутри компании, активно взаимодействуя между подразделениями. Все дедлайны с ними в стиле "это надо сделать вчера". Кого-то это раздражает, а мне в условиях большой и неповоротливой компании это безумно нравилось. Что интересно — сейчас, живя в США, таких американцев не встречаю - попадаются сплошные бюрократы.

🇸🇦Арабы
С арабами зачастую приятно работать. Самое крутое — что с ними обо всем можно договориться. Некрутое — ты тратишь кучу времени на их культуру торга. Запрашиваешь $50к за проект, а тебе на серьезных щах говорят — а давай 25? Чтобы получить нормальную цену за свои услуги, нужно максимально разжевать что и почему надо делать. Если ты недостаточно убедителен — уйдут к пакистанцам, которые сделают дешевле. Но если удалось договориться — это твои клиенты, правда надо быть готовым к торгу на последующих этапах. Они очень вовлекаются в рабочий процесс и стараются помочь, но при этом любят длинные звонки по 2 часа.

🇨🇳Китайцы
Я очень люблю китайцев и азиатов в целом. Если вам в команду нужен исполнитель, который просто берет и хорошо делает свою работу, соблюдая дедлайны — нанимайте китайцев. Еще когда я работал SMM-щиком в Xiaomi, я поражался тому, что они буквально жили в офисе. Я был студентом и приезжал в офис либо до, либо после пар. Приезжал к 7 утра — китайцы уже там. Уезжал после пар в 9 вечера — китайцы все еще там. Бесконечное уважение за такое отношение к труду и дисциплине.

🇩🇪Немцы
Все мы наслышаны про немецкую точность. Так вот, я с ней столкнулся в плохом проявлении. Работал в кросс-команде с девушкой из Германии. Отказывалась делать что-то сверх того, что требовал ее непосредственный руководитель. Помог переход на жесткий менеджмент и ультиматум в стиле "либо делаешь как я сказал, либо катишься отсюда нахрен". Работу в итоге она сделала идеально.

🇬🇧Британцы
Мой худший опыт. Ленивые, несамостоятельные и чрезмерно нежные. Мой дизайнер не успевал уложиться в дедлайн, о чем я ему сказал прямым текстом, мол, не успеем сделать — проект закроют, давай искать пути оптимизации. Тот пошел жаловаться своему руководителю, что я был грубым и оказываю на него давление. А его руководитель (тоже британка) — моему, но мой менеджер был русским, и мы их в итоге задавили 🙂 Помимо скорости, мой британский дизайнер был максимально негибким и не любил проводить исследования, при этом стоил просто дофига денег. Был и хороший пример. В один момент ко мне также приставили девушку-продакта, чтобы я ее менторил. Работала она неплохо, не хватало самостоятельности, но в целом — неплохо. И, кстати говоря, на днях увидел, что она перешла на позицию AI-продакта в Pearson, так что можно считать, что менторинг удался.

А какой у вас опыт работы с иностранцами?
👍93
Как получить набор лучших ИИ-инструментов за $200 вместо $14 000+

Ленни Рачицкий - один из немногих продактов, за которыми я слежу, запустил аукцион невиданной щедрости. Для контекста: Ленни - основатель стартапа Localmind, который был в 2012 году приобретен Airbnb. В общем, крутой чувак и за ним как минимум стоит следить.

Собственно, в чем атракцион: у Ленни есть своя почтовая рассылка, в которой он делится своим профессиональным опытом, хаками и много чем другим, годовая подписка на которую стоит $200.

И 15 апреля он объявил, что тем, кто приобретет годовой тариф, насыпят следующих плюшек в виде годовых подписок на:

- Cursor AI - лучший ИИ-редактор кода, стоимость подписки $192
- Bolt.new - лучший ИИ-сервис для создания сайтов и прототипов, стоимость подписки $216
- Vercel v0 - ИИ для создания макетов ваших приложений, стоимость подписки $240
- Lovable - аналог Bolt, стоимость подписки $240
- Replit - еще одна платформа для разработки, стоимость подписки $360
- Granola - сервис для автоматической транскрибации и создания заметок с ИИ, подписка на команду до 100 участников, стоимость $10 000
- Perplexity - тот самый хайповый поисковик, стоимость подписки $200
- Notion Plus с безлимитным Notion AI на команду до 10 человек, стоимость подписки $2000
- Linear - трекер, аналог Jira и прочих, стоимость подписки $336
- Superhuman - почтовый клиент с ИИ, стомость подписки $300

Итого: стоимость всего набора - $14 084! Прям полезного, долларов на 1000.

Неважно, интересен вам продакт менеджмент или опыт Ленни, это однозначно предложение, на которое стоит подписаться. Если вы из всего списка используете хотя бы 2 инструмента - вы уже сэкономите 200+ баксов.

Действуют ограничения:
1. Чтобы промокоды действовали вам нужен аккаунт, с которого ранее вы не покупали подписку
2. Код привязывается строго к email, на который оформлена подписка на рассылку Ленни
3. Коды можно использовать в любой момент. Подписка на любой из сервисов у вас активируется лишь в момент ввода промокода. Ленни говорит, что они должны работать и через год, но гарантировать прямо он этого не может
4. Если вы отпишитесь от рассылки Ленни - ваш код перестанет работать

Подробности акции тут.

Не реклама, бегом забирать!

P.S. на сервисы на всякий случай рекомендую активировать коды с пустой картой, дабы избежать неожиданных списаний, когда действие кода/акции закончится
🔥6
Разбираем предложение от Ленни: стоит ли оно того?

У многих, включая меня, возникает вопрос: зачем раздают столько подписок и как на этом зарабатывают?

Логично, что главная цель - это маркетинг, а выгода, как всегда, скрыта в условиях и некоторых деталях.

Давайте разбираться!

1. Раздача поможет спонсорам привлекать корпоративных пользователей: сотрудники попробуют сервисы из бандла, оценят выгоду и могут инициировать покупку корпоративной подписки. Люди будут хотеть делиться хорошим продуктом, а у Ленни как раз в блоге самая сочная ЦА
2. Большинство купивших подписку Ленни не будут использовать все возможности:
- Не все сервисы нужны каждому, для большинства половина - это мусор
- Промо действует только для новых пользователей сервисов, у большинства уже куплены подписки на часть сервисов
- Многие не израсходуют платные лимиты полностью
3. Компании рассчитывают, что за год пользования вы привыкнете к сервисам и не захотите отказываться от них после окончания акции.
4. Количество кодов ограничено, и спонсоры могут прекратить их активацию в любой момент. Поэтому:
- Активируйте промо сразу (многие отложат и пропустят)
- Используйте виртуальную/запасную карту чтобы избежать неожиданных списаний
5. Условия, которых мы не знаем - возможно Ленни отстегивает сервисам часть выручки, а может сам рассчитывает, что люди будут продлевать его подписку.

Что касается инструментов - тут зависит от ваших задач
- Cursor и Bolt пригодятся вам либо если вы разраб либо в своей работе вы много прототипируете. Тогда они окупаются. Про них я писал ранее
- v0 - крутой сервис, очень похож на Bolt, но с фокусом на создание дизайна. Также стоит использовать, если вы много прототипируете
- Lovable - аналог Bolt, который, на мой взгляд, хуже, не такой удобный, качество прототипов как будто хуже. Стоит использовать только когда на Bolt закончились кредиты.
- Replit - еще одна платформа, похожая на Bolt, которая берет на себя вообще весь цикл: от разработки до деплоя. Я бы сказал, это для тех, кто совсем боится кода.
- Granola - прикольный сервис, но работает только на английском. Буде полезен, если у вас много встреч и нужно делать по ним заметки. Но есть бесплатная мультиязычная альтернатива в виде Vibe. Не хотите вайб, а у вас Mac? 59 евро и Macwhisper пожизненно ваш. Выгоду в $10 000 увидят только те, кто приведет в Granola компанию в 100+ сотрудников.
- Perplexity - крутой поисковик. Но я не считаю его маст-хевом. На мой взгляд, Deep Research от Google работает лучше. Имеет смысл только если вы не платите за подписку, в которой есть дип ресерч либо вам удалось купить подписку дешево.
- Notion Plus - для тех, кто использует Notion - это no brainer. Но что, если я вам скажу, что можно бесплатно использовать Affine и прикрутить к нему бесплатный AI? (выложу инструкцию на следующей неделе)
- Linear - не пробовал. Но если вы работаете в компании с существующим трекером, а не стартапе, то подписка как будто вообще не имеет смысла.
- Superhuman - продают как почту со встроенным ИИ и коллаборативной работой с командой. Я скачал, полистал и удалил. UX неудобный, UI на мой вкус плохой, сам клиент ужасный. На телефон ставим Gmail с Gemini а на ПК - Notion Mail. Подписка явно не стоит заявленных $300, я бы не заплатил даже $50, продукт отврат.

Итого, в зависимости от ваших потребностей, ваша выгода варируется от 200 до 1000 долларов и половина списка бесполезна. Но все равно это выгодно.

Лично я подписался потому что:
1. Мне интересна сама рассылка
2. Cursor, Bolt и v0 - для меня Must Have приложения
3. Lovable и Replit - Nice to have, без них жил нормально, но буду пользоваться
4. Notion я бы использовал, если бы не переезжал на Affine. Активирую т.к. часть рабочих проектов там. Granola - ситуативно для англоязычных встреч.

Свою выгоду считайте сами 🙂
6
Поигрался с Google Veo 2: лучшая, но далеко неидеальная модель для генерации видео

На прошлой неделе Google открыли доступ по API и начали постепенно раскатывать в AI Studio доступ к модели. Мне повезло попасть в волну раскатки на этой неделе, несколько дней игрался с моделькой, пробовал разное, чтобы понять, в чем она хороша, а в чем неочень. К посту прикрепляю примеры (как плохие, так и хорошие)

В целом, как и ожидалось, модель стала лучшей в своей категории. На лидербордах она регулярно делала конкурентов с отрывом. Генерация видео - одно из самых прикольных и, на мой взгляд, обделенных вниманием направлений. Понятное дело, что AI-видео не всем нужны, но кейсов его применения достаточно много.

Из того, что мне приходит в голову:
- коммерческая анимация
- презентации
- демо продуктов
- моделирование
и многое другое…

Итак, в чем хороша VEO?
Анимация: то, с чем модель справляется лучше всего. Всякие мультики, анимирование существующих картинок - прямо делает очень приятно. Есть некоторые артефакты, но уровень достаточно крутой!
Пейзажи: хорошо передает природные кадры, видео из гор мне прямо напомнило Армению.
Крупные планы: видимо, модель тренировали довольно сильно на видео с крупными планами. Объекты и люди у нее получаются прекрасно.

Где модель страдает:
Физика: обратите внимание на примерах на движение ног, воды, и то, как идет стабилизация видео. Выглядит все это неестественно.
Байас на цвет кожи: гугл снова наступили на те же грабли, когда Gemini создавал чернокожего Наполеона. Специально не указывал в промпте цвет кожи. Когда генерировал видео с девушкой, белую девушку удалось получить только с 4 раза. Все остальные были чернокожие
Динамичные сцены: если у вас много движения и деталей модель вообще плывет (см видео с терминатором и людьми на концерте)

Однако, не смотря на недостатки, данная модель все равно лучше конкурентов + очень по-умному распределили нагрузку, видео генерятся не одновременно, а в порядке некоторой очереди, причем очередей несколько. поэтому все проходит довольно быстро. В AI Studio в день дают ограниченное число генераций и видео 8 секунд генерируется примерно за 30 секунд.

👉🏻 Накидайте 20 реакций на пост, и расскажу, как я составляю промпты для генерации видео и картинок
1👍14🔥21
Экономим на подписках: как использовать все LLM эффективно и тратить меньше

Решил поделиться небольшой инструкцией, как я экономлю на подписках. Не смотря на то, что у меня есть доступ к платным LLM на рабочих аккаунтах, не все я могу использовать регулярно. Сейчас стандартная цена подписки на одну LLM — $20 в месяц. Я считаю, что в арсенале нужно иметь минимум 2 модели для разных задач, а лучше 3. Получается, базовый ежемесячный расход на LLM — $40-60. + к этому добавьте еще пару сервисов вроде Cursor. Сначала кажется, что это не так много, но за год набегает почти $1000 из которой можно половину сэкономить, а на эти деньги купить себе что-то приятное.

В чем секрет?
Вне зависимости от задач, большинство из нас не будет использовать возможности LLM на все $20. Шанс выйти за лимиты велик только если постоянно использовать самую продвинутую модель, но это нужно далеко не всегда. Исходя из этого, предлагаю покупать подписку только на одну, самую нужную LLM, а остальные использовать на бесплатном тарифе или по API.

У меня это выглядит так: я плачу только за Gemini (входит в мой тариф Google One), а в качестве API-провайдера выбрал Openrouter. У Openrouter есть много бесплатных моделей, включая DeepSeek, Llama 4, экспериментальные Gemini и другие. Удобство в том, что вы получаете один API-ключ для доступа ко всему. Плюс, если разрешаете использовать свои промпты для дообучения, получаете скидку на платные модели. А еще, ключ от Openrouter вы можете вставить в Cline и иметь полный аналог Cursor бесплатно с Gemini 2.5 PRO. В общем, плюсов много.

Для подключения API-ключа я использую приложения Intellibar и Chatbox AI.

Про первое я уже рассказывал, а вот про второе хочу немного добавить. Chatbox AI дает контроль над параметрами, которые недоступны в стандартных пользовательских интерфейсах, например, температура, TOP-P, количество сообщений в контексте. При этом там есть все нужные инструменты: поиск, готовые ассистенты, чтение ссылок. В общем, для базового ежедневного использования — очень классная штука. К тому же, модель можно сменить прямо во время диалога. Условно, начали работать с Gemini, но решили переключиться на ChatGPT, сохранив контекст — в Chatbox это делается легко. Альтренатива чатбоксу, если вы не боитесь командной строки - Open WebUI, там настроек еще больше.

Главный минус такого подхода: если используете бесплатные модели от Openrouter, ваши данные будут использоваться для дообучения. Хотя это происходит и в классических интерфейсах того же ChatGPT и Gemini. Для платных заверяют, что нет (но я в это не верю). Поэтому для приватных задач лично я использую локальные модели через Ollama и LMStudio, но о них расскажу в отдельном посте.

#инструменты
👍112👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥2
Что посеешь, то и пожнешь: почему новые модели OpenAI галлюцинируют чаще старых

Помните, я как-то упоминал исследование Google DeepMind? Они тогда еще подсветили интересный момент: OpenAI активно использует автоматизацию для исследований в области ИИ. Google напирал на то, что правильное применение автоматизации - это ускорение исследований, а не полное перекладывание на машину цикла обучения моделей. Подход OpenAI они как раз критиковали. Мол, так можно наплодить ошибок.

Вспомним еще пару моментов. В статье DeepSeek про их метод обучения SPCT (когда модель сама себя критикует и учится на этом) тоже отмечались риски: увеличение предвзятости (bias) и галлюцинаций. Логика простая: если в исходных данных была ошибка, то при самообучении количество таких ошибок будет только множиться. А в статье "AI 2027", о которой я также писал, предсказывался сценарий, где OpenBrain, автоматизировав создание ИИ, получил на выходе AI с проблемой рассогласования целей (Missalignment).

К чему я это все? А к тому, что очень похожую картину мы сейчас наблюдаем с последними моделями от OpenAI - o3 и o4-mini. Их позиционируют как state-of-the-art, особенно в задачах, требующих "рассуждений". Но вот незадача: согласно последним данным, галлюцинируют они чаще, чем их предшественники.

Смотрите сами на результаты внутренних тестов OpenAI на бенчмарке PersonQA (проверка знаний о людях):
- o3: галлюцинирует в 33% случаев.
- o1 и o3-mini (предыдущие "reasoning" модели): 16% и 14.8% соответственно.
- o4-mini: вообще 48%!

То есть, модели, заточенные под агентский ИИ, под задачи, где нужно не просто выдать текст, а "подумать", построить цепочку рассуждений, совершают больше ошибок. Сама OpenAI в своем отчете признает, что пока "требуется больше исследований", чтобы понять, почему так происходит. (Не видят слона в комнате). Одна из гипотез: модели стали делать больше утверждений в целом, и среди них, естественно, растет как число верных, так и число неверных. Подобное также отмечают и исследователи Transluce.

И это огромная проблема.

Чтобы агентский ИИ был реально полезен, количество ошибок нужно не увеличивать, а сокращать. Мы же хотим использовать ИИ для работы в реальном мире, верно? А теперь представьте: вы - обычный айтишник, собрались в отпуск и решили делегировать планирование ИИ-агенту, сказав “Я хочу хорошо отдохнуть в Монако”. А он возьми и сгаллюцинируй: забронировал вам с карты пару мишленовских ресторанов, яхту и отель, на который уйдут все сбережения. Вроде цель "сделать крутой отдых" достигнута, но какой ценой? 🙂

И это еще самое безобидное. Представьте, что такому "галлюцинирующему" агенту доверят более серьезные задачи: управление бизнес-процессами, научные расчеты, решение социальных проблем. Последствия могут быть куда масштабнее. Некоторые исследователи предполагают, что проблема может быть в методах обучения с подкреплением, которые используются для o-серии и могут усиливать проблемы, обычно сглаживаемые на других этапах.

Нам постоянно говорят, что ИИ сделает жизнь лучше, автоматизирует рутину. Но чтобы этого достичь, нельзя бежать впереди паровоза в безумной гонке за AGI. Если ставка делается на самообучение без должного контроля, то количество предвзятостей и галлюцинаций рискует расти в геометрической прогрессии, и человек просто потеряет контроль.

Очень надеюсь, что текущие "сырые" модели - это все же эксперимент, и OpenAI предпримет меры. Хотя, глядя на действия Альтмана, скорее верится в то, что финансовые показатели и хайп вокруг "гонки вооружений" важнее надежности и безопасности.
👍2🤔21
Media is too big
VIEW IN TELEGRAM
В общем, навайбкодил :)

Пока думаю над форматом. Вдохновлялся, думаю, сами знаете чем 😁

P.S. Делал в Cursor, и, все-таки, сравнивая Cursor и Bolt, в Bolt мне больше нравится делать сайты. Режим Агента в Cursor вобще не зашел, часто творит дичь. + постоянное переключение между браузером и IDE - тоже такая себе штука. + в плане точечного редактирования и работы с адаптивами Bolt выигрывает.
🔥4👍1
🚀 NGI дайджест за неделю (№5)

1. Как получить набор лучших ИИ-инструментов за $200 вместо $14 000+ - рассказываю про подписку от Ленни, которая дает доступ к AI-тулам. Промокоды на курсор закончились, но подписка все еще выгодна

2. Разбираем предложение от Ленни: стоит ли оно того? - объяснил, почему подписка не скам, что может быть полезно, что нет и кому стоит брать

3. Поигрался с Google Veo 2: лучшая, но далеко неидеальная модель для генерации видео - делюсь впечатлениями про модель Гугла для генерации видео, к которой у меня появился доступ

4. Affine - симбиоз Notion и Miro, напичканный AI - рассказываю как я нашел лучшую, на мой взгляд, альтернативу Notion, в котором есть и AI и функции Miro

5. Про Vibe Coding - здесь рекомендую подписаться на канал моего коллеги, в котором много информации по ИИ-программированию, или так называемом Вайб Кодинге.

6. Как работают иностранцы: мой опыт кросскультурной коммуникации - рассказал про свой опыт работы с иностранцами, в комментариях подписчики поделились своим. Собираем базу отзывов 🙂

7. Экономим на подписках: как использовать все LLM эффективно и тратить меньше - поделился своим подходом к экономии на LLM и парой приложений и сервисов, которые в этом помогут

8. Опрос о необходимости разработки курса по ИИ-программированию - в рамках обоих моих тренингов у меня есть модуль по ИИ-программированию. Работая над уроком понял, что материала там вполне хватает на отдельный курс, который можно было бы пройти в более спокойном темпе. Если вам интересно такое, проголосуйте в опросе и я запущу фокус-группу в ближайшее время.

9. Что посеешь, то и пожнешь: почему новые модели OpenAI галлюцинируют чаще старых - разбираю, что не так с послежними моделями с опорой на самые свежие исследования

Прошлый дайджест тут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Google добавили Veo 2 и Whisk в подписку Google One с Gemini

С каждым днем подписка от Гугла становится все более выгодной. Ребята прямо нормально качают свою экосистему и просто убивают необходимость подписываться на сторонние сервисы. 15 числа компания объявила о том, что Veo 2 теперь будет доступна как в веб-интерфейсе Gemini (в списке моделей), так и в Whisk. Будет доступно 100 генераций в месяц, и мне уже предоставили доступ!

Про Gemini знают все, а про Whisk стоит рассказать. Плюс дам вам полезной инфы, о том, как можно пробовать всякие штуки от гугла раньше времени.

У Google есть такая инициатива - Google Labs. Туда в раннем доступе добавляют множество интересных инструментов, о которых блогеры потом восторженно рассказывают. Это своего рода акселератор внутри компании, направленный на различные эксперименты. Большинство из них, как сейчас принято, сконцентрированы на AI. Из Labs вышли такие продукты, как NotebookLM, Firebase Studio (ранее назывался IDX), а теперь в более широкий доступ отдали Whisk.

Благодаря Labs я попробовал Whisk еще в декабре прошлого года, как и Firebase Studio. В общем, если хотите раньше всех узнавать об инициативах Google, рекомендую следить за Labs.

Для участия в Google Labs нужно подавать запрос и иметь аккаунт из США (желательно). После этого некоторые инструменты становятся доступны всем, в то время как доступ к другим предоставляется по спискам ожидания. Так вот, Whisk я попробовал еще раньше, а сейчас его значительно улучшили. Если раньше можно было генерировать картинки и персонажей, менять их окружение и многое другое, то сейчас добавили возможность анимации сгенерированных картинок и персонажей. И это работает гораздо интереснее, чем Veo в AI Studio. Есть возможность сначала точечно отредактировать картинку либо создать что-то на ее основе.

Мне продукт очень понравился. Я не люблю генерировать что-то реалистичное, поэтому вот вам несколько примеров анимаций, которые я в нем сделал. Кажется, что очень скоро у родителей появится больше контроля над тем, какие мультики смотрят их дети :)

Представьте: захотел обучить ребенка чему-то и вместо того, чтобы включать традиционные мультфильмы, с помощью пары промптов создаешь сюжет с определенными персонажами, прописываешь текст, мораль и прочее, и на выходе получается уникальный мультик, в котором вы контролируете все:

- персонажей
- сюжет
- когда и как показывать его ребенку
- когда выходят новые серии

В целом, такое и сейчас возможно, но пока для этого нужно неплохо владеть, как минимум, парой ИИ-инструментов и видеоредактором :)
👍3🔥1