Это я еду в поезде в костюме банана, а рядом - в нем же подписываю американские законы в овальном кабинете :)
Почему так? Потому что сегодня рассекретили модель, которая возглавила рейтинг редактирования изображений, дебютировав под названием nano-banana. Ей оказалась новая Gemini Flash, и работает она напорядок лучше, чем то, что мы видели в GPT 4o (уже вижу очередную волну хайпа в AI Studio). И, скорее всего, именно эта модель используется в новых Google Pixel 10 для редактирования фото через текст.
Я уже успел пощупать модельку, вот пара выводов:
1. Очень хорошо справляется с задачей переодевания, где нужно сменить сеттинг или одежду.
2. Отлично удаляет лишние предметы с картинок, делает точечные правки.
3. Понравилось, что можно доуточнять изображение в процессе. Условно, если вам понравился результат, но вы хотите внести правки, в отличие от GPT, последующее изображение не будет так искажаться.
4. А вот где модель страдает, так это если нужно прямо сильно изменить фото. Например, я попробовал переодеть себя в костюм банана и посадить в Овальный Кабинет. В этом случае мое лицо несколько исказилось, а качество пострадало.
Модель доступна в AI Studio и в приложении Gemini. Нужен VPN США.
Почему так? Потому что сегодня рассекретили модель, которая возглавила рейтинг редактирования изображений, дебютировав под названием nano-banana. Ей оказалась новая Gemini Flash, и работает она напорядок лучше, чем то, что мы видели в GPT 4o (уже вижу очередную волну хайпа в AI Studio). И, скорее всего, именно эта модель используется в новых Google Pixel 10 для редактирования фото через текст.
Я уже успел пощупать модельку, вот пара выводов:
1. Очень хорошо справляется с задачей переодевания, где нужно сменить сеттинг или одежду.
2. Отлично удаляет лишние предметы с картинок, делает точечные правки.
3. Понравилось, что можно доуточнять изображение в процессе. Условно, если вам понравился результат, но вы хотите внести правки, в отличие от GPT, последующее изображение не будет так искажаться.
4. А вот где модель страдает, так это если нужно прямо сильно изменить фото. Например, я попробовал переодеть себя в костюм банана и посадить в Овальный Кабинет. В этом случае мое лицо несколько исказилось, а качество пострадало.
Модель доступна в AI Studio и в приложении Gemini. Нужен VPN США.
🔥13🤣6❤1
Топ сфер, где, на мой взгляд, AI сделает наибольшую разницу
Как правило, весь AI-хайп сегодня строится вокруг LLM. В каждом пресс-релизе нам говорят о том, что модели стали умнее, быстрее и демонстрируют знания уровня PHD. Однако говорить о том, что LLM - это то, что сделает наш мир лучше, повысит качество жизни и так далее - на мой взгляд, ошибочно. Ранее я уже писал, что с одними LLM, AGI мы не достигнем. Да и есть много чего другого интересного в сфере AI.
До бума генеративного ИИ огромное количество прорывов совершалось в классическом ML, который сегодня, на мой взгляд, незаслуженно уходит на второй план за всем шумом вокруг ChatGPT и других генеративных ИИ. В этом посте хочется поделиться видением того, где, на мой взгляд, AI даст нам наибольший буст, вне зависимости от применяемых технологий.
Направление 1 - медицина.
Я безумно люблю медтех, так как вижу это наиболее полезной для человека сферой, ведь при отсутствии здоровья все остальное становится неважным. AI активно используется для диагностики медицинских данных изображений, вроте КТ, МРТ и ОКТ-снимков, выявляя болезни и биомаркеры с точностью 95%+. Это может быть как базовая диагностика, так и превентивная медицина для выявления болезней на самых ранних стадиях. Мы в EAI как раз занимаемся разработкой подобных систем и это просто крутое чувство, когда ты думаешь о том, качество жизни скольких людей может улучшить твоя разработка и сколько болезней может предотвратить.
Другой сценарий применения AI - это работа с генетикой. Считается, что геном человека полностью расшифровали в 2023, и теперь, имея современные ML-алгоритмы и мощности, мы можем вести речь о том, чтобы работать над исправлением различного рода генетических поломок.
Третий важный кейс на мой взгляд - это разработка вакцин. Помните Pfizer? Здесь не обошлось без AI. Есть еще исследования: 1, 2.
В общем, медтех + AI - мое любимое сочетание.
Направление 2 - персональные мультиагентные системы.
Более приземленный, но наиболее близкий к реализации вариант. Добавить к LLM пару других сеток и готово. Наличие у каждого человека ассистента наподобие Джарвиса из железного человека, который знает информацию о вас, вашем календаре, почте и помогает в повседневных задачах. На последней презентации Made By Google, компания показала, функцию Magic Cue для новых Pixel 10, которая именно это и делает. Прикрутить к этому всему еще голос - и Джарвис готов. Лично у меня есть огромная куча задач, где такой ассистент бы пригодился
Направление 3 - исследования космоса.
Как бы грустно ни было, но Земля и наша Солнечная система не являются вечными и причин исследовать космос довольно много: от понимания того, как устроена вселенная до поиска новых ресурсов и мест обитания. Примеров применения AI уже достаточно, от интеллектуальных систем Space X, обеспечивающих повторное использование Шатлов и автономных марсходов NASA до исследований глубокого космоса, как например, сделал студент, выиграв грант на $250 к. Там, где нужно ловить минимальные вероятности и искать скрытые закономерности AI нам реально поможет, а исследование космоса именно таким делом и является.
Направление 4 - физика и квантовые вычисления.
Если бы меня попросили выбрать одну-единственную сферу, в которую стоит сейчас погружаться, я бы назвал именно эту. Текущие вычислительные мощности уже почти на своем пике, а вот в квантовых вычислениях - непаханое поле.
Квантовые компьютеры способны решать задачи, которые для классических компьютеров просто не под силу. Они могут моделировать сложные молекулярные структуры, что откроет новые горизонты в создании лекарств и материалов. В области криптографии квантовые вычисления могут как создать абсолютно защищенные системы, так и взломать существующие, что приведет к настоящей революции в сфере безопасности. В общем, потенциал у квантовых вычислений - огромен. И все, где сейчас применяется и будет применяться AI, при переходе к квантовым вычислениям будет давать результат в десятки, а-то и тысячи раз лучше и быстрее.
Какие направления, на ваш взгляд, я упустил? Делитесь в комментариях!
Как правило, весь AI-хайп сегодня строится вокруг LLM. В каждом пресс-релизе нам говорят о том, что модели стали умнее, быстрее и демонстрируют знания уровня PHD. Однако говорить о том, что LLM - это то, что сделает наш мир лучше, повысит качество жизни и так далее - на мой взгляд, ошибочно. Ранее я уже писал, что с одними LLM, AGI мы не достигнем. Да и есть много чего другого интересного в сфере AI.
До бума генеративного ИИ огромное количество прорывов совершалось в классическом ML, который сегодня, на мой взгляд, незаслуженно уходит на второй план за всем шумом вокруг ChatGPT и других генеративных ИИ. В этом посте хочется поделиться видением того, где, на мой взгляд, AI даст нам наибольший буст, вне зависимости от применяемых технологий.
Направление 1 - медицина.
Я безумно люблю медтех, так как вижу это наиболее полезной для человека сферой, ведь при отсутствии здоровья все остальное становится неважным. AI активно используется для диагностики медицинских данных изображений, вроте КТ, МРТ и ОКТ-снимков, выявляя болезни и биомаркеры с точностью 95%+. Это может быть как базовая диагностика, так и превентивная медицина для выявления болезней на самых ранних стадиях. Мы в EAI как раз занимаемся разработкой подобных систем и это просто крутое чувство, когда ты думаешь о том, качество жизни скольких людей может улучшить твоя разработка и сколько болезней может предотвратить.
Другой сценарий применения AI - это работа с генетикой. Считается, что геном человека полностью расшифровали в 2023, и теперь, имея современные ML-алгоритмы и мощности, мы можем вести речь о том, чтобы работать над исправлением различного рода генетических поломок.
Третий важный кейс на мой взгляд - это разработка вакцин. Помните Pfizer? Здесь не обошлось без AI. Есть еще исследования: 1, 2.
В общем, медтех + AI - мое любимое сочетание.
Направление 2 - персональные мультиагентные системы.
Более приземленный, но наиболее близкий к реализации вариант. Добавить к LLM пару других сеток и готово. Наличие у каждого человека ассистента наподобие Джарвиса из железного человека, который знает информацию о вас, вашем календаре, почте и помогает в повседневных задачах. На последней презентации Made By Google, компания показала, функцию Magic Cue для новых Pixel 10, которая именно это и делает. Прикрутить к этому всему еще голос - и Джарвис готов. Лично у меня есть огромная куча задач, где такой ассистент бы пригодился
Направление 3 - исследования космоса.
Как бы грустно ни было, но Земля и наша Солнечная система не являются вечными и причин исследовать космос довольно много: от понимания того, как устроена вселенная до поиска новых ресурсов и мест обитания. Примеров применения AI уже достаточно, от интеллектуальных систем Space X, обеспечивающих повторное использование Шатлов и автономных марсходов NASA до исследований глубокого космоса, как например, сделал студент, выиграв грант на $250 к. Там, где нужно ловить минимальные вероятности и искать скрытые закономерности AI нам реально поможет, а исследование космоса именно таким делом и является.
Направление 4 - физика и квантовые вычисления.
Если бы меня попросили выбрать одну-единственную сферу, в которую стоит сейчас погружаться, я бы назвал именно эту. Текущие вычислительные мощности уже почти на своем пике, а вот в квантовых вычислениях - непаханое поле.
Квантовые компьютеры способны решать задачи, которые для классических компьютеров просто не под силу. Они могут моделировать сложные молекулярные структуры, что откроет новые горизонты в создании лекарств и материалов. В области криптографии квантовые вычисления могут как создать абсолютно защищенные системы, так и взломать существующие, что приведет к настоящей революции в сфере безопасности. В общем, потенциал у квантовых вычислений - огромен. И все, где сейчас применяется и будет применяться AI, при переходе к квантовым вычислениям будет давать результат в десятки, а-то и тысячи раз лучше и быстрее.
Какие направления, на ваш взгляд, я упустил? Делитесь в комментариях!
❤13👍8🔥7
Как AI помог мне в ремонте ноутбука и сэкономил денег на запчастях
Моя детская мечта стать инженером и любовь собирать различные конструкторы преобразовалась в то, что если что-то из моей техники, будь это ноутбук, гитара или велосипед, нужно как-то обслужить/отремонтировать, я делаю это сам, когда есть время.
На днях сел заменить в своем маке термопасту. Делать это надо хотя бы раз в год, чтобы ноут не перегревался, особенно если гоняете его в тяжелых задачах вроде монтажа видео и локальных моделек. Свою текущую модель я разбирал в первый раз, поэтому первым делом я нашел соответствующее видео на YouTube. Но в процессе, по своей невнимательности и из-за отсутствия соответствующего предупреждения автора, при разборке я порвал шлейфы вентиляторов. Поломка максимально неприятная, так как из-за их конструкции обрыв было не спаять. Естественно, я пошел искать замену в интернете и никаких шлейфов не нашел ни у iFixIt ни на ebay ни где-либо еще. Сложилась гипотеза, что данную запчасть вообще не продают, позвал на помощь Deep Research и заодно пару AI-браузеров. Все, как один подтвердили мою правоту, даже нашли на Reddit-е несколько веток, где такое обсуждалось. Рекомендация ИИ - покупать вентриляторы в сборе.
Я пошел искать нужные части на известных мне сайтах, стоимость одного вентилятора, БУ составляла в среднем от 30 до 35 баксов. На сайте iFixIT БУ вентилятор стоит как раз те самые $35. Я подумал, что здесь мне снова может помочь AI. Запустил Perplexity Labs с задачкой найти мне вентиляторы в сборе по Part Number и получил результат лучше, чем ожидал. Меня ждала ссылочка на магазин, где комплект из двух новых оригинальных вентиляторов стоил те же самые 35 долларов. С ноткой сомнения я оформил заказ, т.к. замену мне нужно было сделать как можно быстрее, ведь в пятницу у меня конференция.
В итоге вчера вентиляторы доехали до меня, я распаковал их и они они реально оказались оригинальными, 1 в 1 с теми, что стояли в моем маке. Размеры, маркировка, штрих-коды, защитные пленочки - все на месте.
В процессе обратной сборки ноута, я столкнулся с другой проблемой: после сборки у меня почему-то не работала клавиатура и микрофон. Позвал на помощь Gemini Live, снял на видео внутрянку мака. Gemini сказал мне, на какие соединения смотреть и подсказал, что на на этих шлейфах должна быть защелка. Так и оказалось. В отличие от предыдущей модели, Apple изменили конструкцию нескольких шлейфов и после их соединения нужно было подвинуть защелку. В итоге этот пост я пишу с полностью рабочего ноута.
Итого получился кейс, где AI во-первых, помог мне проверить правильность хода своих мыслей, затем обеспечил экономию на оригинальных запчастях в два раза и, наконец, помог разобраться и исправить мои косяки.
Моя детская мечта стать инженером и любовь собирать различные конструкторы преобразовалась в то, что если что-то из моей техники, будь это ноутбук, гитара или велосипед, нужно как-то обслужить/отремонтировать, я делаю это сам, когда есть время.
На днях сел заменить в своем маке термопасту. Делать это надо хотя бы раз в год, чтобы ноут не перегревался, особенно если гоняете его в тяжелых задачах вроде монтажа видео и локальных моделек. Свою текущую модель я разбирал в первый раз, поэтому первым делом я нашел соответствующее видео на YouTube. Но в процессе, по своей невнимательности и из-за отсутствия соответствующего предупреждения автора, при разборке я порвал шлейфы вентиляторов. Поломка максимально неприятная, так как из-за их конструкции обрыв было не спаять. Естественно, я пошел искать замену в интернете и никаких шлейфов не нашел ни у iFixIt ни на ebay ни где-либо еще. Сложилась гипотеза, что данную запчасть вообще не продают, позвал на помощь Deep Research и заодно пару AI-браузеров. Все, как один подтвердили мою правоту, даже нашли на Reddit-е несколько веток, где такое обсуждалось. Рекомендация ИИ - покупать вентриляторы в сборе.
Я пошел искать нужные части на известных мне сайтах, стоимость одного вентилятора, БУ составляла в среднем от 30 до 35 баксов. На сайте iFixIT БУ вентилятор стоит как раз те самые $35. Я подумал, что здесь мне снова может помочь AI. Запустил Perplexity Labs с задачкой найти мне вентиляторы в сборе по Part Number и получил результат лучше, чем ожидал. Меня ждала ссылочка на магазин, где комплект из двух новых оригинальных вентиляторов стоил те же самые 35 долларов. С ноткой сомнения я оформил заказ, т.к. замену мне нужно было сделать как можно быстрее, ведь в пятницу у меня конференция.
В итоге вчера вентиляторы доехали до меня, я распаковал их и они они реально оказались оригинальными, 1 в 1 с теми, что стояли в моем маке. Размеры, маркировка, штрих-коды, защитные пленочки - все на месте.
В процессе обратной сборки ноута, я столкнулся с другой проблемой: после сборки у меня почему-то не работала клавиатура и микрофон. Позвал на помощь Gemini Live, снял на видео внутрянку мака. Gemini сказал мне, на какие соединения смотреть и подсказал, что на на этих шлейфах должна быть защелка. Так и оказалось. В отличие от предыдущей модели, Apple изменили конструкцию нескольких шлейфов и после их соединения нужно было подвинуть защелку. В итоге этот пост я пишу с полностью рабочего ноута.
Итого получился кейс, где AI во-первых, помог мне проверить правильность хода своих мыслей, затем обеспечил экономию на оригинальных запчастях в два раза и, наконец, помог разобраться и исправить мои косяки.
❤24👍10🤯2
Media is too big
VIEW IN TELEGRAM
Google начали раскатывать Gemini в Chrome на всех - записал быстрый обзор
Сегодня открыл свой ноутбук и там меня ждало обновление, которого я очень ждал! Gemini в Chrome начала выходить из беты и это прямо прикольно. Сразу скажу, что в отличие от Comet и Genspark - это не агент, который может контролировать ваш компьютер и принимать решения за вас, но с точки зрения коллаборативной работы Gemini меня прямо порадовал.
Решил прямо сходу протестировать этот функционал, так еще и на русском (я не знал, ответит ли мне модель). К посту приложил запись экрана.
Задачку взял простую: у меня был открыт обзор велосипедного седла, я попросил Gemini помочь мне определиться, подходит ли мне это седло, а после - найти, где я могу его купить подешевле.
Коротко про результат
В целом, модель справилась неплохо с точки зрения анализа, и на троечку с точки зрения поиска информации. Думаю, связано это с тем, что в угоду работе в режиме реального времени, они используют легкую Flash модель. В результате, когда я попросил найти мне ссылки на магазины - она дала всего две ссылки на разные седла. Это были седла той же серии, на которую я смотрел обзор, но не прямо те же конкретные.
А как хотелось бы?
С точки зрения работы на результат, было бы круто, если бы они реализовали это в мультиагентном режиме. Условно: для базового общения с пользователем используется Gemini Flash, которая отвечает за речь и информирование пользователя о том, что происходит, а при детекции сложной задачи - она бы отдавала ее PRO с каким-то набором инструментов. При переключении на PRO было бы круто информировать пользователя о том, что выполняется действие (например, ведется поиск), а параллельно спрашивать, может ли ИИ чем-то еще помочь. В Comet это +- так реализовано, но там модель более глупая и в схожем сценарии завалила меня кучей лишних вопросов.
Итог и для чего может быть полезно сейчас
В общем, до прямо крутого AI браузинга нам еще далеко, но формат взаимодействия с AI именно голосом и с маленьким окошком мне кажется более нативным и удобным. Сейчас основной сценарий, который я вижу - голосовое взаимодействие и коллаборация по материалам на разных страницах, браузинг конкретных страниц без рук (например, пока готовишь - можно пообщаться с ИИ), анализ UI-интерфейсов (часто делал так анализ первичных прототипов).
В общем, пока польза очень специфическая, но когда Google добавят агента, это может быть уже интересно
Сегодня открыл свой ноутбук и там меня ждало обновление, которого я очень ждал! Gemini в Chrome начала выходить из беты и это прямо прикольно. Сразу скажу, что в отличие от Comet и Genspark - это не агент, который может контролировать ваш компьютер и принимать решения за вас, но с точки зрения коллаборативной работы Gemini меня прямо порадовал.
Решил прямо сходу протестировать этот функционал, так еще и на русском (я не знал, ответит ли мне модель). К посту приложил запись экрана.
Задачку взял простую: у меня был открыт обзор велосипедного седла, я попросил Gemini помочь мне определиться, подходит ли мне это седло, а после - найти, где я могу его купить подешевле.
Коротко про результат
В целом, модель справилась неплохо с точки зрения анализа, и на троечку с точки зрения поиска информации. Думаю, связано это с тем, что в угоду работе в режиме реального времени, они используют легкую Flash модель. В результате, когда я попросил найти мне ссылки на магазины - она дала всего две ссылки на разные седла. Это были седла той же серии, на которую я смотрел обзор, но не прямо те же конкретные.
А как хотелось бы?
С точки зрения работы на результат, было бы круто, если бы они реализовали это в мультиагентном режиме. Условно: для базового общения с пользователем используется Gemini Flash, которая отвечает за речь и информирование пользователя о том, что происходит, а при детекции сложной задачи - она бы отдавала ее PRO с каким-то набором инструментов. При переключении на PRO было бы круто информировать пользователя о том, что выполняется действие (например, ведется поиск), а параллельно спрашивать, может ли ИИ чем-то еще помочь. В Comet это +- так реализовано, но там модель более глупая и в схожем сценарии завалила меня кучей лишних вопросов.
Итог и для чего может быть полезно сейчас
В общем, до прямо крутого AI браузинга нам еще далеко, но формат взаимодействия с AI именно голосом и с маленьким окошком мне кажется более нативным и удобным. Сейчас основной сценарий, который я вижу - голосовое взаимодействие и коллаборация по материалам на разных страницах, браузинг конкретных страниц без рук (например, пока готовишь - можно пообщаться с ИИ), анализ UI-интерфейсов (часто делал так анализ первичных прототипов).
В общем, пока польза очень специфическая, но когда Google добавят агента, это может быть уже интересно
🔥12👌3👍2❤1
Пока постов не так много, решил снизить каденс дайджестов до 1 раза в 2 недели.
1. Google выпустили новую модельку для редактирования фото - поделился своими впечатлениями, моделька получилась прямо очень хорошая, уже использую регуларно.
2. Топ сфер, где, на мой взгляд, AI сделает наибольшую разницу - расписал, где я вижу наибольшую пользу
3. Что я узнал потеряв life-work balance при уходе из найма - поделился своим опытом, вижу большую поддержку и благодарен за нее каждому 🫶🏻
4. Как AI помог мне в ремонте ноутбука и сэкономил денег на запчастях - всю прошлую неделю был без ноута, поделился бытовым примером применения AI. Главный вывод - его можно и нужно пробовать применять в разных сценариях
5. Google начали раскатывать Gemini в Chrome на всех - здесь описал мой опыт использования Gemini в Chrome и даже записал небольшое демо-видео.
Также на этой неделе выступал на конференциях от Wonnabe и GWC. Если вам не пришли какие-то ссылки - напишите мне в личку. Также напоминаю, что бесплатный вебинар по промпт инжинирингу, состоится на следующей неделе. Зарегистрироваться можно тут, мероприятие на английском.
Прошлый дайджест тут
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥1
Мой воркфлоу для создания презентаций с AI
Я как-то писал, что не доверяю создание AI презентаций полностью под ключ, но это не значит, что я его вообще не использую. Сегодня, делая очередную презу, решил поделиться своим воркфлоу в канале. Без лишних слов - к делу!
Сценарий 1: “Быстрые презы”
Часто мне нужно где-то выступить, адаптировать существующий материал либо просто собрать какую-то визуализацию для себя. В таком случае мне не так важны детали, преза выполняет скорее вспомогательную роль, а не функцию произведения дополнительного впечатления.
Шаг 1: набрасываем план презентации. Для этого нам нужен полный текст либо детальное описание нашего выступления. Тут мяч на вашей стороне, можете предложить план сами, а можете закинуть в LLM. Самое главное - наличие структуры.
Шаг 2: набрасываем наполнение. Что вы хотите, чтобы было на слайде? Какой основной месседж? Что есть такого, что вашей аудитории нужно не только услышать от вас, но и увидеть на экране? Продумываем эти аспекты на каждом слайде. Дополняем ими план из шага 1.
Шаг 3: зовем на помощь Manus. Из всего, что я пробовал, с точки зрения коллаборативной работы над презами Манус мне показался самым лучшим. Флоу работы с ним следующий: на вход я даю ему промпт, в котором описываю, что за преза, кто аудитория, какие цели выступления. Также он получает от меня информацию по флоу нашей работы: сначала ознакомиться с моим планом, затем посмотреть на референсы в формате скришнотов, которые я ему присылаю, после - построить используя цвета, картинки и иконки, которые я ему даю в виде файла. После получения задания ждем минут 10, возвращаемся, говорим ему, какие внести правки и за 2-3 промпта получаем готовую презу.
Сценарий 2: продающие и обучающие презентации
Для тренингов и агентства презентации делаю уже я сам. И здесь для меня AI выполняет скорее функцию ассистента, чем делает работу за меня. Здесь поделюсь несколькими кейсами, как извлекаю пользу.
Набросай схему слайда: довольно часто у меня есть контент, но не всегда я знаю, как его лучше разместить на слайде. В таком случае я прошу Gemini набросать мне схему расположения элементов на слайде. Решает проблему чистого листа.
Покритикуй: когда преза или слайд готовы - прошу принять LLM роль заказчика и проанализировать слайды на предмет того, заходит ли ей продукт и повествование. Позволяет получить первую ОС.
Поменяй формулировку: часто нужно адаптировать повествование под заказчика. Если это врач - нужны аналогии, если это чел из промышленности - тоже. AI отлично справляется с приземлением технических терминов.
Сгенерируй визуал: презентации без фото - это скучно. А когда у Gemini есть контекст по проекту - он очень круто может вам помочь заполнить пустое пространство.
Сделай по формату: если вы используете шаблоны в своих презентациях - это мастхев. Даете контекст, а потом просите заполнить. Также помогает умещать на слайде нужную информацию, играя с длиной формулировок.
К посту приложил пару примеров из диалогов с Gemini
А какие у вас воркфлоу?
Я как-то писал, что не доверяю создание AI презентаций полностью под ключ, но это не значит, что я его вообще не использую. Сегодня, делая очередную презу, решил поделиться своим воркфлоу в канале. Без лишних слов - к делу!
Сценарий 1: “Быстрые презы”
Часто мне нужно где-то выступить, адаптировать существующий материал либо просто собрать какую-то визуализацию для себя. В таком случае мне не так важны детали, преза выполняет скорее вспомогательную роль, а не функцию произведения дополнительного впечатления.
Шаг 1: набрасываем план презентации. Для этого нам нужен полный текст либо детальное описание нашего выступления. Тут мяч на вашей стороне, можете предложить план сами, а можете закинуть в LLM. Самое главное - наличие структуры.
Шаг 2: набрасываем наполнение. Что вы хотите, чтобы было на слайде? Какой основной месседж? Что есть такого, что вашей аудитории нужно не только услышать от вас, но и увидеть на экране? Продумываем эти аспекты на каждом слайде. Дополняем ими план из шага 1.
Шаг 3: зовем на помощь Manus. Из всего, что я пробовал, с точки зрения коллаборативной работы над презами Манус мне показался самым лучшим. Флоу работы с ним следующий: на вход я даю ему промпт, в котором описываю, что за преза, кто аудитория, какие цели выступления. Также он получает от меня информацию по флоу нашей работы: сначала ознакомиться с моим планом, затем посмотреть на референсы в формате скришнотов, которые я ему присылаю, после - построить используя цвета, картинки и иконки, которые я ему даю в виде файла. После получения задания ждем минут 10, возвращаемся, говорим ему, какие внести правки и за 2-3 промпта получаем готовую презу.
Сценарий 2: продающие и обучающие презентации
Для тренингов и агентства презентации делаю уже я сам. И здесь для меня AI выполняет скорее функцию ассистента, чем делает работу за меня. Здесь поделюсь несколькими кейсами, как извлекаю пользу.
Набросай схему слайда: довольно часто у меня есть контент, но не всегда я знаю, как его лучше разместить на слайде. В таком случае я прошу Gemini набросать мне схему расположения элементов на слайде. Решает проблему чистого листа.
Покритикуй: когда преза или слайд готовы - прошу принять LLM роль заказчика и проанализировать слайды на предмет того, заходит ли ей продукт и повествование. Позволяет получить первую ОС.
Поменяй формулировку: часто нужно адаптировать повествование под заказчика. Если это врач - нужны аналогии, если это чел из промышленности - тоже. AI отлично справляется с приземлением технических терминов.
Сгенерируй визуал: презентации без фото - это скучно. А когда у Gemini есть контекст по проекту - он очень круто может вам помочь заполнить пустое пространство.
Сделай по формату: если вы используете шаблоны в своих презентациях - это мастхев. Даете контекст, а потом просите заполнить. Также помогает умещать на слайде нужную информацию, играя с длиной формулировок.
К посту приложил пару примеров из диалогов с Gemini
А какие у вас воркфлоу?
🔥18👍9❤3
AI Agent vs. Agentic AI: Почему “больше” не всегда значит “лучше”?
На днях один из моих заказчиков прислал мне схему и попросил просто и понятно объяснить, в чем же разница между AI Agent и Agentic AI. Можно долго рассуждать о корректности архитектуры на изображении, но если отбросить детали, фундаментальное различие между этими концепциями действительно есть, и оно крайне важно.
Если упростить до предела, то разница вот в чем:
AI Agent - это, как правило, один специализированный ИИ-помощник, который выполняет за вас конкретную, часто узконаправленную задачу. Отличный пример - любая модель с функцией Deep Research. Вы ставите задачу, контролируете процесс и получаете результат.
Agentic AI - это уже мультиагентная система. Представьте себе команду, где несколько ИИ-агентов (например, аналитик, тестировщик, разработчик) распределяют задачи между собой, чтобы в итоге выдать вам готовое комплексное решение.
Иными словами, первый подход предполагает ваше активное вовлечение, а второй работает по принципу “отдал задачу и забыл”. Интуитивно всем хочется второго сценария, ведь это звучит как настоящая магия. Но действительно ли он лучше?
Далеко не всегда. Я бы даже сказал, что в подавляющем большинстве случаев для серьезной работы - нет. И вот почему.
1. Рентабельность: цена за автономность
Как правило, инструменты, работающие по принципу “отдал и забыл”, потребляют колоссальное количество токенов. И это неизбежно, какими бы качественными ни были внутренние пайплайны и промпты. В контексте бизнеса такая конструкция окупается очень тяжело, если окупается в принципе. Автономность стоит дорого, и за нее приходится платить буквально.
2. Эффект домино: каскадные галлюцинации
Галлюцинации у LLM - это данность, особенно при работе с большими объемами информации. А теперь представьте: когда у вас работает один агент, вы имеете дело с одним потенциальным источником ошибки. Но когда у вас три агента, работающих последовательно, риски многократно возрастают. Ошибка или неточность первого агента становится входными данными для второго. Тот, в свою очередь, может добавить свои фантазии поверх уже искаженной информации, и так далее. В итоге конечный результат может кардинально отличаться от первоначальных требований.
3. Проблема “черного ящика”: потеря контроля и прозрачности
Чем автономнее система, тем меньше у нас контроля над промежуточными этапами. Агент реже возвращается к вам, чтобы показать свои наработки, и в результате наше понимание того, что происходило «под капотом» и откуда взялись те или иные выводы, стремится к нулю. Здесь в полный рост встает проблема Lost in the Middle, о которой мы говорили на эфире про управление контекстом. И неважно, над какой задачей мы работаем - будь то код, исследование или стратегия, - человеку становится гораздо сложнее включиться в процесс и скорректировать его. Это и есть цена, которую мы платим за делегирование.
Так что же, Agentic AI совсем не нужен?
И казалось бы, при всех этих недостатках, есть ли у таких систем будущее? На мой взгляд - да, и еще какое. Важно понимать, что описанные проблемы по большей части временные. Я верю, что вопросы стоимости и галлюцинаций в сложных системах со временем удастся решить.
Но самый главный поинт - это разница в сценариях использования. Если вам нужно что-то сделать очень быстро, Agentic AI может быть невероятно полезен. Например, собрать прототип для проверки гипотезы - инструмент вроде Shotgun здесь будет идеальным выбором. Но если вы хотите построить надежный продукт и продумать его архитектуру, здесь придется больше думать самостоятельно и использовать более контролируемые AI-агенты.
Какой из этого можно сделать вывод? Всё дело в правильном выборе инструмента для конкретной задачи. Для глубокой, вдумчивой и контролируемой работы - используем AI Agents. А там, где нужна скорость, быстрое прототипирование и проверка идей - на помощь приходит Agentic AI. Вот такая выходит разница.
На днях один из моих заказчиков прислал мне схему и попросил просто и понятно объяснить, в чем же разница между AI Agent и Agentic AI. Можно долго рассуждать о корректности архитектуры на изображении, но если отбросить детали, фундаментальное различие между этими концепциями действительно есть, и оно крайне важно.
Если упростить до предела, то разница вот в чем:
AI Agent - это, как правило, один специализированный ИИ-помощник, который выполняет за вас конкретную, часто узконаправленную задачу. Отличный пример - любая модель с функцией Deep Research. Вы ставите задачу, контролируете процесс и получаете результат.
Agentic AI - это уже мультиагентная система. Представьте себе команду, где несколько ИИ-агентов (например, аналитик, тестировщик, разработчик) распределяют задачи между собой, чтобы в итоге выдать вам готовое комплексное решение.
Иными словами, первый подход предполагает ваше активное вовлечение, а второй работает по принципу “отдал задачу и забыл”. Интуитивно всем хочется второго сценария, ведь это звучит как настоящая магия. Но действительно ли он лучше?
Далеко не всегда. Я бы даже сказал, что в подавляющем большинстве случаев для серьезной работы - нет. И вот почему.
1. Рентабельность: цена за автономность
Как правило, инструменты, работающие по принципу “отдал и забыл”, потребляют колоссальное количество токенов. И это неизбежно, какими бы качественными ни были внутренние пайплайны и промпты. В контексте бизнеса такая конструкция окупается очень тяжело, если окупается в принципе. Автономность стоит дорого, и за нее приходится платить буквально.
2. Эффект домино: каскадные галлюцинации
Галлюцинации у LLM - это данность, особенно при работе с большими объемами информации. А теперь представьте: когда у вас работает один агент, вы имеете дело с одним потенциальным источником ошибки. Но когда у вас три агента, работающих последовательно, риски многократно возрастают. Ошибка или неточность первого агента становится входными данными для второго. Тот, в свою очередь, может добавить свои фантазии поверх уже искаженной информации, и так далее. В итоге конечный результат может кардинально отличаться от первоначальных требований.
3. Проблема “черного ящика”: потеря контроля и прозрачности
Чем автономнее система, тем меньше у нас контроля над промежуточными этапами. Агент реже возвращается к вам, чтобы показать свои наработки, и в результате наше понимание того, что происходило «под капотом» и откуда взялись те или иные выводы, стремится к нулю. Здесь в полный рост встает проблема Lost in the Middle, о которой мы говорили на эфире про управление контекстом. И неважно, над какой задачей мы работаем - будь то код, исследование или стратегия, - человеку становится гораздо сложнее включиться в процесс и скорректировать его. Это и есть цена, которую мы платим за делегирование.
Так что же, Agentic AI совсем не нужен?
И казалось бы, при всех этих недостатках, есть ли у таких систем будущее? На мой взгляд - да, и еще какое. Важно понимать, что описанные проблемы по большей части временные. Я верю, что вопросы стоимости и галлюцинаций в сложных системах со временем удастся решить.
Но самый главный поинт - это разница в сценариях использования. Если вам нужно что-то сделать очень быстро, Agentic AI может быть невероятно полезен. Например, собрать прототип для проверки гипотезы - инструмент вроде Shotgun здесь будет идеальным выбором. Но если вы хотите построить надежный продукт и продумать его архитектуру, здесь придется больше думать самостоятельно и использовать более контролируемые AI-агенты.
Какой из этого можно сделать вывод? Всё дело в правильном выборе инструмента для конкретной задачи. Для глубокой, вдумчивой и контролируемой работы - используем AI Agents. А там, где нужна скорость, быстрое прототипирование и проверка идей - на помощь приходит Agentic AI. Вот такая выходит разница.
❤13👍8🔥5🤯1
Google релизнули AI-тул для создания мини-аппов и простых AI-агентов
В очередной раз залез в Google Labs и наткнулся там на полезное. Google сделали новый тул, который называется Opal.
Что это такое?
Многие из вас слышали про n8n. Лично я не фанат этого сервиса и подобного способа работы: рисование сложных блок-схем и ограниченность функционалом конструктора заставляют меня отдавать предпочтение кодингу.
Но что, если я вам скажу, что Opal - это тул, который берет лучшее и от n8n и от Cursor?
Дело в том, что данный конструктор апок работает по следующему принципу:
В результате получается тул, который не так ограничен, как n8n, но при этом не так сложен, как AI-кодинг. Все, что вам нужно - уметь четко формулировать, что вам нужно.
Какие функции имеются у Opal?
1. Прямые обращения к LLM.
2. Планирование действий (для агентских задач).
3. Проведение Deep Research по нужным темам или ссылкам.
4. Генерация картинок, речи, видео или музыки.
5. Tool-use для LLM (сейчас доступны поиск, получение погоды, скрейпинг страниц и поиск по картам)
Все это может взаимодействовать с видео на ютубе, вашими файлами в Google Drive и много чем еще. В общем, на мой взгляд, концептуально очень прикольный и полезный получился инструмент. С точки зрения практической реализации - надо понять, какие лучше в него скидывать задачи и как с ним взаимодействовать.
Попробовать можно тут. Я попробовал себе быстренько сделать собиратор новостей, чтобы присылал мне саммари на русском, но переводить он пока отказывается, поэтому буду еще тыкать.
Кто уже попробовал - делитесь кейсами, для чего используете Opal 😁
В очередной раз залез в Google Labs и наткнулся там на полезное. Google сделали новый тул, который называется Opal.
Что это такое?
Многие из вас слышали про n8n. Лично я не фанат этого сервиса и подобного способа работы: рисование сложных блок-схем и ограниченность функционалом конструктора заставляют меня отдавать предпочтение кодингу.
Но что, если я вам скажу, что Opal - это тул, который берет лучшее и от n8n и от Cursor?
Дело в том, что данный конструктор апок работает по следующему принципу:
Вы в чате пишете, что вам нужно -> моделька пишет код вашей апки и также преобразует его в блок-схему -> вы можете менять как блок-схему, так и вносить правки, описывая нужные изменения.
В результате получается тул, который не так ограничен, как n8n, но при этом не так сложен, как AI-кодинг. Все, что вам нужно - уметь четко формулировать, что вам нужно.
Какие функции имеются у Opal?
1. Прямые обращения к LLM.
2. Планирование действий (для агентских задач).
3. Проведение Deep Research по нужным темам или ссылкам.
4. Генерация картинок, речи, видео или музыки.
5. Tool-use для LLM (сейчас доступны поиск, получение погоды, скрейпинг страниц и поиск по картам)
Все это может взаимодействовать с видео на ютубе, вашими файлами в Google Drive и много чем еще. В общем, на мой взгляд, концептуально очень прикольный и полезный получился инструмент. С точки зрения практической реализации - надо понять, какие лучше в него скидывать задачи и как с ним взаимодействовать.
Попробовать можно тут. Я попробовал себе быстренько сделать собиратор новостей, чтобы присылал мне саммари на русском, но переводить он пока отказывается, поэтому буду еще тыкать.
Кто уже попробовал - делитесь кейсами, для чего используете Opal 😁
opal.google
Opal [Experiment]
🔥17👍9
Как маркетологи превращают AI из конкурентного преимущества в мусор
Вернувшись в США, я, ожидаемо стал видеть больше рекламы в разных сервисах, которыми пользуюсь: от контекстной рекламы до YouTube, запрещенной сети с фотографиями и почты. И, что я заметил, так это то, что за пару месяцев моего отсутствия все еще больше сошли с ума и пихают AI вообще повсюду, зачастую, туда, где он тебе даже не нужен.
Стоит тебе что-то загуглить - будь уверен, что тебя настигнет реклама с AI про это. AI-конструктор сайтов, AI-SEO, AI-писатель, AI-тренер, AI-учитель, AI-трейдер, AI-друг, AI-девушка - и так можно продолжать до бесконечности. И проблем здесь несколько.
Проблема 1 - обесценивание технологии
Во-первых, большинство из того, что нам рекламируется либо не является AI либо является каким-то ну очень базовым ИИ. Как результат - люди пользуются этим, получают плохой результат, формируют мнение о том, что "AI-это какая-то фигня" и, условно, что все продукты, может, кроме ChatGPT - это скам. И если раньше эта болезнь была местечковой (помню, как маркетологи Skyeng гордо писали, что мы обучили свою версию GPT4 (тогда я Сэм Альтман)), то сейчас это превращается из попыток хайпануть в маркер некомпетентности.
Проблема 2 - Маркетинговая слепота
Другая проблема, которая перекачевала из ритейла - банерная слепота. Помните, сколько разноцветных ценников с разными акциями можно увидеть в условной "Пятерочке"? Работая с Х5 в 2017 мы пытались решить эту задачку, создавая умные интерактивные стеллажи с подсветкой. Но с AI ситуация сложнее.
Вся реклама идет в цифровом мире и способов влияния на человека здесь не так много. В итоге, я, как потребитель, не понимаю, что мне выбрать, потому что пресловутый AI вообще везде. В то же время, я, как разработчик, даже если у меня реально крутой AI - сталкиваюсь с проблемой того, что мой продукт сложнее позиционировать. AI - это уже не конкурентное преимущество, а клеймо.
Что с этим делать?
Вне зависимости от того, выступаете вы в роли продакта или пользователя, вам нужно задать себе два простых вопроса:
- "Решает ли данный продукт мою проблему/проблему пользователя?"
- "Достигается ли это благодаря AI?".
Если вы выбили "Да" по обоим вопросам - поздравляю, возможно перед вами стоящий AI продукт. Во всех остальных случаях - проверьте свои уши, скорее всего с них что-то свисает :)
AI-это новая нормальность, а не конкурентное преимущество. На мой взгляд, идеальная реклама - это та, просмотрев которую, я открываю приложение банка и перевожу деньги на платежную карту, вообще не думая про AI, а не та, где эти две буквы упоминаются по 3 раза в одном предложении.
Вернувшись в США, я, ожидаемо стал видеть больше рекламы в разных сервисах, которыми пользуюсь: от контекстной рекламы до YouTube, запрещенной сети с фотографиями и почты. И, что я заметил, так это то, что за пару месяцев моего отсутствия все еще больше сошли с ума и пихают AI вообще повсюду, зачастую, туда, где он тебе даже не нужен.
Стоит тебе что-то загуглить - будь уверен, что тебя настигнет реклама с AI про это. AI-конструктор сайтов, AI-SEO, AI-писатель, AI-тренер, AI-учитель, AI-трейдер, AI-друг, AI-девушка - и так можно продолжать до бесконечности. И проблем здесь несколько.
Проблема 1 - обесценивание технологии
Во-первых, большинство из того, что нам рекламируется либо не является AI либо является каким-то ну очень базовым ИИ. Как результат - люди пользуются этим, получают плохой результат, формируют мнение о том, что "AI-это какая-то фигня" и, условно, что все продукты, может, кроме ChatGPT - это скам. И если раньше эта болезнь была местечковой (помню, как маркетологи Skyeng гордо писали, что мы обучили свою версию GPT4 (тогда я Сэм Альтман)), то сейчас это превращается из попыток хайпануть в маркер некомпетентности.
Проблема 2 - Маркетинговая слепота
Другая проблема, которая перекачевала из ритейла - банерная слепота. Помните, сколько разноцветных ценников с разными акциями можно увидеть в условной "Пятерочке"? Работая с Х5 в 2017 мы пытались решить эту задачку, создавая умные интерактивные стеллажи с подсветкой. Но с AI ситуация сложнее.
Вся реклама идет в цифровом мире и способов влияния на человека здесь не так много. В итоге, я, как потребитель, не понимаю, что мне выбрать, потому что пресловутый AI вообще везде. В то же время, я, как разработчик, даже если у меня реально крутой AI - сталкиваюсь с проблемой того, что мой продукт сложнее позиционировать. AI - это уже не конкурентное преимущество, а клеймо.
Что с этим делать?
Вне зависимости от того, выступаете вы в роли продакта или пользователя, вам нужно задать себе два простых вопроса:
- "Решает ли данный продукт мою проблему/проблему пользователя?"
- "Достигается ли это благодаря AI?".
Если вы выбили "Да" по обоим вопросам - поздравляю, возможно перед вами стоящий AI продукт. Во всех остальных случаях - проверьте свои уши, скорее всего с них что-то свисает :)
AI-это новая нормальность, а не конкурентное преимущество. На мой взгляд, идеальная реклама - это та, просмотрев которую, я открываю приложение банка и перевожу деньги на платежную карту, вообще не думая про AI, а не та, где эти две буквы упоминаются по 3 раза в одном предложении.
👍10❤8
Как сделать написание AI-кода более предсказуемым и контролируемым
Одна из проблем, на которую поголовно жалуются все, кто пробовал писать код с AI - это то, что агенты творят всякую дичь. Вы либо сталкивались сами либо читали про ситуации, когда все работало, а после добавления новой функции вдруг перестало, либо агент радостно вам сообщает, что сделал какие-то оптимизации в коде, “потому что это лучшая практика”. Ни то ни другое ни к чему хорошему не приводит. Сегодня делюсь своими способами того, как с этим бороться.
Гит - ваш лучший друг
Базовый совет, которым многие принебрегают. Сохраняйте весомые изменения. ВСЕГДА. Сделали фичу - залейте в гит. Потратите 30 секунд времени, но избавите себя от головной боли с откатом изменений.
Откажитесь от автономных мультиагентных систем
Я писал об этом ранее. Как бы соблазнительно ни звучала идея того, что AI за вас и ТЗ напишет и тесты - на данный момент этот подход я называю “наговнякать и оно как-то работает”. Помимо того, что это дорого и чревато каскаднымы галлюцинациями, есть куча других “бонусов”. Вы не будете знать архитектуру, вы не будете понимать, какой файл и за что у вас отвечает, вы не будете знать, что грузить в контекст LLM, а что нет. В конечном итоге вы утратите контроль над процессом
ТЗ - всему голова
Уделите особое внимание написанию ТЗ. По моему опыту - это ~70% вашего результата. Не нужно уходить в технические дебри. Опишите подробные сценарии, как бы вы сделали для человека. Само ТЗ разбейте на этапы с точки зрения User Stories, чтобы их можно было потестить. При работе просите агента изолированно реализовать каждую функцию, дайте ему общий контекст о том, что вы делаете, а затем - только описание нужной вам фичи.
Одно изменение за раз
Старайтесь избегать ситуаций в стиле “Увеличь мне кнопку, добавь картинку, а еще сделай мобильный адаптив”. Это три разные задачи, причем третья может быть вообще огромной. Можно объединять в одной задаче “изменения” - типа изменения вида и положения элементов. “Добавления” и “Создания с нуля” - лучше всегда выносить отдельно.
Отключите лишние MCP
Они засоряют контекст. В результате вы сталкиваетесь с тем, что модель что-то упускает, либо делает то, что вы ее не просили. Не работаете с фигмой? Выключите Figma MCP. Скармливаете модели документацию вручную? Отключите Context 7, он вам не нужен, и так далее.
Смоук-тесты - ваша опора
Хорошей практикой будет писать тесты. Тесты мы просим LLM писать с опорой на ТЗ. При каждом изменении перед публикацией в Гит - прогоняем тесты. С написанием тестов лучше справляются консервативные модели, вроде GPT o3 и GPT-5.
Вникайте в код
Даже если вы не технарь. Читайте, что AI вам пишет. Просите объяснить, как и что работает, почему сделано методом А, а не методом B. На дистанции вы начнете замечать определенные патерны и сможете избегать типовых ошибок.
Не пытайтесь “ваншотить”
Сделать что-то с “одного промпта” - звучит классно, но на деле получается так себе. Базовый минимум - спросить сначала агента, КАК и ЧТО он будет делать, а только потом приступить к реализации на основании этого плана. Вам - больше контроля, а AI - больше системности.
Выносите сложные куски в другие AI и понижайте температуру
Не работайте испключительно в Cursor, Claude Code или где-либо еще. Сложные фичи я рекомендую пробовать реализовать в той же AI Studio. Где вам нужен четкий результат - скрутите температуру в 0. Чаще всего это будет работать.
А какие у вас лайфхаки по работе с кодом?
Одна из проблем, на которую поголовно жалуются все, кто пробовал писать код с AI - это то, что агенты творят всякую дичь. Вы либо сталкивались сами либо читали про ситуации, когда все работало, а после добавления новой функции вдруг перестало, либо агент радостно вам сообщает, что сделал какие-то оптимизации в коде, “потому что это лучшая практика”. Ни то ни другое ни к чему хорошему не приводит. Сегодня делюсь своими способами того, как с этим бороться.
Гит - ваш лучший друг
Базовый совет, которым многие принебрегают. Сохраняйте весомые изменения. ВСЕГДА. Сделали фичу - залейте в гит. Потратите 30 секунд времени, но избавите себя от головной боли с откатом изменений.
Откажитесь от автономных мультиагентных систем
Я писал об этом ранее. Как бы соблазнительно ни звучала идея того, что AI за вас и ТЗ напишет и тесты - на данный момент этот подход я называю “наговнякать и оно как-то работает”. Помимо того, что это дорого и чревато каскаднымы галлюцинациями, есть куча других “бонусов”. Вы не будете знать архитектуру, вы не будете понимать, какой файл и за что у вас отвечает, вы не будете знать, что грузить в контекст LLM, а что нет. В конечном итоге вы утратите контроль над процессом
ТЗ - всему голова
Уделите особое внимание написанию ТЗ. По моему опыту - это ~70% вашего результата. Не нужно уходить в технические дебри. Опишите подробные сценарии, как бы вы сделали для человека. Само ТЗ разбейте на этапы с точки зрения User Stories, чтобы их можно было потестить. При работе просите агента изолированно реализовать каждую функцию, дайте ему общий контекст о том, что вы делаете, а затем - только описание нужной вам фичи.
Одно изменение за раз
Старайтесь избегать ситуаций в стиле “Увеличь мне кнопку, добавь картинку, а еще сделай мобильный адаптив”. Это три разные задачи, причем третья может быть вообще огромной. Можно объединять в одной задаче “изменения” - типа изменения вида и положения элементов. “Добавления” и “Создания с нуля” - лучше всегда выносить отдельно.
Отключите лишние MCP
Они засоряют контекст. В результате вы сталкиваетесь с тем, что модель что-то упускает, либо делает то, что вы ее не просили. Не работаете с фигмой? Выключите Figma MCP. Скармливаете модели документацию вручную? Отключите Context 7, он вам не нужен, и так далее.
Смоук-тесты - ваша опора
Хорошей практикой будет писать тесты. Тесты мы просим LLM писать с опорой на ТЗ. При каждом изменении перед публикацией в Гит - прогоняем тесты. С написанием тестов лучше справляются консервативные модели, вроде GPT o3 и GPT-5.
Вникайте в код
Даже если вы не технарь. Читайте, что AI вам пишет. Просите объяснить, как и что работает, почему сделано методом А, а не методом B. На дистанции вы начнете замечать определенные патерны и сможете избегать типовых ошибок.
Не пытайтесь “ваншотить”
Сделать что-то с “одного промпта” - звучит классно, но на деле получается так себе. Базовый минимум - спросить сначала агента, КАК и ЧТО он будет делать, а только потом приступить к реализации на основании этого плана. Вам - больше контроля, а AI - больше системности.
Выносите сложные куски в другие AI и понижайте температуру
Не работайте испключительно в Cursor, Claude Code или где-либо еще. Сложные фичи я рекомендую пробовать реализовать в той же AI Studio. Где вам нужен четкий результат - скрутите температуру в 0. Чаще всего это будет работать.
А какие у вас лайфхаки по работе с кодом?
4🔥17👍9❤8
Apple потеряли себя не только в AI
За "прогресс" в AI Apple не пнул только ленивый. И, честно говоря, их отставание здесь было вполне ожидаемым - ребята из Купертино делают ставку на приватность, а эта идея зачастую противоречит быстрому обучению и развитию моделей. Но это еще полбеды.
Я никогда не был ярым фанатом Apple, но как человек, который проектирует кучу интерфейсов и приложений, всегда считал их золотым стандартом UX и UI. Однако недавно произошло то, за что мне самому захотелось пнуть компанию - продукты Apple перестали быть похожи на продукты Apple.
И я сейчас не про сомнительный дизайн новых iPhone или слабую презентацию, которая была неделю назад. Я про радикальные изменения в новых версиях операционных систем.
Еще когда представили Liquid Glass, он мне не зашел. Но я обычно не сужу по ранним бета-версиям, ведь многое может поменяться. И вот, я обновился, и могу сказать: красивый, интуитивный и буквально “вылизанный" до идеала дизайн - это больше не про Apple. Сужу по iPadOS, так как после этого обновлять Mac желания нет от слова "совсем".
Дизайн: привет из 2012-го
Это какой-то странный возврат в 2012 год с его трендом на неоморфизм, но выглядит все как дешевая китайская поделка с телефонов того же периода.
1. Тени на иконках выглядят так, будто их пересветили с выкрученной на максимум экспозицией.
2. Вместо невесомых, элегантных границ у элементов - грубые линии.
3. Кнопки, которые раньше были естественной частью интерфейса и не отвлекали внимание, превратились в какие-то пуговицы.
Главная причина, почему неоморфизм когда-то канул в Лету, - это жертвование функциональностью ради дизайна. И Apple снова наступает на те же грабли. А самое обидное, что это даже некрасиво: держишь в руках устройство за $1000, а интерфейс выглядит максимум на $100.
UX: было просто - стало непонятно
В свое время Apple взорвали индустрию тем, что любой мог взять их устройство и сразу начать им пользоваться. В новой ОС этого нет. Чтобы понять, как работают новые фичи, мне - человеку с огромной насмотренностью и общением с техникой на "ты" - пришлось скачивать приложение Tips.
И что еще хуже - вместе с добавлением новых функций Apple не дает возможности вернуть "как было". На iPad появилась мультиоконность, но при этом убрали Split Screen, где можно было удобно разместить браузер слева, а Telegram справа. В новом режиме это неудобно, а старые жесты, которыми мы пользовались годами, больше не работают.
Консистентности больше нет
Еще одной киллер-фичей Apple была консистентность: ты мог без проблем переключаться между устройствами, потому что расположение кнопок и элементов было идентичным. iPadOS хотели сделать похожей на macOS, но провалили эту задачу.
- Родные приложения, вроде заметок, обросли каким-то мусором.
- Кнопки управления размером окна почему-то расположены по центру, когда оно развернуто на весь экран, а когда свернуто - снова в левом углу, как на Mac.
- И таких мелких нелогичных моментов - целая куча.
Грустно наблюдать, как компания, бывшая для многих эталоном, превратилась в анти-пример. Отстать в AI, испортить дизайн и ОС всего за полтора-два года - для этого нужен особый талант. Искренне надеюсь, что это последний год Тима Кука у руля.
Что думаете по этому поводу? Может, я слишком критичен, или вам тоже не нравится вектор развития компании?
За "прогресс" в AI Apple не пнул только ленивый. И, честно говоря, их отставание здесь было вполне ожидаемым - ребята из Купертино делают ставку на приватность, а эта идея зачастую противоречит быстрому обучению и развитию моделей. Но это еще полбеды.
Я никогда не был ярым фанатом Apple, но как человек, который проектирует кучу интерфейсов и приложений, всегда считал их золотым стандартом UX и UI. Однако недавно произошло то, за что мне самому захотелось пнуть компанию - продукты Apple перестали быть похожи на продукты Apple.
И я сейчас не про сомнительный дизайн новых iPhone или слабую презентацию, которая была неделю назад. Я про радикальные изменения в новых версиях операционных систем.
Еще когда представили Liquid Glass, он мне не зашел. Но я обычно не сужу по ранним бета-версиям, ведь многое может поменяться. И вот, я обновился, и могу сказать: красивый, интуитивный и буквально “вылизанный" до идеала дизайн - это больше не про Apple. Сужу по iPadOS, так как после этого обновлять Mac желания нет от слова "совсем".
Дизайн: привет из 2012-го
Это какой-то странный возврат в 2012 год с его трендом на неоморфизм, но выглядит все как дешевая китайская поделка с телефонов того же периода.
1. Тени на иконках выглядят так, будто их пересветили с выкрученной на максимум экспозицией.
2. Вместо невесомых, элегантных границ у элементов - грубые линии.
3. Кнопки, которые раньше были естественной частью интерфейса и не отвлекали внимание, превратились в какие-то пуговицы.
Главная причина, почему неоморфизм когда-то канул в Лету, - это жертвование функциональностью ради дизайна. И Apple снова наступает на те же грабли. А самое обидное, что это даже некрасиво: держишь в руках устройство за $1000, а интерфейс выглядит максимум на $100.
UX: было просто - стало непонятно
В свое время Apple взорвали индустрию тем, что любой мог взять их устройство и сразу начать им пользоваться. В новой ОС этого нет. Чтобы понять, как работают новые фичи, мне - человеку с огромной насмотренностью и общением с техникой на "ты" - пришлось скачивать приложение Tips.
И что еще хуже - вместе с добавлением новых функций Apple не дает возможности вернуть "как было". На iPad появилась мультиоконность, но при этом убрали Split Screen, где можно было удобно разместить браузер слева, а Telegram справа. В новом режиме это неудобно, а старые жесты, которыми мы пользовались годами, больше не работают.
Консистентности больше нет
Еще одной киллер-фичей Apple была консистентность: ты мог без проблем переключаться между устройствами, потому что расположение кнопок и элементов было идентичным. iPadOS хотели сделать похожей на macOS, но провалили эту задачу.
- Родные приложения, вроде заметок, обросли каким-то мусором.
- Кнопки управления размером окна почему-то расположены по центру, когда оно развернуто на весь экран, а когда свернуто - снова в левом углу, как на Mac.
- И таких мелких нелогичных моментов - целая куча.
Грустно наблюдать, как компания, бывшая для многих эталоном, превратилась в анти-пример. Отстать в AI, испортить дизайн и ОС всего за полтора-два года - для этого нужен особый талант. Искренне надеюсь, что это последний год Тима Кука у руля.
Что думаете по этому поводу? Может, я слишком критичен, или вам тоже не нравится вектор развития компании?
👍23🤔10❤4👌1
Мои друзья из LLM arena выложили результаты своего исследования по тому, как мы выбираем LLM
Пару месяцев назад я просил вас пройти опросик от ребят. Наконец-то они выложили результаты. И хоть участников исследования было не так много, менее ценным оно от этого не становится, т.к. в основном в нем принимали участие ребята, которые работают с AI руками: от ML-инженеров и продактов до руководителей AI-направлений.
Отсюда и выводы из исследования будут максимально полезными и прикладными, особенно, если вы хотите глубже погрузиться в специфику AI сами. Специально не дублирую информацию здесь целиком, так как, ребята проделали большую работу по ее сбору и обработке. Поэтому, если вам интересны результаты - перейдите по ссылочке, вся информация там находится в открытом доступе.
Пару месяцев назад я просил вас пройти опросик от ребят. Наконец-то они выложили результаты. И хоть участников исследования было не так много, менее ценным оно от этого не становится, т.к. в основном в нем принимали участие ребята, которые работают с AI руками: от ML-инженеров и продактов до руководителей AI-направлений.
Отсюда и выводы из исследования будут максимально полезными и прикладными, особенно, если вы хотите глубже погрузиться в специфику AI сами. Специально не дублирую информацию здесь целиком, так как, ребята проделали большую работу по ее сбору и обработке. Поэтому, если вам интересны результаты - перейдите по ссылочке, вся информация там находится в открытом доступе.
🔥10👍4👌4❤1
Когда соло-предпринимателю с AI нужны реальные люди?
AI сделал так, что практически любой думающий человек, имеющий какую-то идею и обладающий хорошей усидчивостью может в соло реализовать свой проект, особенно если это что-то в цифровой сфере. Нужен лендинг? Bolt и Lovable в помощь. Хочешь свое приложение - тот же Bolt + Expo помогут его создать. Воронки в Telegram? Можно собрать в n8n без навыков кодинга. Маркетинговые тексты - Claude поможет. И я не говорю про то, сколько всего можно сделать с LLM на этапе планирования и анализа своей бизнес идеи. Если у вас есть экспертность - потратьте $100 на AI-тулы, выделите $400 на маркетинг и, скорее всего, это отобьется.
Однако AI для запуска своего проекта - не панацея. Выше я неслучайно написал про экспертность. И есть определенные ситуации, когда идея полностью полагаться на ИИ может вам выйти боком. Здесь хочется поделиться как своим опытом, так и других ребят, которые использовали AI для своих проектов.
Если нужно решить задачу из несмежной вам сферы. Допустим, вы хотите сделать цифровой продукт. И, если вы, как и я имеете бекграунд работы в IT, то, скорее всего, вы шарите за дизайн и архитектуру и можно попробовать что-то сделать самому. Но если нет, то базовый минимум - это проконсультироваться с теми, у кого этот опыт есть. Я не говорю про найм разработчика. Продумайте идею с AI, а затем обстучите это видение об тех, у кого есть релевантный опыт. Это сэкономит вам кучу времени, особенно если вы собрались что-то кодить. Например, я не особо много работаю с маркетингом и продажами, поэтому в этом аспекте предпочитаю полагаться на людей, а не на AI, который будет мне говорить, что я “абсолютно прав в своих гипотезах”.
Если разобраться своими силами - это “дорого”. Узнавать новое и учиться - это круто, но далеко невсегда рентабельно. Например, возьмем тот же маркетинг. Вы можете потратить месяц, чтобы понять, как настроить рекламу, какие делать креативы, как сформировать свой пайплайн в Midjourney для генерации картинок для этих самых креативов. Попутно сольете еще денег на настройку этого всего. А можете сразу нанять нужного спеца, который скорее всего, будет стоить в 2 раза больше, чем вы сольете, но сделает все за неделю. Таким образом у вас будет выше отдача от инвестиций, а свой фокус вы сможете направить на то, в чем разбираетесь.
Если вы масштабируете бизнес. AI офигенно подходит для MVP. Проверить первые гипотезы, получить первых платящих клиентов. Но для масштабирования такой подход будет слишком шатким. Архитектура цифрового продукта будет дырявой и несовершенной, конверсии из креативов, сделанных с AI - на 30-40% хуже, дизайны - с какими-то упущениями и.т.д. Если с AI вам удалось достичь соотношения затрат к прибыли 1к4, значит почти наверняка у вас получился нужный людям продукт и пора инвестировать в масштабирование.
Когда работаете с юриспруденцией, финансами и бухгалтерией. Если вы стартуете бизнес - первые продажи в РФ можно делать как самозанятый, здесь все относительно несложно, но рано или поздно вам понадобится составлять оферты, договоры, регистрировать ИП и так далее. Например, LLM неплохо набрасывают драфты таких документов и критикуют, но очень часто ошибаются, так как не смотрят на законодательную базу так, как это бы сделал юрист. Поэтому если вы не умеете составлять договоры, читать законы сами и правильно их интерпретировать - обращайтесь к юристам. Я делаю это для всех проектов. Ошибка LLM здесь может стоить вам бизнеса или свободы 🙂
Когда вы затыкаете собой все “дыры”. Иллюзия “я все могу сам с AI” - опасная ловушка. Да, вы можете. Но какой ценой? В какой-то момент вы ловите себя на том, что вместо работы над стратегией и развитием продукта, вы третий час подбираете идеальный промпт, чтобы впилить новую фичу в продукт. Как только вы чувствуете, что тонете в операционке и у вас не остается сил на задачи, которые кроме вас никто не решит, - пора бить тревогу.
Итого, хоть AI и хорош, но даже при строительстве MVP невсегда его хватает. Если вы пробовали использовать ИИ для построения своего пет-проекта - расскажите про свой опыт!
AI сделал так, что практически любой думающий человек, имеющий какую-то идею и обладающий хорошей усидчивостью может в соло реализовать свой проект, особенно если это что-то в цифровой сфере. Нужен лендинг? Bolt и Lovable в помощь. Хочешь свое приложение - тот же Bolt + Expo помогут его создать. Воронки в Telegram? Можно собрать в n8n без навыков кодинга. Маркетинговые тексты - Claude поможет. И я не говорю про то, сколько всего можно сделать с LLM на этапе планирования и анализа своей бизнес идеи. Если у вас есть экспертность - потратьте $100 на AI-тулы, выделите $400 на маркетинг и, скорее всего, это отобьется.
Однако AI для запуска своего проекта - не панацея. Выше я неслучайно написал про экспертность. И есть определенные ситуации, когда идея полностью полагаться на ИИ может вам выйти боком. Здесь хочется поделиться как своим опытом, так и других ребят, которые использовали AI для своих проектов.
Если нужно решить задачу из несмежной вам сферы. Допустим, вы хотите сделать цифровой продукт. И, если вы, как и я имеете бекграунд работы в IT, то, скорее всего, вы шарите за дизайн и архитектуру и можно попробовать что-то сделать самому. Но если нет, то базовый минимум - это проконсультироваться с теми, у кого этот опыт есть. Я не говорю про найм разработчика. Продумайте идею с AI, а затем обстучите это видение об тех, у кого есть релевантный опыт. Это сэкономит вам кучу времени, особенно если вы собрались что-то кодить. Например, я не особо много работаю с маркетингом и продажами, поэтому в этом аспекте предпочитаю полагаться на людей, а не на AI, который будет мне говорить, что я “абсолютно прав в своих гипотезах”.
Если разобраться своими силами - это “дорого”. Узнавать новое и учиться - это круто, но далеко невсегда рентабельно. Например, возьмем тот же маркетинг. Вы можете потратить месяц, чтобы понять, как настроить рекламу, какие делать креативы, как сформировать свой пайплайн в Midjourney для генерации картинок для этих самых креативов. Попутно сольете еще денег на настройку этого всего. А можете сразу нанять нужного спеца, который скорее всего, будет стоить в 2 раза больше, чем вы сольете, но сделает все за неделю. Таким образом у вас будет выше отдача от инвестиций, а свой фокус вы сможете направить на то, в чем разбираетесь.
Если вы масштабируете бизнес. AI офигенно подходит для MVP. Проверить первые гипотезы, получить первых платящих клиентов. Но для масштабирования такой подход будет слишком шатким. Архитектура цифрового продукта будет дырявой и несовершенной, конверсии из креативов, сделанных с AI - на 30-40% хуже, дизайны - с какими-то упущениями и.т.д. Если с AI вам удалось достичь соотношения затрат к прибыли 1к4, значит почти наверняка у вас получился нужный людям продукт и пора инвестировать в масштабирование.
Когда работаете с юриспруденцией, финансами и бухгалтерией. Если вы стартуете бизнес - первые продажи в РФ можно делать как самозанятый, здесь все относительно несложно, но рано или поздно вам понадобится составлять оферты, договоры, регистрировать ИП и так далее. Например, LLM неплохо набрасывают драфты таких документов и критикуют, но очень часто ошибаются, так как не смотрят на законодательную базу так, как это бы сделал юрист. Поэтому если вы не умеете составлять договоры, читать законы сами и правильно их интерпретировать - обращайтесь к юристам. Я делаю это для всех проектов. Ошибка LLM здесь может стоить вам бизнеса или свободы 🙂
Когда вы затыкаете собой все “дыры”. Иллюзия “я все могу сам с AI” - опасная ловушка. Да, вы можете. Но какой ценой? В какой-то момент вы ловите себя на том, что вместо работы над стратегией и развитием продукта, вы третий час подбираете идеальный промпт, чтобы впилить новую фичу в продукт. Как только вы чувствуете, что тонете в операционке и у вас не остается сил на задачи, которые кроме вас никто не решит, - пора бить тревогу.
Итого, хоть AI и хорош, но даже при строительстве MVP невсегда его хватает. Если вы пробовали использовать ИИ для построения своего пет-проекта - расскажите про свой опыт!
❤13🔥10👍5
Meta* представили кучу AI-продуктов, направленных на взаимодействие с реальным миром
LLM по-истине забрали на себя все внимание на сцене AI, но вчера компания Цукенберга показала несколько очень крутых продуктов, в основе которых лежат ну ОЧЕНЬ крутые нейросети. И что самое крутое - это не очередной чат-бот, а технологии, работающие через взаимодействие с реальным миром: это было главным фокусом презентации.
Прокачали Ray-Ban Meta
Начали с обновления умных очков. Помимо увеличения автономности, добавили Live-режим, работающий так же, как и Gemini Live. Во время презентации пытались что-то приготовить, но случился первый фейл на демо и ИИ-шка затупила, но сам по-себе концепт того, что ты можешь сказать очкам, что-то подсказать тебе в реальном мире, не доставая телефон из кармана - очень крут. Уверен, что проблему пофиксят к запуску.
Представили Oakley Meta* Vanguard
Тут хочется похвалить как сам продукт, так и работу с инфлюенсерами, к рекламе привлекли Килиана Мбаппе (одного из лучших футболистов) и Марка Кавендиша (велосипедист с 35 победами на этапах Тур Де Франс). Мне, как человеку, увлеченному спортом, продукт очень зашел. В очки встроена камера, которую можно активировать вов ремя занятий спортом, также у очков плотная интеграция с Garmin и Strava. Вы можете узнавать свою статистику прямо на ходу и всячески с ней взаимодействовать. Пока что в целом, очки - дорогая игрушка, но для себя вижу, что в будущем лично я на что-то такое точно готов потратиться.
Показали Meta* Ray-Ban Display
Самое топовое, что показали. Очки с дисплеем. Если в одном предложении - ребята засунули смартфон в оправу. Но помимо дисплея меня впечатлили фичи на основе AI. Meta* сделали специальный браслет, который назвали нейроинтерфейсом. Фишка браслета в том, что он используется для управления очками и распознает мельчайшие движения. Так, он может распознать рукописный ввод, если вы хотите отправить сообщение. Хотите прибавить звук? Прокрутите воображаемое колеско громкости. За всем этим стоят прикольные нейросети и это прямо очень круто. Помимо прочего, в очках есть функции живого перевода и субтитров в режиме реального времени.
Помимо очков показали еще новый движок Horizon, позволяющий генерировать объекты в VR по текстовым промптам, и переносить в VR свое реальное окружение.
Отдельно хочется отметить, что все эти штуки были показаны в Live-режиме, а не предзаписи. Во время презентации было несколько фейлов (куда без них), но насколько же круто видеть, когда компании не прикрывают косяки предзаписанными видео! Рекомендую всем посмотреть выжимку из презентации.
А как вам новые продукты? Захотелось ли что-то из этого приобрести?
*Деятельность компании Meta Inc. и её продуктов признана в России экстремистской и запрещена.
LLM по-истине забрали на себя все внимание на сцене AI, но вчера компания Цукенберга показала несколько очень крутых продуктов, в основе которых лежат ну ОЧЕНЬ крутые нейросети. И что самое крутое - это не очередной чат-бот, а технологии, работающие через взаимодействие с реальным миром: это было главным фокусом презентации.
Прокачали Ray-Ban Meta
Начали с обновления умных очков. Помимо увеличения автономности, добавили Live-режим, работающий так же, как и Gemini Live. Во время презентации пытались что-то приготовить, но случился первый фейл на демо и ИИ-шка затупила, но сам по-себе концепт того, что ты можешь сказать очкам, что-то подсказать тебе в реальном мире, не доставая телефон из кармана - очень крут. Уверен, что проблему пофиксят к запуску.
Представили Oakley Meta* Vanguard
Тут хочется похвалить как сам продукт, так и работу с инфлюенсерами, к рекламе привлекли Килиана Мбаппе (одного из лучших футболистов) и Марка Кавендиша (велосипедист с 35 победами на этапах Тур Де Франс). Мне, как человеку, увлеченному спортом, продукт очень зашел. В очки встроена камера, которую можно активировать вов ремя занятий спортом, также у очков плотная интеграция с Garmin и Strava. Вы можете узнавать свою статистику прямо на ходу и всячески с ней взаимодействовать. Пока что в целом, очки - дорогая игрушка, но для себя вижу, что в будущем лично я на что-то такое точно готов потратиться.
Показали Meta* Ray-Ban Display
Самое топовое, что показали. Очки с дисплеем. Если в одном предложении - ребята засунули смартфон в оправу. Но помимо дисплея меня впечатлили фичи на основе AI. Meta* сделали специальный браслет, который назвали нейроинтерфейсом. Фишка браслета в том, что он используется для управления очками и распознает мельчайшие движения. Так, он может распознать рукописный ввод, если вы хотите отправить сообщение. Хотите прибавить звук? Прокрутите воображаемое колеско громкости. За всем этим стоят прикольные нейросети и это прямо очень круто. Помимо прочего, в очках есть функции живого перевода и субтитров в режиме реального времени.
Помимо очков показали еще новый движок Horizon, позволяющий генерировать объекты в VR по текстовым промптам, и переносить в VR свое реальное окружение.
Отдельно хочется отметить, что все эти штуки были показаны в Live-режиме, а не предзаписи. Во время презентации было несколько фейлов (куда без них), но насколько же круто видеть, когда компании не прикрывают косяки предзаписанными видео! Рекомендую всем посмотреть выжимку из презентации.
А как вам новые продукты? Захотелось ли что-то из этого приобрести?
*Деятельность компании Meta Inc. и её продуктов признана в России экстремистской и запрещена.
YouTube
Everything Announced at Meta Connect 2025 in 20 minutes
The next generation of Meta Ray-Bans, Meta's Oakley Vanguard sports glasses, and the Ray-Ban display glasses with neural link wristband were some big reveals at the 2025 Meta Connect Keynote with Mark Zuckerberg. But it wasn't just hardware that was the focus…
🔥10👍9
NGI | Влад Корнышев про AI и создание AI-продуктов
Meta* представили кучу AI-продуктов, направленных на взаимодействие с реальным миром LLM по-истине забрали на себя все внимание на сцене AI, но вчера компания Цукенберга показала несколько очень крутых продуктов, в основе которых лежат ну ОЧЕНЬ крутые нейросети.…
Никак не привыкну к таймзоне США, чтобы выкладывать дайджесты по воскресеньям, поэтому в этот раз он выходит в понедельник
1. Мой воркфлоу для создания презентаций с AI - поделился двумя сценариями создания през
2. AI Agent vs. Agentic AI: Почему “больше” не всегда значит “лучше”? - описал особенности каждого и что и когда использовать
3. Google релизнули AI-тул для создания мини-аппов и простых AI-агентов - очень рекомендую попробовать новый инструмент для автоматизации личных задач
4. Как маркетологи превращают AI из конкурентного преимущества в мусор - рассказал, что происходит и что с этим делать
5. Как сделать написание AI-кода более предсказуемым и контролируемым - поделился практическими советами, которые упростят вашу жизнь
6. Apple потеряли себя не только в AI - про новые айфоны и Liquid Glass
7. Мои друзья из LLM arena выложили результаты своего исследования по тому, как мы выбираем LLM - здесь ссылка на результаты ресерча
8. Когда соло-предпринимателю с AI нужны реальные люди? - поделился кейсами, когда на AI полагаться не стоит
9. Meta* представили кучу AI-продуктов, направленных на взаимодействие с реальным миром - уж очень зашла презентация Цукенберга, не смотря на косяки, прямо крутые продукты
*Деятельность компании Meta Inc. и её продуктов признана в России экстремистской и запрещена.
Прошлый дайджест тут
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
Мой воркфлоу для создания презентаций с AI
Я как-то писал, что не доверяю создание AI презентаций полностью под ключ, но это не значит, что я его вообще не использую. Сегодня, делая очередную презу, решил поделиться своим воркфлоу в канале. Без лишних слов…
Я как-то писал, что не доверяю создание AI презентаций полностью под ключ, но это не значит, что я его вообще не использую. Сегодня, делая очередную презу, решил поделиться своим воркфлоу в канале. Без лишних слов…
❤6
NGI Academy: новый этап и большие планы
Последние несколько потоков тренингов NGI Academy я проводил в партнерстве с Карьерным Цехом. Это был отличный и продуктивный этап: благодаря этому сотрудничеству я смог привлечь больше учеников в академию, а также еще глубже сфокусироваться на качестве учебных программ и работе со студентами. Я очень благодарен команде за совместную работу.
Как это часто бывает в бизнесе, проекты развиваются, и пути партнеров могут расходиться. Мы с коллегами увидели, что наши взгляды на дальнейшее развитие AI-направления начинают различаться: команда Цеха решила сосредоточиться на создании собственных AI-продуктов, а я хочу сконцентрироваться на улучшении образовательного опыта и расширении экосистемы NGI Academy. Это абсолютно нормальный и здоровый процесс роста для обеих сторон.
Поэтому я с радостью объявляю, что NGI Academy возвращается к формату независимого проекта! Для меня это возможность реализовать свое видение на 100%: создавать новые, еще более глубокие продукты, экспериментировать с форматами и строить вокруг академии комьюнити.
Чтобы реализовать эти амбиции, я уделил много времени выбору кофаундера. По заветам Марти Кагана, я искал настоящего “миссионера” - человека, который так же, как и я, горит идеей качественного AI-образования и стремится создавать долгосрочную ценность, а не просто гнаться за кратко-срочными метриками. Теперь, когда ядро команды сформировано, мы добираем специалистов по операционным задачам и маркетингу.
Из-за этих организационных изменений старт новых потоков переносится на октябрь. Это время нам нужно, чтобы идеально подготовиться к запуску.
Что ждет вас в ближайшем будущем? Мы сфокусируемся на трех ключевых направлениях:
⁃ ИИ для личной эффективности
⁃ AI Product Management
⁃ ИИ-программирование
Следите за новостями - уже до конца этой недели я поделюсь подробными анонсами по каждому из них. Впереди много интересного!
Последние несколько потоков тренингов NGI Academy я проводил в партнерстве с Карьерным Цехом. Это был отличный и продуктивный этап: благодаря этому сотрудничеству я смог привлечь больше учеников в академию, а также еще глубже сфокусироваться на качестве учебных программ и работе со студентами. Я очень благодарен команде за совместную работу.
Как это часто бывает в бизнесе, проекты развиваются, и пути партнеров могут расходиться. Мы с коллегами увидели, что наши взгляды на дальнейшее развитие AI-направления начинают различаться: команда Цеха решила сосредоточиться на создании собственных AI-продуктов, а я хочу сконцентрироваться на улучшении образовательного опыта и расширении экосистемы NGI Academy. Это абсолютно нормальный и здоровый процесс роста для обеих сторон.
Поэтому я с радостью объявляю, что NGI Academy возвращается к формату независимого проекта! Для меня это возможность реализовать свое видение на 100%: создавать новые, еще более глубокие продукты, экспериментировать с форматами и строить вокруг академии комьюнити.
Чтобы реализовать эти амбиции, я уделил много времени выбору кофаундера. По заветам Марти Кагана, я искал настоящего “миссионера” - человека, который так же, как и я, горит идеей качественного AI-образования и стремится создавать долгосрочную ценность, а не просто гнаться за кратко-срочными метриками. Теперь, когда ядро команды сформировано, мы добираем специалистов по операционным задачам и маркетингу.
Из-за этих организационных изменений старт новых потоков переносится на октябрь. Это время нам нужно, чтобы идеально подготовиться к запуску.
Что ждет вас в ближайшем будущем? Мы сфокусируемся на трех ключевых направлениях:
⁃ ИИ для личной эффективности
⁃ AI Product Management
⁃ ИИ-программирование
Следите за новостями - уже до конца этой недели я поделюсь подробными анонсами по каждому из них. Впереди много интересного!
🔥12👍8❤7
AI в MedTech: 4 проблемы, о которые вы споткнетесь на старте.
MedTech - одна из самых сложных и одновременно интересных ниш, где мне доводилось работать. Сейчас мы с командой как раз пилим один такой проект и постоянно сталкиваемся с челленджами, опытом решения которых хочется поделиться.
Проект пока в stealth-режиме, так что без конкретики. Если в двух словах: мы разрабатываем ПО для поддержки принятия врачебных решений. Софт анализирует медицинские снимки (вроде МРТ), находит патологии, подсвечивает их, а врач уже ставит финальный диагноз.
Звучит круто, но на пути к работающему продукту лежит минное поле из неочевидных проблем. Вот главные из них.
Проблема №1: Данные. Где их брать?
Первая же задача, которая ставит в тупик. Да, в сети есть открытые медицинские датасеты, но есть нюанс: большинство из них можно использовать только в исследовательских целях, но никак не в коммерческих.
Окей, допустим, вы нашли подходящий датасет. Но если обучить модель на открытых данных, ваше конкурентное преимущество будет крайне неустойчивым - любой сможет повторить ваш результат. Значит, нужны свои, уникальные данные. А медицинские снимки просто так не скачать или прийти и забрать в больнице. Фаундерам предстоит пройти все круги бюрократического ада, согласований и договоренностей.
Проблема №2: Разметка. А кто и как будет размечать?
Собрали снимки? Отлично, это лишь 10% успеха. Теперь модели нужно “объяснить”, как выглядят болезни. Этим занимаются разметчики. И здесь компромиссов быть не может: разметчиками должны быть высококвалифицированные врачи, которые работают с такими снимками каждый день. Найти их - уже челлендж, благо, у нас был доступ к клиникам.
Но вопрос “кто?” - это полбеды. Настоящая боль начинается дальше.
Медицина - не математика, здесь нет единственно верного мнения. Диагноз часто зависит от уникального опыта конкретного врача. А теперь представьте: у вас три врача, у каждого свой бэкграунд и своя школа. У вас есть 10 биомаркеров, которые встречаются с разной частотой, и часть из них некоторые врачи видели всего пару раз в жизни.
Результат? Один и тот же снимок каждый из трех врачей может разметить совершенно по-разному. Это напрямую убивает согласованность данных. А если она низкая - модель ничему не научится и будет выдавать рандом.
Нашим решением стала разработка детальной методологии разметки. Мы сделали так, чтобы все врачи работали по единому стандарту. И нам пришлось несколько раз эту методологию переделывать, чтобы наконец достичь нужных показателей согласованности. Как только согласованность в одной партии снимков достигнута - появляется задача ее не уронить
Проблема №3: Продукт. Для кого мы это делаем?
Классический продуктовый вопрос, который в MedTech становится в разы сложнее. У нашего продукта есть три ключевых стейкхолдера: пациент, врач и владелец клиники.
У каждого свои интересы:
Пациенту нужна точность и скорость.
Врачу - удобный инструмент, который не усложняет, а упрощает его работу. Он не должен чувствовать, что его хотят заменить.
Владельцу клиники нужна экономическая эффективность и снижение рисков.
Балансировать между точностью диагностики, юзабилити для врачей и рентабельностью бизнеса - тот еще вызов.
Проблема №4: Сроки. Почему все опять горит?
Забудьте про стандартные спринты и предсказуемые дедлайны. Бюрократия с клиниками, поиск и обучение врачей-разметчиков, недели на разработку и тестирование той самой методологии, сама скорость разметки - все это умножает ваши первоначальные оценки сроков на два, а то и на три.
Вам предстоит очень много учить людей, а это всегда долго и дорого. У нас на проекте сроки сдвигались уже несколько раз по всем перечисленным выше причинам. Это нужно просто принять и заложить в план.
Продолжение следует... Вместе с развитием проекта буду делиться новыми инсайтами.
MedTech - одна из самых сложных и одновременно интересных ниш, где мне доводилось работать. Сейчас мы с командой как раз пилим один такой проект и постоянно сталкиваемся с челленджами, опытом решения которых хочется поделиться.
Проект пока в stealth-режиме, так что без конкретики. Если в двух словах: мы разрабатываем ПО для поддержки принятия врачебных решений. Софт анализирует медицинские снимки (вроде МРТ), находит патологии, подсвечивает их, а врач уже ставит финальный диагноз.
Звучит круто, но на пути к работающему продукту лежит минное поле из неочевидных проблем. Вот главные из них.
Проблема №1: Данные. Где их брать?
Первая же задача, которая ставит в тупик. Да, в сети есть открытые медицинские датасеты, но есть нюанс: большинство из них можно использовать только в исследовательских целях, но никак не в коммерческих.
Окей, допустим, вы нашли подходящий датасет. Но если обучить модель на открытых данных, ваше конкурентное преимущество будет крайне неустойчивым - любой сможет повторить ваш результат. Значит, нужны свои, уникальные данные. А медицинские снимки просто так не скачать или прийти и забрать в больнице. Фаундерам предстоит пройти все круги бюрократического ада, согласований и договоренностей.
Проблема №2: Разметка. А кто и как будет размечать?
Собрали снимки? Отлично, это лишь 10% успеха. Теперь модели нужно “объяснить”, как выглядят болезни. Этим занимаются разметчики. И здесь компромиссов быть не может: разметчиками должны быть высококвалифицированные врачи, которые работают с такими снимками каждый день. Найти их - уже челлендж, благо, у нас был доступ к клиникам.
Но вопрос “кто?” - это полбеды. Настоящая боль начинается дальше.
Медицина - не математика, здесь нет единственно верного мнения. Диагноз часто зависит от уникального опыта конкретного врача. А теперь представьте: у вас три врача, у каждого свой бэкграунд и своя школа. У вас есть 10 биомаркеров, которые встречаются с разной частотой, и часть из них некоторые врачи видели всего пару раз в жизни.
Результат? Один и тот же снимок каждый из трех врачей может разметить совершенно по-разному. Это напрямую убивает согласованность данных. А если она низкая - модель ничему не научится и будет выдавать рандом.
Нашим решением стала разработка детальной методологии разметки. Мы сделали так, чтобы все врачи работали по единому стандарту. И нам пришлось несколько раз эту методологию переделывать, чтобы наконец достичь нужных показателей согласованности. Как только согласованность в одной партии снимков достигнута - появляется задача ее не уронить
Проблема №3: Продукт. Для кого мы это делаем?
Классический продуктовый вопрос, который в MedTech становится в разы сложнее. У нашего продукта есть три ключевых стейкхолдера: пациент, врач и владелец клиники.
У каждого свои интересы:
Пациенту нужна точность и скорость.
Врачу - удобный инструмент, который не усложняет, а упрощает его работу. Он не должен чувствовать, что его хотят заменить.
Владельцу клиники нужна экономическая эффективность и снижение рисков.
Балансировать между точностью диагностики, юзабилити для врачей и рентабельностью бизнеса - тот еще вызов.
Проблема №4: Сроки. Почему все опять горит?
Забудьте про стандартные спринты и предсказуемые дедлайны. Бюрократия с клиниками, поиск и обучение врачей-разметчиков, недели на разработку и тестирование той самой методологии, сама скорость разметки - все это умножает ваши первоначальные оценки сроков на два, а то и на три.
Вам предстоит очень много учить людей, а это всегда долго и дорого. У нас на проекте сроки сдвигались уже несколько раз по всем перечисленным выше причинам. Это нужно просто принять и заложить в план.
Продолжение следует... Вместе с развитием проекта буду делиться новыми инсайтами.
🔥22❤5👍3🤣2🤔1
Про автоматизацию первого контакта с помощью AI
С развитием AI одним из направлений, куда его буквально пихают чуть ли не все, стала автоматизация первичной коммуникации. Наиболее частые сценарии - холодный аутрич (B2B и B2C), саппорт, продажи и HR. И основная проблема здесь в том, что большинство таких интеграций работают не так, как надо.
Я уже как-то писал про кейс Klarna, когда они автоматизировали саппорт, поспешив уволить людей, за что в результате поплатились, так как агент не умел правильно эскалировать запросы. А сегодня в интернете завирусилась история с парнем из Stripe, который сделал prompt injection в своем профиле, чтобы, если ему пишет AI-рекрутер, в конце ему присылался рецепт пирога :D В результате чуть ли не во всех сообщениях от HR он получал этот рецепт.
Почему так выходит?
Основных причин несколько. Во-первых, в большинстве случаев интеграция осуществляется слишком прямолинейно: берется LLM по API, в нее втыкается какой-то системный промпт и правила. Чаще всего такое собирают в условном n8n и запускают в продакшн. Однако хорошая система коммуникации с помощью AI обычно гораздо сложнее. Зачастую здесь можно встретить память или базы данных в том или ином виде, к которым бот будет обращаться, а также наборы инструментов и правила их использования. Помимо этого, нужно базово защищаться от инъекций как на уровне промпта, так и на уровне кода.
Можно возразить в стиле: “Klarna же не дураки, они об этом знают, ведь их партнёр OpenAI”. Однако здесь на сцену выходит второй фактор: сами ограничения и возможности LLM. На момент эксперимента той же Klarna модели OpenAI были не настолько хороши в использовании инструментов: отсюда и растут ноги у проблем с эскалацией. С другой стороны, LLM не всегда может правильно определить приоритеты, потому что не обладает должным контекстом. И здесь речь идет уже о контекстном инжиниринге. Суть в том, что для правильного контекстного инжиниринга недостаточно быть хорошим специалистом по LLM: нужно понимать задачу на уровне того эксперта, чью работу ты пытаешься автоматизировать.
Хочешь автоматизировать саппорт? Привлекай специалиста службы поддержки. Нужен HR-аутрич? Пусть HR-специалист создаст систему правил того, на что он обращает внимание при скрининге. Да, все кричат, что у LLM знания уже выше среднего, но у неё нет профессионального контекста нужного специалиста.
А как сделать нормально?
Здесь я бы предложил сделать шаг назад и задать себе вопрос: так ли велик профит от полной автоматизации? Даже в хорошо собранном решении часто можно сравнительно несложно распознать AI, если ты регулярно его используешь. А когда человеку пишет ИИ, то и конверсия ниже.
Если же выгода все-таки ощутима, я бы рекомендовал делать POC доступными инструментами типа n8n и, если есть положительная динамика, привлекать реальных специалистов по AI: вам напишут правильные инструменты, продумают более устойчивую архитектуру, добавят резервные сценарии (fallback), где это необходимо. Другой важный принцип: дополнять, а не заменять. В текущей формации и на горизонте ближайших пары лет AI будет нужен “наставник” для того, чтобы стать более полезным. Поэтому важно привлекать профильных специалистов к разработке решений.
С развитием AI одним из направлений, куда его буквально пихают чуть ли не все, стала автоматизация первичной коммуникации. Наиболее частые сценарии - холодный аутрич (B2B и B2C), саппорт, продажи и HR. И основная проблема здесь в том, что большинство таких интеграций работают не так, как надо.
Я уже как-то писал про кейс Klarna, когда они автоматизировали саппорт, поспешив уволить людей, за что в результате поплатились, так как агент не умел правильно эскалировать запросы. А сегодня в интернете завирусилась история с парнем из Stripe, который сделал prompt injection в своем профиле, чтобы, если ему пишет AI-рекрутер, в конце ему присылался рецепт пирога :D В результате чуть ли не во всех сообщениях от HR он получал этот рецепт.
Почему так выходит?
Основных причин несколько. Во-первых, в большинстве случаев интеграция осуществляется слишком прямолинейно: берется LLM по API, в нее втыкается какой-то системный промпт и правила. Чаще всего такое собирают в условном n8n и запускают в продакшн. Однако хорошая система коммуникации с помощью AI обычно гораздо сложнее. Зачастую здесь можно встретить память или базы данных в том или ином виде, к которым бот будет обращаться, а также наборы инструментов и правила их использования. Помимо этого, нужно базово защищаться от инъекций как на уровне промпта, так и на уровне кода.
Можно возразить в стиле: “Klarna же не дураки, они об этом знают, ведь их партнёр OpenAI”. Однако здесь на сцену выходит второй фактор: сами ограничения и возможности LLM. На момент эксперимента той же Klarna модели OpenAI были не настолько хороши в использовании инструментов: отсюда и растут ноги у проблем с эскалацией. С другой стороны, LLM не всегда может правильно определить приоритеты, потому что не обладает должным контекстом. И здесь речь идет уже о контекстном инжиниринге. Суть в том, что для правильного контекстного инжиниринга недостаточно быть хорошим специалистом по LLM: нужно понимать задачу на уровне того эксперта, чью работу ты пытаешься автоматизировать.
Хочешь автоматизировать саппорт? Привлекай специалиста службы поддержки. Нужен HR-аутрич? Пусть HR-специалист создаст систему правил того, на что он обращает внимание при скрининге. Да, все кричат, что у LLM знания уже выше среднего, но у неё нет профессионального контекста нужного специалиста.
А как сделать нормально?
Здесь я бы предложил сделать шаг назад и задать себе вопрос: так ли велик профит от полной автоматизации? Даже в хорошо собранном решении часто можно сравнительно несложно распознать AI, если ты регулярно его используешь. А когда человеку пишет ИИ, то и конверсия ниже.
Если же выгода все-таки ощутима, я бы рекомендовал делать POC доступными инструментами типа n8n и, если есть положительная динамика, привлекать реальных специалистов по AI: вам напишут правильные инструменты, продумают более устойчивую архитектуру, добавят резервные сценарии (fallback), где это необходимо. Другой важный принцип: дополнять, а не заменять. В текущей формации и на горизонте ближайших пары лет AI будет нужен “наставник” для того, чтобы стать более полезным. Поэтому важно привлекать профильных специалистов к разработке решений.
❤10🔥7🤔1