NGI | Влад Корнышев про AI и создание AI-продуктов

Forwarded from LLM Arena

😨

Бенчмаркинг LLM в кризисе?

Классические лидерборды больше не отражают реальную эффективность моделей в прикладных задачах. Мы видим, что специалисты комбинируют метрики и сигналы, чтобы подобрать идеальную LLM под свой уникальный кейс.

Мы проводим новое исследование, чтобы понять:

🔹Как профессионалы выбирают решение на базе LLM.
🔹Какие данные, инструменты и сигналы реально помогают.

🧑‍💻 Для кого?

Приглашаем всех, кто профессионально связан с AI-продуктами и работает с LLM: ML-инженеры, дата-сайентисты, исследователи, продакты, MLOps и индивидуальные контрибьюторы.

➡️ Пройти опрос: https://forms.gle/dDWeWaWbxhk6qsNL7

🙏 Будем признательны за репост — это поможет собрать более широкую и качественную выборку. Мы обязательно поделимся результатами исследования по его завершению.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2

1.04K views08:21

NGI | Влад Корнышев про AI и создание AI-продуктов

По поводу локального ИИ

В продолжение моего вчерашнего поста про AI гигиену. Буквально вчера вышло обновление Ollama, сделавшее этот сервис более доступным для простых пользователей: они сделали нормальный интерфейс (раньше работало только через терминал и нужно было возиться с настройкой).

Для приватных задач я настоятельно рекомендую ее к установке. Я как-то делал тест локальных моделей. С тех пор изменений произошло не так много.

Базовые рекомендации такие
Для транскрибации: используем Vibe (бесплатно, есть на мак и винду), MacWhisper, SuperWhisper (эти два только на мак, платные). Также есть сервис Spokenly, оказалось, что его разработчик - @valdomars - подписчик моего канала 😅 Модель выбирайте Whisper Large v3 Turbo, она быстрая, точная и будет работать практически на любых современных компьютерах.

Для работы с LLM: теперь можно смело брать Ollama. Какую модель взять? Берите Gemma 3, обязательно QAT (у них меньше потери при сжатии, так как модель проходит через специальный процесс, который их снижает).

Чтобы скачать модель, устанавливаем Ollama, дальше открываем терминал и используем одну из следующих команд:

Если у вас слабый комьютер с меньше 8 гб объединенной памяти (для Mac)/видео памяти (для Windows)

ollama pull gemma3:1b-it-qat

Если у вас есть 8 гб объединенной/видео памяти

ollama pull gemma3:4b-it-qat

Если у вас 16 гб объединенной/видео памяти

ollama pull gemma3:12b-it-qat

Если у вас 32 и выше гб объединенной/видео памяти

ollama pull gemma3:27b-it-qat

После того, как модель скачается - она будет доступна в приложении Ollama, там вы сможете с ней общаться как с обычным ChatGPT. Не забудьте увеличить контекстное окно модели, по умолчанию оно всего 4000 токенов.

Любые вопросы по настройке пишите в комментариях, всем отвечу :)

🔥20❤11👍8

1.41K viewsedited 08:55

NGI | Влад Корнышев про AI и создание AI-продуктов

Красиво, но бесполезно: как Perplexity Comet убедил меня, что у AI-браузеров нет будущего

После череды разочарований в AI-браузерах вроде Dia и Genspark моей последней надеждой был Comet от Perplexity. Я с симпатией отношусь к их основному продукту, а хайп вокруг нового браузера обещал настоящую революцию. На днях я получил инвайт и теперь я не верю в концепцию AI-браузеров в ее текущем виде.

Comet встречает вас великолепным онбордингом с приятной музыкой и красивым UI. Продукт преподносится так красиво, что им ХОЧЕТСЯ пользоваться. Но как только дело доходит до реальных задач, вся магия рассеивается.

Вот шесть причин, почему
1. AI-сайдбар ломает привычки, не давая ничего взамен
Устоявшиеся паттерны использования браузеров формировались десятилетиями. Идея, что боковая панель с чатом - это удобно и эффективно, кажется мне в корне неверной. Люди все время существания интернета пользовались графическим интерфейсом. Теперь нас пытаются «пересадить» в чат. Это не нативно, не интуитивно и не дает никакой практической пользы. Чтобы AI-браузинг взлетел, нужен принципиально иной способ взаимодействия, а не просто прикрученный сбоку чат-бот.

2. AI не нужен графический интерфейс
Интернет создан для людей, а не для LLM. Нам важны интерфейсы, визуальная иерархия и эстетика. AI всё это не нужно - для него нативны HTML, XML и Markdown. Сейчас AI бразуеры работают за счет мультимодальности: они понимают текст и визуал страницы.

На практике это оборачивается медленным циклом: «распознать элементы сайта → нажать кнопку → распознать элементы нового окна → нажать следующую кнопку». Пока агент думает, я успеваю руками получить результат в несколько раз быстрее.

3. Изоляция вместо экосистемы
Для меня это критический недостаток. В Chrome я могу начать работу на Mac, продолжить на iPad и подхватить на Android-смартфоне. Вкладки, история, пароли - всё синхронизируется. Все AI-браузеры, что я пробовал, существуют только под macOS. В 2025 году выпускать продукт без кроссплатформенной экосистемы - значит делать его бесполезным для огромной аудитории.

4. Зачем нужны аналоги, когда есть Chrome + Gemini?
Давайте честно: все AI-браузеры построены на Chromium. По сути, это надстройки над Chrome с парой новых функций. Но в бета-версиях Chrome уже тестируется глубокая интеграция с Gemini. Как только Google раскатит обновление на всех, смысл в этих нишевых продуктах просто испарится. У Chrome есть всё, чего нет у стартапов: пользовательская база, кроссплатформеность и бесшовная интеграция с сервисами Google. Игра проиграна еще до ее начала.

5. Голосовые ассистенты сделают это лучше
Допустим, сценарии вроде «забронируй мне столик» или «купи билеты на самолет» станут реальностью. Но зачем для этого браузер? Эти задачи гораздо нативнее решаются через голосовых ассистентов. Google уже внедряет продвинутые функции для шопинга в Gemini в США. Нет сомнений, что ChatGPT и другие ассистенты скоро будут делать то же самое, обращаясь к сайтам через API или читая их код, а не медленно «кликая» по кнопкам.

6. Практический тест: полный провал на реальных задачах
Я дал Comet две простые задачи:
- Найти на Авито игру для Nintendo Switch ценой до 3000 рублей и добавить в корзину.
- Найти на Aviasales билеты на самолет на определенные даты с нужными мне фильтрами.

Результаты оказались плачевными.

В первом случае Comet пролистал одну страницу, не нашел игру и добавил в корзину… консоль Nintendo Switch Lite. Сообщение от него гласило «Бро, я не нашел игру, но положил тебе в корзину приставку».

С билетами ситуация не лучше. Из десяти нужных дат агент проверил только две и выдал первый попавшийся результат - с лишними пересадками и по завышенной цене. Руками я нашел вариант лучше за пару минут.

Итог: Текущее поколение AI-браузеров - это медленные, неудобные и изолированные продукты, которые пытаются решить задачи, лучше подходящие для других инструментов. И всё это - в тени Google, который готовится забрать этот рынок себе.

Возможно, я ошибаюсь, и у этой технологии есть будущее, которое я пока не вижу. А что вы думаете об AI-браузерах? Есть ли у них шанс?

2❤18👍13🔥10👌3

1.63K views09:28

NGI | Влад Корнышев про AI и создание AI-продуктов

🚀 NGI дайджест (№19)

1. “Раньше было лучше”: Cursor испортился и так может любой AI-инструмент - рассказываю, что не так теперь с Cursor и какие из этого стоит сделать выводы.

2. Как сформировать AI-майндсет? Ваш главный тренажер - это жизнь, а не рабочие задачи - пост про то, как не просто использовать ИИ в работе, а сделать его частью своей жизни.

3. Фоллоуап по итогам эфира по управлению контекстом - эфир проводили с Колей, автором канала @oestick, здесь саммари от Коли по его итогам.

4. Как Сэм Альтман учит людей цифровой халатности - рассказываю, что не так с последним интервью главы OpenAI и как с этим бороться.

5. По поводу локального ИИ - пост по следам поста про цифрофую халатность, здесь пишу про то, что можно использовать для сокращения своего цифрового следа и повышения приватности при использовании ИИ.

6. Красиво, но бесполезно: как Perplexity Comet убедил меня, что у AI-браузеров нет будущего - поделился своим опытом пользования новешим браузером. После публикации поста продолжил пытаться пользоваться данным браузером, но практическая польза минимальна.

7. Опрос про то, как вы оцениваете результаты работы LLM - мои друзья из LLM Arena попросии пригласить моих подписчиков поучаствовать в исследовании. Нужны ответы от тех, кто профессионально связан с AI-продуктами и работает с LLM.

Прошлый дайджест тут

Please open Telegram to view this post

VIEW IN TELEGRAM

NGI | Влад Корнышев про AI и создание AI-продуктов

“Раньше было лучше”: Cursor испортился и так может любой AI-инструмент

На занятие вайбкодингом я потратил уже более 1000 часов. За это время перепробовал многое: писал код в AI Studio, применял Github Copilot и Cline в VS Code, тыкал консольные инструменты…

❤4👍4🔥1

1.05K viewsedited 06:01

NGI | Влад Корнышев про AI и создание AI-продуктов

Про плюсы США

Неделю начинаем не с ИИ :D В прошлый раз я писал про минусы Штатов, пост собрал большое количество реакций и вы его довольно много пересылали. По нему могло сложиться впечатление, что я - хейтер Штатов (на самом деле я просто приехал без ожиданий). Однако не смотря на минусы, есть еще и объективные плюсы. Через неделю я возвращаюсь в США и время поговорить о них!

1. Жизнь в США заставляет развиваться. Здесь все ОЧЕНЬ дорого. На те деньги, что уходят у нас на вполне обычную квартиру и нормальное питание в Мичигане, мы могли бы шикарно жить в центре Москвы 🙂 И, как это часто бывает, увеличение расходов вынуждает задуматься о том, как повысить доход. Переезд побудил меня изучать больше нового, пробовать реализовать то, что я ранее откладывал, работая в найме. Я стал более цепким в переговорах и смелее выставляю более высокий ценник за свои услуги. Это не обеспечивает тот же уровень жизни, что был в СНГ, но меня это мотивирует работать дальше. Через 2 года мы уедем, но доход и капитал будут уже на ином уровне.

2. Исключительные возможности для образования и нетворкинга. Одна из моих целей здесь - пройти обучение в университетах Лиги Плюща и наладить профессиональные связи. Да, это сопряжено с определенными расходами: интересующие меня Executive-программы стоят от $9000, + а где-то нужно еще потратиться на поездки в кампус. Однако близость к Кремниевой долине (буквально один авиаперелет) и шанс учиться у профессионалов мирового уровня, среди которых есть Нобелевские лауреаты и крутые бизнесмены, превращают эту цель из мечты в реальность.

3. Доступность материальных благ. Даже на местный прожиточный минимум (около $50 к баксов в год), здесь ты легче можешь себе позволить технику и всякие штуки для хобби. Помогают более низкие цены и честные распродажи. Для сравнения: я покупал жене электропианино за 740 баксов (60 к рублей по текущему курсу), в РФ оно стоит 102к. Крутая Американская гитара ручной работы стоит 3700 баксов (300к), в России - 616к. Велосипеды, домашняя техника, спортивное оборудование все здесь можно купить дешевле в 2-2.5 раза.

4. Разнообразие еды. Я говорю не об условном наличии “санкционки”. В местных магазинах ты можешь найти вообще ВСЕ. Любые продукты из любых точек мира. Trader Joe’s (с него скопировали Вкуссвилл) - мой любимый магазин. Филе Миньон из Аргентинской говядины можно купить 2 штуки за 20 баксов. А еще здесь я впервые увидел всякие интересные штуки, вроде протеиновых чипсов.

5. Университетские кампусы. Это целые города, в которые хочется возвращаться. В России подобное есть только в МГУ и м.б., Вышке. Огромные парковые территории, футбольные поля и тенисные корты, библиотеки, современные общежития и лаботатории, оборудованные компьютерами Mac, университетские спортивные команды. Я бы очень хотел провести здесь часть студенческих лет!

6. Уникальная природа. Хоть США и находятся в тех же широтах, что и Россия, природа здесь одновременно и похожа и нет. Здесь другие деревья, другие птицы, белки. Другой ландшафт. Мы пока мало ездили по Америке, но в планах посетить национальные парки с их уникальными экосистемами. Друзья делились фото и своим опытом и это поражает! В России есть Байкал, Алтай, Карелия, Дальний Восток. Туда мы еще успеем съездить, когда вернемся, а новое и необычное здесь хочется впитать по-максимуму.

7. Доступ к технологиям. Весь самый крутой AI сейчас разрабатывается здесь. Я сменил локаль своих аккаунтов на Американскую, и могу в числе первых пробовать последние инструменты и залетать на бета-тесты, просто потому что у меня стоит регион США и есть американский номер.

8. Достойная оплата труда для всех. Я жаловался на “уравниловку” в прошлом посте, но есть и обратная сторона. Да, здесь сложно “быть богатым”, но и чтобы “стать бедным” здесь надо быть совсем бездельником. Учителя, врачи, спасатели - получают достойную оплату труда, хоть и работают не меньше, чем в РФ (у жены бывают недели по 95 рабочих часов).

Заставляют ли эти плюсы задуматься меня о том, чтобы остаться здесь? Вообще нет. Цель - максимизировать свою выгоду от пребывания здесь и уехать 🙂

5❤26👍7🔥6🤔6

1.18K views06:05

NGI | Влад Корнышев про AI и создание AI-продуктов

Один из проектов, которые я консультирую, запускается на Product Radar

Я уже как-то упоминал, что работал над сервисом аналитики в Telegram - Synapex AI. Чуть больше года назад ребята позвали меня в качестве консультанта по продукту и AI. Тогда меня зацепила не просто идея, а команда и харизматичный фаундер, которые хотели сделать по-настоящему полезный и технологичный продукт. С тех пор я помогаю им в этом и по сей день.

Сегодня для продукта важный день
Мы вышли на Product Radar (российский аналог Product Hunt). Для любого стартапа это возможность заявить о себе, получить ценную обратную связь и, конечно, найти новых пользователей через дополнительный трафик. Наша большая цель - стать «Проектом недели», а затем и «Проектом месяца». Это поможет развивать проект дальше, а может даже и привлечь доп инвестиции.

Именно поэтому я обращаюсь к вам. Не как к подписчикам, а как к сообществу, которое ценит крутые проекты и готово поддержать своих. Для нас - это реальный шанс быть замеченными.

Как нас поддержать (это займет 30 секунд):
1. Перейдите по ссылке: https://productradar.ru/product/synapex-ai/
2. Авторизуйтесь удобным способом (Google или Яндекс).
3. Нажмите на кнопку «Поддержать» прямо под описанием.

Это займет меньше минуты, а для нас станет огромным вкладом в общее дело. Заранее огромное спасибо каждому, кто откликнется!

👍13❤1

1.15K viewsedited 13:47

NGI | Влад Корнышев про AI и создание AI-продуктов

Пересобираю свои тренинги, чтобы сделать их еще лучше

Друзья, с того момента, как я запустил тренинги по AI, я отвел 6 потоков по личной эффективности и 4 по продакт менеджменту. Пришло время взять паузу и пересобрать их.

Несмотря на то, что тренинги получили исключительно положительную ОС (сейчас выпустил еще потоки), по тому, как люди делали практические задания и какие затыки и вопросы возникали в процессе самих тренингов, я увидел ряд вещей, которые можно сделать лучше. Поэтому до сентября я буду работать над этими улучшениями, а сейчас опишу, что изменится.

Убиваем оффлайн-потоки. Вопросов во время обучения у людей было очень много и одна из главных ценностей тренинга - это возможность их задать, это повышает вовлеченность и качество освоения материала. Поэтому базовый тариф теперь также будет проходить онлайн. Для тех, у кого высокая занятость - останется возможность посмотреть в записи, но я хочу дать каждому лучший возможный образовательный опыт, вне зависимости от того, сколько вы заплатили за тренинг, а это можно сделать только при личном взаимодействии.

Совместные блоки для обоих тренингов. Ряд тем сейчас в них общий и ведение их отдельно по курсам неэффективно. От совместных занятий выиграют все: вы сможете услышать вопросы других и глубже понять тему, а у меня будет больше времени на практику, из которой я черпаю знания, все-таки тренинги - это не основной мой источник дохода. Кроме того, тренинг по эффективности теперь будет не каждый месяц, а раз в 2.5 месяца (как для продактов), будет больше времени на его актуализацию, в текущем темпе это было крайне сложно.

Новые практические задания. Текущие были крутые и понравились и мне и тем, кто их выполнил. Но проблема здесь в том, что для рабочего человека, параллельно проходящего учебу, выделить достаточное количество времени на ДЗ - проблематично. В связи с этим я переработаю структуру ДЗ. Их будет меньше, на них будет выделено больше времени, при этом они будут направлены на проверку большего количества навыков.

Занятия в новой LMS. телеграм-бот как обучающая платформа показал себя отвратительно. Поэтому я собрал свою LMS (с помощью ИИ-кодинга). Потихоньку туда перевожу всех. Пока есть баги, но за время перерыва их исправлю и у нас будет более качественный образовательный опыт.

Дополнительный практикум по ИИ-программированию на тарифах Расширенный и Премиум для обоих тренингов. Тема сложная и первые шаги в ней лучше делать с сопровождением. Для этого будет отдельное трехчасовое занятие, где мы настроим инструменты и напишем пару простых программ с помощью ИИ в режиме онлайн. Домашкой будет их выкладка

Дополнительный воркшоп по дизайн-мышлению в тренинге для продактов на тарифах Расширенный и Премиум. Эта история дико зашла на корпоративных потоках, хочется перенести ее в B2C. На занятии мы будем работать в группах в режиме симуляции процесса дизайн-мышления, а в прототипировании нам помогут AI-инструменты. Будут доски со стикерами, мозговые штурмы, интерактивы и прочие плюшки.

Больше интерактивов для тарифов Расширенный и Премиум. Также инсайт из корп потоков, теперь на занятиях вы будете трогать инструменты и всячески с ними взаимодейстовать еще больше. Вообще во всех лекциях

Приблизительная дата старта обоих тренингов - 3 сентября 📆

❤14🔥8👍1

1.2K views08:57

NGI | Влад Корнышев про AI и создание AI-продуктов

OpenAI впервые за долгое время стали действительно Open?

Вчера OpenAI наконец-то выпустила новые открытые модели, сопроводив это смелым заявлением: теперь якобы каждый может запустить у себя на компьютере модели чуть ли не уровня o3 и o4-mini. Свет увидели gpt-oss на 20b и 120b.

Однако, как это часто бывает, громкие маркетинговые заявления не совсем соответствуют действительности. Во-первых, мы с вами знаем, что цифры в бенчмарках - далеко не всегда показатель реальной производительности. А во-вторых, «каждый» в понимании OpenAI - это человек с компьютером, на борту которого имеется как минимум 16 ГБ видеопамяти. Именно столько требуется для запуска 20b модели.

Тем не менее, это огромный шаг для всего open-source сообщества. Я практически уверен, что даже если цифры в отчетах немного завышены, это все равно будут очень крутые модели. Из интересного:
- Они построены на базе архитектуры MoE (Mixture of Experts), когда в память комьютера загружаются не все параметры сразу, а только нужные для задачи,что как раз и позволяет запускать большие модели на не самом мощном железе.
- У них есть встроенная способность к ризонингу, что уже становится базой.
- Они обучены использовать внешние инструменты, т.е. к ним можно подключать всякие MCP и другие полезные штуки.

Все это говорит о большом потенциале моделей для создания сложных ИИ-агентов.

В целом, я вижу, как мы постепенно движемся к действительно качественному ИИ, который можно запустить локально и комфортно с ним работать. Думаю, еще год-полтора, и действительно каждый, уже без особых требований к железу, сможет установить себе хорошую модель для решения рабочих задач.

Как обычно, не хочу спешить с выводами - модели нужно «пощупать» в реальных условиях. Для этого необходимо дождаться, пока сообщество подготовит квантизированные версии, а еще лучше - упакует их в формат MLX, чтобы можно было запускать их на Mac в полную мощность.

Через неделю у меня предстоит трансатлантический перелет. Надеюсь, к этому моменту появится что-то, что я смогу запустить у себя на ноуте. Из 19 часов полета я точно найду время, чтобы подробно протестировать модели не на технических бенчмарках, а на реальных задачах, с которыми я сталкиваюсь в разработке продуктов и ведении бизнеса.

Так что, у кого канал на мьюте - самое время это исправить, чтобы не пропустить подробный разбор 😉

👍14🔥6❤3🤣2

1.27K views06:59

NGI | Влад Корнышев про AI и создание AI-продуктов

Завышенные ожидания или OpenAI выдохлись?

OpenAI презентовали GPT-5, которую так долго мариновали и которую мы так долго ждали. Сэм Альтман активно продвигал модель в своем твитере и публичных выступлениях, но что на деле?

На деле мы получили самую скучную и невпечатляющую презентацию
Я отсмотрел эфир “от” и “до”. Вердикт: надо тестить, потому что верить на слово больше не получается. В начале нас покормили стандартной порцией бенчмарков: модель, конечно же, стала лучше в логике, рассуждениях и безопасности. Классика.

А потом начались демо, вызвавшие один вопрос: и это всё?
Нам показали ответы на вопросы по физике, на лету собрали приложение для изучения французского и сгенерировали код. Да, сократилось количество действий для получения результата. Но это скорее про удобство, а не про прорыв. OpenAI не показали абсолютно ничего такого, чего мы бы не видели раньше.

- Ответы на вопросы, серьезно? Это уже классика применения LLM
- Делать приложение в ChatGPT? То же самое легко делается в Claude Artifacts и в Gemini с их Canvas либо в режиме Build в ai.studio.

Я не говорю, что модели OpenAI плохие, но они явно не тянут на ту “революцию”, которую нам обещали.

И тут закрадывается подозрение: а может, дело не в скучной презентации, а в проблемах внутри компании? Есть прямые и косвенные признаки.

Прямые:
- Марк Цукерберг активно переманивает к себе ключевых специалистов OpenAI.
- Google перехватывает сделку со стартапом Windsurf, буквально уводя фаундеров из-под носа Сэма Альтмана.

Если компания стоит на пороге AGI, почему лучшие умы бегут с корабля или не поднимаются на борт?

Косвенные:
- Интерфейсы, показанные на демо, подозрительно напоминают то, что делает Claude.
- И как вишенка на торте - недавняя новость о том, что Anthropic ограничили OpenAI доступ к своим моделям. Совпадение?

Модели еще надо щупать, это 100%. Но лично у меня сейчас ощущения как от просмотра презентации Apple: вроде стало лучше, но ожидания, которые нам так долго формировали, пока не оправдались.

А как вам презентация?

P.S. Вообще, у меня ощущение, что мы уже выжимаем максимум из LLM в их текущем виде. И, кажется, что для чего-то прорывного нужно что-то большее, чем просто языковая модель. Нужна новая архитектура

❤14👍9🤔8🤣1

1.27K viewsedited 18:47

NGI | Влад Корнышев про AI и создание AI-продуктов

Почему я не считаю, что LLM - это путь к AGI

В конце вчерашнего поста по итогам презентации OpenAI я написал, что мы почти выжимаем максимум из LLM в их текущем виде. Эта мысль регулярно всплывает в разговорах с коллегами из индустрии - и сегодня хочу чуть подробнее расписать, почему я всё сильнее убеждаюсь, что LLM - это не прямой путь к AGI, а скорее один из важнейших, но не единственный, шаг к нему.

Фундаментально всё упирается в архитектуру. LLM - это гениальный автокомплит. Вся их магия - это невероятно сложная и отточенная на триллионах слов способность предсказывать следующее наиболее вероятное слово. И из этой задачи берутся все их сильные стороны и ограничения.

1. Язык - это не весь мир
LLM великолепно работают с языком и кодом - по сути, тоже языком, просто формальным. И то и другое - мир символов, но не людей. Наглядно на примере: возьмем слово стул. Для LLM - это не предмет с ножками, на котором сидят, а вектор, статистически связанный с векторами сидеть, стол, мебель. Модель не знает, “Что есть стул в реальном мире?”, так как у нее нет опыта взаимодействия с этим миром. Она может написать, что если толкнуть стул, он упадет, потому что читала об этом. Но она не понимает этого на уровне интуитивной физики.

Поэтому в медицине, финансах и инженерии, даже если используется LLM, то делает это как интерфейс или ассистент, а не как основной ”мозг”. Чтобы язык имел ценность, за ним должны стоять модели, которые работают с реальностью: числами, физическими измерениями, причинно-следственными связями. Без этого заземления интеллект остается поверхностным.

2. LLM - это про корелляцию, а не про логику
LLM идеально находят корреляции. Они знают, что за вспышкой молнии почти всегда следует раскат грома, они знают что это происходит из-за разницы скорости света и звука, но они не понимают, связи между этими явлениями. В ответе они оперируют паттернами из данных, а не законами логики и физики.

Это приводит к двум последствиям:
- Ненадежность в новых задачах: Если дать LLM нестандартную логическую головоломку, которой не было в обучающей выборке, она скорее всего ошибется, пытаясь решить ее “по аналогии”, а не путем строгих выводов. GPT 5 все еще не справляется с простой логической задачкой, которую я придумал почти год назад (см скрин)

- Шаблонность решений: LLM - это конструкторы. Если внимательно смотреть на сайты, дизайн, документацию, советы или даже код, созданные ИИ, то легко заметить повторяющиеся структуры, любимые фразы, характерные ошибки. Причём у каждой модели свой почерк, который легко распознать, если много с ними работаешь. Это значит, что LLM не генерируют принципиально новое - они комбинируют уже существующие паттерны.

3. Замороженные знания и неспособность учиться на лету
Модель обучается на статичном срезе данных (условно, интернет до декабря 2024). После этого ее знания зафиксированы. Если вы сообщите ей новый факт, она не встроит его в свою нейронную сеть. В новом окне она его забудет. Методы вроде RAG - это костыли, которые позволяют подсовывать модели актуальную информацию: in context learning - это не lifelong learning. Настоящий интеллект должен быть способен к непрерывному обучению - усваивать новую информацию на лету и интегрировать ее в существующую картину мира, не разрушая ее. LLM так не умеют, да и технически это сложно реализуемо.

Так что же нужно для AGI?
Это не одна гигантская нейросеть, а сложная гибридная система, где LLM - выполняют роль языкового процессора.

Настоящему AGI также понадобятся:
- способность симулировать реальность для планирования (ответ на вопрос: “А что, если?”);
- отдельное логическое ядро для проверки гипотез, которые генерят LLM;
⁃ воплощение в физическом мире для “заземления” знаний через датчики и манипуляторы;
⁃ агентность - умение самостоятельно ставить и достигать цели;

Из всего этого у нас есть подвижки только в агентности 😁

А что вы думаете про достижение AGI?

5👍23❤11🔥5🤔2

1.33K viewsedited 16:26

NGI | Влад Корнышев про AI и создание AI-продуктов

🚀

NGI дайджест (№20)

1. Про плюсы США - описал, что все-таки нравится в Штатах и ради чего здесь стоит пожить.

2. Один из проектов, которые я консультирую запустился на Product Radar - в том числе благодаря вам набрали больше 400 голосов. Уже почти наверняка заберем продукт недели, впереди еще звание продукта месяца, поэтому продолжаем голосовать, подробности в посте.

3. Пересобираю свои тренинги - описал, что нового будет в следующих потоках по “ИИ для личной эффективности” и “AI продакт менеджменту”.

4. OpenAI впервые за долгое время стали действительно Open? - компания выпустила первую со времен GPT 2 открытую модель. Тесты планирую на грядущей неделе.

5. Завышенные ожидания или OpenAI выдохлись? - пост по результатам не самой удачной презентации. Маркетинг отработал так хорошо, что аж плохо. В результате получились хорошие модели, которые никого не впечатлили с первых минут.

6. Почему я не считаю, что LLM - это путь к AGI - рассказал, почему все заявления про AGI сейчас - это маркетинг, и что реально нужно для AGI. У моего коллеги Богдана также был пост с похожими мыслями, заодно там еще интересный видосик

Прошлый дайджест тут

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤4

1.15K viewsedited 12:22

NGI | Влад Корнышев про AI и создание AI-продуктов

ИИ и бытовуха: что работает хорошо

Не так давно я писал, что чтобы использовать ИИ реально эффективно - надо использовать его везде. Я регулярно пробую найти у себя в рутине какие-то операции, которые можно оптимизировать с помощью LLM. Сегодня делюсь тем, где это получается неплохо, в следующем посте - что работает так себе. Сразу скажу, что я использую вообще все: Perplexity, Manus, GPT-5, Gemini. Модель можете использовать на свой вкус, ниже привожу кейсы и промпты.

Критик
Один из моих любимых кейсов, когда мне нужно почалленджить какие-то свои решения. Помогает максимально проработать нужную мне проблему.


Твоя задача конструктивно критиковать все мои решения, подробно описывая, что именно в них не так, но не предлагать альтернативы, я должен сам до них дойти. Твоя цель - помочь мне максимально проработать все аспекты моего решения.
Инструкции:
Я присылаю тебе проблему, контекст и свое решение
Ты пишешь мне конструктивную критику 
Далее мы с тобой вместе это обсуждаем. Никогда со мной не соглашайся и продолжай конструктивно критиковать

Консультант по коммуникации
Использую очень часто, чтобы заранее проработать и избежать неприятных ситуаций вообще во всех сферах, где есть общение. Помогает как в переговорах, так и при общении в условном МФЦ :D

Ты - эксперт по коммуникации и переговорам. Твоя задача - помочь мне спланировать эффективную коммуникацию. Вот моя ситуация [опишите здесь контекст]. Цель коммуникации [опишите, чего хотите достичь]. Вот что я думаю [сюда кидаем черновики и свои мысли]. Помоги мне сформулировать мысли лучшим образом для достижения целей.

Кулинарный ассистент
Одно из моих хобби - это готовка. Какие-то рецепты я делаю редко и периодически забываю, как их готовить. В таких случаях меня выручает ИИ и делает это он прямо неплохо.

Ты - профессиональный шеф-повар. Я хочу приготовить [название блюда], у меня есть [перечислить названия продуктов]. Я хочу, чтобы блюдо было [написать тут особенности, например, без сахара]. Напиши мне подробный пошаговый рецепт того, как его приготовить со всеми пропорциями.

Сравнение по характеристикам
Иногда бывает, что мне нужно что-то купить, но я не могу выбрать В таком случае я прошу ИИ провести для меня сравнительный анализ.

Я хочу купить [название продукта], мои сценарии использования - это [описать тут сценарии]. Мне важно, чтобы [описать ключевые параметры продукта]. Я выбираю между [продукт 1], [продукт 2], [продукт n]. Сравни их по следующим характеристикам [список характеристик], и скажи, какой будет оптимальнее.

Разносторонний анализ
Иногда нужно взвесить все "за" и "против" при принятии какого-то решения. В таком случае я промпчу себе 3 ассистентов: позитивиста, негативиста и сбалансированного. Для каждого отдельный чат. Это позволяет им не зависеть друг от друга и максимально покрыть все сценарии. Далее - я беру их аргументы и принимаю уже свое решение.

Позитивист

Твоя задача - отмечать только положительные стороны [описать чего]. Вот контекст ситуации [сюда грузим описание]. Дай мне топ 10 с подробной аргументацией.

Негативист

Твоя задача - отмечать только отрицательные стороны [описать чего]. Вот контекст ситуации [сюда грузим описание]. Дай мне топ 10 с подробной аргументацией.

Баланс

Твоя задача - отметить все положительные и отрицательные стороны [описать чего]. Вот контекст ситуации [сюда грузим описание]. Напиши по 10 пунктов для каждой группы, каждый обоснуй.

Генераторы промптов
Помогает не тратить время при быстрых задачах. Здесь приведу ссылки на прошлые посты: для генерации видео/фото, для подкастов в NotebookLM.

Изучение новых материалов
Здесь также будет ссылка на пост про то, как я читаю с ИИ. Помогает заполнить FOMO и обрабатывать новую информацию быстрее.

В следующем посте я поделюсь тем, что получается плохо, а вы пока делитесь своими кейсами!

6👍34🔥11❤9

1.52K views06:14

NGI | Влад Корнышев про AI и создание AI-продуктов

ИИ и бытовуха: кейсы, когда модели лажают

В прошлом посте я привел примеры того, где ИИ мне реально помогает. Сегодня делюсь теми кейсами, где мне меня спас фактчекинг и внимательность. Делаю специально в формате кейсов, чтобы показать цену ошибки наглядно, итак, поехали!

Делегирование покупок
Касается Operator, Perplexity Comet, Manus и других агентов. Основная их проблема - они все ленятся: стараются листать меньше страниц, хватаются за первый попавшийся вариант, если не нашли - пытаются выбрать похожее, но не по своей сущности, а по названию. Подробный опыт с покупкой авиабилетов и вещей на Avito в Comet я описывал ранее. Цена ошибки - не тот товар в корзине.

Сравнения в деталях
Мне нужно было подобрать мультитул для велосипеда и пару доп инструментов к нему под мои цели катания. Я выбрал такой , а задачей ИИ было найти мне недостающие инструменты, которые бы были максимально легкими и дополняли функции мультитула.

Результат: ИИ сформировал для меня 3 варианта комплектов. Во всех трех случаях он дал мне неплохие варианты, но не самые легкие. А в том, варианте, который на первый взгляд подходил больше всего, он предлагал мне купить доп инструмент, который уже был в моем мультитуле. Если бы не моя внимательность - отдал бы $20 за то, что мне не нужно.

Внимание к деталям
Нужно было сделать онлайн-регистрацию на рейс в США. При заполнении требуют номера визы. На визе в США номеров довольно много, а ситуация усугубилась тем, что мне выдали визу нового образца (с мостом, выдают с 2023). Пошел в LLM, пробовал DeepResearch Perplexity и GPT 5. Обе сказали мне о том, что номер визы - справа внизу красным шрифтом, но проблема была в том, что шрифт переливается и красный он на визах старого образца. Пришлось идти в гугл, ибо введи я все неправильно - никуда бы не полетел, а не введи - сидел бы 11 часов у туалета.

Советы, когда вы разбираетесь в тематике
ИИ очень хорош, когда вы только вливаетесь в какую-то тему, но не когда вы на ней собаку съели. Мне нужно было сравнить несколько велосипедов между собой, решил использовать Deep Research для этого. Указал нужные модели и попросил обоснования по нужным мне параметрам. Все ИИ, что я использовал, напутали параметры велосипедов, где-то даже между собой. А вместо сравнения велосипедов - я получил выжимки из маркетинговых материалов о них. Там, где я ожидал разбор компонентов и их производительность в разных условиях, я получил кучу воды с сайтов производителей, а нужные мне аспекты были описаны поверхностно. Нужный мне велосипед модели выбрали только после моих наводящих вопросов: полистать YouTube и Reddit мне было бы быстрее. За косяки ИИ вы платите своим временем.

Правильное питание
Рецепты с ИИ - это хорошо, но пробовали ли вы составить с ним план питания? А забить потом результат в калькулятор калорий? Лично у меня цифры не совпадают вообще никогда. Чаще всего происходит занижение калоража и/или БЖУ по сравнению с реальной базой. Поэтому для вдохновения ЛЛМ использовать можно, но вашим нутрициологом он пока быть не может. Если же поверите ИИ - своих фитнес-целей достичь будет проблематично :D

Это лишь немногие мои кейсы, делитесь в комментариях своими, пока я лечу, буду онлайн - почитаю :)

NGI | Влад Корнышев про AI и создание AI-продуктов

Красиво, но бесполезно: как Perplexity Comet убедил меня, что у AI-браузеров нет будущего

После череды разочарований в AI-браузерах вроде Dia и Genspark моей последней надеждой был Comet от Perplexity. Я с симпатией отношусь к их основному продукту, а хайп…

👍13🔥3❤1

1.33K views09:15

NGI | Влад Корнышев про AI и создание AI-продуктов

Провожу два бесплатных воркшопа для GWC

Сезон публичных активностей для меня открыт! 29 августа и 5 сентября я проведу два бесплатных воркшопа по AI для GWC. Воркшопы - по сути, адаптированные версии первых двух тем моих тренингов. Мероприятие будет проходить на английском, и зарегистрироваться может любой желающий.

- Воркшоп 1: Introduction to AI Technology
- Воркшоп 2: AI Basics and Prompt Engineering

GWC - это организация, которая создаёт возможности для профессионального развития женщин, и я очень рад присоединиться к ним в качестве спикера и ментора, чтобы помочь другим в их карьерном пути. Для меня это отличная возможность сделать что-то весомое для женщин, ведь в течение моей жизни именно они помогали мне двигаться в ту сторону, куда я хотел. Начиная с моей мамы, которая открыла для меня невероятное количество возможностей, и заканчивая моими коллегами и руководителями.

В Skyeng моим первым руководителем и менеджером, которая наняла меня, была как раз-таки женщина. Её зовут Виолетта, и это один из самых крутых руководителей, встречавшихся мне до сих пор: отношение к команде, умение “заразить” рабочим энтузиазмом, качество принимаемых решений и то, как она вкладывается в развитие сотрудников, для меня до сих пор остаются эталоном.

Очень надеюсь, что данное мероприятие поможет кому-то подняться по карьерной лестнице или затянет кого-то в AI, как в своё время Виолетта затянула меня в Skyeng.

👉 Зарегистрироваться на мероприятие можно по ссылке

P.S. если хотите видеть меня в качестве спикера на своем мероприятии или конференции - не стесняйтесь писать мне в ЛС или в сообщения канала, есть еще пара слотов под это 😉

❤11🔥3👍2👌2

1.52K views15:33

NGI | Влад Корнышев про AI и создание AI-продуктов

Спустя 3 года я исполнил свою мечту

Пост не по тематике канала, а про жизнь!

В свободное от работы время я стараюсь посвящать хобби, коих у меня несколько: дома - это гитара, а за его пределами - велоспорт. Так получилось, что велосипед занимает особое место в моей жизни: на нем я путешествую, тренируюсь, вижу новые места, отдыхаю и прокачиваю свою менталку, когда, например, надо заехать на 3000 метров вверх в гору, что потом помогает добиваться целей в работе :D

Свой прошлый велосипед - Cannondale Slate я брал 3 года назад с рук. Он достался мне по очень хорошей цене, а в дальшейшем я неплохо в него вложился,поставив карбоновые колеса и другие классные компоненты. Вместе мы прошли больше 12 000 км, объездили всю Армению и поколесили по России и США. За время владения этим велосипедом я познакомился со своей женой и так получилось, что тоже увлек ее велосипедом.

Slate был очень крутой, но он не был велосипедом мечты. Это был тот байк, который я мог себе позволить. Но в душе я хотел карбоновую раму, электронные переключатели передач, потайной отсек для хранения инструментов и другие мелочи. И все 3 года я заглядывался на флагманские карбоновые модели от Cannondale.

И сегодня я исполнил свою велосипедную мечту, купив новенький Cannondale Topstone Carbon DI2 LTD. Все это время компания выпускала новые велосипеды, но в них все время мне что-то не нравилось: то переключатели не те, то цвет не тот, то колеса хуже, чем на моем предыдущем. А эта модель для меня идеальна во всем: красивый внешний вид, компоненты более высокого уровня, чем у меня были, электронная трансмиссия и тот самый скрытый отсек для инструментов в раме. Я уже успел прокатиться и нереально кайфанул!

Прошлый год у меня был не из простых, и этот начался не так гладко, но мне удалось преодолеть трудности, поэтому я решил себя порадовать чем-то материальным, исполнив свою мечту, ведь это не просто разовая покупка, а еще и море впечатлений, которые я буду получать от нее в будущем.

Старый велосипед продавать не планирую, он останется в моей коллекции и будет радовать теперь уже не меня, а жену на ее пути в качестве велосипедиста :) Планируем поколесить по Калифорнии уже в ноябре этого года.

Мечтайте, мечты сбываются :)

2❤35👍22🔥12

1.37K views14:33

NGI | Влад Корнышев про AI и создание AI-продуктов

🚀

NGI дайджест (№21)

1. ИИ и бытовуха: что работает хорошо - поделился своими промптами и воркфлоу

2. ИИ и бытовуха: кейсы, когда модели лажают - а здесь тем, где ИИ использовать можно, но осторожно

3. Провожу два бесплатных воркшопа для GWC - выступаю на конференции в конце августа, вход бесплатный, приходите 🙂

4. Спустя 3 года я исполнил свою мечту - не про ИИ 😄 Рассказываю историю своей охоты за новым велосипедом

Прошлый дайджест тут

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤3

1.25K views11:52

NGI | Влад Корнышев про AI и создание AI-продуктов

Выступаю на конференции WANNABE AI GENIUS

30 августа пройдет очередная конфа, на которой я выступлю в роли спикера. Буду проводить воркшоп для продактов по прототипированию AI-продуктов с помощью AI.

Воршкоп будет состоять из двух частей: на теоретической мы разберем, в чем особенности прототипирования и тестирования AI-продуктов, а во второй части, вместе, под моим руководством соберем небольшой прототипчик с помощью AI-кодинга. Моими целями на нем будут: во-первых, показать, что AI-кодинг это не страшно, а во-вторых, помочь вам сделать первые шаги и начать экспериментировать 🙂

Конфа будет проходить с 11 до 17 по мск и будет включать ряд тем по использованию AI для продактов и продуктовых дизайнеров: от исследований и оптимизационных лайфхаков до быстрого прототипирования. Помимо меня будут еще другие классные спикеры, например, уже знакомый вам Коля, автор канала AI и Грабли, полный лайнап можете глянуть по ссылке ниже, все ребята компетентные и довольно приятные.

Конфа на этот раз платная, купить место можно по ссылке

🔥11❤5👍2👌1

1.33K views14:38

NGI | Влад Корнышев про AI и создание AI-продуктов

Что я узнал, потеряв life-work balance при уходе из найма

Я всегда был ярым сторонником life-work balance. Всегда находилось время на 6 тренировок (зал + велик), почитать книжку, выспаться и сделать вообще все по работе. Настроение всегда отличное, стабильный вес и другие показатели здоровья, цели на квартал закрывал минимум на 96%. Так бы продолжалось и дальше, если бы после Pearson я пошел куда-то еще.

Но вмешался переезд в США: другой рынок, усталось от EdTech и несовпадение моих целей желаниями работодателей. В США есть возможность найти работу, но это всегда офис, зачастую в другом Штате, или опять EdTech. За пределами Штатов звали на позицию Head of AI в пару компаний с релокацией на Кипр/ОАЭ и очень хорошим окладом, но опять не то. Главная причина моего переезда в США - желание быть рядом с женой, которая здесь учится, а тут нужно было уехать. В итоге это завело меня на путь предпринимательства: сначала были отдельные проекты, затем агентство, потом подтянулись тренинги.

За 1.5 года мне удалось с нуля вернуться на нормальный доход, но при этом я стал работать по 14 часов в день, перестал читать книги, тренируюсь 1-2 раза в неделю, и набрал 10 кг веса. На днях рефлексировал и думал о том, какие бы дал себе советы, чтобы это изменить, захотелось поделиться ими в канале.

Обеспечьте финансовую подушку. Так сложилось, что вся моя ушла на переезд. Мне казалось, что я нормально откладывал, но США - это слишком дорого. Наличие большей финансовой подушки помогло бы принимать более взвешанные решения. Помимо базовых накоплений, старайтесь создать себе подушку для подушки. Например сейчас у меня есть счет, куда я просто скидываю деньги и даже не знаю, сколько там.

Планируйте свой уход. У меня все вышло спонтанно. Чтобы уйти из найма плавно - нужно быть готовым как финансово, так и психологически. А я не был 🙂 Практика с коучем помогла донастроить майндест на работу в новых условиях. Также, я совершил ошибку, не приняв оффер в РФ-компанию, пока я еще был там: даже если бы я уволился через 3 месяца в связи с переездом - это бы дало больше гибкости.

Не бросайтесь на все подряд. Если вы крутой спец - на вас будет спрос. Моей ошибкой после ухода из Pearson была паника от предстоящего переезда. В результате я набрал себе ряд абсолютно тупых проектов, которые приносили деньги, с которых было сложно слиться, когда буквально через месяц появились нормальные. Итог? Сидение за комьютером круглые сутки, в выходные и в отпуск…

Если цели не достигаются - пробуйте еще. Вообще все мои инициативы начинались так себе. Первые несколько клиентов агентства, с которыми мы должны были работать - отвалились. Первые потоки тренингов собрали крутую ОС, но финансово меня не удовлетворили. Но и там и там я видел спрос и понимал, что просто так сложилось, поэтому я просто продолжил работать.

Не забывайте про то, что вы любите. Время в календаре, которое я выделял на музыку, спорт и чтение, я стал отдавать рабочим встречам либо использовать как “время на поработать”. Мой доход начал расти, но я не стал от этого счастливее. Хобби - это не пустая трата времени, это то, что помогает вам не двинуться кукухой.

Не пилите себя. Моя главная ошибка, касающаяся вообще всего. Пара месяцев без дохода - это не страшно, если ты пытаешься. Брать меньшие веса в зале - не страшно, если ты меньше тренируешься. Умирать в горку на велосипеде - не трагедия, когда ты не штурмуешь подъемы каждую неделю. Мой контекст изменился кардинально, при этом требования к себе остались на прежнем уровне. Я хотел прогрессировать всегда и жестко критиковал себя за любой откат. Откатывался еще сильнее и сильнее себя критиковал, живя в постоянном напряжении. В переходные периоды такое бывает, но мне нужно было время, чтобы это усвоить.

Дайте себе отдохнуть. На август я останавливаю вообще все тренинги и не беру новых проектов лично себе. Сопровождаю имеющееся, а остальное время занимаюсь восстановлением привычек и отдыхом. Работа без перерыва - прямой путь к выгоранию.

Любите себя и помните, что мир не крутится вокруг работы и денег.

7❤57👍10🤣1

1.57K views11:03

NGI | Влад Корнышев про AI и создание AI-продуктов

Это я еду в поезде в костюме банана, а рядом - в нем же подписываю американские законы в овальном кабинете :)

Почему так? Потому что сегодня рассекретили модель, которая возглавила рейтинг редактирования изображений, дебютировав под названием nano-banana. Ей оказалась новая Gemini Flash, и работает она напорядок лучше, чем то, что мы видели в GPT 4o (уже вижу очередную волну хайпа в AI Studio). И, скорее всего, именно эта модель используется в новых Google Pixel 10 для редактирования фото через текст.

Я уже успел пощупать модельку, вот пара выводов:
1. Очень хорошо справляется с задачей переодевания, где нужно сменить сеттинг или одежду.
2. Отлично удаляет лишние предметы с картинок, делает точечные правки.
3. Понравилось, что можно доуточнять изображение в процессе. Условно, если вам понравился результат, но вы хотите внести правки, в отличие от GPT, последующее изображение не будет так искажаться.
4. А вот где модель страдает, так это если нужно прямо сильно изменить фото. Например, я попробовал переодеть себя в костюм банана и посадить в Овальный Кабинет. В этом случае мое лицо несколько исказилось, а качество пострадало.

Модель доступна в AI Studio и в приложении Gemini. Нужен VPN США.

🔥13🤣6❤1

1.23K views15:35

About

Blog

Apps

Platform