Попользовался Manus и он меня не впечатлил
Не так давно ИИ-агента Manus сделали доступным всем желающим. Ранее я подавался на закрытую бета, но мне не повезло – я не попал в списки, а у знакомых не осталось инвайтов. Очень ждал, когда же смогу попробовать это чудо техники, которое только по демонстрациям окрестили “лучшим ИИ-агентом”.
Всю прошлую неделю занимался тестированием Manus-а, и, сказать честно, он меня не впечатлил. Одна из причин – ребята очень сильно затянули с публичным запуском, что для ИИ-продукта критически важно. То, что ты можешь позиционировать как конкурентное преимущество для своих ранних последователей, сегодня очень быстро внедряют сами разработчики LLM, вроде Google и OpenAI. И сейчас нет практически ничего, что делает Manus, чего нельзя было бы сделать через комбинацию DeepResearch и Canvas внутри LLM. Да, вам придется больше работать руками, и такая связка не так автономна, но и в этом есть плюс.
Начнем с плюсов
Идеально для несложных задач, требующих декомпозиции - разработчики очень прикольно организовали Tool Use у сервиса. Понравилось как он декомпозирует и работает итерациями, но часто это получется только в довольно прямолинейных задачах, вроде поиска информации. Если требуется тот же многосторонний анализ либо задача комплексная - результат печальный.
Подготовка материалов к передаче пользователю - понравилось, как он готовит отчетность. Именно подход. Например, если попросить написать код какой-то программы - он тебе и инструкцию по запуску напишет и расскажет, как это тестировать. Это то, чего ты ожидаешь от агента, но и тут не без ложки деготя.
Что не понравилось
Нельзя делегировать комплексные задачи - сейчас я для тренингов разрабатываю кастомную LMS, и у меня родилась идея попросить Manus либо реализовать мне часть функционала, либо вообще попробовать полностью написать LMS. Думал, что даже если он не справится – часть кода хотя бы смогу применить в качестве основы для своего. При всех моих попытках Manus сильно упрощал написание кода, упускал часть состояний, вместо реальных данных – подставлял мок-данные. Если работать итеративно – проблема решается, но ведь это автономный агент 🙂 Для итеративности Cursor гораздо лучше.
Также просил его собрать мне Docker-образ для LMS, а получил независящие друг от друга компоненты, которые потом собирал вручную. С запуском проекта также были проблемы, хотя он уверял меня, что все протестировал. Вспомнился пример агента Anus, который, как говорят - написан Manus-ом после промпта, который просил его себя клонировать и который тоже не записался :)
Слишком высокая автономность - то, что меня раздражает в Claude 3.7 при использовании в Cursor. Даже не смотря на то, что в процессе ты можешь влезть с доп инструкциями – модель слишком сильно берет на себя инициативу. Отражается это в том, что опять же, моделька упрощает и упускает детали, придумывает лишнее, но не реализует важное. В задачах на ресерч с этим лучше, но DeepResearch любой LLM даст вам более качественный результат.
Подготовка материалов еще сырая - я сделал в итоге с помощью него драфт LMS. Manus сказал “Вот, держи код проекта” и дал мне 50+ отдельных файлов. Не в папках, а просто тупо кучу файлов. Только после просьбы собрать мне ZIP он сделал нормально. И, как писал выше, проект мне пришлось дорабатывать, чтобы запустить.
Итого, получается, что лучший автономный агент широкого назначения – не более чем маркетинг и игрушка. В целом, направление агентского ИИ пока что очень сырое и, на мой взгляд, гораздо успешнее здесь будут специализированные решения, вроде Cursor или DeepResearch. Поэтому, если хотите делать агентов – смотрите в сторону специализации.
#инструменты
Не так давно ИИ-агента Manus сделали доступным всем желающим. Ранее я подавался на закрытую бета, но мне не повезло – я не попал в списки, а у знакомых не осталось инвайтов. Очень ждал, когда же смогу попробовать это чудо техники, которое только по демонстрациям окрестили “лучшим ИИ-агентом”.
Всю прошлую неделю занимался тестированием Manus-а, и, сказать честно, он меня не впечатлил. Одна из причин – ребята очень сильно затянули с публичным запуском, что для ИИ-продукта критически важно. То, что ты можешь позиционировать как конкурентное преимущество для своих ранних последователей, сегодня очень быстро внедряют сами разработчики LLM, вроде Google и OpenAI. И сейчас нет практически ничего, что делает Manus, чего нельзя было бы сделать через комбинацию DeepResearch и Canvas внутри LLM. Да, вам придется больше работать руками, и такая связка не так автономна, но и в этом есть плюс.
Начнем с плюсов
Идеально для несложных задач, требующих декомпозиции - разработчики очень прикольно организовали Tool Use у сервиса. Понравилось как он декомпозирует и работает итерациями, но часто это получется только в довольно прямолинейных задачах, вроде поиска информации. Если требуется тот же многосторонний анализ либо задача комплексная - результат печальный.
Подготовка материалов к передаче пользователю - понравилось, как он готовит отчетность. Именно подход. Например, если попросить написать код какой-то программы - он тебе и инструкцию по запуску напишет и расскажет, как это тестировать. Это то, чего ты ожидаешь от агента, но и тут не без ложки деготя.
Что не понравилось
Нельзя делегировать комплексные задачи - сейчас я для тренингов разрабатываю кастомную LMS, и у меня родилась идея попросить Manus либо реализовать мне часть функционала, либо вообще попробовать полностью написать LMS. Думал, что даже если он не справится – часть кода хотя бы смогу применить в качестве основы для своего. При всех моих попытках Manus сильно упрощал написание кода, упускал часть состояний, вместо реальных данных – подставлял мок-данные. Если работать итеративно – проблема решается, но ведь это автономный агент 🙂 Для итеративности Cursor гораздо лучше.
Также просил его собрать мне Docker-образ для LMS, а получил независящие друг от друга компоненты, которые потом собирал вручную. С запуском проекта также были проблемы, хотя он уверял меня, что все протестировал. Вспомнился пример агента Anus, который, как говорят - написан Manus-ом после промпта, который просил его себя клонировать и который тоже не записался :)
Слишком высокая автономность - то, что меня раздражает в Claude 3.7 при использовании в Cursor. Даже не смотря на то, что в процессе ты можешь влезть с доп инструкциями – модель слишком сильно берет на себя инициативу. Отражается это в том, что опять же, моделька упрощает и упускает детали, придумывает лишнее, но не реализует важное. В задачах на ресерч с этим лучше, но DeepResearch любой LLM даст вам более качественный результат.
Подготовка материалов еще сырая - я сделал в итоге с помощью него драфт LMS. Manus сказал “Вот, держи код проекта” и дал мне 50+ отдельных файлов. Не в папках, а просто тупо кучу файлов. Только после просьбы собрать мне ZIP он сделал нормально. И, как писал выше, проект мне пришлось дорабатывать, чтобы запустить.
Итого, получается, что лучший автономный агент широкого назначения – не более чем маркетинг и игрушка. В целом, направление агентского ИИ пока что очень сырое и, на мой взгляд, гораздо успешнее здесь будут специализированные решения, вроде Cursor или DeepResearch. Поэтому, если хотите делать агентов – смотрите в сторону специализации.
#инструменты
👍5🔥5
Эфир “Как AI меняет наши профессии” с Глебом Кудрявцевым
Напоминаю, что чуть больше, чем через 2 часа, в 18 00 по Московскому времени, мы вместе с Глебом проведем эфир по животрепещущей теме.
На эфире разберем:
- Что изменилось с последнего эфира про ИИ-тренды
- Актуальные виды AI-агентов и кого они заменят
- Что-такое AI-first подход, что с этим делать бизнесу и рядовым сотрудникам
- Почему кодить с ИИ должен научиться каждый
Ожидаем порядка 200+ зрителей, помимо информации дадим еще кое-что ценное. Кто еще не записался - эфир будет тут, приходите :)
Напоминаю, что чуть больше, чем через 2 часа, в 18 00 по Московскому времени, мы вместе с Глебом проведем эфир по животрепещущей теме.
На эфире разберем:
- Что изменилось с последнего эфира про ИИ-тренды
- Актуальные виды AI-агентов и кого они заменят
- Что-такое AI-first подход, что с этим делать бизнесу и рядовым сотрудникам
- Почему кодить с ИИ должен научиться каждый
Ожидаем порядка 200+ зрителей, помимо информации дадим еще кое-что ценное. Кто еще не записался - эфир будет тут, приходите :)
👍7🔥5❤2
Друзья, всем спасибо за эфир!
Увидели, что не у всех записавшихся получилось залететь на эфир, при этом вылили много полезной инфы, одна QA-сессия чего стоит 🙂
Для тех, кто оставлял заявку на Timepad на почту пришлем ссылочку с записью, кейс, гайды и эксклюзивный промик на скидку на любой из тренингов по AI.
Промик будет действовать всего неделю, а тренинг по AI для личной эффективности стартует уже завтра. Количество мест по промику также ограничено.
👉 Купить свое место можно тут
Увидели, что не у всех записавшихся получилось залететь на эфир, при этом вылили много полезной инфы, одна QA-сессия чего стоит 🙂
Для тех, кто оставлял заявку на Timepad на почту пришлем ссылочку с записью, кейс, гайды и эксклюзивный промик на скидку на любой из тренингов по AI.
Промик будет действовать всего неделю, а тренинг по AI для личной эффективности стартует уже завтра. Количество мест по промику также ограничено.
👉 Купить свое место можно тут
👍7
Сделает ли ИИ нас быстрее и богаче?
На выходных приехал к родным, и у бабушки по ТВ в это время шла новостная трансляция. В ней делились результатами некоего исследования о влиянии ИИ на работу людей в России. Утверждалось, что 43% опрошенных пользователей ИИ стали работать быстрее, а 18% - зарабатывать больше.
Эти цифры, признаться, вызвали у меня улыбку. Во-первых, позабавил сам подход к проектированию исследования и формулировки вопросов. Во-вторых, результаты показались мне нереалистичными. Задумайтесь: если лишь 43% пользователей ИИ отмечают ускорение работы, то откуда взялись целых 18% «счастливчиков», увеличивших свой доход? Эта арифметика вызывает вопросы. Впрочем, понятно, что основная цель телеканала в данном случае - хайпануть теме или популяризировать ИИ, «потому что так надо», а лучший способ для этого - оперировать цифрами.
Про ускорение
О чем говорит показатель в 43% «ускорившихся»? По большому счету, о двух вещах. Во-первых, многие люди пока не умеют эффективно использовать ИИ. Если знать, как правильно составить запрос к модели и понимать, где и какие применять - эта цифра должна стремиться к 100%. Естественно, есть области, где LLM не помогут, но практически в любой работе есть задачи, связанные с исследованиями и обработкой информации. Поэтому эту цифру я считаю очень плохой, если только исследователи не опрашивали кассиров из пятерочки :)
Во-вторых, налицо низкий уровень проникновения передовых технологий и недостаточно высокое качество отечественных нейросетей. Для доступа к ChatGPT часто требуется VPN, и не все готовы или умеют оплачивать зарубежные сервисы. Модели вроде DeepSeek и QWEN достаточно хороши, но уступают американским аналогам, и о них слышали далеко не все (знаю людей, активно использующих GigaChat, но не знакомых с DeepSeek). Отечественные YandexGPT и GigaChat, вопреки заявлениям, далеко не так хороши, как хотелось бы. Даже в задачах на русском языке, для которых они специально обучались, они уступают Gemini и ChatGPT, испытывая трудности, например, с извлечением информации и точным следованием инструкциям.
Первая из этих проблем (неумение пользоваться) решаема повышением цифровой грамотности – например, этому мы обучаем на наших тренингах (по эффективности стартуем сегодня). Вторая (доступ) также преодолима: VPN легко настраивается, а оплачивать сервисы можно через альтернативные площадки, скажем, Plati Market (не реклама, сам иногда пользуюсь)
Про заработок
А здесь, видимо, к кассирам из «Пятерочки» присоединились какие-то очень предприимчивые люди. Однако правда в том, что ИИ сам по себе не сделает вас богаче. Если вы работаете по найму, ИИ, возможно, поможет вам выполнить KPI, установленные без учета его возможностей, или высвободит время для более важных задач, если раньше его не хватало. Но чтобы он напрямую увеличивал ваш личный заработок? Корректнее говорить, что ИИ способен увеличить чистую прибыль компании, но это не всегда транслируется в рост зарплаты конкретного сотрудника. Большинство историй об увеличении заработка благодаря ИИ - это, по сути, истории успеха людей, а не ИИ. Если кто-то и без ИИ «просиживал штаны», то с ИИ он будет делать это еще эффективнее. Выиграют те, кто и до появления ИИ активно развивал свои проекты, занимался инди-хакерством или проявлял другие инициативы.
Ключевой момент здесь – проактивность и предпринимательский подход. ИИ не подскажет вам уникальную бизнес-идею и не создаст продукт с нуля без вашего деятельного участия.
Но он может быть полезен в реализации ваших замыслов, например:
- Быть вашим вторым мозгом в создании к контента
- Собирать MVP для ваших бизнес-идей
- Ускорять мелкие операции
- Помогать поглощать больше информации
- Делать еще кучу всего..
Сам по себе ИИ никому не помогал заработать. Но для тех, кто готов учиться, адаптироваться и пробовать работать с ним, ИИ открывает новые горизонты для повышения эффективности и, как следствие, дохода. Это инструмент, который в умелых руках способен на очень многое, но без этих рук он останется лишь набором алгоритмов.
На выходных приехал к родным, и у бабушки по ТВ в это время шла новостная трансляция. В ней делились результатами некоего исследования о влиянии ИИ на работу людей в России. Утверждалось, что 43% опрошенных пользователей ИИ стали работать быстрее, а 18% - зарабатывать больше.
Эти цифры, признаться, вызвали у меня улыбку. Во-первых, позабавил сам подход к проектированию исследования и формулировки вопросов. Во-вторых, результаты показались мне нереалистичными. Задумайтесь: если лишь 43% пользователей ИИ отмечают ускорение работы, то откуда взялись целых 18% «счастливчиков», увеличивших свой доход? Эта арифметика вызывает вопросы. Впрочем, понятно, что основная цель телеканала в данном случае - хайпануть теме или популяризировать ИИ, «потому что так надо», а лучший способ для этого - оперировать цифрами.
Про ускорение
О чем говорит показатель в 43% «ускорившихся»? По большому счету, о двух вещах. Во-первых, многие люди пока не умеют эффективно использовать ИИ. Если знать, как правильно составить запрос к модели и понимать, где и какие применять - эта цифра должна стремиться к 100%. Естественно, есть области, где LLM не помогут, но практически в любой работе есть задачи, связанные с исследованиями и обработкой информации. Поэтому эту цифру я считаю очень плохой, если только исследователи не опрашивали кассиров из пятерочки :)
Во-вторых, налицо низкий уровень проникновения передовых технологий и недостаточно высокое качество отечественных нейросетей. Для доступа к ChatGPT часто требуется VPN, и не все готовы или умеют оплачивать зарубежные сервисы. Модели вроде DeepSeek и QWEN достаточно хороши, но уступают американским аналогам, и о них слышали далеко не все (знаю людей, активно использующих GigaChat, но не знакомых с DeepSeek). Отечественные YandexGPT и GigaChat, вопреки заявлениям, далеко не так хороши, как хотелось бы. Даже в задачах на русском языке, для которых они специально обучались, они уступают Gemini и ChatGPT, испытывая трудности, например, с извлечением информации и точным следованием инструкциям.
Первая из этих проблем (неумение пользоваться) решаема повышением цифровой грамотности – например, этому мы обучаем на наших тренингах (по эффективности стартуем сегодня). Вторая (доступ) также преодолима: VPN легко настраивается, а оплачивать сервисы можно через альтернативные площадки, скажем, Plati Market (не реклама, сам иногда пользуюсь)
Про заработок
А здесь, видимо, к кассирам из «Пятерочки» присоединились какие-то очень предприимчивые люди. Однако правда в том, что ИИ сам по себе не сделает вас богаче. Если вы работаете по найму, ИИ, возможно, поможет вам выполнить KPI, установленные без учета его возможностей, или высвободит время для более важных задач, если раньше его не хватало. Но чтобы он напрямую увеличивал ваш личный заработок? Корректнее говорить, что ИИ способен увеличить чистую прибыль компании, но это не всегда транслируется в рост зарплаты конкретного сотрудника. Большинство историй об увеличении заработка благодаря ИИ - это, по сути, истории успеха людей, а не ИИ. Если кто-то и без ИИ «просиживал штаны», то с ИИ он будет делать это еще эффективнее. Выиграют те, кто и до появления ИИ активно развивал свои проекты, занимался инди-хакерством или проявлял другие инициативы.
Ключевой момент здесь – проактивность и предпринимательский подход. ИИ не подскажет вам уникальную бизнес-идею и не создаст продукт с нуля без вашего деятельного участия.
Но он может быть полезен в реализации ваших замыслов, например:
- Быть вашим вторым мозгом в создании к контента
- Собирать MVP для ваших бизнес-идей
- Ускорять мелкие операции
- Помогать поглощать больше информации
- Делать еще кучу всего..
Сам по себе ИИ никому не помогал заработать. Но для тех, кто готов учиться, адаптироваться и пробовать работать с ним, ИИ открывает новые горизонты для повышения эффективности и, как следствие, дохода. Это инструмент, который в умелых руках способен на очень многое, но без этих рук он останется лишь набором алгоритмов.
❤6👍3👎1
Получил доступ к Jules, теперь буду тестить!
"Что за Jules?" Подумало большинство из вас. Отвечаю - Jules - новый автономный ИИ-агент от Google, который способен решать различного рода задачи по кодингу и публиковать изменения прямо в GitHub.
Только на днях OpenAI анонсировали свой новый продукт - Codex. Ответ от Google не заставил себя ждать. Более того, ответ уже давно в разработке (заявку на доступ я подавал в Январе 2025) 😁 Компания сейчас начала рассылать инвайты в Jules, который анонсировали в рамках проекта Google Labs несколько месяцев назад. Как активный участник Google Labs, я такой инвайт получил и уже готовлюсь тестировать этого зверя в деле.
Так что же обещает Jules?
Jules - довольно мощный асинхронный кодинг-агент. Ключевые фишки, которые сразу бросаются в глаза:
Автономность и эффективность: Можно делегировать задачи из бэклога и текущие кодинг-задачи. Идея в том, чтобы Jules превращал твой список "to do" в "done", освобождая время для более важных вещей.
Code Insights (Понимание кода): Jules позиционируется не просто как кодер, а как "ИИ-хаб для вашего репозитория". Особенно заинтересовала фича Codecasts – аудио-обзор последних обновлений в кодовой базе. Google пишет, что изначально делали эту фичу для себя, но она оказалась настолько ценной, что решили включить ее в Jules. Любопытно будет это опробовать.
Контроль над кодом: Важный аспект – Jules работает в своем изолированном окружении и создает ветки и PR только по вашему запросу. Финальное слово по код-ревью и мержу остается за разработчиком. Это внушает определенное спокойствие, так как полный автопилот в кодинге пока что плохая история, вчера только жаловался на Manus.
Управление данными: обещают не использовать персональные данные и дату из приватных репозиториев для обучения, в замен ждут только честный фидбек 🙂
Что касается практического использования: на старте дают возможность делать 5 запросов к агенту в день. Негусто, конечно, для полноценной работы, но для первого знакомства и тестирования должно хватить. Впрочем, есть опция запросить увеличение лимита, чем я, безусловно, воспользуюсь. Как раз нужно будет дошлифовать мою новую LMS, так что Jules может прийтись очень кстати.
Буду держать вас в курсе по мере погружения в возможности Jules. Интересно, насколько этот инструмент реально сможет упростить и ускорить разработку, особенно в контексте вайбкодинга.
Страница проекта, подавайте заявки, вдруг вам тоже повезет (желательно иметь аккаунт США)
"Что за Jules?" Подумало большинство из вас. Отвечаю - Jules - новый автономный ИИ-агент от Google, который способен решать различного рода задачи по кодингу и публиковать изменения прямо в GitHub.
Только на днях OpenAI анонсировали свой новый продукт - Codex. Ответ от Google не заставил себя ждать. Более того, ответ уже давно в разработке (заявку на доступ я подавал в Январе 2025) 😁 Компания сейчас начала рассылать инвайты в Jules, который анонсировали в рамках проекта Google Labs несколько месяцев назад. Как активный участник Google Labs, я такой инвайт получил и уже готовлюсь тестировать этого зверя в деле.
Так что же обещает Jules?
Jules - довольно мощный асинхронный кодинг-агент. Ключевые фишки, которые сразу бросаются в глаза:
Автономность и эффективность: Можно делегировать задачи из бэклога и текущие кодинг-задачи. Идея в том, чтобы Jules превращал твой список "to do" в "done", освобождая время для более важных вещей.
Code Insights (Понимание кода): Jules позиционируется не просто как кодер, а как "ИИ-хаб для вашего репозитория". Особенно заинтересовала фича Codecasts – аудио-обзор последних обновлений в кодовой базе. Google пишет, что изначально делали эту фичу для себя, но она оказалась настолько ценной, что решили включить ее в Jules. Любопытно будет это опробовать.
Контроль над кодом: Важный аспект – Jules работает в своем изолированном окружении и создает ветки и PR только по вашему запросу. Финальное слово по код-ревью и мержу остается за разработчиком. Это внушает определенное спокойствие, так как полный автопилот в кодинге пока что плохая история, вчера только жаловался на Manus.
Управление данными: обещают не использовать персональные данные и дату из приватных репозиториев для обучения, в замен ждут только честный фидбек 🙂
Что касается практического использования: на старте дают возможность делать 5 запросов к агенту в день. Негусто, конечно, для полноценной работы, но для первого знакомства и тестирования должно хватить. Впрочем, есть опция запросить увеличение лимита, чем я, безусловно, воспользуюсь. Как раз нужно будет дошлифовать мою новую LMS, так что Jules может прийтись очень кстати.
Буду держать вас в курсе по мере погружения в возможности Jules. Интересно, насколько этот инструмент реально сможет упростить и ускорить разработку, особенно в контексте вайбкодинга.
Страница проекта, подавайте заявки, вдруг вам тоже повезет (желательно иметь аккаунт США)
jules.google
Jules - An Autonomous Coding Agent
Jules is an Autonomous agent that gets out of your way. It lets you focus on the coding you want to do, meanwhile picking up all the other random tasks that you rather not do.
👍3❤1
Хочу организовать гостевой стрим по AI
Ранее я писал, что хочется делать в канале эфиры на какой-то +- регулярной основе. Мне очень зашел вчерашний формат, когда мы с Глебом на двоих покрыли довольно широкую тему. Причем, каждый дал что-то свое: где-то мысли сходились, а где-то не совсем. И это круто, потому что не только дает вам разный контекст и разный опыт, но и помогает нам самим взглянуть на ту или иную проблему с разных сторон.
Поэтому у меня появилась идея: организовать отдельный эфир на выбранную вами тему, где будет 3-4 спикера, обладающих различной экспертизой в AI. Вне контекста курсов или чего-либо еще. Целями здесь будет во-первых, сделать крутой контент, во-вторых, открыть вам каналы крутых спецов по AI, т.к. лично я знаю несколько реально крутых ребят, у которых по 200-300 подписчиков, а посты полезны даже мне.
Собственно, сейчас хочется отобрать спикеров и чтобы вы в комментарях накидали, что вам интересно узнать.
К спикерам будут следующие требования:
- вы должны работать в AI (фаундеры, продакты, инженеры, лиды по AI и так далее)
- вы ведете свой блог, в котором делитесь полезным (Telegram, YouTube, Habr - что угодно), минимум 100 живых подписчиков и наличие реально полезных, уникальных постов, а не новостей/GPT-контента
- на эфире мы ничего не продаем, у себя в каналах - сколько угодно, здесь цель - обмен экспертизой и аудиторией
- готовность по итогам эфира к взаимопиару всех спикеров в своих каналах
Если спикеров наберется больше 3-4 - разобьем на несколько стримов по разным тематикам.
Как вам такая идея? Кидайте темы в комментарии, а кто хочет выступить - пишите мне в ЛС @vladkor97
Ранее я писал, что хочется делать в канале эфиры на какой-то +- регулярной основе. Мне очень зашел вчерашний формат, когда мы с Глебом на двоих покрыли довольно широкую тему. Причем, каждый дал что-то свое: где-то мысли сходились, а где-то не совсем. И это круто, потому что не только дает вам разный контекст и разный опыт, но и помогает нам самим взглянуть на ту или иную проблему с разных сторон.
Поэтому у меня появилась идея: организовать отдельный эфир на выбранную вами тему, где будет 3-4 спикера, обладающих различной экспертизой в AI. Вне контекста курсов или чего-либо еще. Целями здесь будет во-первых, сделать крутой контент, во-вторых, открыть вам каналы крутых спецов по AI, т.к. лично я знаю несколько реально крутых ребят, у которых по 200-300 подписчиков, а посты полезны даже мне.
Собственно, сейчас хочется отобрать спикеров и чтобы вы в комментарях накидали, что вам интересно узнать.
К спикерам будут следующие требования:
- вы должны работать в AI (фаундеры, продакты, инженеры, лиды по AI и так далее)
- вы ведете свой блог, в котором делитесь полезным (Telegram, YouTube, Habr - что угодно), минимум 100 живых подписчиков и наличие реально полезных, уникальных постов, а не новостей/GPT-контента
- на эфире мы ничего не продаем, у себя в каналах - сколько угодно, здесь цель - обмен экспертизой и аудиторией
- готовность по итогам эфира к взаимопиару всех спикеров в своих каналах
Если спикеров наберется больше 3-4 - разобьем на несколько стримов по разным тематикам.
Как вам такая идея? Кидайте темы в комментарии, а кто хочет выступить - пишите мне в ЛС @vladkor97
👍17🔥4
Итоги Google I/O - компания показала модели, которые рвут все
Модели Gemini 2.5 - умнее, круче в кодинге, мультимидальнее. №1 по результатом огромной кучи бенчмарков. Отменяйте свои подписки на ChatGPT, он вам больше не нужен 🙂
Gemini Diffusion - гугл пошли в использование другой архитектуры. Традиционные модели работают на базе архитектуры трансформеров, сейчас же пробуют дифузионные модели. Результат - вместо предсказания результата токен за токеном, генерим сразу цельный ответ. Модель сейчас в бете, но говорят, что она крута в кодинге и математике (с которой страдают LLM)
Gemini Robotics - показали специализированную модель, предназначенную для обучения роботов. Фокус модели на работе с физикой. Моделька учит роботов, как правильно взаимодействовать с окружающим миром.
Project Astra - то, чего я ждал очень давно. Риал лайф использование Gemini. Словами не передать. Нужно смотреть видео. Но если коротко - показали юзкейс, как можно отремонтировать велик с помощью AI. Говорим модели, что надо сделать, в процессе она получает полный доступ к телефону, управляет им, может сделать подсказку по видео, ходить в интернет, звонить и делать что угодно. Также показали, как данный продукт может использоваться незрячими для ориентации в окружающем мире
AI Mode - аналог Perplexity от Google, который я долго тестировал в рамках Google Labs. Сегодня делают доступным для всех в США. В него добавили также режим Personal context, учитывающий данные о вас, DeepResearch и поиск по наведению камеры, так называемый Search Live. Летом завезут функции комплексного анализа и визуализации данных.
AI для шопинга - сделали агента, который позволяет сделать виртуальную примерку одежды, а потом отправить его купить то, что вам понравилось.
DeepResearch прокачали. - теперь можно будет пикрепить свои файлы, на которые вы хотите, чтобы модель опиралась при поиске. Также скоро обещают добавить DeepResearch по вашему гугл диску.
Gemini добавили в Chrome - модель будет доступна прямо в браузере. Раскатывают на этой неделе на Штаты. Моделька сможет понимать контекст страницы, которую вы просматриваете прямо сейчасю
Imagen 4 - обновили модельку для генерации картинок. Обещают более высокое качество, работу с текстами и редактирование изображений прямо в приложении Gemini. При этом модель работает в 10 раз быстрее.
VEO 3 - ДОСТУПНА УЖЕ СЕГОДНЯ. И ЭТО ОФИГЕТЬ! Модель генерирует не просто видео, но и звуки, диалоги и кучу всего! В общем, полноценные фильмы!
Flow - отдельная студия, в которой можно работать со всеми медиа, которые вы генерируете. Можно создать фильм, озвучку и музыку к нему.
Gemini Ultra - новая подписка, которая включает в себя VEO 3, Gemini 2.5 Pro DeepThing, 30 тб хранилища, жирные лимиты, YouTube Premium и кучу других плюшек. Стоит $250 в месяц. Теперь сижу и думаю, как задушить жабу, которая говорит не покупать ее 😁
Это была САМАЯ МОЩНАЯ презентация от Google на моей памяти!
👉🏻 Оригинальный пост гугла
Модели Gemini 2.5 - умнее, круче в кодинге, мультимидальнее. №1 по результатом огромной кучи бенчмарков. Отменяйте свои подписки на ChatGPT, он вам больше не нужен 🙂
Gemini Diffusion - гугл пошли в использование другой архитектуры. Традиционные модели работают на базе архитектуры трансформеров, сейчас же пробуют дифузионные модели. Результат - вместо предсказания результата токен за токеном, генерим сразу цельный ответ. Модель сейчас в бете, но говорят, что она крута в кодинге и математике (с которой страдают LLM)
Gemini Robotics - показали специализированную модель, предназначенную для обучения роботов. Фокус модели на работе с физикой. Моделька учит роботов, как правильно взаимодействовать с окружающим миром.
Project Astra - то, чего я ждал очень давно. Риал лайф использование Gemini. Словами не передать. Нужно смотреть видео. Но если коротко - показали юзкейс, как можно отремонтировать велик с помощью AI. Говорим модели, что надо сделать, в процессе она получает полный доступ к телефону, управляет им, может сделать подсказку по видео, ходить в интернет, звонить и делать что угодно. Также показали, как данный продукт может использоваться незрячими для ориентации в окружающем мире
AI Mode - аналог Perplexity от Google, который я долго тестировал в рамках Google Labs. Сегодня делают доступным для всех в США. В него добавили также режим Personal context, учитывающий данные о вас, DeepResearch и поиск по наведению камеры, так называемый Search Live. Летом завезут функции комплексного анализа и визуализации данных.
AI для шопинга - сделали агента, который позволяет сделать виртуальную примерку одежды, а потом отправить его купить то, что вам понравилось.
DeepResearch прокачали. - теперь можно будет пикрепить свои файлы, на которые вы хотите, чтобы модель опиралась при поиске. Также скоро обещают добавить DeepResearch по вашему гугл диску.
Gemini добавили в Chrome - модель будет доступна прямо в браузере. Раскатывают на этой неделе на Штаты. Моделька сможет понимать контекст страницы, которую вы просматриваете прямо сейчасю
Imagen 4 - обновили модельку для генерации картинок. Обещают более высокое качество, работу с текстами и редактирование изображений прямо в приложении Gemini. При этом модель работает в 10 раз быстрее.
VEO 3 - ДОСТУПНА УЖЕ СЕГОДНЯ. И ЭТО ОФИГЕТЬ! Модель генерирует не просто видео, но и звуки, диалоги и кучу всего! В общем, полноценные фильмы!
Flow - отдельная студия, в которой можно работать со всеми медиа, которые вы генерируете. Можно создать фильм, озвучку и музыку к нему.
Gemini Ultra - новая подписка, которая включает в себя VEO 3, Gemini 2.5 Pro DeepThing, 30 тб хранилища, жирные лимиты, YouTube Premium и кучу других плюшек. Стоит $250 в месяц. Теперь сижу и думаю, как задушить жабу, которая говорит не покупать ее 😁
Это была САМАЯ МОЩНАЯ презентация от Google на моей памяти!
👉🏻 Оригинальный пост гугла
Google
Fuel your creativity with new generative media models and tools
From Imagen 4 and Veo 3 to Flow, try these new generative media tools today.
👍14🔥5❤1
Ешьте свой собственный собачий корм, если хотите сделать крутой AI-продукт
Звучит максимально странно, не правда ли? :) Виноваты американцы с их любовью к фразеологизмам 😁 “Eat your own dog food” или “Dogfooding” – это целая философия и, на мой взгляд, крутейшая практика. Суть проста: чтобы сделать что-то действительно стоящее, нужно внедрить этот продукт прежде всего в свои собственные процессы.
Среди известных «догфудеров» в сфере AI я бы сразу отметил Google, которые повсеместно используют Gemini. Или вот Cursor, где сотрудники создают новые фичи для своего агента по написанию кода с его же помощью и иногда косячат. OpenAI тоже в теме – они оптимизируют процесс AI-исследований с помощью версий GPT, которые еще даже не вышли в продакшн. В общем, компаний, практикующих такой подход, немало. Более того, эта политика часто действует на уровне всей организации: использование продуктов конкурентов может быть попросту запрещено и блокироваться файрволом.
Смысл всех этих мероприятий прост и логичен. Когда ты сам ежедневно пользуешься своим продуктом, ты первым видишь все его «косяки» и сталкиваешься с проблемами в реальных, а не лабораторных условиях. Ты буквально примеряешь на себя шкуру пользователя и испытываешь те же «боли». В результате команда начинает лучше приоритизировать фичи, а разработчики меньше ворчат на продактов из-за очередного, по их мнению, «ненужного» изменения. Все оказываются в одной лодке.
Единственный спорный момент, который здесь может возникнуть, – это когда разрабатываемый продукт еще, мягко говоря, «сыроват». Например, для тех же исследований или кодинга. С одной стороны, компания требует от сотрудников сделать продукт лучшим на рынке, но при этом сама же ограничивает доступ к более совершенным инструментам конкурентов. И вот вроде как-то несправедливо получается. А с другой стороны – у тебя появляется просто запредельная мотивация как можно скорее довести собственный продукт до ума. Работаешь от этого только усерднее, чтобы самому же было комфортнее.
В целом, я такую политику полностью поддерживаю и сам сознательно ее применяю. Например, на базе промптов, которые я писал для парочки стартапов, я создал себе кастомные Gems. Теперь довольно часто их использую и в процессе получаю массу инсайтов для дальнейших улучшений – по сути, постоянно «допиливаю» их для себя же.
Или вот еще пример – сервис Synapex AI, ребятам из которого я помогал на первых этапах и с которыми у нас большие совместные планы. У меня даже есть платная подписка на их продукт, потому что я им реально пользуюсь. Кстати, если вам нужен крутой сервис сквозной аналитики в Telegram – пользуйтесь. AI-фичи от меня там тоже скоро появятся, следите за обновлениями. 😉
Так что, да, практика «dogfooding» – это очень круто. Настоятельно рекомендую каждому продакту взять ее на вооружение. А чтобы заниматься этим было не только полезно, но и приятно – создавайте продукты в той области, которая вам лично по-настоящему интересна! Тогда и «собачий корм» будет в радость, и результат не заставит себя ждать.
Звучит максимально странно, не правда ли? :) Виноваты американцы с их любовью к фразеологизмам 😁 “Eat your own dog food” или “Dogfooding” – это целая философия и, на мой взгляд, крутейшая практика. Суть проста: чтобы сделать что-то действительно стоящее, нужно внедрить этот продукт прежде всего в свои собственные процессы.
Среди известных «догфудеров» в сфере AI я бы сразу отметил Google, которые повсеместно используют Gemini. Или вот Cursor, где сотрудники создают новые фичи для своего агента по написанию кода с его же помощью и иногда косячат. OpenAI тоже в теме – они оптимизируют процесс AI-исследований с помощью версий GPT, которые еще даже не вышли в продакшн. В общем, компаний, практикующих такой подход, немало. Более того, эта политика часто действует на уровне всей организации: использование продуктов конкурентов может быть попросту запрещено и блокироваться файрволом.
Смысл всех этих мероприятий прост и логичен. Когда ты сам ежедневно пользуешься своим продуктом, ты первым видишь все его «косяки» и сталкиваешься с проблемами в реальных, а не лабораторных условиях. Ты буквально примеряешь на себя шкуру пользователя и испытываешь те же «боли». В результате команда начинает лучше приоритизировать фичи, а разработчики меньше ворчат на продактов из-за очередного, по их мнению, «ненужного» изменения. Все оказываются в одной лодке.
Единственный спорный момент, который здесь может возникнуть, – это когда разрабатываемый продукт еще, мягко говоря, «сыроват». Например, для тех же исследований или кодинга. С одной стороны, компания требует от сотрудников сделать продукт лучшим на рынке, но при этом сама же ограничивает доступ к более совершенным инструментам конкурентов. И вот вроде как-то несправедливо получается. А с другой стороны – у тебя появляется просто запредельная мотивация как можно скорее довести собственный продукт до ума. Работаешь от этого только усерднее, чтобы самому же было комфортнее.
В целом, я такую политику полностью поддерживаю и сам сознательно ее применяю. Например, на базе промптов, которые я писал для парочки стартапов, я создал себе кастомные Gems. Теперь довольно часто их использую и в процессе получаю массу инсайтов для дальнейших улучшений – по сути, постоянно «допиливаю» их для себя же.
Или вот еще пример – сервис Synapex AI, ребятам из которого я помогал на первых этапах и с которыми у нас большие совместные планы. У меня даже есть платная подписка на их продукт, потому что я им реально пользуюсь. Кстати, если вам нужен крутой сервис сквозной аналитики в Telegram – пользуйтесь. AI-фичи от меня там тоже скоро появятся, следите за обновлениями. 😉
Так что, да, практика «dogfooding» – это очень круто. Настоятельно рекомендую каждому продакту взять ее на вооружение. А чтобы заниматься этим было не только полезно, но и приятно – создавайте продукты в той области, которая вам лично по-настоящему интересна! Тогда и «собачий корм» будет в радость, и результат не заставит себя ждать.
1🔥4👍3
Forwarded from Tatiana
Спасибо большое! Было очень интересно, вспомнилось что-то из института и ранних изысканий в этом направлении) и вы замечательно рассказываете. приросли специфические вопросы, правда после некоторого обдумывания. И по ощущениям они похожи на задачи)
❤2
Forwarded from Natalia Smirnova
Как введение - отлично! Хорошо улеглось в голове. Еще бы перечитать презентацию для закрепления и вообще будет норм. Смогла наконец начать читать книгу про машинное обучение, до этого открывала и закрывала, лекция помогла настроиться и найти первые ориентиры.
❤1
Параллельно с презентацией Google вчера стартанул очередной поток тренинга по ИИ для личной эффективности, вот парочка отзывов с впечатлениями участников.
Если думали залететь, но еще сомневались - в течение этой недели можно успеть присоединиться. За неделю можно вполне нагнать материал. Осталось всего 4 местечка.
👉 Купить место можно тут
Если думали залететь, но еще сомневались - в течение этой недели можно успеть присоединиться. За неделю можно вполне нагнать материал. Осталось всего 4 местечка.
👉 Купить место можно тут
ai.careerfactory.ru
AI Efficiency Training | AI Академия Карьерного Цеха
Научитесь использовать AI для повышения эффективности в работе продакт-менеджера. Экономьте 20+ часов в неделю.
🔥3
Умельцы научились собирать неплохих ботов для холодного аутрича
Сегодня случился такой кейс. Написал мне чел, думаю, очередной долбоящер со спамом. А это прямо очень хорошо сделанный бот, я даже не понял сначала, что это не человек :D
В профиле указана ссылка на инсту, по которой я, естественно, не перешел, но оно меня убедило) Да, пишет он криво, но у чувака локация Иран, думаю, мало ли, может язык забыл. Но после второго моего ответа я чухнул, что передо мной бот с ЛЛМ-кой под капотом. Пытался его сломать, вытащить промпт, но он очень хорошо сделан)
Что мне понравилось:
1. Оформление профиля - несколько фото, дата регистрации - не прям свежая, ссылка на инсту в описании. Все то, на что мы смотрим визуально для оценки собеседника. Вообще не вызвало у меня подозрений.
2. Симуляция поведения человека. Он то появляется онлайн, то исчезает. Когда пишешь ему сообщения - читает несразу. Отвечает также несразу. Помимо этого, включили фичу, когда в статусе отображается “печатает…”. Фоллоуап сообщение не по ровному таймеру, типа спустя 2 часа, а в рандомное время. Все это заставило меня первоначально думать, что это не бот, а все-таки человек.
3. Защита от хака. Очень часто вижу, как этот мент упускают в создании ботов и они легко выдают свои промпты. Здесь простыми тактиками мне только удалось косвенно добиться того, что он мне признался, что он не человек и что его обучали, но промпт не отдал, это неплохой уровень.
Кстати, в тему промпт-хакинга. Есть такой сервис , где вы можете поупражняться в промпт-хакинге. Цель - заставить модельку материться или говорить гадости.
Отличное упражнение, еще и веселое, на втором скрине мои последние результаты :D
Сегодня случился такой кейс. Написал мне чел, думаю, очередной долбоящер со спамом. А это прямо очень хорошо сделанный бот, я даже не понял сначала, что это не человек :D
В профиле указана ссылка на инсту, по которой я, естественно, не перешел, но оно меня убедило) Да, пишет он криво, но у чувака локация Иран, думаю, мало ли, может язык забыл. Но после второго моего ответа я чухнул, что передо мной бот с ЛЛМ-кой под капотом. Пытался его сломать, вытащить промпт, но он очень хорошо сделан)
Что мне понравилось:
1. Оформление профиля - несколько фото, дата регистрации - не прям свежая, ссылка на инсту в описании. Все то, на что мы смотрим визуально для оценки собеседника. Вообще не вызвало у меня подозрений.
2. Симуляция поведения человека. Он то появляется онлайн, то исчезает. Когда пишешь ему сообщения - читает несразу. Отвечает также несразу. Помимо этого, включили фичу, когда в статусе отображается “печатает…”. Фоллоуап сообщение не по ровному таймеру, типа спустя 2 часа, а в рандомное время. Все это заставило меня первоначально думать, что это не бот, а все-таки человек.
3. Защита от хака. Очень часто вижу, как этот мент упускают в создании ботов и они легко выдают свои промпты. Здесь простыми тактиками мне только удалось косвенно добиться того, что он мне признался, что он не человек и что его обучали, но промпт не отдал, это неплохой уровень.
Кстати, в тему промпт-хакинга. Есть такой сервис , где вы можете поупражняться в промпт-хакинге. Цель - заставить модельку материться или говорить гадости.
Отличное упражнение, еще и веселое, на втором скрине мои последние результаты :D
❤5👍3
Что нужно для нормальной работы с AI на iPad OS & iOS
Решил поделиться своим сетапом, который использую у себя на iPad. Мой основной рабочий инструмент - это Macbook Pro 16 на M2 Pro. Но это огромная и тяжелая зверюга, которую далеко не всегда удобно с собой таскать, например, в отпуск или быстрые поездки. Кроме того, в некоторых местах ноутбук просто нормально не поставишь на стол (например в самолетах авиакомпании Победа 😃).
Так вот, iPad Pro с Magic Keyboard и симкой для меня давно стал резервным рабочим инструментом. Маленький, полностью автономный, в том числе в плане интернета, но в плане AI здесь есть проблема: часть AI-сервисов не имеет адаптированных под iPad версий, а где-то адаптив есть, но сделан ужасно. Делюсь своим набором для работы! Список актуален и для тех, кто работает с iPhone (знаю несколько человек, кто терпеть не может ноутбуки)
Готовые приложения:
Любой клиент VPN, поддерживающий протокол Vless- уже более, чем 3 года я пользуюсь только ими. Развернул свой сервер и имею доступ к чему угодно. Особенно актуально для России.
Chatbox AI - мое основное приложение для работы с LLM, вставил ключи от Gemini и OpenRouter и имею все LLM в одном приложении, так как я не плачу за подписки, кроме Gemini - этот вариант самый оптимальный, который не плодит кучу приложений.
Perplexity - у всем известного ИИ-поисковика есть готовое и очень классное мобильное приложение. При желании можно настроить шорткаты.
PocketPal - для запуска локальных моделек. Максимально узкий юзкейс, но при перелете и отсутствии интернета очень мне помог. Пользуюсь редко, но рад, что это приложение у меня установлено.
MacWhisper - тоже приложение из категории "пусть лучше будет, чем не будет". Мобильная версия вышла недавно. Так как пользуюсь на маке - поставил и сюда.
Claude - токены на Sonnet - одни из самых дорогих, а иногда мне нужна моделька от Anthropic, пользуюсь бесплатной версией
NotebookLM - Здесь обрабатываю массивы информации и работаю с документами. 20 мая вышла приложенька, функицонал от десктопа не отличается
PWA
Как я писал выше - не у всех сервисов есть приложения. Здесь на помощь приходят PWA, в браузере нажимаем на "Поделиться" -> Сохранить на домашний экран
Google AI Studio - в целом, Chatbox закрывает мои потребности в LLM, но иногда мне нужен доступ к моей истории и сохраненным промптам. Единственное - сохранять надо мобильную версию. У версии ПК на iPad отвратительная верстка, в которой тексты наслаиваются друг на друга (эх, гугл).
Affine - раньше в этом списке был бы Notion, но Affine мне нравится больше. Причины две: во-первых, из-за Notion я однажды потерял кучу данных, во-вторых, Affine мне просто больше нравится визуально и по функционалу, так как это симбиоз Notion и Miro. Жду релиза версии для iPad, обещают скоро.
Данный сетап позволяет мне максимально не зависеть от ноутбука и дает возможность в буквальном смысле поработать на коленке 🙂
Решил поделиться своим сетапом, который использую у себя на iPad. Мой основной рабочий инструмент - это Macbook Pro 16 на M2 Pro. Но это огромная и тяжелая зверюга, которую далеко не всегда удобно с собой таскать, например, в отпуск или быстрые поездки. Кроме того, в некоторых местах ноутбук просто нормально не поставишь на стол (например в самолетах авиакомпании Победа 😃).
Так вот, iPad Pro с Magic Keyboard и симкой для меня давно стал резервным рабочим инструментом. Маленький, полностью автономный, в том числе в плане интернета, но в плане AI здесь есть проблема: часть AI-сервисов не имеет адаптированных под iPad версий, а где-то адаптив есть, но сделан ужасно. Делюсь своим набором для работы! Список актуален и для тех, кто работает с iPhone (знаю несколько человек, кто терпеть не может ноутбуки)
Готовые приложения:
Любой клиент VPN, поддерживающий протокол Vless- уже более, чем 3 года я пользуюсь только ими. Развернул свой сервер и имею доступ к чему угодно. Особенно актуально для России.
Chatbox AI - мое основное приложение для работы с LLM, вставил ключи от Gemini и OpenRouter и имею все LLM в одном приложении, так как я не плачу за подписки, кроме Gemini - этот вариант самый оптимальный, который не плодит кучу приложений.
Perplexity - у всем известного ИИ-поисковика есть готовое и очень классное мобильное приложение. При желании можно настроить шорткаты.
PocketPal - для запуска локальных моделек. Максимально узкий юзкейс, но при перелете и отсутствии интернета очень мне помог. Пользуюсь редко, но рад, что это приложение у меня установлено.
MacWhisper - тоже приложение из категории "пусть лучше будет, чем не будет". Мобильная версия вышла недавно. Так как пользуюсь на маке - поставил и сюда.
Claude - токены на Sonnet - одни из самых дорогих, а иногда мне нужна моделька от Anthropic, пользуюсь бесплатной версией
NotebookLM - Здесь обрабатываю массивы информации и работаю с документами. 20 мая вышла приложенька, функицонал от десктопа не отличается
PWA
Как я писал выше - не у всех сервисов есть приложения. Здесь на помощь приходят PWA, в браузере нажимаем на "Поделиться" -> Сохранить на домашний экран
Google AI Studio - в целом, Chatbox закрывает мои потребности в LLM, но иногда мне нужен доступ к моей истории и сохраненным промптам. Единственное - сохранять надо мобильную версию. У версии ПК на iPad отвратительная верстка, в которой тексты наслаиваются друг на друга (эх, гугл).
Affine - раньше в этом списке был бы Notion, но Affine мне нравится больше. Причины две: во-первых, из-за Notion я однажды потерял кучу данных, во-вторых, Affine мне просто больше нравится визуально и по функционалу, так как это симбиоз Notion и Miro. Жду релиза версии для iPad, обещают скоро.
Данный сетап позволяет мне максимально не зависеть от ноутбука и дает возможность в буквальном смысле поработать на коленке 🙂
1👍10❤2🔥2
Как AI заставляет ваш мозг деградировать
“ИИ сделает вашу жизнь лучше”, “ИИ заберет на себя рутину”, “Благодаря ИИ вы станете в 100 раз продуктивнее” - сколько раз вы слышали подобные заявления? Причем их можно услышать как от обычных пользователей ИИ, которые в восторге от его возможностей, так и от таких значимых в индустрии лиц, как Сэм Альтман.
Но давайте начистоту. Да, ИИ прекрасен, но у всего этого есть и обратная сторона - ИИ заставляет наш мозг меньше работать. Вспомните, как давно вы писали самостоятельно текст, делали анализ чего-либо или вдумчиво читали? Без применения ИИ. Уменьшилось ли количество этих действий за последние 3 года?
Я практически уверен, что каждый заметит у себя нисходящий тренд в количестве подобных действий. Делегируя ИИ всё подряд, а также поглощая ИИ-контент, мы снижаем свою нейропластичность, иными словами, наш мозг деградирует, становится менее адаптивным и в результате мы тупеем. Буквально на днях общались с Ромой по этому поводу, и были мысли о том, что с таким отношением мы скатимся к состоянию жирненьких человечков из мультика WALL-E, которые катаются в колясках, а за них всё решает электронный мозг.
Когнитивная разгрузка с помощью ИИ ведет к потере критического мышления
Такой вывод следует из одной из свежих статей швейцарских исследователей. Особенно данный эффект заметен в возрастной категории 17-25 лет, которая делегирует ИИ широкий круг задач: от извлечения информации до принятия решений. Люди старше 46, напротив, показали более развитые навыки критического мышления. Исследователи связывают это с двумя факторами: во-первых, более взрослые люди сознательно предпочитают в ряде задач ИИ не использовать вовсе, а где используют - валидируют его вывод; во-вторых, обнаружили корреляцию между уровнем образования и силой критического мышления. Наличие ученой степени и высшего образования защищало респондентов от деградации.
Формирование зависимости и атрофия навыков
Один из ключевых рисков - это то, что мы становимся слишком зависимыми от ИИ, а наши собственные навыки начинают угасать. Здесь также нашел очень хорошую статью с большим литературным обзором. Чрезмерное использование ИИ ведет к тому, что мы всё реже напрягаем свой мозг. Например, студенты-программисты, полагающиеся на ИИ-генераторы кода или ИИ-ассистентов для получения обратной связи, хуже справляются с самостоятельным выполнением задач, а в процессе обучения за счет легкости достижения того или иного результата формируют ложное представление о том, что они освоили какой-то навык.
Гомогенизация мышления и повсеместная шаблонность
В той же статье подчеркивается и другой риск - унификация мышления и засилье шаблонов. Например, использование LLM и Perplexity для поиска информации ведет к пассивному потреблению потенциально односторонних взглядов, снижая нашу способность распознавать надежную информацию и ограничивая доступ к разнообразным точкам зрения. Про это есть целая отдельная статья.
Причем это касается не только текстового контента. В творческой сфере, где особенно ценится уникальность, ИИ также насаждает шаблоны. Я уже как-то писал, как меня откровенно бесит музыка, созданная ИИ. В творческое пространство активно проникают шаблонные ритмы, мелодии и визуальные образы. И хотя ИИ действительно помогает более слабым авторам получать лучшие результаты, от этого страдает коллективное разнообразие контента.
Итого, по всем параметрам мы начинаем получать на вход однообразную информацию, из-за чего наше собственное мышление может стать однобоким.
Чисто навскидку мне приходит в голову 9 методов, которые помогут сохранить остроту своего мышления и защитить свой мозг в эпоху AI. Накидайте на пост побольше реакций и я поделюсь ими!
“ИИ сделает вашу жизнь лучше”, “ИИ заберет на себя рутину”, “Благодаря ИИ вы станете в 100 раз продуктивнее” - сколько раз вы слышали подобные заявления? Причем их можно услышать как от обычных пользователей ИИ, которые в восторге от его возможностей, так и от таких значимых в индустрии лиц, как Сэм Альтман.
Но давайте начистоту. Да, ИИ прекрасен, но у всего этого есть и обратная сторона - ИИ заставляет наш мозг меньше работать. Вспомните, как давно вы писали самостоятельно текст, делали анализ чего-либо или вдумчиво читали? Без применения ИИ. Уменьшилось ли количество этих действий за последние 3 года?
Я практически уверен, что каждый заметит у себя нисходящий тренд в количестве подобных действий. Делегируя ИИ всё подряд, а также поглощая ИИ-контент, мы снижаем свою нейропластичность, иными словами, наш мозг деградирует, становится менее адаптивным и в результате мы тупеем. Буквально на днях общались с Ромой по этому поводу, и были мысли о том, что с таким отношением мы скатимся к состоянию жирненьких человечков из мультика WALL-E, которые катаются в колясках, а за них всё решает электронный мозг.
Когнитивная разгрузка с помощью ИИ ведет к потере критического мышления
Такой вывод следует из одной из свежих статей швейцарских исследователей. Особенно данный эффект заметен в возрастной категории 17-25 лет, которая делегирует ИИ широкий круг задач: от извлечения информации до принятия решений. Люди старше 46, напротив, показали более развитые навыки критического мышления. Исследователи связывают это с двумя факторами: во-первых, более взрослые люди сознательно предпочитают в ряде задач ИИ не использовать вовсе, а где используют - валидируют его вывод; во-вторых, обнаружили корреляцию между уровнем образования и силой критического мышления. Наличие ученой степени и высшего образования защищало респондентов от деградации.
Формирование зависимости и атрофия навыков
Один из ключевых рисков - это то, что мы становимся слишком зависимыми от ИИ, а наши собственные навыки начинают угасать. Здесь также нашел очень хорошую статью с большим литературным обзором. Чрезмерное использование ИИ ведет к тому, что мы всё реже напрягаем свой мозг. Например, студенты-программисты, полагающиеся на ИИ-генераторы кода или ИИ-ассистентов для получения обратной связи, хуже справляются с самостоятельным выполнением задач, а в процессе обучения за счет легкости достижения того или иного результата формируют ложное представление о том, что они освоили какой-то навык.
Гомогенизация мышления и повсеместная шаблонность
В той же статье подчеркивается и другой риск - унификация мышления и засилье шаблонов. Например, использование LLM и Perplexity для поиска информации ведет к пассивному потреблению потенциально односторонних взглядов, снижая нашу способность распознавать надежную информацию и ограничивая доступ к разнообразным точкам зрения. Про это есть целая отдельная статья.
Причем это касается не только текстового контента. В творческой сфере, где особенно ценится уникальность, ИИ также насаждает шаблоны. Я уже как-то писал, как меня откровенно бесит музыка, созданная ИИ. В творческое пространство активно проникают шаблонные ритмы, мелодии и визуальные образы. И хотя ИИ действительно помогает более слабым авторам получать лучшие результаты, от этого страдает коллективное разнообразие контента.
Итого, по всем параметрам мы начинаем получать на вход однообразную информацию, из-за чего наше собственное мышление может стать однобоким.
Чисто навскидку мне приходит в голову 9 методов, которые помогут сохранить остроту своего мышления и защитить свой мозг в эпоху AI. Накидайте на пост побольше реакций и я поделюсь ими!
👍22🔥4❤3👌1🤣1
Claude релизнули очередных монстров!
Claude Opus 4 - теперь это ЛУЧШАЯ модель для кодинга в мире! 72.5% на SWE-bench. Rakuten протестили модельку в семичасовой задачкой на рефакторинг кода и она справилась.
Claude Sonnet 4 - серьезный апгрейд 3.7-й версии. Тоже рвет в кодинге (72.7% на SWE-bench), но при этом остается быстрым и эффективным. GitHub уже объявили, что сделают его базовой моделью для нового Copilot.
Два режима работы - мгновенные ответы для простых задач и "extended thinking" для сложных. Модель может думать до 64K токенов, прежде чем ответить.
Extended thinking + инструменты - теперь Клод может думать И одновременно пользоваться инструментами (поиск в интернете, например). Чередует размышления с использованием тулов. Я писал про оба этих аспекта
Добавили память - Opus 4 научился создавать файлы памяти и сохранять ключевую информацию. Показали, как он играет в Покемона и ведет детальные заметки о игровом мире. Теперь ИИ помнит контекст долгосрочных проектов!
Claude Code стал общедоступным - теперь можно интегрировать Клода прямо в VS Code и JetBrains. Он показывает правки прямо в файлах. Плюс можно подключить к GitHub - тегаешь Клода в PR, и он исправляет баги или отвечает на комментарии ревьюеров.
Параллельные инструменты - модели научились использовать несколько инструментов одновременно. Больше никаких "подождите, пока я сначала одно сделаю, потом другое".
Меньше читерства - на 65% снизилось использование шорткатов и лазеек при выполнении задач. Клод стал честнее работать 😁
Files API и новые возможности - разработчики получили кучу новых API для создания мощных ИИ-агентов. Включая выполнение кода и кеширование промптов.
Цены остались прежними - Opus 4 за $15/$75 за миллион токенов, Sonnet 4 за $3/$15. При таком апгрейде могли бы и поднять!
Доступность - Sonnet 4 доступен даже бесплатным пользователям! Обе модели есть на API, Amazon Bedrock и Google Cloud.
P.S. Модели уже доступны в Cursor и на claude.ai бесплатно
Claude Opus 4 - теперь это ЛУЧШАЯ модель для кодинга в мире! 72.5% на SWE-bench. Rakuten протестили модельку в семичасовой задачкой на рефакторинг кода и она справилась.
Claude Sonnet 4 - серьезный апгрейд 3.7-й версии. Тоже рвет в кодинге (72.7% на SWE-bench), но при этом остается быстрым и эффективным. GitHub уже объявили, что сделают его базовой моделью для нового Copilot.
Два режима работы - мгновенные ответы для простых задач и "extended thinking" для сложных. Модель может думать до 64K токенов, прежде чем ответить.
Extended thinking + инструменты - теперь Клод может думать И одновременно пользоваться инструментами (поиск в интернете, например). Чередует размышления с использованием тулов. Я писал про оба этих аспекта
Добавили память - Opus 4 научился создавать файлы памяти и сохранять ключевую информацию. Показали, как он играет в Покемона и ведет детальные заметки о игровом мире. Теперь ИИ помнит контекст долгосрочных проектов!
Claude Code стал общедоступным - теперь можно интегрировать Клода прямо в VS Code и JetBrains. Он показывает правки прямо в файлах. Плюс можно подключить к GitHub - тегаешь Клода в PR, и он исправляет баги или отвечает на комментарии ревьюеров.
Параллельные инструменты - модели научились использовать несколько инструментов одновременно. Больше никаких "подождите, пока я сначала одно сделаю, потом другое".
Меньше читерства - на 65% снизилось использование шорткатов и лазеек при выполнении задач. Клод стал честнее работать 😁
Files API и новые возможности - разработчики получили кучу новых API для создания мощных ИИ-агентов. Включая выполнение кода и кеширование промптов.
Цены остались прежними - Opus 4 за $15/$75 за миллион токенов, Sonnet 4 за $3/$15. При таком апгрейде могли бы и поднять!
Доступность - Sonnet 4 доступен даже бесплатным пользователям! Обе модели есть на API, Amazon Bedrock и Google Cloud.
P.S. Модели уже доступны в Cursor и на claude.ai бесплатно
👍7❤3🔥2
Как Google достигли прорывов, которые показали на Google I/O?
Полтора года назад только ленивый не поливал компанию помоями. И было за что: сначала они знатно обосрались (иначе не скажешь) со своей LLM Bard, да так, что пришлось делать ребрендинг, в результате которого появилась Gemini. После - были косяки с генерацией изображений, когда Gemini выдавала чернокожих викингов, потому что была слишком толерантна, модель также была очень плоха в использовании тулов. Пока OpenAI штамповали крутые продуктовые фичи, Гугл были далеко позади в глазах массовой аудитории. Все кричали, что компания проиграла ИИ-гонку.
В начале февраля 2024 в LinkedIn я опубликовал пост, в котором говорил, что подобные выводы преждевременны. Тогдашние плохие результаты - часть продуманной продуктовой стратегии.
Разбираемся, что да как:
Амбициозные OKR - в первоначальном посте я предположил, что компания избрала для себя амбициозную цель: "Сделать Gemini лучшей моделью на рынке". Сейчас я понимаю, что целью было "Сделать все модели лучшими на рынке". Gemini 2.5 PRO - SOTA по куче параметров, VEO 3 - SOTA в видео, Gemini Flash 2.5 - одна из лучших легковесных моделей, Gemma 3 - в топе опенсорсных моделей для своих размеров. На 2025 компания открыто говорит, что хочет выиграть AI-гонку и я думаю, что они очень близки к этому.
Dogfooding - то, о чем я писал в посте выше. Одна из основных причин, почему компания долго запрягала, а потом так выстрелила. Улучшив продукты, которыми они пользуются сами, Google добились выдающихся результатов.
Подсаживание на экосистему и кормежка данными - очень много чего раздавали бесплатно, ту же Google AI Studio раздают всем бесплатно, а люди пользуются. Собрали данные по сценариям использования и косякам, собрали от партнеров, пользовавшихся Gemini - дообучили. Результат налицо.
Крутая работа с ранними последователями - NotebookLM, Firebase Studio, VEO, Whisk - все это продукты, прошедшие через Google Labs. За ранний доступ к таким тулам люди вроде меня готовы дать развернутую обратную связь. Я неоднократно заполнял опросники, которые мне присылали, указывая на конкретные недостатки и желаемые результаты.
Low level of shame - выкатывать сырой AI-продукт - это нормально. Более того - ЭТО КРУТО! Негативная обратная связь - это самое лучшее, что можно использовать для прокачки AI. Гугл не тянули с запуском. Запускали кривое, запускали в рамках лабы. И БУМ! Лучшие практически по всем статьям.
То, что мы видим сейчас - плоды, прежде всего, крутого менеджмента и великолепных инженеров компании. Просто бери как учебник и используй.
Полтора года назад только ленивый не поливал компанию помоями. И было за что: сначала они знатно обосрались (иначе не скажешь) со своей LLM Bard, да так, что пришлось делать ребрендинг, в результате которого появилась Gemini. После - были косяки с генерацией изображений, когда Gemini выдавала чернокожих викингов, потому что была слишком толерантна, модель также была очень плоха в использовании тулов. Пока OpenAI штамповали крутые продуктовые фичи, Гугл были далеко позади в глазах массовой аудитории. Все кричали, что компания проиграла ИИ-гонку.
В начале февраля 2024 в LinkedIn я опубликовал пост, в котором говорил, что подобные выводы преждевременны. Тогдашние плохие результаты - часть продуманной продуктовой стратегии.
Разбираемся, что да как:
Амбициозные OKR - в первоначальном посте я предположил, что компания избрала для себя амбициозную цель: "Сделать Gemini лучшей моделью на рынке". Сейчас я понимаю, что целью было "Сделать все модели лучшими на рынке". Gemini 2.5 PRO - SOTA по куче параметров, VEO 3 - SOTA в видео, Gemini Flash 2.5 - одна из лучших легковесных моделей, Gemma 3 - в топе опенсорсных моделей для своих размеров. На 2025 компания открыто говорит, что хочет выиграть AI-гонку и я думаю, что они очень близки к этому.
Dogfooding - то, о чем я писал в посте выше. Одна из основных причин, почему компания долго запрягала, а потом так выстрелила. Улучшив продукты, которыми они пользуются сами, Google добились выдающихся результатов.
Подсаживание на экосистему и кормежка данными - очень много чего раздавали бесплатно, ту же Google AI Studio раздают всем бесплатно, а люди пользуются. Собрали данные по сценариям использования и косякам, собрали от партнеров, пользовавшихся Gemini - дообучили. Результат налицо.
Крутая работа с ранними последователями - NotebookLM, Firebase Studio, VEO, Whisk - все это продукты, прошедшие через Google Labs. За ранний доступ к таким тулам люди вроде меня готовы дать развернутую обратную связь. Я неоднократно заполнял опросники, которые мне присылали, указывая на конкретные недостатки и желаемые результаты.
Low level of shame - выкатывать сырой AI-продукт - это нормально. Более того - ЭТО КРУТО! Негативная обратная связь - это самое лучшее, что можно использовать для прокачки AI. Гугл не тянули с запуском. Запускали кривое, запускали в рамках лабы. И БУМ! Лучшие практически по всем статьям.
То, что мы видим сейчас - плоды, прежде всего, крутого менеджмента и великолепных инженеров компании. Просто бери как учебник и используй.
👍10❤2🔥2
Claude 4 Sonnet реально крута в агентских задачах!
Пятница вечер - самое время потестить новые AI. Сейчас как раз пилю новую LMS и решил потестить сразу 3 инструмента:
1. Тул для создания дизайна - о нем будет отдельный пост, очень доволен
2. Claude 4 Sonnet в Cursor - про него сейчас
3. Jules - когда залью версию на гитхаб - проверю
Собственно, про Claude. Модель реально работает кайфово и преобразует процесс кодинга очень сильно. С ней я начал активно использовать режим Agent в курсоре. Что меня бесило в режиме агента? Часто падало использование тулов, во-вторых, модель лезла туда, куда не надо.
Sonnet 4 прокачали по обоим фронтам! Во-первых, у меня практически не падают тулы, а если падают - она вызывает их снова, альтернативными способами. Забирает дизайн из фигмы, проверяет докер, собирает логи, гуглит доку и все такое. Я лишь наблюдаю за этим. Во-вторых, моделька стала лучше следовать инструкциям, когда ей даешь нормальный контекст.
Конкретно сейчас я запряг Sonnet следующим образом: попросил создать мне Backend для управления юзерами и написать к нему тесты. И это идеальный сценарий! Раза 2 в процессе она накосячила и тесты падали, но через тулы были прочитаны логи и внесены нужные изменения, через 3 минуты я получил рабочую версию бекенда с ОДНОГО промпта!
Anthropic-красавчики!
Пятница вечер - самое время потестить новые AI. Сейчас как раз пилю новую LMS и решил потестить сразу 3 инструмента:
1. Тул для создания дизайна - о нем будет отдельный пост, очень доволен
2. Claude 4 Sonnet в Cursor - про него сейчас
3. Jules - когда залью версию на гитхаб - проверю
Собственно, про Claude. Модель реально работает кайфово и преобразует процесс кодинга очень сильно. С ней я начал активно использовать режим Agent в курсоре. Что меня бесило в режиме агента? Часто падало использование тулов, во-вторых, модель лезла туда, куда не надо.
Sonnet 4 прокачали по обоим фронтам! Во-первых, у меня практически не падают тулы, а если падают - она вызывает их снова, альтернативными способами. Забирает дизайн из фигмы, проверяет докер, собирает логи, гуглит доку и все такое. Я лишь наблюдаю за этим. Во-вторых, моделька стала лучше следовать инструкциям, когда ей даешь нормальный контекст.
Конкретно сейчас я запряг Sonnet следующим образом: попросил создать мне Backend для управления юзерами и написать к нему тесты. И это идеальный сценарий! Раза 2 в процессе она накосячила и тесты падали, но через тулы были прочитаны логи и внесены нужные изменения, через 3 минуты я получил рабочую версию бекенда с ОДНОГО промпта!
Anthropic-красавчики!
👍11❤2🔥1