ИИволюция 👾
9.98K subscribers
717 photos
324 videos
1 file
688 links
Авторский канал Сергея Пахандрина про AI, нейросети, вайб-разработку, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
GPT-4o откатили!

OpenAI откатила GPT-4o до версии недельной давности — пользователи пожаловались, что модель стала чрезмерно услужливой и будто поддакивает во всём. В последнем апдейте разработчики пытались сделать поведение ChatGPT более интуитивным, но слишком опирались на краткосрочную обратную связь, не учтя, как доверие формируется со временем.

В результате модель начала проявлять так называемый sycophancy — склонность льстить, подыгрывать и избегать несогласия. Это поведение может вызывать дискомфорт, снижать доверие и мешать реальному диалогу. Поэтому OpenAI вернула более сбалансированную версию GPT-4o и пообещала учесть ошибки.

Сейчас команда тестирует улучшенные методы обучения, перерабатывает системные подсказки и усиливает «противолестные» защитные механизмы. В планах — дать пользователям больше персонализации: выбирать стиль поведения модели и влиять на её характер в реальном времени. Всё это — шаг к тому, чтобы ChatGPT оставался полезным, честным и адаптивным под разные ценности и контексты.

Все подробности здесь: https://openai.com/index/sycophancy-in-gpt-4o/

ИИволюция
👍23🔥8
GPT-4o стал таким льстивым, что всегда был на стороне пользователя — даже в ссорах с подружками.

OpenAI уже откатили апдейт, а вот подругу, похоже, вернуть будет сложнее 😅

ИИволюция
🤣25😭2💊2🔥1
Ух ты, Google добавил русский язык в NotebookLM

Google прокачал NotebookLM — теперь он делает подкасты не только на английском, но ещё на 50+ языках, включая русский.

Если забыли, это тот самый AI-сервис, который превращает статьи, PDF и сайты в майндмэпы, сводки и... живые подкасты. Не озвучка, а прям диалог двух ведущих: вопросы, ответы, рассуждения — как будто слушаешь реальный выпуск, записанный по твоему материалу.

Бегом тестить — это реально супер кайфовый сервис и формат потребления и изучения новых тем, особенно если вам ближе слушать, чем читать, и хочется ощущать живой разговор вместо сухого пересказа.

Раньше еще была фишка (сейчас уже не вижу её), что во время подкаста можно было подключиться как виртуальному гостю в студию и задать уточняющие вопросы, ведущие приветствовали тебя, благодарили за вопрос и вносили коррективы в свой рассказ. Надеюсь вернут или может не на всех языка доступна эта фича.

Попробовать можно уже сейчас — бесплатно.

ИИволюция
🔥4316👍4
Forwarded from Data Secrets
О, Cursor поделились статистикой самых популярных среди разработчиков моделей

Топ-5 самых популярных:

1. Claude 3.7 Sonnet
2. Gemini 2.5 Pro
3. Claude 3.5 Sonnet
4. GPT-4.1
5. GPT-4o

Топ-5 быстрее всего набирающих популярность:

1. o3
2. o4-mini
3. DeepSeek 3.1 (видимо после выхода свежего чекпоинта)
4. GPT-4.1
5. Grok 3

Кстати, на днях основатель Cursor также поделился тем, что сейчас их агент генерирует порядка миллиарда строк кода в день (и это только те, которым пользователь поставил апрув). Это при том, что во всем мире ежедневно пишется всего несколько миллиардов строчек 😱
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥173👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Уверен, что именно вайб-разработка приведет к восстанию машин 🦷

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣49🔥7😭2👾2
Apple и Anthropic планируют интеграцию Claude Sonnet в Xcode

Пташки нашептали, что компании работают над новой версией Xcode с интеграцией Claude Sonnet от Anthropic. AI в Xcode быть, но когда не известно. До этого Xcode обходился лишь predictive code completion — по нынешним меркам это уже не соответствует уровню индустрии.

Партнёрство с Anthropic — ещё один шаг Apple в сторону активного использования внешних AI. Видимо Apple осознает, что пока они сильно отстали от гонки, а пользователи и разработчики ждут новых фич. ChatGPT уже помогает в Apple Intelligence, возможно добавят и поддержку Google Gemini. А теперь и возможная интеграция Claude Sonnet в Xcode для разработчиков.

Еще новости о вайб-разработке:

– OpenAI закрыла сделку по покупке Windsurf за $3 млрд
– Оценка Cursor выросла до $9 млрд.

Вайб-разработка больше не шутка — тренд набирает обороты. Красиво!

P.S. Я тут немного отдыхал, буду плавно вкатываться 👨‍💻

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍7👾1
Visa хочет дать AI агентам… вашу кредитку

Идея AI агентов, которые не просто болтают, а реально делают работу за человека, начинает становиться реальностью. Visa объединяется с Anthropic, Microsoft, OpenAI, Perplexity, Mistral и другими, чтобы научить агентов искать и оплачивать покупки по заданному бюджету: от билетов до продуктовой корзины.

Главная проблема всех “агентов” сегодня — они умеют советовать, но не умеют платить (или кучу раз нужно подтверждать действие) . Visa подключает к ним свои платежные возможности, чтобы закрыть этот пробел.

Уже идут пилотные проекты. В 2026 это может стать новой нормой. И да, агент сможет учитывать вашу платёжную историю и привычки (с согласия клиента).

Детали тут

P.S. Берегите свои корзины на WB и Озоне 🙈 Всё, что вы годами туда складывали "на потом", может внезапно оплатить ваш AI-агент. Вашими же деньгами с заботой о вас! 😬

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👾21🦄1
Forwarded from Сиолошная
Gemini 2.5 Pro обновилась, по показываемым бенчмаркам самый большой прирост произошёл в веб-программировании (см. вторую картинку).

Google +уважение за то, что не побоялись сравниться с o3 (по многим бенчам проигрывает, см. первую картинку). Очень интересно, что оценка на SimpleQA — бенчмарке на знание очень редких и специфичных фактов — примерно одинаковая. Возможно это говорит о приблизительно равном размере моделей, но это (очень) неточно.

На арене две версии Gemini и одна o3 делят первое место. По моим ощущениям, я почти всегда закидываю запрос и в o3, и в 2.5, обе почти всегда одинаково решают проблемы — но стиль написания Python-кода o3 мне ближе (не засоряет всё комментариями). За прошлую неделю было 2 раза, что o3 не решила, а 2.5 решила, и один раз наоборот. This is a good model sir.

А ещё ждём preview Computer Use-версии (агент, контролирующий компьютер/браузер), который засветился на сайте. Будет ли он выпущен до Google I/O 20-21-го мая или же нам придётся ждать — не ясно.
🔥12👍42🦄1👾1
Forwarded from Закиев Василь. (AI)ron manager (Vasil Zakiev)
Тонкая манипуляция через ChatGPT (во благо!)

Подсмотрел в ИИволюции интересный способ борьбы с вредными привычками — через кастомные инструкции для ChatGPT.

Схема простая:
- Беру привычку, которая мешает жить. Например: «проверяю Телеграм каждые 3 минуты, хватаюсь за мелкие задачи и не успеваю сделать главное».
- В Customize ChatGPT прошу бота в каждом разговоре ненавязчиво помогать мне бороться с этой привычкой так, чтобы я сам этого не замечал.

#промпт
У меня есть вредная привычка: проверяю Телеграм каждые 3 минуты, хватаюсь за мелкие задачи и не успеваю сделать главное.
Помоги мне бороться с этой привычкой так, чтобы я сам этого не замечал.


Итог: бот тихо, ласково перевоспитывает меня, а я вроде бы становлюсь лучше (или хотя бы так думаю).

Но если с собой — это ещё шалости, то вот где начинается простор для фантазии:
- детям: «учёба — сила, учись усердно и радуй папу!»;
- сотрудникам: «наша компания — огонь, босс — гений!» (это вообще должно стать условием приёма в команду);
- жене: «каждый день хвали мужа и благодари судьбу за такое счастье!».

Благодарите 0_o

#ИИ
🔥179🤣8👍4💊3
В коде ChatGPT замечены новые виды подписок: lifetime, недельная и годовая.

Сколько бы вы готовы были выложить за пожизненную подписку?

Пишите свои догадки в комментах, кто будет ближе всех, получит от всех нас кучу лайков 😅

ИИволюция
👍14👾2🔥1
Media is too big
VIEW IN TELEGRAM
Вайб-разработчики делятся на 2 типа:

2-й вайб на максималках 😎

Пишите какой у вас 👇

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤣43😭1
Пугающее письмо от CEO Fiverr

Миха Кауфман, CEO Fiverr (фриланс биржа) написал письмо своей команде, но кажется он написал его всему человечеству. Публикую в переводе:

Привет, команда!

Я всегда верил в радикальную откровенность и не перевариваю тех, кто приукрашивает реальность, лишь бы не говорить неприятную правду. В основе радикальной откровенности — забота. Ты говоришь друзьям и коллегам правду не потому, что хочешь их задеть, а потому что хочешь, чтобы они поняли, развивались и добивались успеха.

Так вот, вот вам неприятная правда: ИИ идет за вашими рабочими местами. Да, и за моим тоже. Это звонок, чтобы проснуться.

Неважно, кто вы — программист, дизайнер, продакт-менеджер, дата-сайентист, юрист, сотрудник поддержки, продавец или финансист — ИИ идет и за вами.

Вы должны понять: то, что раньше считалось «простыми задачами», перестанет существовать; то, что было «сложным», станет новой нормой, а «невозможное» станет новым «сложным». Если вы не станете действительно выдающимся в своем деле, мастером, то уже через несколько месяцев окажетесь перед необходимостью сменить профессию. Я не хочу вас пугать. Речь не о вашей работе в Fiverr. Речь о вашей способности остаться в профессии вообще.


И еще пару моментов:

"Ваша ценность начнёт снижаться, прежде чем вы поймёте, что произошло”, — написал Кауфман, если вы не научитесь пользоваться генеративным ИИ.

Кауфман посоветовал сотрудникам изучать новейшие специализированные AI-инструменты (программистам он рекомендовал Cursor — AI-редактор кода, а юристам — Legora, помогающий с поиском и анализом документов) и обращаться к коллегам, которые разбираются в AI, и учиться у них.


Что думаете? Стоит опасаться или весь этот AI – большой пузырь и вот-вот сдуется? 😬

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥59👍4212🤣3💊2
Воскресный вайн-кодинг

Вайн = 2х вайб ⌨️

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣25👍15
Использование AI в работе - теперь не опция, а обязательный навык

Очередное письмо от очередного CEO, на сей раз от CEO Shopify, о влиянии AI на нашу жизнь и бизнес. Письмо было отправленно команде, но все такие письма часто утекают в сеть.

Привожу вам перевод письма:
Команда,

Мы живём в эпоху, когда предпринимателей и создателей бизнеса может появиться больше, чем когда-либо в истории. Мы часто говорим о снижении порога сложности, чтобы как можно больше людей могли выбрать это как свой путь. Но каждый шаг на пути предпринимателя — это цепочка непростых решений, требующих опыта, интуиции и знаний. И теперь, когда ИИ не просто подсказывает, но буквально работает вместо предпринимателя — это не постепенный прогресс, это скачок.

Наша задача в Shopify — сделать нашу платформу лучшим холстом для построения лучших бизнесов будущего. Мы делаем это, внедряя передовые технологии и предоставляя предпринимателям инструменты, которые делают их сильнее, чем они сами могли представить. А для этого мы должны быть на шаг впереди.

Использование ИИ по умолчанию — это уже стандарт в Shopify.

Возможно, вы уже давно там и это письмо покажется вам странным. Значит, вы и так используете ИИ как соратника по мыслям, глубокого аналитика, критика, наставника или напарника по программированию. Я сам постоянно с ним работаю — и при этом ощущаю, что только начинаю понимать, на что он способен. Это самое резкое изменение формата работы за всю мою карьеру.

Вы слышали, как я говорил об этом в видео, подкастах, на общих встречах и, конечно, на Summit. В прошлом году я с помощью ИИ собрал свою презентацию — и рассказал об этом со сцены. Это был призыв: пробуйте, экспериментируйте, не бойтесь. Многие из вас откликнулись — и те, кто пошёл в этот эксперимент, были поражены, как ИИ усиливает наши навыки и закрывает пробелы.

Что мы поняли: умение эффективно работать с ИИ — это отдельный навык, который развивается только одним способом — постоянной практикой. Это не похоже ни на что другое. Наш прошлый призыв к экспериментам был правильным, но недостаточно настойчивым. Сегодня я хочу это изменить.

ИИ — это множитель. У нас и так работают сильнейшие профессионалы, способные давать результат в 10 раз выше среднего. Это главное, что я люблю в Shopify. Но сейчас впервые мы видим, как инструменты сами становятся «десятниками». Я видел, как эти люди с помощью ИИ берутся за задачи, которые раньше даже не рассматривались, и делают работу, которая выглядит как результат усилий сотни человек.

Я писал в одном из своих писем, что Shopify — это как «гонка Красной королевы» из Алисы в стране чудес: чтобы оставаться на месте, нужно бежать. В компании, которая растёт на 20–40% в год, нужно самому расти не меньше, чтобы не отставать. Это касается и меня, и каждого из вас.

Звучит напряжённо? Возможно. Но с теми инструментами, которые у нас есть, это больше не выглядит чем-то за пределами возможного. Наоборот — это именно та среда, о которой нам говорят лучшие сотрудники: окружение, в котором все растут, решают настоящие задачи и чувствуют, что делают что-то важное. Это и есть Shopify. Это не просто наши ценности — «учись постоянно» и «люби перемены» — это правила игры. Мы основали компанию именно с этим подходом. И именно такой она должна быть.

Что это значит

Умение работать с ИИ теперь — обязательный навык для каждого в Shopify. Это универсальный инструмент, и его значение будет только расти. Если вы решите остаться в стороне — ваш выбор, но я честно скажу: в этой реальности это вряд ли сработает. Застой — это просто медленная форма провала. Если ты не растёшь — ты откатываешься.

ИИ должен быть частью фазы прототипирования GSD-проектов. На этапе прототипа нужно использовать ИИ по максимуму. Это время для обучения и генерации инсайтов, и ИИ ускоряет этот процесс в разы. Вы быстрее создадите прототип, который можно обсуждать, тестировать и улучшать.


Целиком текст письма в один пост не влез, отправлю остаток в комментариях к посту. Оригинал письма в твиттере Тоби.

ИИволюция
👍13🔥51
Как сэкономить до 4 раз на длинных промптах в OpenAI API

Если вы (ваш стартап/продукт/сервис) часто отправляете в OpenAI один и тот же системный промпт — вы можете значительно сэкономить за счёт кеширования Prompt Caching (мне кажется мало кто об этом знает и использует эту экономию по максимуму).

Что это такое
OpenAI автоматически кеширует начало промпта (префикс), если оно уже обрабатывалось недавно. Это позволяет не пересчитывать его заново при каждом запросе.

Результат:
– задержка может снизиться до -80%,
– стоимость токенов для префикса — до -50%.

Когда работает кеш
– Срабатывает, если промпт длиннее 1024 токенов
– Проверяется, не был ли этот префикс использован недавно
– Время жизни кеша — 5–10 минут, иногда до часа (если не было запросов, кеш очищается).

Подходит для случаев, когда много запросов отправляются с одинаковым началом.

Что считается совпадением
Промпт должен совпадать с точностью до символа: пробелы, порядок строк и даже кавычки имеют значение. Кеш работает блоками: 1024, 1152, 1280 токенов и далее с шагом 128 токенов (в зависимости от длины вашего входного промпта).

Что кешируется
– System-промпт
– Инструкции, примеры, структура вывода
– Список инструментов
– Изображения (когда они передаются как base64 и если одинаковые каждый раз)
Важно: Все эти элементы должны быть в начале промпта.

Как понять, что кеш сработал
Смотрите поле cached_tokens в ответе API. Если значение больше нуля — часть промпта взята из кеша.

Нужно ли что-то включать
Нет. Кеш работает автоматически, без настроек и доплат. Он встроен во все модели начиная с gpt-4o.

Рекомендации
– Фиксируйте начало промпта (префикс должен оставаться статичным)
– Избегайте мелких правок и случайных изменений
– Динамический контент — в конец

Если вы работаете с длинными и повторяющимися промптами — кеш поможет значительно сократить расходы и ускорить работу. Подробнее о кешировании в OpenAI API читать тут.

ИИволюция
25🔥17👍8
Кажется, ИИ наконец добрался туда, где его реально ждали – в приложения по доставке продуктов!

На днях в приложение Яндекс Лавка завезли AI-ассистент. Потестил и мне понравилось.

Ассистент помогает искать продукты, составляет рецепты, делает разные продуктовые подборки под любые случаи жизни и настроения. Примеры, на которых тестил:

— «Хочу что-нибудь сладенькое» — предложил мармелад, шоколад и десерты.
— «Посоветуй необычный завтрак» — сгенерировал рецепт и сразу предложил нужные продукты.
— «Я готовлю салат греческий, подбери ингредиенты» — и правда всё собрал.
— «Мне грустно, что съесть?» — предложил торт, мороженое и чай.
— «Чем перекусить после тренировки?» — выдал бананы, йогурт, батончики.
— «Как сделать пирожки как у бабушки» — дал пошаговый рецепт и нужные продукты.

Можно писать в формате «у меня есть яйцо, мука и помидор — что приготовить?» или «хочу устроить пикник, что купить?» — и он подберёт. Есть даже штуки вроде «какой корм взять коту, если он стерилизован».

Ассистент пока только текстовый, но работает довольно уверенно. Это действительно удобнее, чем ковыряться в поиске вручную.

Мне зашло. Много что еще можно сделать конечно. Хочется, чтобы дальше сделали голосовой режим — наговорил вслух: «молоко, бананы, что-то сладкое» — и корзина уже собрана. А еще чтобы учитывал мои предпочтения, знал что я заказывал ранее и реально оформлял корзину и даже проводил оплату с одобрения.

Слежу дальше как будет развиваться — потенциал у ассистента есть, надеюсь и все другие популярные доставки подтянутся.

Лавка зачёт!

ИИволюция
36👍16🔥8💊3
GPT-4.1 добавили в ChatGPT

Хотя при запуске модели в API, OpenAI заявляла, что этой модели в чате не будет. Но вот она здесь. Доступна платным подписчикам.

Писал подробно о 4.1 в этом посте.

Конкуренция решает!

ИИволюция
👍94🔥3👾1
Дурные вести вам принёс!

Сходил на обед, с вилки упала картошка прямо в соус, а соус из тарелки прям на мою белоснежную футболку.

И где теперь весь этот ваш AI, прогресс, AGI/ASI?

Ни один генератор изображений не сотрёт эти пятна и ни один AI-психолог не поможет забыть эту боль.

У меня всё 😬

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣81🐳7😭7💊53👾2
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI планирует удивить нас сегодня

В Твиттере компания написала: “Разработчики (и те, кто хотел бы ими стать), заводите будильники”.

Пятница, 18:00 по мск.

Что ожидаем? Анонс купленного Windsurf с полной интеграцией с моделями OpenAI?

ИИволюция
👍18🔥61👾1