ИИволюция 👾
10.7K subscribers
807 photos
336 videos
1 file
735 links
Авторский канал Сергея Пахандрина про AI, нейросети, вайб-разработку, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
РКН: https://clck.ru/3QJLiL

#UGUMN
Download Telegram
В ChatGPT немного причесали и обновили раздел с персонализацией чатика под вас.

Теперь всё в одном месте!

А вы вообще этот раздел используете и адаптируете чатик под себя? Или Сэм и ко зря стараются?
👍103
Forwarded from Сиолошная
OpenAI выпустили новую GPT-5 😑

...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно, если вы подписаны на любой тир ChatGPT. В комментариях многие отмечали, что им нравится больше, чем Claude Code, и модель работает лучше.

GPT-5 Codex дотренировали на новых сложных реальных задач, создании проектов с нуля, добавлении функций и тестов, отладке, проведении масштабных рефакторингов и ревью кода.

По стандартному бенчмарку SWE-bench Verified разница не особо заметна, 74.5% против старых 72.8%. Однако на внутреннем бенчмарке OpenAI на задачах рефакторинга модель стала гораздо лучше: прыжок с 33.9% до 51.3%!

Но и это не всё: модель стала писать меньше бесполезных или ошибочных комментариев, лучше ловить баги в коде, и... думать меньше, когда это не надо. OpenAI взяли запросы от сотрудников внутри компании и сравнили количество токенов в ответах двух моделей.

Там, где ответы были короткими, они стали ещё короче, а там, где цепочки рассуждений и сгенерированный код были длиннее — стало больше. Со слов OpenAI, во время они наблюдали, как GPT‑5-Codex работал автономно более 7 часов подряд над большими и сложными задачами, выполняя итерации по внедрению, исправляя ошибки тестирования и в конечном итоге обеспечивая успешное решение задачи.

Codex CLI и Codex Web получили кучу обновлений за последний месяц, но про них писать не буду.

В API модель появится скоро, очень ждём, пока замеряют качество и на других бенчмарках. В системной карточке модели указали лишь один — по решению многоступенчатых задачек по кибер-взлому (с соревнований CTF). Модель наконец-то статистически значимо обгоняет o3! Жаль, не замерили другие бенчмарки (вроде PaperBench).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥5
О, уже достали системный промпт для gpt-5-codex

Всегда интересно изучать, как к таким инструкциям подходят «создатели», чтобы применить/перенять подходы на практике.

Полный промпт доступен здесь

А если не знали, то этот спец первый на рынке, кто достаёт из всех моделей и агентов системные промпты и выкладывает их у себя здесь (огромная коллекция, там есть все-все). Если вам нужен промпт гайд “Как писать промпты” и всякие бест практисы, то лучше места не найти! Следить за новостями можно в его твиттере.
1👍148🔥4
Forwarded from InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
3 месяца ChatGPT Plus по цене за 1,5

Если у вас есть активная подписка ChatGPT Plus и привязана карта оплаты, можно получить 50% скидку за запрос отмены текущего плана. Правда только на квартал, а дальше снова по 20$ в месяц. Пробуйте 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍19🤣9🔥6🤔4
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI услышали фидбек о том, что GPT-5 Thinking иногда думает слишком долго

Теперь для Plus/Pro/Business пользователей добавили настройки скорости мышления:

Standard — новый режим по умоланию, баланс скорости и качества. Когда подумать нужно, но без усердий.

Extended — старый режим размышлений, когда модель думала секунд 30-40. Теперь его можно выставлять отдельно для задач по сложнее.

Light (только Pro) — быстро и по делу. Ризонинг, но на супер лайте.

Heavy (только Pro) — самый тяжелый режим размышлений, для самых сложных задач, решение которых не требует спешки с выводами и результатами.

И что удобно, настройка сохраняется между чатами (если выставили один режим, он не будет сбрасываться автоматически в новых чатах). Наконец-то можно выбирать между "дай ответ сейчас" и "подумай хорошенько" в зависимости от задачи.
🔥123
Наконец-то дошли руки допилить и запустить своего спам-бота (пока в тесте), который в чатике следит за спамом, “шлюхоботами” (кстати, в последнее время они у меня поутихли) и прочим мусором, и банит их. Решение принимает gpt-4o-mini.

Писал об этом еще в июле, в этом посте.

Тест провожу сразу в реальной среде “life mode on”, если вас забанит, напишите мне в личку 😄

Эксперимент интересный, как наберу больше данных для анализа, расскажу. И да, гроза всех спамеров родилась сегодня! Надеюсь AI не подведёт 😅

UPD: нужно тюнить юмор у AI, поспешил я с продом, поставил на паузу автобаны пока))
UPD UPD: попытка номер 2 запущена
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍16🔥7
Оформил подписку за $100 (была за $20) на Claude Code и прям второе дыхание открылось.

Начал постигать спек-дривен разработку (меньше вайба)

А еще запилил 2 MCP для работы с рекламным кабинетом Apple Search Ads и системой аналитики, где все данные по пользователям, когортам, подпискам, рекламной атрибуции. И теперь задаю вопрос в Claude Code по любым метрикам, аномалиям, он сам все данные с помощью MCP подгружает, анализирует, сопоставляет, догружает более узкие сегменты и в итоге делает выводы. Скоро еще и рекламными кампаниями будет управлять, бюджетами и ставками.

А я хотел для этого агентов городить. Шок! Теперь Claude Code для меня не просто инструмент для разработки, но еще и личный ассистент. Теперь буду стоить коллекцию MCP и сетку саб агентов, которые будут помогать мне каждый день по всем направлениям прямо в Claude Code. Такого поворота я не ожидал 😁

А у вас как выходные проходят? 😅
2🔥445🤣4
Сэм Альтман как бы намекает нам: нужно больше золота!

Новые фичи, по его словам, будут жрать столько вычислений, что даже Pro за $200 баксов не покроет расходы. И вероятно новые прожорливые по компьюту фичи, будут продаваться отдельно.

Plus пользователи вообще видимо в пролете. За $20 теперь получишь только базовый ChatGPT, а все интересное уйдет в премиум тарифы или за доплату.

С одной сторой ход понятен. Обучение моделей стоит безумных денег, серверы тоже не бесплатные. Но получается странная ситуация, как с наркоманами. Сначала всех подсадили на ИИ по демократичной цене, теперь начинают выжимать максимум за каждую новую фичу.

Интересно посмотреть что там за фичи такие. Есть мысли?
😭24🍓10🤣74👾1
Режим ultrathink в Claude Code порой забавный. Иногда мне кажется, что он немного понтуется передо мной 😃

“Четвертую задачу сделал, перехожу к пятой задаче. Ладно, на самом деле пятую я тоже уже сделал.”

Ну смешной 😄
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣46
Ого, зашел в свой канал под аккаунтом без Телеграм Премиум, а там…

Шок контент! Т.е такой огромный спам вы видите регулярно, кто без премиум подписки? Пол экрана занимает. Как так? Как это возможно? Несколько раз перезашел и каждый раз какие-то курсы там рекламят по нейросетям.

Пашка Дуров, лучше бы стену вернул!
😭46🤣205🔥3👍2👾2
У меня появился AI-диктофон

Классный, минималистичный, размером с банковскую карту. Удобно носится в чехле на MagSafe. Называется Plaud Note.

Нажал одну кнопку — и он уже пишет. Легко даже разговоры по телефону записывает. Я писал о таких штуках вот в этом посте

Недавно, чисто ради эксперимента, записал весь разговор с женой в кафе. Хотелось попробовать транскрибировать и саммаризировать обычный разговор, а не рабочий созвон. И содержание получилось забавным: обсуждали всякое, просто болтали о том о сём. Но когда я увидел тайминг с короткими заголовками, я прям посмеялся. Выглядит так, будто попали на подкаст и серьёзно беседовали на темы дня.

В общем, девайс супер. Быстро включается, выглядит стильно и минималистично, батарейки хватает до 30 часов, и он всегда при мне на телефоне.

Жалко только, что он не транскрибирует сразу в реальном времени. Приходится скачивать записи и уже потом прогонять их через транскрибацию. А было бы идеально: в реальном времени из любого разговора формируется твоя личная база знаний с поиском, подмечаются любые факты из твоей жизни, и в любой момент можно легко найти нужную информацию.

Кажется, идея для стартапа!

P.S. Взял недельку отдыха от новостей, поэтому почти не писал вам про всякое интересное, но скоро вернусь! Новостей масса, и Sonnet 4.5 и обновление Claude Code и куча всего. Надеюсь, что вы в курсе всего этого и уже во всю используете?!
🔥43👍162🤣2👾1
Еще, кстати, вайбкодинг очень сильно повышает требования к скорости выполнения задач.

Раньше разработчик говорит: «эту штуку пилить две недели», и мы такие блин ну ок

А теперь мы говорим: какие нахрен две недели, я сам это за два часа запилю.

Ну и где-то на двух днях в итоге можно сойтись
1🔥32👍5🤣5😭31👾1
Профдеформация

Зашел в МФЦ, а тут у них свои MCP, что бы это не значило 😀 Но мои когнитивные искажения сразу считывают такое в рамках AI контекста и не сразу понимаю, что это совсем о другом😁
🤣155👍2
Мы? 😄
1🤣649🫡2👾2
Ходит денежка по кругу. Триллионный план инвестиций в AI-индустрии

Все инвестируют друг в друга, накачивая капитализацию. Что-то напоминает, да?

Bloomberg опубликовал материал про денежные потоки в AI-экосистеме. И, главное, визуализировал, как эта схема выглядит — получился мем про план эвакуации при пожаре: просто круг со стрелочками и паника «А-а-а-а-а!».

Вот как работает накачка:

— OpenAI за $500 миллиардов закупает GPU у Nvidia
— Nvidia инвестирует обратно в OpenAI до $100 миллиардов
— OpenAI заключает облачный контракт с Oracle на $300 миллиардов
— Oracle покупает чипы у Nvidia на десятки миллиардов
— OpenAI договаривается с AMD о GPU мощностью на 6 ГВт, а AMD получает опцион на покупку 160 миллионов акций OpenAI
— Microsoft инвестирует в OpenAI, OpenAI арендует мощности у Microsoft
— А ещё есть правительство США, которое получает 10% в Intel и 15% в экспорте Nvidia в Китай, Nebius Воложа, Mistral, xAI…

И так по кругу. Каждая сделка увеличивает капитализацию всех участников, создавая иллюзию бешеного роста рынка.

Прикол в том, что уже ОЧЕНЬ сильно напоминает классические схемы манипуляции рынком. Когда компании инвестируют друг в друга не столько ради реальной выгоды, сколько ради накачки оценок перед инвесторами.

Основной посыл — никогда ещё столько денег не тратилось на технологии без доказанной способности приносить прибыль.

Альтман «способен обрушить мировую экономику на десятилетие или привести нас всех в землю обетованную», — написала Стейси Расгон, аналитик Bernstein Research, в заметке для инвесторов на этой неделе. «Прямо сейчас мы не знаем, что за карты у него в руке».
🤔203🤣3🍓2
Узнал о себе много интересного задав всего 1 вопрос в ChatGPT:

"Напиши обо мне то, что я могу о себе не знать, но что можешь знать ты, основываясь на моих запросах"

На основе всех наших переписок, вопросов и обсуждения, ChatGPT многое о нас может рассказать.

После детального ответа, он предложил мне:

"Если хочешь, я могу развернуть это в формате краткого психологического профиля — с акцентом на рабочие паттерны (мотивация, риск, лидерство, усталость, креативность)"

Конечно же согласился и получил еще больше инсайтов о паттернах своего поведения в разных ситуациях и историях!

После чего попросил:

"Что мне стоит в себе усилить, а что ослабить, чтобы стать устойчивее и счастливее/продуктивнее/ваша цель?"

Куча интересных мыслей для переваривания. Мне было интересно и крайне полезно взглянуть на себя со стороны и понять можно идти идти/расти над собой, чтобы меньше "париться", и больше наслаждаться процессом.

Как итог, попросил составить для себя список вопросов и дополнительно ритуалов, которые стоит задавать себе и делать утром, днём, вечером и на выходных перед началом новой недели.

Надеюсь, что это будет полезно еще кому-нибудь ❤️
729🔥15👍8