Forwarded from Сиолошная
OpenAI выпустили новую GPT-5 😑
...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно, если вы подписаны на любой тир ChatGPT. В комментариях многие отмечали, что им нравится больше, чем Claude Code, и модель работает лучше.
GPT-5 Codex дотренировали на новых сложных реальных задач, создании проектов с нуля, добавлении функций и тестов, отладке, проведении масштабных рефакторингов и ревью кода.
По стандартному бенчмарку SWE-bench Verified разница не особо заметна, 74.5% против старых 72.8%. Однако на внутреннем бенчмарке OpenAI на задачах рефакторинга модель стала гораздо лучше: прыжок с 33.9% до 51.3%!
Но и это не всё: модель стала писать меньше бесполезных или ошибочных комментариев, лучше ловить баги в коде, и... думать меньше, когда это не надо. OpenAI взяли запросы от сотрудников внутри компании и сравнили количество токенов в ответах двух моделей.
Там, где ответы были короткими, они стали ещё короче, а там, где цепочки рассуждений и сгенерированный код были длиннее — стало больше. Со слов OpenAI, во время они наблюдали, как GPT‑5-Codex работал автономно более 7 часов подряд над большими и сложными задачами, выполняя итерации по внедрению, исправляя ошибки тестирования и в конечном итоге обеспечивая успешное решение задачи.
Codex CLI и Codex Web получили кучу обновлений за последний месяц, но про них писать не буду.
В API модель появится скоро, очень ждём, пока замеряют качество и на других бенчмарках. В системной карточке модели указали лишь один — по решению многоступенчатых задачек по кибер-взлому (с соревнований CTF). Модель наконец-то статистически значимо обгоняет o3! Жаль, не замерили другие бенчмарки (вроде PaperBench).
...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно, если вы подписаны на любой тир ChatGPT. В комментариях многие отмечали, что им нравится больше, чем Claude Code, и модель работает лучше.
GPT-5 Codex дотренировали на новых сложных реальных задач, создании проектов с нуля, добавлении функций и тестов, отладке, проведении масштабных рефакторингов и ревью кода.
По стандартному бенчмарку SWE-bench Verified разница не особо заметна, 74.5% против старых 72.8%. Однако на внутреннем бенчмарке OpenAI на задачах рефакторинга модель стала гораздо лучше: прыжок с 33.9% до 51.3%!
Но и это не всё: модель стала писать меньше бесполезных или ошибочных комментариев, лучше ловить баги в коде, и... думать меньше, когда это не надо. OpenAI взяли запросы от сотрудников внутри компании и сравнили количество токенов в ответах двух моделей.
Там, где ответы были короткими, они стали ещё короче, а там, где цепочки рассуждений и сгенерированный код были длиннее — стало больше. Со слов OpenAI, во время они наблюдали, как GPT‑5-Codex работал автономно более 7 часов подряд над большими и сложными задачами, выполняя итерации по внедрению, исправляя ошибки тестирования и в конечном итоге обеспечивая успешное решение задачи.
Codex CLI и Codex Web получили кучу обновлений за последний месяц, но про них писать не буду.
В API модель появится скоро, очень ждём, пока замеряют качество и на других бенчмарках. В системной карточке модели указали лишь один — по решению многоступенчатых задачек по кибер-взлому (с соревнований CTF). Модель наконец-то статистически значимо обгоняет o3! Жаль, не замерили другие бенчмарки (вроде PaperBench).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🔥5
О, уже достали системный промпт для gpt-5-codex
Всегда интересно изучать, как к таким инструкциям подходят «создатели», чтобы применить/перенять подходы на практике.
Полный промпт доступен здесь
А если не знали, то этот спец первый на рынке, кто достаёт из всех моделей и агентов системные промпты и выкладывает их у себя здесь (огромная коллекция, там есть все-все). Если вам нужен промпт гайд “Как писать промпты” и всякие бест практисы, то лучше места не найти! Следить за новостями можно в его твиттере.
Всегда интересно изучать, как к таким инструкциям подходят «создатели», чтобы применить/перенять подходы на практике.
Полный промпт доступен здесь
А если не знали, то этот спец первый на рынке, кто достаёт из всех моделей и агентов системные промпты и выкладывает их у себя здесь (огромная коллекция, там есть все-все). Если вам нужен промпт гайд “Как писать промпты” и всякие бест практисы, то лучше места не найти! Следить за новостями можно в его твиттере.
1👍12❤7🔥4
Forwarded from InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
3 месяца ChatGPT Plus по цене за 1,5
Если у вас есть активная подписка ChatGPT Plus и привязана карта оплаты, можно получить 50% скидку за запрос отмены текущего плана. Правда только на квартал, а дальше снова по 20$ в месяц. Пробуйте🤔
Если у вас есть активная подписка ChatGPT Plus и привязана карта оплаты, можно получить 50% скидку за запрос отмены текущего плана. Правда только на квартал, а дальше снова по 20$ в месяц. Пробуйте
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍18🤣8🔥6🤔4
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI услышали фидбек о том, что GPT-5 Thinking иногда думает слишком долго
Теперь для Plus/Pro/Business пользователей добавили настройки скорости мышления:
Standard — новый режим по умоланию, баланс скорости и качества. Когда подумать нужно, но без усердий.
Extended — старый режим размышлений, когда модель думала секунд 30-40. Теперь его можно выставлять отдельно для задач по сложнее.
Light (только Pro) — быстро и по делу. Ризонинг, но на супер лайте.
Heavy (только Pro) — самый тяжелый режим размышлений, для самых сложных задач, решение которых не требует спешки с выводами и результатами.
И что удобно, настройка сохраняется между чатами (если выставили один режим, он не будет сбрасываться автоматически в новых чатах). Наконец-то можно выбирать между "дай ответ сейчас" и "подумай хорошенько" в зависимости от задачи.
Теперь для Plus/Pro/Business пользователей добавили настройки скорости мышления:
Standard — новый режим по умоланию, баланс скорости и качества. Когда подумать нужно, но без усердий.
Extended — старый режим размышлений, когда модель думала секунд 30-40. Теперь его можно выставлять отдельно для задач по сложнее.
Light (только Pro) — быстро и по делу. Ризонинг, но на супер лайте.
Heavy (только Pro) — самый тяжелый режим размышлений, для самых сложных задач, решение которых не требует спешки с выводами и результатами.
И что удобно, настройка сохраняется между чатами (если выставили один режим, он не будет сбрасываться автоматически в новых чатах). Наконец-то можно выбирать между "дай ответ сейчас" и "подумай хорошенько" в зависимости от задачи.
🔥11❤3
Наконец-то дошли руки допилить и запустить своего спам-бота (пока в тесте), который в чатике следит за спамом, “шлюхоботами” (кстати, в последнее время они у меня поутихли) и прочим мусором, и банит их. Решение принимает gpt-4o-mini.
Писал об этом еще в июле, в этом посте.
Тест провожу сразу в реальной среде “life mode on”, если вас забанит, напишите мне в личку😄
Эксперимент интересный, как наберу больше данных для анализа, расскажу. И да, гроза всех спамеров родилась сегодня! Надеюсь AI не подведёт😅
UPD: нужно тюнить юмор у AI, поспешил я с продом, поставил на паузу автобаны пока))
UPD UPD: попытка номер 2 запущена
Писал об этом еще в июле, в этом посте.
Тест провожу сразу в реальной среде “life mode on”, если вас забанит, напишите мне в личку
Эксперимент интересный, как наберу больше данных для анализа, расскажу. И да, гроза всех спамеров родилась сегодня! Надеюсь AI не подведёт
UPD: нужно тюнить юмор у AI, поспешил я с продом, поставил на паузу автобаны пока))
UPD UPD: попытка номер 2 запущена
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍16🔥6
Оформил подписку за $100 (была за $20) на Claude Code и прям второе дыхание открылось.
Начал постигать спек-дривен разработку (меньше вайба)
А еще запилил 2 MCP для работы с рекламным кабинетом Apple Search Ads и системой аналитики, где все данные по пользователям, когортам, подпискам, рекламной атрибуции. И теперь задаю вопрос в Claude Code по любым метрикам, аномалиям, он сам все данные с помощью MCP подгружает, анализирует, сопоставляет, догружает более узкие сегменты и в итоге делает выводы. Скоро еще и рекламными кампаниями будет управлять, бюджетами и ставками.
А я хотел для этого агентов городить. Шок! Теперь Claude Code для меня не просто инструмент для разработки, но еще и личный ассистент. Теперь буду стоить коллекцию MCP и сетку саб агентов, которые будут помогать мне каждый день по всем направлениям прямо в Claude Code. Такого поворота я не ожидал 😁
А у вас как выходные проходят? 😅
Начал постигать спек-дривен разработку (меньше вайба)
А еще запилил 2 MCP для работы с рекламным кабинетом Apple Search Ads и системой аналитики, где все данные по пользователям, когортам, подпискам, рекламной атрибуции. И теперь задаю вопрос в Claude Code по любым метрикам, аномалиям, он сам все данные с помощью MCP подгружает, анализирует, сопоставляет, догружает более узкие сегменты и в итоге делает выводы. Скоро еще и рекламными кампаниями будет управлять, бюджетами и ставками.
А я хотел для этого агентов городить. Шок! Теперь Claude Code для меня не просто инструмент для разработки, но еще и личный ассистент. Теперь буду стоить коллекцию MCP и сетку саб агентов, которые будут помогать мне каждый день по всем направлениям прямо в Claude Code. Такого поворота я не ожидал 😁
А у вас как выходные проходят? 😅
2🔥43❤4🤣4
Похоже, мы на пороге чего-то гораздо более крутого, чем просто ChatGPT. AGI (те самые ИИ-агенты, которые сами решают, что делать дальше) всё быстрее съедают ту нишу, где раньше жили ИИ-ассистенты. И в бигтехе это уже не эксперименты — там уже несколько лет внедряют ИИ в разработку.
3 октября в Москве будет любопытное событие как раз про все эти процессы. AI Boost 2025 — первая конференция в России, где честно расскажут, как AI реально ускоряет разработку, как именно использовать AI-ассистентов и как развиваются AI-агенты. Обещают много конкретики и никакой воды: расскажут про вайбкодинг в больших командах, автогенерацию тестов и кейсы внедрения ИИ в банковских процессах с нуля. Даже отдельный научный взгляд будет — о том, кто вообще «выживет» в новой реальности: человек или алгоритм.
Самое интересное для меня — круглые столы. На конференции соберутся эксперты от Сбера, Ozon и Positive Technologies и поговорят про то, как ускорять разработку без дыр в безопасности и ущерба бюджету и как проекты будут контролироваться государством. Второй стол — про то, как выглядит ИИ в продакшн на самом деле, и можно ли полностью доверить ИИ разработку сложных систем.
А вечером — фуршет, нетворкинг и стенд с ИИ-предсказателем, который покажет нам наше девелоперское будущее. Отдельная фишка — возможность получить консультацию от CTO Surf о внедрении ИИ в ваш проект.
В общем, если хочется понять, куда реально движется индустрия и как AI меняет саму профессию, рекомендую.
🗓 Когда: 3 октября 2025 года, 12:00
📍 Где: Москва, ДК «Рассвет»
👉 Подробнее и регистрация
Реклама. ИНН 3665812625, erid: 2VtzquXxE9z
3 октября в Москве будет любопытное событие как раз про все эти процессы. AI Boost 2025 — первая конференция в России, где честно расскажут, как AI реально ускоряет разработку, как именно использовать AI-ассистентов и как развиваются AI-агенты. Обещают много конкретики и никакой воды: расскажут про вайбкодинг в больших командах, автогенерацию тестов и кейсы внедрения ИИ в банковских процессах с нуля. Даже отдельный научный взгляд будет — о том, кто вообще «выживет» в новой реальности: человек или алгоритм.
Самое интересное для меня — круглые столы. На конференции соберутся эксперты от Сбера, Ozon и Positive Technologies и поговорят про то, как ускорять разработку без дыр в безопасности и ущерба бюджету и как проекты будут контролироваться государством. Второй стол — про то, как выглядит ИИ в продакшн на самом деле, и можно ли полностью доверить ИИ разработку сложных систем.
А вечером — фуршет, нетворкинг и стенд с ИИ-предсказателем, который покажет нам наше девелоперское будущее. Отдельная фишка — возможность получить консультацию от CTO Surf о внедрении ИИ в ваш проект.
В общем, если хочется понять, куда реально движется индустрия и как AI меняет саму профессию, рекомендую.
🗓 Когда: 3 октября 2025 года, 12:00
📍 Где: Москва, ДК «Рассвет»
👉 Подробнее и регистрация
Реклама. ИНН 3665812625, erid: 2VtzquXxE9z
🤣30❤5👍5🔥5😭3
Сэм Альтман как бы намекает нам: нужно больше золота!
Новые фичи, по его словам, будут жрать столько вычислений, что даже Pro за $200 баксов не покроет расходы. И вероятно новые прожорливые по компьюту фичи, будут продаваться отдельно.
Plus пользователи вообще видимо в пролете. За $20 теперь получишь только базовый ChatGPT, а все интересное уйдет в премиум тарифы или за доплату.
С одной сторой ход понятен. Обучение моделей стоит безумных денег, серверы тоже не бесплатные. Но получается странная ситуация, как с наркоманами. Сначала всех подсадили на ИИ по демократичной цене, теперь начинают выжимать максимум за каждую новую фичу.
Интересно посмотреть что там за фичи такие. Есть мысли?
Новые фичи, по его словам, будут жрать столько вычислений, что даже Pro за $200 баксов не покроет расходы. И вероятно новые прожорливые по компьюту фичи, будут продаваться отдельно.
Plus пользователи вообще видимо в пролете. За $20 теперь получишь только базовый ChatGPT, а все интересное уйдет в премиум тарифы или за доплату.
С одной сторой ход понятен. Обучение моделей стоит безумных денег, серверы тоже не бесплатные. Но получается странная ситуация, как с наркоманами. Сначала всех подсадили на ИИ по демократичной цене, теперь начинают выжимать максимум за каждую новую фичу.
Интересно посмотреть что там за фичи такие. Есть мысли?
😭20🍓8🤣5❤3👾1
Режим ultrathink в Claude Code порой забавный. Иногда мне кажется, что он немного понтуется передо мной 😃
“Четвертую задачу сделал, перехожу к пятой задаче. Ладно, на самом деле пятую я тоже уже сделал.”
Ну смешной😄
“Четвертую задачу сделал, перехожу к пятой задаче. Ладно, на самом деле пятую я тоже уже сделал.”
Ну смешной
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣33
Ого, зашел в свой канал под аккаунтом без Телеграм Премиум, а там…
Шок контент! Т.е такой огромный спам вы видите регулярно, кто без премиум подписки? Пол экрана занимает. Как так? Как это возможно? Несколько раз перезашел и каждый раз какие-то курсы там рекламят по нейросетям.
Пашка Дуров, лучше бы стену вернул!
Шок контент! Т.е такой огромный спам вы видите регулярно, кто без премиум подписки? Пол экрана занимает. Как так? Как это возможно? Несколько раз перезашел и каждый раз какие-то курсы там рекламят по нейросетям.
Пашка Дуров, лучше бы стену вернул!
😭38🤣15🔥3❤2👾2👍1