Технозаметки Малышева

OpenAI выпустила o3-mini: быстрее, умнее, доступнее

OpenAI только что представила o3-mini — новую модель в линейке рассуждающих (reasoning) систем.

- Модель заточена под STEM-задачи: математику, программирование и науку
- На сложных математических тестах (AIME 2024) o3-mini в режиме "high reasoning" достигает точности 83.6%
- В соревновательном программировании (Codeforces) набирает впечатляющие 2073 ELO
- Отвечает на 24% быстрее предшественника o1-mini: в среднем 7.7 секунд до первого ответа против 10.16

Интересный момент: впервые reasoning-модель станет доступна бесплатным пользователям ChatGPT. А для платных подписчиков втрое увеличили лимит — со скромных 50 до 150 сообщений в день.

OpenAI добавила в o3-mini поиск по интернету, хотя называют это "ранним прототипом".

Модель поддерживает три режима размышления (новое поле в API - reasoning effort): low, medium и high.
По сути, можно заставить её "думать усерднее" на сложных задачах или работать быстрее, когда важна скорость.

Для разработчиков особенно приятно появление function calling и Structured Outputs — теперь маленькая модель может делать почти всё, что умеет её старшая версия.

В общем, похоже на серьезную заявку в борьбе за рынок "умных, но экономных" AI-помощников.

Сэм обещал, - Сэм сделал. :)
Го тестировать!

В Веб версии пока нет. Модель доступна по API и в Playground

Называется o3-mini

Модель доступна только разработчикам 3-5 тира!
Если у вас молодой аккаунт - вам её пока не дадут.

ЦЕНЫ:
200k context length
Input: $1.10 / 1M tokens
Cached input: $0.55 / 1M tokens
Output: $4.40 / 1M tokens

#OpenAI #o3mini
———
@tsingular

🔥7

945 views19:23

Технозаметки Малышева

Forwarded from Сиолошная

Как бесплатным юзерам пользоваться o3-mini:

1) нужно зайти в аккаунт (это бесплатно, но нужен VPN из РФ) на chat.com

2) ввести свой запрос

3) нажать кнопочку «Reason» (на картинке)

4) Наслаждаться 10-60 секундами, пока модель думает над ответом

А если нажать кнопочку «Search», так она ещё и в интернете поищет! (правда пока функция экспериментальная и может плохо работать)

UPD: если кнопки нет — попробуйте а) обновить страницу б) перезайти в аккаунт в) сменить VPN (в EU пока у одного знакомого не работает). Если не помогло — попробуйте завтра, может быть конкретно до вас ещё не докатилось обновление.

👍7

835 views19:57

Технозаметки Малышева

В платной версии бота @cloud_gpt_bot включён o3-mini

#dev #o3-mini
———
@tsingular

👍5🔥4

832 views21:02

Технозаметки Малышева

Ну все. AGI достигнут, считаю 😀

@cloud_gpt_bot

#o3mini
------
@tsingular

❤8👍8😁4🔥1👀1

979 viewsedited 22:16

Технозаметки Малышева

Хорошие новости.

Cursor раздаёт o3-mini бесплатно!

Но народ все ещё предпочитает Sonnet 😀😃🙂

Пользуемся, пока не прикрыли.

#Cursor #o3mini
------
@tsingular

✍4👍2🔥2

893 viewsedited 22:29

Технозаметки Малышева

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Примеры кода, который o3-mini создаёт с 1 запроса.

Промпт:

write a script for 100 bouncing yellow balls within a sphere, make sure to handle collision detection properly. 
each collision changes color of collided balls.
the closer balls to the sphere's center - the less radius they have, up until 50% of their initial sizes
make the sphere slowly rotate. 
make sure balls stays within the sphere.  
implement it in p5.js
All code must be in single html file

Исходник в комментарии

#o3mini #dev #demo
———
@tsingular

👍9🔥6🍓5❤2

975 viewsedited 04:07

Технозаметки Малышева

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

Мини-курс по LLM с проверкой ответов в формате интерактивной презентации создан за 1 запрос:

напиши интерактивную презентацию с React
расскажи для новичков как устроены LLM модели.
Визуально покажи детали их работы.
используй интерактивные возможности по-максимуму чтобы сделать презентацию красивой и интересной.
добавь в конце проверочные вопросы.
весь код должен быть в 1 html файле

Результат в комментарии

#o3mini #demo
———
@tsingular

🔥20👍3🆒3

914 views04:40

Технозаметки Малышева

0:30

Media is too big

VIEW IN TELEGRAM

Ещё один пример - интерактивные графики.

Тоже с 1 запроса:

Создай шаблон-пример интерактивного 3D дашборда на three.js
Разработай информативную и визуально эффектную панель, где данные превращаются в динамические 3D графики, диаграммы и карты. Пользователи смогут изменять параметры в реальном времени, настраивать фильтры и наблюдать за изменениями, что демонстрирует возможности сложной визуализации.
создай шаблонные данные, чтобы демонстрация была полной
весь код должен быть в 1 html файле

Итоговый html в комментарии

#o3mini #demo
———
@tsingular

👍9🔥6

975 views05:01

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

А вот еще огонь.

Попросил наглядно показать как TF-IDF устроен.

Промпт:

напиши визуальную демонстрацию процесса tfidf.
технически достоверную и понятную.
Используй код по максимуму, чтобы нагляднее раскрыть детали процесса на комплексном примере
используй three.js
Проверь, чтобы результат был видимым и объекты не перекрывали друг друга
весь код должен быть в 1 html

Т.е. запросы больше к описательной части.
Что такое tf-idf он и без меня знает и может пояснить.

И для примера что по ровно тому же промпту выдал Sonnet.

Оба кода в комментарии

#o3mini #tfidf #demo
———
@tsingular

🔥7❤‍🔥2👍2

1.3K views05:29

Технозаметки Малышева

🔐 Deepseek взломан ещё раз: Как Wallarm раскрыл все секреты китайского AI

Исследователи Wallarm разобрали Deepseek на запчасти, и результаты просто 🔥

Главное:
Удалось полностью извлечь системный промпт!

В коде нашли следы использования моделей OpenAI

Выявили работоспособность 5 основных техник джейлбрейка, включая самые хитрые - от токен-смаглинга до мульти-агентных атак. (на защиту, похоже, вообще забили)

Самое забавное - после взлома Deepseek внезапно стал болтливым и признался в использовании технологий OpenAI для обучения. 😅

Интересно так же разобрано сравнение промптов OpenAI и Deepseek:

OpenAI более гибкий, поощряет критическое мышление
Deepseek жёстко цензурирует и избегает спорных тем

Wallarm кстати предлагает бесплатное тестирование на джейлбрейк для компаний.
Нашим бы ИБ компаниям тоже не мешало подумать в эту сторону.
Проблема, скорее всего, массовая.

#AIsecurity #Deepseek #Wallarm #jailbreak
———
@tsingular

✍8😢5❤‍🔥2👍2

1.2K views06:01

Технозаметки Малышева

Forwarded from эйай ньюз

У ChatGPT 15,5 миллионов платных подписчиков

По данным The Information, сентября добавилось более 4 миллионов подписчиков. Их доля общем количестве юзеров не растёт и составляет около 5%, а рост в количестве подписчиков обусловлен ростом юзербазы, которая за 2024 год утроилась.

А вот выручка с подписчика растёт - Pro подписка уже приносит больше выручки чем Enterprise, то есть количество Pro подписчиков уже измеряется в сотнях тысяч. При этом всём, по заявлениям Сэма Альтмана, подписка месяц назад была убыточной - OpenAI не расчитывали на такое активное использование. При таких вводных подписка в $2,000 звучит уже не так безумно как несколько месяцев назад.

Ещё быстрее подписок росла выручка с API - за 2024 она выросла в 7 раз, при том что компания несколько раз за 2024 год сбрасывала цены. Вот вам и наглядная иллюстрация парадокса Джевонса.

При этом всём, сколько именно зарабатывают сейчас OpenAI понять трудно. Хоть мы и знаем, что за первое полугодие 2024 проекция выручки удвоилась до $3,4 миллиарда долларов в год, но как повлияли на выручку запуск Voice API и o1 - незвестно. Зато известно что переговоры про новый раунд инвестиций размером в $40 миллиардов, ведутся уже при оценке компании в $260 миллиардов, что на 73% выше оценки в октябре 2024

@ai_newz

✍3

1.06K views13:04

Технозаметки Малышева

США хотят "отключить" свои AI-технологии от Китая

Сенатор Josh Hawley представил радикальный законопроект, который может серьезно изменить ландшафт AI-разработок. И не в лучшую сторону.

Ключевые моменты:

Тотальный запрет 🚫

Запрещает любое AI-сотрудничество с китайскими организациями

Причем ЛЮБОЕ - нет разделения по уровню риска или мощности AI

Касается как экспорта, так и импорта (впервые в истории!)

Драконовские штрафы 💰
До $100 млн для компаний
До $1 млн для физлиц

Плюс утроенный размер ущерба

Для неграждан США - риск депортации

Потенциальные жертвы:
Под удар попадает весь open source AI

Студенты из Китая не смогут участвовать даже в совместных научных статьях

Разработчики не смогут контролировать, кто скачивает их открытые модели

Побочные эффекты - глобальны! 🌍

Может привести к изоляции США в AI-исследованиях

Вероятно усиление зависимости других стран от китайских технологий

Ударит больше по малым компаниям и исследователям, чем по Big Tech

Забавно, что это республиканская инициатива - она жестче, чем любые предложения Байдена или ЕС. Похоже, в попытке "отключиться" от Китая США рискуют отключить себя от глобального AI-сообщества.

Вопрос: действительно ли такая "китайская стена" (но это со стороны США) в мире AI возможна? И не получится ли, что вместо защиты американских интересов мы увидим расцвет китайских AI-компаний? 🤔

Источники:
Twitter

Законопроект
Файл в комментариях

#Китай #США #законы
———
@tsingular

🤔11😈5👍2👨‍💻1

1.42K views11:28

Технозаметки Малышева

Дарю лайфхак:

o3-mini отлично пишет код в части архитектуры, но есть косяки с синтаксисом.

Claude Sonnet 3.5 - качественно его полирует на предмет финальных ошибок.

Вместе эффективнее.
Народ там для этого уже фреймворки пилит, но я как-то не вижу смысла в таких вещах.

#Claude #OpenAI #dev
———
@tsingular

👍11❤‍🔥5

1.16K views14:09

Технозаметки Малышева

0:58

This media is not supported in your browser

VIEW IN TELEGRAM

🔬 Новая фича Deep Research от OpenAI

OpenAI представила новую функцию Deep Research для ChatGPT - возможность глубокого исследования темы с анализом множества источников.

Возможности:
- Глубокий веб-поиск с анализом источников
- Работа с загруженными файлами
- Создание подробных аналитических отчётов
- Пошаговое объяснение своих выводов
- Поддержка разных форматов вывода (таблицы, списки, текст)

Ограничения:
- Только для Pro-подписчиков
- Лимит 100 запросов в месяц (из-за высокой вычислительной нагрузки)
- Пока нет доступа для UK и ЕЭС
- Может занимать много времени на обработку ( ~30 минут)

Технические особенности:
- Использует улучшенную версию модели OpenAI o3
- Требует огромных вычислительных ресурсов
- Умеет верифицировать источники
- Может создавать артефакты (графики, код, SVG)

Планы развития:
- Скоро выйдет облегчённая версия
- Добавят поддержку специализированных источников данных (корпоративных в т.ч.)
- Планируют интеграцию с подпиской Plus и Team
- Обещают релиз на мобильных устройствах

Звучит круто, но... знакомо :)
DeepSeek уже месяц как запустил аналогичную функциональность через связку DeepThink + WebSearch. И работает, надо сказать, весьма неплохо!

Но самое интересное - подобные решения уже давно существуют на уровне энтузиастов и небольших проектов. Например, уже больше года такой функционал доступен у меня в ботах. А пол года назад я даже накидал локального "Исследователя" для личных целей, который за ночь может сгенерировать 120-страничный отчет с анализом 5000+ источников. И все это на обычном домашнем GPU!

Т.е. OpenAI, имея миллиардные инвестиции, выпускает функционал, который по сути можно было реализовать на уровне студенческого проекта.

При этом их решение требует космических вычислительных ресурсов - настолько, что даже Pro-пользователям дают только 100 запросов в месяц.

В общем, складывается впечатление, что OpenAI просто "догоняет" существующие решения, но с большим шумом и пафосом. А ведь от компании с такими ресурсами хотелось бы видеть что-то действительно инновационное!

Метрики выглядят интересно, пожалуй.
Humanity Last Exam 26.6%

#OpenAI #AI #DeepResearch #Research
———
@tsingular

👍8❤‍🔥6❤1

3.34K views05:59

About

Blog

Apps

Platform