Технозаметки Малышева
9.03K subscribers
3.91K photos
1.46K videos
41 files
4.08K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
OpenAI выпустила o3-mini: быстрее, умнее, доступнее

OpenAI только что представила o3-mini — новую модель в линейке рассуждающих (reasoning) систем.

- Модель заточена под STEM-задачи: математику, программирование и науку
- На сложных математических тестах (AIME 2024) o3-mini в режиме "high reasoning" достигает точности 83.6%
- В соревновательном программировании (Codeforces) набирает впечатляющие 2073 ELO
- Отвечает на 24% быстрее предшественника o1-mini: в среднем 7.7 секунд до первого ответа против 10.16

Интересный момент: впервые reasoning-модель станет доступна бесплатным пользователям ChatGPT. А для платных подписчиков втрое увеличили лимит — со скромных 50 до 150 сообщений в день.

OpenAI добавила в o3-mini поиск по интернету, хотя называют это "ранним прототипом".

Модель поддерживает три режима размышления (новое поле в API - reasoning effort): low, medium и high.
По сути, можно заставить её "думать усерднее" на сложных задачах или работать быстрее, когда важна скорость.

Для разработчиков особенно приятно появление function calling и Structured Outputs — теперь маленькая модель может делать почти всё, что умеет её старшая версия.

В общем, похоже на серьезную заявку в борьбе за рынок "умных, но экономных" AI-помощников.

Сэм обещал, - Сэм сделал. :)
Го тестировать!

В Веб версии пока нет. Модель доступна по API и в Playground

Называется o3-mini

Модель доступна только разработчикам 3-5 тира!
Если у вас молодой аккаунт - вам её пока не дадут.

ЦЕНЫ:
200k context length
Input: $1.10 / 1M tokens
Cached input: $0.55 / 1M tokens
Output: $4.40 / 1M tokens

#OpenAI #o3mini
———
@tsingular
🔥7
Forwarded from Сиолошная
Как бесплатным юзерам пользоваться o3-mini:

1) нужно зайти в аккаунт (это бесплатно, но нужен VPN из РФ) на chat.com

2) ввести свой запрос

3) нажать кнопочку «Reason» (на картинке)

4) Наслаждаться 10-60 секундами, пока модель думает над ответом

А если нажать кнопочку «Search», так она ещё и в интернете поищет! (правда пока функция экспериментальная и может плохо работать)

UPD: если кнопки нет — попробуйте а) обновить страницу б) перезайти в аккаунт в) сменить VPN (в EU пока у одного знакомого не работает). Если не помогло — попробуйте завтра, может быть конкретно до вас ещё не докатилось обновление.
👍7
В платной версии бота @cloud_gpt_bot включён o3-mini

#dev #o3-mini
———
@tsingular
👍5🔥4
Ну все. AGI достигнут, считаю 😀

@cloud_gpt_bot

#o3mini
------
@tsingular
8👍8😁4🔥1👀1
Хорошие новости.

Cursor раздаёт o3-mini бесплатно!

Но народ все ещё предпочитает Sonnet 😀😃🙂

Пользуемся, пока не прикрыли.

#Cursor #o3mini
------
@tsingular
4👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Примеры кода, который o3-mini создаёт с 1 запроса.

Промпт:
write a script for 100 bouncing yellow balls within a sphere, make sure to handle collision detection properly. 
each collision changes color of collided balls.
the closer balls to the sphere's center - the less radius they have, up until 50% of their initial sizes
make the sphere slowly rotate.
make sure balls stays within the sphere.
implement it in p5.js
All code must be in single html file


Исходник в комментарии

#o3mini #dev #demo
———
@tsingular
👍9🔥6🍓52
This media is not supported in your browser
VIEW IN TELEGRAM
Мини-курс по LLM с проверкой ответов в формате интерактивной презентации создан за 1 запрос:

напиши интерактивную презентацию с React
расскажи для новичков как устроены LLM модели.
Визуально покажи детали их работы.
используй интерактивные возможности по-максимуму чтобы сделать презентацию красивой и интересной.
добавь в конце проверочные вопросы.
весь код должен быть в 1 html файле


Результат в комментарии

#o3mini #demo
———
@tsingular
🔥20👍3🆒3
Media is too big
VIEW IN TELEGRAM
Ещё один пример - интерактивные графики.

Тоже с 1 запроса:
Создай шаблон-пример интерактивного 3D дашборда на three.js
Разработай информативную и визуально эффектную панель, где данные превращаются в динамические 3D графики, диаграммы и карты. Пользователи смогут изменять параметры в реальном времени, настраивать фильтры и наблюдать за изменениями, что демонстрирует возможности сложной визуализации.
создай шаблонные данные, чтобы демонстрация была полной
весь код должен быть в 1 html файле


Итоговый html в комментарии

#o3mini #demo
———
@tsingular
👍9🔥6
А вот еще огонь.

Попросил наглядно показать как TF-IDF устроен.

Промпт:
напиши визуальную демонстрацию процесса tfidf.
технически достоверную и понятную.
Используй код по максимуму, чтобы нагляднее раскрыть детали процесса на комплексном примере
используй three.js
Проверь, чтобы результат был видимым и объекты не перекрывали друг друга
весь код должен быть в 1 html


Т.е. запросы больше к описательной части.
Что такое tf-idf он и без меня знает и может пояснить.

И для примера что по ровно тому же промпту выдал Sonnet.

Оба кода в комментарии

#o3mini #tfidf #demo
———
@tsingular
🔥7❤‍🔥2👍2
🔐 Deepseek взломан ещё раз: Как Wallarm раскрыл все секреты китайского AI

Исследователи Wallarm разобрали Deepseek на запчасти, и результаты просто 🔥

Главное:
Удалось полностью извлечь системный промпт!

В коде нашли следы использования моделей OpenAI

Выявили работоспособность 5 основных техник джейлбрейка, включая самые хитрые - от токен-смаглинга до мульти-агентных атак. (на защиту, похоже, вообще забили)

Самое забавное - после взлома Deepseek внезапно стал болтливым и признался в использовании технологий OpenAI для обучения. 😅

Интересно так же разобрано сравнение промптов OpenAI и Deepseek:

OpenAI более гибкий, поощряет критическое мышление
Deepseek жёстко цензурирует и избегает спорных тем

Wallarm кстати предлагает бесплатное тестирование на джейлбрейк для компаний.
Нашим бы ИБ компаниям тоже не мешало подумать в эту сторону.
Проблема, скорее всего, массовая.

#AIsecurity #Deepseek #Wallarm #jailbreak
———
@tsingular
8😢5❤‍🔥2👍2
Forwarded from эйай ньюз
У ChatGPT 15,5 миллионов платных подписчиков

По данным The Information, сентября добавилось более 4 миллионов подписчиков. Их доля общем количестве юзеров не растёт и составляет около 5%, а рост в количестве подписчиков обусловлен ростом юзербазы, которая за 2024 год утроилась.

А вот выручка с подписчика растёт - Pro подписка уже приносит больше выручки чем Enterprise, то есть количество Pro подписчиков уже измеряется в сотнях тысяч. При этом всём, по заявлениям Сэма Альтмана, подписка месяц назад была убыточной - OpenAI не расчитывали на такое активное использование. При таких вводных подписка в $2,000 звучит уже не так безумно как несколько месяцев назад.

Ещё быстрее подписок росла выручка с API - за 2024 она выросла в 7 раз, при том что компания несколько раз за 2024 год сбрасывала цены. Вот вам и наглядная иллюстрация парадокса Джевонса.

При этом всём, сколько именно зарабатывают сейчас OpenAI понять трудно. Хоть мы и знаем, что за первое полугодие 2024 проекция выручки удвоилась до $3,4 миллиарда долларов в год, но как повлияли на выручку запуск Voice API и o1 - незвестно. Зато известно что переговоры про новый раунд инвестиций размером в $40 миллиардов, ведутся уже при оценке компании в $260 миллиардов, что на 73% выше оценки в октябре 2024

@ai_newz
3
США хотят "отключить" свои AI-технологии от Китая

Сенатор Josh Hawley представил радикальный законопроект, который может серьезно изменить ландшафт AI-разработок. И не в лучшую сторону.

Ключевые моменты:

Тотальный запрет 🚫

Запрещает любое AI-сотрудничество с китайскими организациями

Причем ЛЮБОЕ - нет разделения по уровню риска или мощности AI

Касается как экспорта, так и импорта (впервые в истории!)

Драконовские штрафы 💰
До $100 млн для компаний
До $1 млн для физлиц

Плюс утроенный размер ущерба

Для неграждан США - риск депортации

Потенциальные жертвы:
Под удар попадает весь open source AI

Студенты из Китая не смогут участвовать даже в совместных научных статьях

Разработчики не смогут контролировать, кто скачивает их открытые модели

Побочные эффекты - глобальны! 🌍

Может привести к изоляции США в AI-исследованиях

Вероятно усиление зависимости других стран от китайских технологий

Ударит больше по малым компаниям и исследователям, чем по Big Tech

Забавно, что это республиканская инициатива - она жестче, чем любые предложения Байдена или ЕС. Похоже, в попытке "отключиться" от Китая США рискуют отключить себя от глобального AI-сообщества.

Вопрос: действительно ли такая "китайская стена" (но это со стороны США) в мире AI возможна? И не получится ли, что вместо защиты американских интересов мы увидим расцвет китайских AI-компаний? 🤔

Источники:
Twitter

Законопроект
Файл в комментариях

#Китай #США #законы
———
@tsingular
🤔11😈5👍2👨‍💻1
Дарю лайфхак:

o3-mini отлично пишет код в части архитектуры, но есть косяки с синтаксисом.

Claude Sonnet 3.5 - качественно его полирует на предмет финальных ошибок.

Вместе эффективнее.
Народ там для этого уже фреймворки пилит, но я как-то не вижу смысла в таких вещах.

#Claude #OpenAI #dev
———
@tsingular
👍11❤‍🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 Новая фича Deep Research от OpenAI

OpenAI представила новую функцию Deep Research для ChatGPT - возможность глубокого исследования темы с анализом множества источников.

Возможности:
- Глубокий веб-поиск с анализом источников
- Работа с загруженными файлами
- Создание подробных аналитических отчётов
- Пошаговое объяснение своих выводов
- Поддержка разных форматов вывода (таблицы, списки, текст)

Ограничения:
- Только для Pro-подписчиков
- Лимит 100 запросов в месяц (из-за высокой вычислительной нагрузки)
- Пока нет доступа для UK и ЕЭС
- Может занимать много времени на обработку ( ~30 минут)

Технические особенности:
- Использует улучшенную версию модели OpenAI o3
- Требует огромных вычислительных ресурсов
- Умеет верифицировать источники
- Может создавать артефакты (графики, код, SVG)

Планы развития:
- Скоро выйдет облегчённая версия
- Добавят поддержку специализированных источников данных (корпоративных в т.ч.)
- Планируют интеграцию с подпиской Plus и Team
- Обещают релиз на мобильных устройствах

Звучит круто, но... знакомо :)
DeepSeek уже месяц как запустил аналогичную функциональность через связку DeepThink + WebSearch. И работает, надо сказать, весьма неплохо!

Но самое интересное - подобные решения уже давно существуют на уровне энтузиастов и небольших проектов. Например, уже больше года такой функционал доступен у меня в ботах. А пол года назад я даже накидал локального "Исследователя" для личных целей, который за ночь может сгенерировать 120-страничный отчет с анализом 5000+ источников. И все это на обычном домашнем GPU!

Т.е. OpenAI, имея миллиардные инвестиции, выпускает функционал, который по сути можно было реализовать на уровне студенческого проекта.

При этом их решение требует космических вычислительных ресурсов - настолько, что даже Pro-пользователям дают только 100 запросов в месяц.

В общем, складывается впечатление, что OpenAI просто "догоняет" существующие решения, но с большим шумом и пафосом. А ведь от компании с такими ресурсами хотелось бы видеть что-то действительно инновационное!

Метрики выглядят интересно, пожалуй.
Humanity Last Exam 26.6%

#OpenAI #AI #DeepResearch #Research
———
@tsingular
👍8❤‍🔥61