Machine learning Interview

Почему GPT-5 обучался меньше, чем GPT-4.5

Меньше pre-training, больше post-training.

Обычно модели тратили в ~100 раз больше вычислений на предобучение, чем на дообучение.

В GPT-5 ситуация изменилась: масштабирование post-training оказалось выгоднее по качеству на доллар.

- Ключевые факты:
- GPT-5 учился на меньшей базе, но с сильным упором на дообучение.
- Методы reasoning-ориентированного post-training позволяют сократить предобучение примерно в 10 раз при сохранении качества.
- В 2024 году бюджет R&D-вычислений OpenAI был ~$5B, в 2025 вырос до ~$9B.

- Почему не масштабировали как GPT-4.5?
Для безопасного увеличения post-training нужны огромные датасеты задач, среда для RL и длинные циклы экспериментов. Из-за конкуренции OpenAI решила выпустить GPT-5 быстрее, «выжав» максимум из post-training на меньшей модели.

👉 Вероятно, GPT-6 вернётся к большему pre-training + post-training, чтобы раскрыть потенциал масштабирования.

🔬 Новый отчёт от Epoch AI: https://epoch.ai/gradient-updates/why-gpt5-used-less-training-compute-than-gpt45-but-gpt6-probably-wont

👍17❤7🔥5🤣3

3.8K views10:53

Machine learning Interview

Forwarded from Machinelearning

🚀 DeepSeek-V3.2-Exp - вышла новая экспериментальная версия

⚡ Главное:
- Основана на V3.1-Terminus
- Новый механизм Sparse Attention (DSA) → быстрее и дешевле работа с длинными контекстами
- Качество почти без потерь, производительность как у V3.1
- 💰 API подешевел более чем на 50%

📊 V3.1 пока ещё будет доступна до 15 октября 2025.

🔗 Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp)
🔗 Tech Report: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf)
🔗Github: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

@ai_machinelearning_big_data

#DeepSeek #AI #V32 #SparseAttention #LLM

❤2👍2🤔2

3.59K views10:23

Machine learning Interview

1:59

Media is too big

VIEW IN TELEGRAM

⚡️ Сэм Альтман о том, почему энергию на ИИ тратить необходимо

💡 Даже если ИИ будет потреблять сотни мегаватт или гигаватты, это оправдано, если он поможет открыть дешёвый и эффективный ядерный синтез и заменить тысячи ГВт углеродной генерации по всему миру.

🌍 «Мы обречены, если не найдём новые научные решения климатического кризиса. Без ИИ мы делаем это слишком медленно. Давайте попробуем с ним».

🔋 Альтман подчёркивает, что современные модели уже очень эффективны по метрике *watts per token* — и в сравнении с энергозатратами человека на размышления выглядят даже выгоднее.

📜 Он сравнил это с Google: в начале компанию критиковали за энергопотребление, но один поисковый запрос тратил куда меньше ресурсов, чем поездка в библиотеку.

👉 Если ИИ поможет найти дешёвый синтез, польза для климата многократно превысит его энергозатраты.

🤣31❤21👍11✍3🌭3🔥2

4.5K views12:17

Machine learning Interview

⚡ Менять автоэнкодер в latent diffusion моделях проще, чем кажется.

🚀 DC-Gen — это новый фреймворк для ускорения диффузионных моделей после обучения.
Он переводит любую готовую модель в глубоко сжатое латентное пространство, снижая затраты и многократно ускоряя генерацию.

🔑 Основное
- Высокое разрешение без потерь качества
Версия DC-Gen-FLUX.1-Krea-12B выдаёт то же качество, что и оригинал, но работает в 53 раза быстрее на H100 при 4K.
С NVFP4 картинка 4K генерируется всего за 3.5 секунды на одной NVIDIA 5090 (20 шагов).
- 💸 Низкая стоимость адаптации
Перевод FLUX.1-Krea-12B в глубоко-сжатый автоэнкодер требует всего 40 GPU-дней на H100.

📄 Статья: https://arxiv.org/abs/2509.25180
💻 Код: https://github.com/dc-ai-projects/DC-Gen
🎨 Модели : https://huggingface.co/collections/dc-ai/dc-gen-6899bb095082244f396203e1

#diffusion #deeplearning #AI

🔥10❤3😁2🤝2🥰1

4.24K views11:03

Machine learning Interview

😂 Сэм Альтман:

🗣️ Две недели назад:
“Нам нужно $7 трлн и 10 ГВт энергии, чтобы победить рак.”

🗣️ Сегодня:
“Мы запускаем соц сеть для персонализированного нейрослопа

#AI #OpenAI #Altman

😁50🤣7🏆2💊2🆒1

4.52K views14:27

Machine learning Interview

🚀 В ByteDance Seed представили новую технику для обучения LLM - Knapsack RL

Проблема: в классическом RL-тренинге распределение rollout-ов идёт равномерно.

✅ Простые задачи всегда решаются → нет градиента

❌ Сложные задачи всегда проваливаются → тоже нет градиента

💡 Решение: рассматривать exploration как задачу рюкзака (knapsack) и распределять вычислительный бюджет туда, где это реально даёт сигнал обучения.

✨ Результаты:

🔼 +20–40% больше ненулевых градиентов

🧮 До 93 rollout-ов на сложные задачи (без доп. вычислений)

📈 +2–4 средних балла, до +9 на пике в математических бенчмарках

💰 ~в 2 раза дешевле, чем равномерное распределение

📄 Подробности: huggingface.co/papers/2509.25849

👍13❤9🔥2

4.7K views10:10

Machine learning Interview

🛰 ComputerRL - новый фреймворк, который учит AI-агентов работать с компьютером так же, как это делает человек.

Главная идея - парадигма API-GUI: агент может и вызывать API, и кликать по кнопкам интерфейса. Благодаря этому исчезает разрыв между машинной автоматизацией и привычным для человека рабочим столом.

Команда Zai проверила ComputerRL на модели GLM-4-9B-0414 и протестировала её на бенчмарке OSWorld. Результат — новый агент AutoGLM-OS-9B, который достиг рекордной точности и уверенно решает задачи автоматизации в desktop-средах.

Проще говоря: теперь AI может не только «понимать» компьютер, но и полноценно работать с ним — запускать программы, управлять окнами и выполнять сложные действия.

📌 Статья
📌 Проект

❤13👍5🔥3

4.74K views13:02

Machine learning Interview

🎯 Новый вектор атак на ИИ — скрытые промпты в картинках

Trail of Bits показали, что хакеры могут прятать инструкции в изображениях. Пока картинка оригинального размера — всё чисто.

Но как только сервис (например, Gemini CLI или **Vertex AI Studio**) автоматически сжимает её, проявляется скрытый текст.

📌 Что это значит:
- ИИ «видит» спрятанный промпт и исполняет его, думая, что это команда пользователя.
- Так можно обойти фильтры и заставить модель делать то, что задумал атакующий.

🛠 Как защититься:
- Инструмент Anamorpher (open-source) для генерации и проверки таких атак.
- Защита: многоуровневая проверка картинок и отслеживание артефактов при масштабировании.

⚠️ Итог: даже безобидная картинка может оказаться «троянским конем» для ИИ-систем.

🔗Github: https://github.com/trailofbits/anamorpher
🔗 Подробнее: blog.trailofbits.com/2025/08/21/weaponizing-image-scaling-against-production-ai-systems/

#AI #Security #PromptInjection #TrailOfBits

🔥22👍9❤5

4.52K views13:00

Machine learning Interview

1:12

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Генерация видео из кода с Code2Video

Code2Video предлагает инновационный подход к созданию образовательных видео на основе кода. Проект позволяет визуализировать программные концепции, превращая код в наглядные видеоматериалы, что упрощает обучение и понимание.

🚀Основные моменты:
- Генерация видео на основе программного кода.
- Поддержка различных учебных тем.
- Визуализация сложных концепций в доступной форме.
- Открытый доступ к проекту и данным.

📌 GitHub: https://github.com/showlab/Code2Video

#python

🔥23❤10😁3😭3🥰1

4.65K views10:02

Machine learning Interview

🔮 IREE — мост между ML-моделями и железом

Это не просто очередной фреймворк, а целая экосистема для компиляции ML-моделей в универсальное промежуточное представление, которое одинаково хорошо работает и в дата-центрах, и на мобильных устройствах.

Основанный на MLIR инструмент привлёк внимание крупных игроков: AMD использовала его для участия в MLPerf с реализацией SDXL, а сам проект вошёл в LF AI & Data Foundation. Для тех, кто хочет разобраться глубже с его использованием, есть записи выступлений на AsiaLLVM и Vulkanised.

🤖 GitHub

@machinelearning_interview

❤10👍4🥰2

3.93K views13:01

Machine learning Interview

⚡️

Elon Musk’s xAI готовится привлечь $20 млрд — включая $7.5 млрд в виде equity и до $12.5 млрд в виде долга.

Что показано:
- NVIDIA может инвестировать до $2 млрд в equity, причём эта часть финансирована с привязкой к GPU-закупкам.
- Структура сделки включает SPV, которая купит GPU, а сама компания xAI будет их арендовать на пять лет.

Почему это важно:
- схема снижает начальные капитальные затраты xAI — вместо покупки GPU сразу, они арендуют, что даёт гибкость.
- крупный партнёр вроде NVIDIA усиливает доверие к проекту и подчёркивает, что аппаратная база остаётся ключевым фактором в развитии ИИ.
- сочетание equity и долга в таких объёмах говорит о масштабном расширении инфраструктуры и серьёзных вычислительных мощностях.

Возможные риски / вопросы:
- зависимость от условий аренды: стоимость, обеспечение, апгрейды, срок замены оборудования.
- долговая нагрузка может быть большой, особенно если доходы xAI не вырастут по плану.
- риск устаревания оборудования: GPU-поколения меняются, и оборудование может устареть до конца пятилетнего срока аренды.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍5❤3

4.22K views10:50

Machine learning Interview

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

Сэм Альтман рассказал очень любопытную деталь о Sora.

Многие правообладатели наоборот хотят, чтобы их персонажи чаще использовались в видео, созданных с помощью Sora.

Пока OpenAI старается провести грань между конфиденциальностью и защитой, владельцы прав всё чаще просят больше открытости и видимости.

Они поняли, что когда пользователи создают креативные или вирусные видео с их персонажами, это повышает вовлечённость аудитории и популярность франшиз.

Ограничивая использование, можно потерять охват - поэтому для многих теперь открытость стала выгодой, а не угрозой.

🟠

Полное интервью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18😁10❤5🔥4

4.36K views11:31

About

Blog

Apps

Platform