Perforum macro

xAI вступил в ИИ-гонку

В прямом эфире от xAI Илона Маска презентовали новую модель Grok 3. По отчету в ряде задач модель превосходит своих основных конкурентов GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3 (а судя по llmarena.ai обходит всех, включая DeepSeek-R1, o1, o3-mini)

Более продвинутая модель чат-бота использует ресурсы xAI Colossus (мегакомпьютер с 200 тыс. чипов H100), а обучали модель с использованием расширенного набора данных, в том числе документы судебных дел.

xAI отметили, что их новая модель превосходит аналоги по бенчмаркам в математике (AIME) и науке (QPQA) о которых мы говорили ранее, а также по программированию (Coding LCB).

Заметно также, что Grok-3-Reasoning отстаёт от Grok-3-Mini-Reasoning, по словам xAI из-за того что Mini модель тренировали значительно дольше.

Стоит отметить еще то, что в рассуждающей версии скрыли некоторую часть рассуждений, чтобы предотвратить метод дистилляции, используя который другие разработчики могут извлекать знания для других моделей.

⚡️UPDATE: Модель grok 3 c DeepSearch сейчас доступна бесплатно на https://x.com/i/grok (нужно залогинитья в x, нужен VPN)

#LLM #grok3 #AI
Путь ИИ

225 views11:45

About

Blog

Apps

Platform