Forwarded from Путь ИИ
xAI вступил в ИИ-гонку
В прямом эфире от xAI Илона Маска презентовали новую модель Grok 3. По отчету в ряде задач модель превосходит своих основных конкурентов GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3 (а судя по llmarena.ai обходит всех, включая DeepSeek-R1, o1, o3-mini)
Более продвинутая модель чат-бота использует ресурсы xAI Colossus (мегакомпьютер с 200 тыс. чипов H100), а обучали модель с использованием расширенного набора данных, в том числе документы судебных дел.
xAI отметили, что их новая модель превосходит аналоги по бенчмаркам в математике (AIME) и науке (QPQA) о которых мы говорили ранее, а также по программированию (Coding LCB).
Заметно также, что Grok-3-Reasoning отстаёт от Grok-3-Mini-Reasoning, по словам xAI из-за того что Mini модель тренировали значительно дольше.
Стоит отметить еще то, что в рассуждающей версии скрыли некоторую часть рассуждений, чтобы предотвратить метод дистилляции, используя который другие разработчики могут извлекать знания для других моделей.
⚡️UPDATE: Модель grok 3 c DeepSearch сейчас доступна бесплатно на https://x.com/i/grok (нужно залогинитья в x, нужен VPN)
#LLM #grok3 #AI
Путь ИИ
В прямом эфире от xAI Илона Маска презентовали новую модель Grok 3. По отчету в ряде задач модель превосходит своих основных конкурентов GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3 (а судя по llmarena.ai обходит всех, включая DeepSeek-R1, o1, o3-mini)
Более продвинутая модель чат-бота использует ресурсы xAI Colossus (мегакомпьютер с 200 тыс. чипов H100), а обучали модель с использованием расширенного набора данных, в том числе документы судебных дел.
xAI отметили, что их новая модель превосходит аналоги по бенчмаркам в математике (AIME) и науке (QPQA) о которых мы говорили ранее, а также по программированию (Coding LCB).
Заметно также, что Grok-3-Reasoning отстаёт от Grok-3-Mini-Reasoning, по словам xAI из-за того что Mini модель тренировали значительно дольше.
Стоит отметить еще то, что в рассуждающей версии скрыли некоторую часть рассуждений, чтобы предотвратить метод дистилляции, используя который другие разработчики могут извлекать знания для других моделей.
⚡️UPDATE: Модель grok 3 c DeepSearch сейчас доступна бесплатно на https://x.com/i/grok (нужно залогинитья в x, нужен VPN)
#LLM #grok3 #AI
Путь ИИ