Рассуждающие возможности в 10 раз более эффективны, чем у Грока3
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.
#Grok4
———
@tsingular
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.
#Grok4
———
@tsingular
👍5
$3K в год.. ну не дорого.
$300 при помесячной оплате.
Еще сверху налоги, так что считай 30К рублей в месяц, примерно.
#Grok4
———
@tsingular
$300 при помесячной оплате.
Еще сверху налоги, так что считай 30К рублей в месяц, примерно.
#Grok4
———
@tsingular
✍7❤2🤔1
Media is too big
VIEW IN TELEGRAM
Теперь можно вот такого качества игру с ИИ создать за пару часов.
Грок сам создаст и объекты и текстуры и игровую механику.
#Grok4
———
@tsingular
Грок сам создаст и объекты и текстуры и игровую механику.
#Grok4
———
@tsingular
🔥15🆒1
Полная заметка по Гроку 4 от самого Грока4
вы просили промпты, - нате :)
Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)
Ключевые возможности:
Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)
Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).
Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)
Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).
Дополнительно: Понимание мемов/сленга;
скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);
ожидается открытие новых технологий/физики в 1-2 года.
Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.
Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);
фокусируется на сложных задачах, где базовый Grok4 — single-agent.
Ключевые отличия/возможности:
Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.
Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.
Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.
#Grok4
———
@tsingular
вы просили промпты, - нате :)
Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)
Ключевые возможности:
Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)
Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).
Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)
Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).
Дополнительно: Понимание мемов/сленга;
скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);
ожидается открытие новых технологий/физики в 1-2 года.
Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.
Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);
фокусируется на сложных задачах, где базовый Grok4 — single-agent.
Ключевые отличия/возможности:
Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.
Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.
Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.
#Grok4
———
@tsingular
👏6✍5❤3😁2
Media is too big
VIEW IN TELEGRAM
Перевел для вас полный эфир презентации Grok4
Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb
#Grok4 #переводы
———
@tsingular
Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb
#Grok4 #переводы
———
@tsingular
🍾15🔥10👏3
Так, ну все эти ARC-AGI бенчмарки, конечно прикольно, ну у нас тут своя атмосфера.
Для вновьприбывших поясняю, - очень наглядным тестом является запрос на русскую поэзию.
Самый сложный на сегодня тест - написать венок сонетов.
Это когда каждый следующий сонет начинается с последней строки предыдущего, а последний - Магистрал состоит из первых строк каждого из 14ти сонетов венка.
Такой блокчейн в мире поэзии.
Для меня этот тест показателен в нескольких аспектах сразу- тут и русский язык и рифма и в целом понимание задачи. Ну и самое главное, - способность рекурсивно мыслить.
Полный текст в комментарии.
Grok4 - провал.
Для сравнения предыдущие тесты:
Gemini 2.5 Pro
Claude Opus 4
Sonnet3.5
o4
Gpt4.5
Grok3
DeepSeek
#Grok4 #сонет
———
@tsingular
Для вновьприбывших поясняю, - очень наглядным тестом является запрос на русскую поэзию.
Самый сложный на сегодня тест - написать венок сонетов.
Это когда каждый следующий сонет начинается с последней строки предыдущего, а последний - Магистрал состоит из первых строк каждого из 14ти сонетов венка.
Такой блокчейн в мире поэзии.
Для меня этот тест показателен в нескольких аспектах сразу- тут и русский язык и рифма и в целом понимание задачи. Ну и самое главное, - способность рекурсивно мыслить.
Полный текст в комментарии.
Grok4 - провал.
Для сравнения предыдущие тесты:
Gemini 2.5 Pro
Claude Opus 4
Sonnet3.5
o4
Gpt4.5
Grok3
DeepSeek
#Grok4 #сонет
———
@tsingular
👍7✍4🔥4🗿1
Поразительно как народ тестирует Grok4
Т.е. ИИ уже справляется по-сути с задачами демосцены.
Скоро уже можно будет соревнования 64К с ИИ пилить.
Исходник
#demo #Grok4
———
@tsingular
Т.е. ИИ уже справляется по-сути с задачами демосцены.
Скоро уже можно будет соревнования 64К с ИИ пилить.
Исходник
#demo #Grok4
———
@tsingular
🔥17🎉3