Технозаметки Малышева

эфир Грока-4 не случился пока.

#Grok4
———
@tsingular

1.4K views03:22

Эфир:
https://x.com/i/broadcasts/1lDGLzplWnyxm

#Grok4
———
@tsingular

⚡5

1.34K views04:07

Рассуждающие возможности в 10 раз более эффективны, чем у Грока3
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.

#Grok4
———
@tsingular

👍5

1.52K views04:16

Технозаметки Малышева

Grok4 Heavy
Мультиагентная система, которая добивается 50.7% на HLE!

#Grok4
———
@tsingular

🔥3⚡2

1.27K views04:26

Технозаметки Малышева

$3K в год.. ну не дорого.

$300 при помесячной оплате.

Еще сверху налоги, так что считай 30К рублей в месяц, примерно.

#Grok4
———
@tsingular

✍7❤2🤔1

1.22K viewsedited 04:38

Технозаметки Малышева

ARC-AGI Grok4 решает более эффективно.
Дешевле и с лучшим результатом.

#Grok4
———
@tsingular

👍5🔥4

1.21K views04:44

Технозаметки Малышева

0:21

Media is too big

VIEW IN TELEGRAM

Теперь можно вот такого качества игру с ИИ создать за пару часов.
Грок сам создаст и объекты и текстуры и игровую механику.

#Grok4
———
@tsingular

🔥15🆒1

1.23K views04:50

Технозаметки Малышева

По подписке в веб уже доступен

#Grok4
———
@tsingular

🍾3

1.2K views05:01

Технозаметки Малышева

Полная заметка по Гроку 4 от самого Грока4

вы просили промпты, - нате :)

Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)

Ключевые возможности:

Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)

Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).

Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)

Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).

Дополнительно: Понимание мемов/сленга;

скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);

ожидается открытие новых технологий/физики в 1-2 года.

Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.

Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);

фокусируется на сложных задачах, где базовый Grok4 — single-agent.

Ключевые отличия/возможности:

Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.

Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.

Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.

#Grok4
———
@tsingular

👏6✍5❤3😁2

1.46K views05:16

Технозаметки Малышева

41:49

Media is too big

VIEW IN TELEGRAM

Перевел для вас полный эфир презентации Grok4

Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb

#Grok4 #переводы
———
@tsingular

🍾15🔥10👏3

2.58K views08:22

Технозаметки Малышева

Так, ну все эти ARC-AGI бенчмарки, конечно прикольно, ну у нас тут своя атмосфера.

Для вновьприбывших поясняю, - очень наглядным тестом является запрос на русскую поэзию.

Самый сложный на сегодня тест - написать венок сонетов.

Это когда каждый следующий сонет начинается с последней строки предыдущего, а последний - Магистрал состоит из первых строк каждого из 14ти сонетов венка.

Такой блокчейн в мире поэзии.

Для меня этот тест показателен в нескольких аспектах сразу- тут и русский язык и рифма и в целом понимание задачи. Ну и самое главное, - способность рекурсивно мыслить.

Полный текст в комментарии.

Grok4 - провал.

Для сравнения предыдущие тесты:

Gemini 2.5 Pro

Claude Opus 4
Sonnet3.5
o4
Gpt4.5
Grok3
DeepSeek

#Grok4 #сонет
———
@tsingular

👍7✍4🔥4🗿1

1.29K viewsedited 05:01

Технозаметки Малышева

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Поразительно как народ тестирует Grok4

Т.е. ИИ уже справляется по-сути с задачами демосцены.
Скоро уже можно будет соревнования 64К с ИИ пилить.

Исходник

#demo #Grok4
———
@tsingular

🔥17🎉3

1.4K views18:30

About

Blog

Apps

Platform