Технозаметки Малышева
5.55K subscribers
2.79K photos
927 videos
38 files
3.07K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
эфир Грока-4 не случился пока.

#Grok4
———
@tsingular
Рассуждающие возможности в 10 раз более эффективны, чем у Грока3
это позволило вытащить результаты HLE до 41%
Запуск нескольких агентов одновременно позволил решить 50% HLE
Мультиагентная система добавила около 9% к эффекту.

#Grok4
———
@tsingular
👍5
Grok4 Heavy
Мультиагентная система, которая добивается 50.7% на HLE!

#Grok4
———
@tsingular
🔥32
$3K в год.. ну не дорого.

$300 при помесячной оплате.

Еще сверху налоги, так что считай 30К рублей в месяц, примерно.

#Grok4
———
@tsingular
72🤔1
ARC-AGI Grok4 решает более эффективно.
Дешевле и с лучшим результатом.

#Grok4
———
@tsingular
👍5🔥4
Media is too big
VIEW IN TELEGRAM
Теперь можно вот такого качества игру с ИИ создать за пару часов.
Грок сам создаст и объекты и текстуры и игровую механику.

#Grok4
———
@tsingular
🔥15🆒1
По подписке в веб уже доступен

#Grok4
———
@tsingular
🍾3
Полная заметка по Гроку 4 от самого Грока4

вы просили промпты, - нате :)

Grok4 — флагманская модель ИИ от xAI, запущенная 10 июля 2025 года как "самая мощная в мире". Обучена на кластере Colossus с 200K+ GPU, превосходит конкурентов в бенчмарках: лидер в Artificial Analysis Intelligence Index (73), GPQA (88%), MMLU-Pro (87%), AIME 2025 (94-100%), ARC-AGI-2 (15.9%), Humanity’s Last Exam (24-41%)

Ключевые возможности:

Reasoning и анализ:
Превосходит PhD-уровень в физике, математике, праве;
решает олимпиадные задачи (USAMO 61.9%, HMMT 96.7%);
прогнозирует события (например, World Series с вероятностями)

Мультимодальность: Текст, голос (улучшенный, без прерываний), видение (анализ изображений, визуализация, например, слияния чёрных дыр);
генерация изображений в разработке (улучшения через месяц).

Контекст и инструменты: 256K токенов; function calling, structured outputs;
реал-тайм поиск (включая X), инструменты для бизнеса/анализа (например, Polymarket скриншоты за 4.5 мин)

Кодирование: Генерация/отладка кода; лидер в Coding Index (LiveCodeBench 79.4%).

Дополнительно: Понимание мемов/сленга;

скорость ~75 токенов/с; API-доступ ($3/15 за 1M токенов);

ожидается открытие новых технологий/физики в 1-2 года.

Доступ: Через grok.com, X, apps; для SuperGrok ($30/мес) и Premium+; частично на Azure.

Grok4 Heavy — запущенная сегодня продвинутая версия с multi-agent системой (параллельная работа нескольких агентов для сравнения решений, итераций);

фокусируется на сложных задачах, где базовый Grok4 — single-agent.

Ключевые отличия/возможности:

Улучшенный reasoning:
Humanity’s Last Exam до 50.7% (с tools 41%);
ARC-AGI-2 выше;
решает задачи, где Grok4 слабее.

Multi-agent: Параллельный анализ/итерации; визуализация сложных сценариев (чёрные дыры); прогнозирование/моделирование.

Доступ: SuperGrok Heavy ($300/мес или $3000/год); эксклюзивный preview, ранний доступ к фичам, поддержка.

#Grok4
———
@tsingular
👏653😁2
Media is too big
VIEW IN TELEGRAM
Перевел для вас полный эфир презентации Grok4

Поддержать переводы можно тут:
https://pay.cloudtips.ru/p/c8960bbb

#Grok4 #переводы
———
@tsingular
🍾15🔥10👏3
Так, ну все эти ARC-AGI бенчмарки, конечно прикольно, ну у нас тут своя атмосфера.

Для вновьприбывших поясняю, - очень наглядным тестом является запрос на русскую поэзию.

Самый сложный на сегодня тест - написать венок сонетов.

Это когда каждый следующий сонет начинается с последней строки предыдущего, а последний - Магистрал состоит из первых строк каждого из 14ти сонетов венка.

Такой блокчейн в мире поэзии.

Для меня этот тест показателен в нескольких аспектах сразу- тут и русский язык и рифма и в целом понимание задачи. Ну и самое главное, - способность рекурсивно мыслить.

Полный текст в комментарии.

Grok4 - провал.

Для сравнения предыдущие тесты:

Gemini 2.5 Pro

Claude Opus 4
Sonnet3.5
o4
Gpt4.5
Grok3
DeepSeek

#Grok4 #сонет
———
@tsingular
👍74🔥4🗿1
Поразительно как народ тестирует Grok4

Т.е. ИИ уже справляется по-сути с задачами демосцены.
Скоро уже можно будет соревнования 64К с ИИ пилить.

Исходник

#demo #Grok4
———
@tsingular
🔥17🎉3