Истории (не)успеха (ИИ)ЕИ
431 subscribers
171 photos
90 videos
2 files
266 links
Просто о математике, нейросетях, программировании, спорте, политике, культуре. Общение, контакты, международные онлайн дискуссии/лекции в формате лайвстрим, встречи на спорт в Мюнхене.
Download Telegram
🚨 Займёмся развенчиванием мифов: выигрывал ли ИИ последнюю всемирную олимпиаду по математике среди школьников (IMO 2025)?🚨

В СМИ разошлись заголовки: «ИИ выиграл IMO-2025», «Gemini взял золото». Звучит громко, но это не совсем так. Давайте разберёмся.

👩‍🎓 Кто реально участвует в IMO:
IMO — это олимпиада школьников (14–19 лет), не студентов и не взрослых. В 2025 году участвовало 630 школьников из 110 стран.

По результатам:
• 67 золотых медалей
• 145 серебряные
• 159 бронзовых

5 участников набрали идеальные 42 балла.
📌 Источник: imo-official.org
Эти участники:
• Ivan Chasovskikh (под нейтральным флагом)
• Warren Bei (Канада)
• Satoshi Kano (Япония)
• Leyan Deng (Китай)
• Hengye Zhang (Китай)

🤖 Что делал ИИ

Впервые при IMO прошёл отдельный конкурс AI Mathematical Olympiad Prize с призом $10 млн. Его цель — поддержка открытых моделей ИИ. Победителем стала команда NemoSkills.
Формат и регламент изучаю. Напишу в продолжении к этому посту, уже не сегодня.

Кроме того, Google DeepMind протестировал свою модель Gemini Deep Think на задачах IMO-2025.
Решения модели проверили официальные координаторы IMO. Итог: 35 баллов из 42, что соответствует уровню золотой медали.

🛑 Где возникло недоразумение

DeepMind написал: «Gemini achieved gold medal standard» — то есть «достиг уровня золотой медали».

Но многие СМИ перевели и подали это как «ИИ выиграл олимпиаду».

Важно:
Gemini не был официальным участником IMO.
Ему не вручали медаль.
Не набрал количества баллов, которые набрали 5 школьников.
Его результат — это вне конкурса, демонстрация возможностей модели.

🗣 Что сказали организаторы IMO
Президент IMO Грегор Долинар:


«Приятно видеть прогресс ИИ, но IMO не может проверять методы (объём вычислений, наличие человеческого вмешательства, воспроизводимость). Мы можем лишь сказать: правильные доказательства ценны сами по себе — будь то от школьников или от ИИ».



⚡️ Вывод:
Медали IMO-2025 получили только школьники.
ИИ показал результат «на уровне золота», но не выигрывал олимпиаду. Кроме того, не известно, насколько имело место человеческое вмешательство. По моему нынешнему пониманию большие языковые модели часто требуют человеческой помощи, к примеру в виде формализации задач. Но пока точно не уверен, изучаю тему. Школьники же сидели в аудитории без интернета и решали сами. Уже поэтому сравнивать не корректно?

Продолжение следует
👍32
До конца с ИМО мы разберёмся, но пока небольшой опрос. Как вы думаете? Кто выиграл ИМО 2025?
Anonymous Poll
33%
ИИ
51%
Школьники
16%
Победила дружба
В соседнем канале началась дискуссия по поводу ИИ и математических олимпиад и я предложил решить вот это 👇
Forwarded from Dmitry
Вот простая задача. На последней ИМО были вроде аналогичные задачи, но там вопрос более сложный ставился, тут просто всё сделаем. решайте как хотите, хоть передовыми моделями, хоть ручкой и бумагой, хоть чем - не важно. Я выставлю потом решение.

Сколько перемешанных состояний существует у пазла на картинке (с учётом естественных симметрий)?
Проводим эксперимент, сейчас одна девочка попробует решить эту задачу 👆ручкой и бумагой
ссылки к лайв-стриму в комментариях:

https://alpha.twizzle.net/
Live stream finished (1 hour)
Live stream finished (9 minutes)
на стриме я сказал, что у нас нет года, вот сам Томас Рокицки пишет, ну и думайте, решать быстро или ждать год и решть меделенно:
Томасу можно написать и спросить, но пока он не очень раскрывает секреты своих оптимальных солверов на графах Кэли. Но его можно спросить. Пока никто не спрашивал.
Про Нобелевскую премию по физике, которая была присуждена на днях, уже много кто написал — подробно расписывать не буду.
Перепощу из канала Михаила, с которым мы делали лайв-стрим в июле (вторая часть тут):

👉 https://t.iss.one/homeostatic_universe/223

От себя отмечу лишь, что эксперименты, за которые дали премию, были проведены ещё в 80-х. То есть, премия была вручена за фундаментальную работу, сделанную почти 40 лет назад, — и тем не менее её результат оказался устойчивым, влиятельным и технологически важным.

Если я правильно понимаю, я ведь не физик, то технологическая важность в том, что на основе этих экспериментов построены современные сверхпроводящие кубиты — основа квантовых компьютеров Google, IBM и других.

#NobelPrize #Physics
В любом случае, как вы видите - результаты оцениваются десятилетия позже чем они были сделаны. Давайте поговорим об этом годе? Какие ваши любимые физмат-результаты в этом году?
🎄 «Цыплят по осени считают», как гласит народная мудрость. А какая научная работа в этом году заставила вас сказать «ВАУ»?

Да, до Нового года ещё аж целых три месяца, коллеги , но почему бы уже не начать подводить итоги? Что сделали физмат-науки за этот год, что вас действительно впечатлило?

В моём поле зрения оказалось два ярких кандидата на результат года:

1️⃣ Теория сложности: свежий взгляд на разделение классов P и PSPACE — новое понимание времени и пространства в вычислениях.
2️⃣ Матфизика: шаг к решению 6-й проблемы Гильберта — корректный предельный переход между неравновесной термодинамикой и уравнениями Навье–Стокса.

Но интересно не только моё мнение:
💡 Какие работы этого года заставили вас сказать «вау»? В любой области науки.
Давайте вместе составим наш рейтинг 2025 года! 🏆
🔥4
Много научпопа написано про основы математики: аксиому выбора, Кантора, Цермело-Френкеля. Но чем занимаются сейчас логики и теоретики множеств? Давайте посмотрим.

🧩 Кантор и бесконечности

В XIX веке Георг Кантор показал, что бесконечности бывают разных размеров. Множество всех вещественных чисел «больше» множества натуральных чисел, хотя оба бесконечны. Это стало основой теории множеств.

Позже появились аксиомы Цермело-Френкеля (ZF) и аксиома выбора (Axiom of Choice). Они дают строгие правила, по которым можно работать с бесконечными множествами.

🔍 HOD — «упорядоченные множества»

HOD (Hereditarily Ordinal Definable) — это множество всех объектов, которые можно полностью описать через числа и правила. Проще говоря, это «хорошо описуемые» объекты.


Продолжение следует 👇
1😇1
Продолжение. Начало тут 👆

HOD-дихотомия
(Hugh Woodin et al, 2016) — это предположение, что вся математическая вселенная множеств (V) либо примерно совпадает с HOD (то есть всё можно формально описать), либо сильно отличается (есть множество скрытых, сложных объектов).

Для чего это нужно:

Позволяет понять, насколько «упорядочена» математика на самом высоком уровне.

Если HOD ≈ V, то структура бесконечностей проста и предсказуема.

Если V ≠ HOD, мы сталкиваемся с «хаотичными» областями, где обычные правила ZFC (ZF + Axiom of Choice = ZFC) уже не дают полного контроля.

Ключевые ссылки:
Woodin, H. The HOD Dichotomy, 2016, arXiv

🏗 Ultimate L — «идеальная гипотетическая внутренняя модель»

Ultimate L — гипотетическая внутренняя модель, максимально отражающая всю вселенную множеств (V). В этой модели:

Упорядочены все кардиналы и бесконечности (кардинал = количество элементов в множестве. Даже у бесконечных множеств, где количество элементов бесконечно, кардиналы можно предположительно упорядочить. Ключевое слово "предположительно" - поэтому модель и гипотетическая.)

В этой модели можно можно предсказать, как «большие» бесконечности взаимодействуют.

Если модель существует, она помогает формально «построить» всю вселенную множеств V и проверить консистентность гипотез.

Для чего это нужно:
Ultimate L cлужит инструментом для проверки, как сильные кардиналы «вписываются» в известную математику. Может показать, какие бесконечности подчиняются структуре, а какие «вне правил».

🔬 Современные исследования (2025)

Aguilera, Bagaria, Lücke ввели новые большие кардиналы: exacting и ultraexacting.

Что известно:
Они совместимы с ZFC, но ведут себя необычно относительно HOD.

Их существование показывает, что HOD ≠ V: есть области, которые нельзя «упорядоченно описать».

Эти кардиналы бросают вызов Ultimate L: модель может не включать их всех, или придётся её корректировать.

Что предполагается и над чем работают:
- Понимание, как новые кардиналы взаимодействуют с существующей иерархией сильных кардиналов.
- Доказательство консистентности этих кардиналов.
- Проверка, насколько Ultimate L отражает реальную вселенную множеств V.

Итог:
Учёные пытаются понять структуру самых больших бесконечностей, проверить, какие из них «упорядочены», а какие «хаотичны». HOD и Ultimate L — инструменты для того, чтобы разглядеть эти скрытые структуры и построить карту самых сложных уровней бесконечности.

Примечния от автора для заинтересованых читателей: автор ни разу не претендует на специалиста в этой области и никоим образом им не является, однако он, ну я то есть :-), попытался изложить эту тему как мог потратив несколько часов на первые попытки её понять. По моему убеждению когда начинаешь разбираться с какой-то темой: самое главное задавать себе вопросы. И вот такие вопросы я себе задавал на первом этапе ознакомления с этой темой:

- почему V (вселенную любых множеств) так сложно определить, что аж понадобилось вводить HOD и Ultimate L?
- ZF + aксиома выбора, на которой строится современная математика: вопрос нужна ли аксиома выбора или нет ставить бессмысленно в рамках математики, хочешь работай с ZF, хочешь с ZFC, в математике - делай всё что хочешь. Но математикой пользуется так же и физика, где речь идёт о наблюдаемых и экспериментально проверяемых явлениях? Берут ли физики в свой матаппарат/модели результаты, которые основаны на ZF, ZFC или ZFx, где х - более слабая версия аксиомы выбора?
- где различия между HOD и Ultimate L?

У автора есть ответы на эти вопросы и он, т.е. я, с удовольствием обсудит их в комментариях. Кроме того, возможно у вас возникнут вопросы, до которых я не додумался, чтобы задать их себе? Так же был бы рад обсудить!
1👍1
К сожалению не в моём в этом случае, я сдох, видел разных людей и это не моё продвигать научные темы. Закрываю канал. Всем привет и успехов! Но я пас. Да, я знаю, что другие люди лучше меня не напишут, но я тоже не вижу большой интерес к научным темам со стороны людей. Интереса нет просто. Мы живём в потребительском обществе. Буду ли я продолжать вести свой канал зависит от одного физика, он об этом не знает, вообщем подождём его реакцию, а пока канал закрывается, у нас же тут все умные.

Я лично возращаюсъ в спорт, про науку не мне судить:

https://t.iss.one/fight_space/8563

Но я работаю над некоторыми темами в теории групп. Если вдруг получится сделать красивый результат - вы узнаете об этом первыми. Всё, моё последнее слово. А так в группе модераторов достаточно.
😢4😱1🫡1