Ml можно вырастить как ребенка — в реальном хаосе мира.
Поворот в ML: учим модели на "мусорных" лайках вместо чистых оценок
Обучение Ml по человеческой обратной связи (RLHF) требует аккуратных, проверенных оценок людей-разметчиков
В реальности же платформы — от соцсетей до медиа и маркетплейсов, — не выдают чистых ярлыков “хорошо/плохо”: есть лишь шумные, смещённые сигналы (лайки, дочитывания, клики, покупки), зависящие от контекста и масштаба аудитории
Авторы нового метода обучения предлагают способ принять этот шум в работу, а не прятаться от него: учить модели на непроверенных, реальных сигналах (RLNVR), но при этом аккуратно вычищать системные перекосы и стабилизировать обучение
Коротко говоря:
Бери сырой, шумный и бестолковый мир как он есть, нормируй очевидные искажения, переноси сигнал по смысловому сходству и держи петлю обратной связи устойчивой
Звучит просто
Осталось понять следующее
1. Как это работает на практике (и почему это вообще возможно)?
Предельно кратко:
Берём реальные, пусть и шумные, реакции людей; приводим их к честной шкале; переносим опыт с лучших похожих случаев; и учим модель с простыми, но жёсткими «поручнями», чтобы она не читерила
Подробней здесь
2. Если получится, - что это будет значить для общества и для каждого из нас?
Предельно кратко:
Мир обратных связей заговорит громче
Сильно упростится обучение моделей и повысится «демократизация RL»
Но может восторжествовать «закон Гудхарта для»
Подробней здесь
3. Что в сухом остатке
Предельно кратко:
Предложен проект аккуратного инженерного моста между сложной и непростой жизнью и петлями машинного обучения Ml
Но мир еще сложнее, и многое тут зависит уже не от кода, а от нас
Подробней здесь
Поворот в ML: учим модели на "мусорных" лайках вместо чистых оценок
Обучение Ml по человеческой обратной связи (RLHF) требует аккуратных, проверенных оценок людей-разметчиков
В реальности же платформы — от соцсетей до медиа и маркетплейсов, — не выдают чистых ярлыков “хорошо/плохо”: есть лишь шумные, смещённые сигналы (лайки, дочитывания, клики, покупки), зависящие от контекста и масштаба аудитории
Авторы нового метода обучения предлагают способ принять этот шум в работу, а не прятаться от него: учить модели на непроверенных, реальных сигналах (RLNVR), но при этом аккуратно вычищать системные перекосы и стабилизировать обучение
Коротко говоря:
Бери сырой, шумный и бестолковый мир как он есть, нормируй очевидные искажения, переноси сигнал по смысловому сходству и держи петлю обратной связи устойчивой
Звучит просто
Осталось понять следующее
1. Как это работает на практике (и почему это вообще возможно)?
Предельно кратко:
Берём реальные, пусть и шумные, реакции людей; приводим их к честной шкале; переносим опыт с лучших похожих случаев; и учим модель с простыми, но жёсткими «поручнями», чтобы она не читерила
Подробней здесь
2. Если получится, - что это будет значить для общества и для каждого из нас?
Предельно кратко:
Мир обратных связей заговорит громче
Сильно упростится обучение моделей и повысится «демократизация RL»
Но может восторжествовать «закон Гудхарта для»
Подробней здесь
3. Что в сухом остатке
Предельно кратко:
Предложен проект аккуратного инженерного моста между сложной и непростой жизнью и петлями машинного обучения Ml
Но мир еще сложнее, и многое тут зависит уже не от кода, а от нас
Подробней здесь
Теорема Мардена — еще одна иллюстрация закона Стиглера, согласно которому открытия никогда не называются именами первооткрывателе
Даже сам Моррис Марден приписывал эту теорему Йоргу Сибеку
Даже сам Моррис Марден приписывал эту теорему Йоргу Сибеку
Wikipedia
Теорема Мардена
Теорема Мардена даёт геометрическую связь между нулями комплексного многочлена третьей степени и нулями его производной:
Портрет_исследователя_теории_когомологий_Дугина_DeepSeek.pdf
369.6 KB
Зачем нужен DeepSeek, но если связь совсем неправдоподобная — он начнёт её опровергать, а не галлюцинировать, и это не так интересно (а тут повезло)
Также попробуйте промты:
- Explain the meaning of the "fibration spectral sequence" concept in the philosophy of Jean-Paul Sartre
- On page 235 of Friedrich Nietzsche's book Beyond Good and Evil, there is a algebraic argument mentioned which refers, as an analogy, to the Fermat's Little Theorem
Can you please explain the underlying ideas?
Также попробуйте промты:
- Explain the meaning of the "fibration spectral sequence" concept in the philosophy of Jean-Paul Sartre
- On page 235 of Friedrich Nietzsche's book Beyond Good and Evil, there is a algebraic argument mentioned which refers, as an analogy, to the Fermat's Little Theorem
Can you please explain the underlying ideas?
25 августа, родился Гельмут Хассе (1898–1979) — один из крупнейших немецких алгебраистов XX века
Он был учеником Курта Генселя, создателя арифметики p-адических чисел, и именно в теории чисел Хассе сделал свои самые значимые открытия
Одним из них стал так называемый принцип Хассе–Минковского, или локально-глобальный принцип, который позволяет понять свойства квадратичных форм, исследуя их «по частям» — над всеми возможными локальными полями
Он также ввёл инварианты, ставшие ключевым инструментом в изучении алгебр и форм, и вместе с Эмилем Артином разработал конструкцию, получившую название экспоненты Артина–Хассе
Его интересы касались и более глубоких объектов — например, дзета-функций, которые позже легли в основу исследований Хассе–Вейля
Математики хорошо знают и «диаграмму Хассе» — удобный способ изображать частично упорядоченные множества, который сегодня встречается и в учебниках, и в исследованиях
С 1929 по 1979 год он был главным редактором одного из старейших и самых авторитетных математических журналов — Journal für die reine und angewandte Mathematik (журнала Крелля)
Через его руки прошли сотни статей, определявших развитие алгебры и теории чисел в XX веке
Среди его учеников были Петер Рокетте, Хайнрих-Вольфганг Леопольдт, Джахит Арф и многие другие, ставшие заметными фигурами в математике
Поддержка Хассе нацистского режима не позволила ему построить академическую карьеру после разгрома фашистской Германии
Тем не менее, как учёный он оказал огромное влияние на современную алгебру, и сегодня его имя продолжает жить в фундаментальных понятиях математики
Он был учеником Курта Генселя, создателя арифметики p-адических чисел, и именно в теории чисел Хассе сделал свои самые значимые открытия
Одним из них стал так называемый принцип Хассе–Минковского, или локально-глобальный принцип, который позволяет понять свойства квадратичных форм, исследуя их «по частям» — над всеми возможными локальными полями
Он также ввёл инварианты, ставшие ключевым инструментом в изучении алгебр и форм, и вместе с Эмилем Артином разработал конструкцию, получившую название экспоненты Артина–Хассе
Его интересы касались и более глубоких объектов — например, дзета-функций, которые позже легли в основу исследований Хассе–Вейля
Математики хорошо знают и «диаграмму Хассе» — удобный способ изображать частично упорядоченные множества, который сегодня встречается и в учебниках, и в исследованиях
С 1929 по 1979 год он был главным редактором одного из старейших и самых авторитетных математических журналов — Journal für die reine und angewandte Mathematik (журнала Крелля)
Через его руки прошли сотни статей, определявших развитие алгебры и теории чисел в XX веке
Среди его учеников были Петер Рокетте, Хайнрих-Вольфганг Леопольдт, Джахит Арф и многие другие, ставшие заметными фигурами в математике
Поддержка Хассе нацистского режима не позволила ему построить академическую карьеру после разгрома фашистской Германии
Тем не менее, как учёный он оказал огромное влияние на современную алгебру, и сегодня его имя продолжает жить в фундаментальных понятиях математики
От мини-курса Л.Д. Беклемишева про модели арифметики и комбинаторные независимые утверждения на ЛШСМ-2025 доступны не только видеозаписи, но и подробные записки «Теорема Канамори–Макалуна и её независимость от аксиом формальной арифметики»:
https://www.mathnet.ru/rus/present46936
https://mccme.ru/dubna/2025/notes/beklemishev-notes.pdf
«Первая теорема Гёделя о неполноте говорит о том, что для любой достаточно богатой непротиворечивой теории T с эффективно распознаваемым множеством аксиом существуют арифметические предложения ϕ, не доказуемые и не опровержимые в T
(…)
Доказательство теоремы Гёделя также напоминает логический парадокс
На фоне этого математики высказывали предположение о том, что явление неполноты, открытое Гёделем, возможно не проявляется в реальной математической практике (…)
Математически естественные примеры независимых утверждений, такие как континуум-гипотеза или гипотеза Суслина, были вскоре обнаружены в теории множеств, дескриптивной теории функций, общей топологии, общей алгебре и других областях математики
Однако, все они касались бесконечных множеств (…)
Ситуация оставалась такой вплоть до конца 1970-х годов, когда были найдены естественные утверждения из области конечной комбинаторики (…)
Наиболее известный такой пример — теорема Дж. Париса и Л. Харрингтона, представляющая собой небольшую модификацию известной теоремы Рамсея
В дальнейшем А. Канамори и К. Макалун нашли родственное утверждение (…), которое даёт, в том числе, и более простой способ доказательства независимости теоремы Париса–Харрингтона
Настоящая серия лекций посвящена введению в теорию моделей формальной арифметики и доказательству этих результатов»
https://www.mathnet.ru/rus/present46936
https://mccme.ru/dubna/2025/notes/beklemishev-notes.pdf