75 subscribers
10 photos
1 video
11 files
189 links
Machine learning
Download Telegram
Ml можно вырастить как ребенка — в реальном хаосе мира.
Поворот в ML: учим модели на "мусорных" лайках вместо чистых оценок

Обучение Ml по человеческой обратной связи (RLHF) требует аккуратных, проверенных оценок людей-разметчиков
В реальности же платформы — от соцсетей до медиа и маркетплейсов, — не выдают чистых ярлыков “хорошо/плохо”: есть лишь шумные, смещённые сигналы (лайки, дочитывания, клики, покупки), зависящие от контекста и масштаба аудитории

Авторы
нового метода обучения предлагают способ принять этот шум в работу, а не прятаться от него: учить модели на непроверенных, реальных сигналах (RLNVR), но при этом аккуратно вычищать системные перекосы и стабилизировать обучение

Коротко говоря:
Бери сырой, шумный и бестолковый мир как он есть, нормируй очевидные искажения, переноси сигнал по смысловому сходству и держи петлю обратной связи устойчивой

Звучит просто
Осталось понять следующее
1. Как это работает на практике (и почему это вообще возможно)?
Предельно кратко:
Берём реальные, пусть и шумные, реакции людей; приводим их к честной шкале; переносим опыт с лучших похожих случаев; и учим модель с простыми, но жёсткими «поручнями», чтобы она не читерила
Подробней здесь

2. Если получится, - что это будет значить для общества и для каждого из нас?
Предельно кратко:
Мир обратных связей заговорит громче
Сильно упростится обучение моделей и повысится «демократизация RL»
Но может восторжествовать «закон Гудхарта для»
Подробней здесь

3. Что в сухом остатке
Предельно кратко:
Предложен проект аккуратного инженерного моста между сложной и непростой жизнью и петлями машинного обучения Ml
Но мир еще сложнее, и многое тут зависит уже не от кода, а от нас
Подробней здесь
Теорема Мардена — еще одна иллюстрация закона Стиглера, согласно которому открытия никогда не называются именами первооткрывателе

Даже сам Моррис Марден
приписывал эту теорему Йоргу Сибеку
Портрет_исследователя_теории_когомологий_Дугина_DeepSeek.pdf
369.6 KB
Зачем нужен DeepSeek, но если связь совсем неправдоподобная — он начнёт её опровергать, а не галлюцинировать, и это не так интересно (а тут повезло)

Также попробуйте промты:
- Explain the meaning of the "fibration spectral sequence" concept in the philosophy of Jean-Paul Sartre
- On page 235 of Friedrich Nietzsche's book Beyond Good and Evil, there is a algebraic argument mentioned which refers, as an analogy, to the Fermat's Little Theorem
Can you please explain the underlying ideas?
25 августа, родился Гельмут Хассе (1898–1979) — один из крупнейших немецких алгебраистов XX века
Он был учеником Курта Генселя, создателя арифметики p-адических чисел, и именно в теории чисел Хассе сделал свои самые значимые открытия

Одним из них стал так называемый принцип Хассе–Минковского, или локально-глобальный принцип, который позволяет понять свойства квадратичных форм, исследуя их «по частям» — над всеми возможными локальными полями
Он также ввёл инварианты, ставшие ключевым инструментом в изучении алгебр и форм, и вместе с Эмилем Артином разработал конструкцию, получившую название экспоненты Артина–Хассе
Его интересы касались и более глубоких объектов — например, дзета-функций, которые позже легли в основу исследований Хассе–Вейля

Математики хорошо знают и «диаграмму Хассе» — удобный способ изображать частично упорядоченные множества, который сегодня встречается и в учебниках, и в исследованиях

С 1929 по 1979 год он был главным редактором одного из старейших и самых авторитетных математических журналов — Journal für die reine und angewandte Mathematik (журнала Крелля)
Через его руки прошли сотни статей, определявших развитие алгебры и теории чисел в XX веке
Среди его учеников были Петер Рокетте, Хайнрих-Вольфганг Леопольдт, Джахит Арф и многие другие, ставшие заметными фигурами в математике

Поддержка Хассе нацистского режима не позволила ему построить академическую карьеру после разгрома фашистской Германии
Тем не менее, как учёный он оказал огромное влияние на современную алгебру, и сегодня его имя продолжает жить в фундаментальных понятиях математики
От мини-курса Л.Д. Беклемишева про модели арифметики и комбинаторные независимые утверждения на ЛШСМ-2025 доступны не только видеозаписи, но и подробные записки «Теорема Канамори–Макалуна и её независимость от аксиом формальной арифметики»:

«Первая теорема Гёделя о неполноте говорит о том, что для любой достаточно богатой непротиворечивой теории T с эффективно распознаваемым множеством аксиом существуют арифметические предложения ϕ, не доказуемые и не опровержимые в T
(…)
Доказательство теоремы Гёделя также напоминает логический парадокс
На фоне этого математики высказывали предположение о том, что явление неполноты, открытое Гёделем, возможно не проявляется в реальной математической практике (…)

Математически естественные примеры независимых утверждений, такие как континуум-гипотеза или гипотеза Суслина, были вскоре обнаружены в теории множеств, дескриптивной теории функций, общей топологии, общей алгебре и других областях математики
Однако, все они касались бесконечных множеств (…)

Ситуация оставалась такой вплоть до конца 1970-х годов, когда были найдены естественные утверждения из области конечной комбинаторики (…)
Наиболее известный такой пример — теорема Дж. Париса и Л. Харрингтона, представляющая собой небольшую модификацию известной теоремы Рамсея

В дальнейшем А. Канамори и К. Макалун нашли родственное утверждение (…), которое даёт, в том числе, и более простой способ доказательства независимости теоремы Париса–Харрингтона

Настоящая серия лекций посвящена введению в теорию моделей формальной арифметики и доказательству этих результатов»


https://www.mathnet.ru/rus/present46936

https://mccme.ru/dubna/2025/notes/beklemishev-notes.pdf