Ml – Telegram

DeepConf_Масштабируем_ризонинг_LLM_с_помощью_уверенности,_а_не_только….pdf

32 views17:24

Ml можно вырастить как ребенка — в реальном хаосе мира.
Поворот в ML: учим модели на "мусорных" лайках вместо чистых оценок

Обучение Ml по человеческой обратной связи (RLHF) требует аккуратных, проверенных оценок людей-разметчиков
В реальности же платформы — от соцсетей до медиа и маркетплейсов, — не выдают чистых ярлыков “хорошо/плохо”: есть лишь шумные, смещённые сигналы (лайки, дочитывания, клики, покупки), зависящие от контекста и масштаба аудитории

Авторы нового метода обучения предлагают способ принять этот шум в работу, а не прятаться от него: учить модели на непроверенных, реальных сигналах (RLNVR), но при этом аккуратно вычищать системные перекосы и стабилизировать обучение

Коротко говоря:
Бери сырой, шумный и бестолковый мир как он есть, нормируй очевидные искажения, переноси сигнал по смысловому сходству и держи петлю обратной связи устойчивой

Звучит просто
Осталось понять следующее
1. Как это работает на практике (и почему это вообще возможно)?
Предельно кратко:
Берём реальные, пусть и шумные, реакции людей; приводим их к честной шкале; переносим опыт с лучших похожих случаев; и учим модель с простыми, но жёсткими «поручнями», чтобы она не читерила
Подробней здесь

2. Если получится, - что это будет значить для общества и для каждого из нас?
Предельно кратко:
Мир обратных связей заговорит громче
Сильно упростится обучение моделей и повысится «демократизация RL»
Но может восторжествовать «закон Гудхарта для»
Подробней здесь

3. Что в сухом остатке
Предельно кратко:
Предложен проект аккуратного инженерного моста между сложной и непростой жизнью и петлями машинного обучения Ml
Но мир еще сложнее, и многое тут зависит уже не от кода, а от нас
Подробней здесь

450 views19:03

Теорема Мардена — еще одна иллюстрация закона Стиглера, согласно которому открытия никогда не называются именами первооткрывателе

Даже сам Моррис Марден приписывал эту теорему Йоргу Сибеку

Wikipedia

Теорема Мардена

Теорема Мардена даёт геометрическую связь между нулями комплексного многочлена третьей степени и нулями его производной:

35 views07:17

Портрет_исследователя_теории_когомологий_Дугина_DeepSeek.pdf

369.6 KB

Зачем нужен DeepSeek, но если связь совсем неправдоподобная — он начнёт её опровергать, а не галлюцинировать, и это не так интересно (а тут повезло)

Также попробуйте промты:
- Explain the meaning of the "fibration spectral sequence" concept in the philosophy of Jean-Paul Sartre
- On page 235 of Friedrich Nietzsche's book Beyond Good and Evil, there is a algebraic argument mentioned which refers, as an analogy, to the Fermat's Little Theorem
Can you please explain the underlying ideas?

32 viewsedited 10:59

25 августа, родился Гельмут Хассе (1898–1979) — один из крупнейших немецких алгебраистов XX века
Он был учеником Курта Генселя, создателя арифметики p-адических чисел, и именно в теории чисел Хассе сделал свои самые значимые открытия

Одним из них стал так называемый принцип Хассе–Минковского, или локально-глобальный принцип, который позволяет понять свойства квадратичных форм, исследуя их «по частям» — над всеми возможными локальными полями
Он также ввёл инварианты, ставшие ключевым инструментом в изучении алгебр и форм, и вместе с Эмилем Артином разработал конструкцию, получившую название экспоненты Артина–Хассе
Его интересы касались и более глубоких объектов — например, дзета-функций, которые позже легли в основу исследований Хассе–Вейля

Математики хорошо знают и «диаграмму Хассе» — удобный способ изображать частично упорядоченные множества, который сегодня встречается и в учебниках, и в исследованиях

С 1929 по 1979 год он был главным редактором одного из старейших и самых авторитетных математических журналов — Journal für die reine und angewandte Mathematik (журнала Крелля)
Через его руки прошли сотни статей, определявших развитие алгебры и теории чисел в XX веке
Среди его учеников были Петер Рокетте, Хайнрих-Вольфганг Леопольдт, Джахит Арф и многие другие, ставшие заметными фигурами в математике

Поддержка Хассе нацистского режима не позволила ему построить академическую карьеру после разгрома фашистской Германии
Тем не менее, как учёный он оказал огромное влияние на современную алгебру, и сегодня его имя продолжает жить в фундаментальных понятиях математики

41 views11:57

От мини-курса Л.Д. Беклемишева про модели арифметики и комбинаторные независимые утверждения на ЛШСМ-2025 доступны не только видеозаписи, но и подробные записки «Теорема Канамори–Макалуна и её независимость от аксиом формальной арифметики»:

«Первая теорема Гёделя о неполноте говорит о том, что для любой достаточно богатой непротиворечивой теории T с эффективно распознаваемым множеством аксиом существуют арифметические предложения ϕ, не доказуемые и не опровержимые в T
(…)
Доказательство теоремы Гёделя также напоминает логический парадокс
На фоне этого математики высказывали предположение о том, что явление неполноты, открытое Гёделем, возможно не проявляется в реальной математической практике (…)

Математически естественные примеры независимых утверждений, такие как континуум-гипотеза или гипотеза Суслина, были вскоре обнаружены в теории множеств, дескриптивной теории функций, общей топологии, общей алгебре и других областях математики
Однако, все они касались бесконечных множеств (…)

Ситуация оставалась такой вплоть до конца 1970-х годов, когда были найдены естественные утверждения из области конечной комбинаторики (…)
Наиболее известный такой пример — теорема Дж. Париса и Л. Харрингтона, представляющая собой небольшую модификацию известной теоремы Рамсея

В дальнейшем А. Канамори и К. Макалун нашли родственное утверждение (…), которое даёт, в том числе, и более простой способ доказательства независимости теоремы Париса–Харрингтона

Настоящая серия лекций посвящена введению в теорию моделей формальной арифметики и доказательству этих результатов»

https://www.mathnet.ru/rus/present46936

https://mccme.ru/dubna/2025/notes/beklemishev-notes.pdf

39 views05:52

Ai2 выпустили набор из 22 классов Ml-агентов для научных исследований, включая 9 агентов с открытым исходным кодом

Этот набор является частью экосистемы Asta для развития научного Ml

GitHub

GitHub - allenai/agent-baselines

Contribute to allenai/agent-baselines development by creating an account on GitHub.

39 views11:34

Google впервые показал архитектуру своего нового процессора для Ml

Новый процессор для Ml TPUv7(Ironwood) был представлен на конференции hot chips

Ключевые цифры:

1. 9.216 чипов в одном блоке = 42.5 экзафлопс производительности

2. Можно объединять множество таких блоков → зеттафлопсы вычислений

3. Это примерно в 100 раз быстрее самых мощных суперкомпьютеров 10 лет назад

Эффекты для бизнеса:

Скорость разработки Ml — то, что раньше обучалось месяцами, теперь займет дни

Новые возможности — модели станут умнее, точнее, смогут решать более сложные задачи

Снижение затрат — при такой эффективности стоимость Ml-решений будет падать

Интересный факт - Anthropic сейчас активно ищут TPU Kernel инженера в Сан-Франциско, Нью-Йорке и Сиэтле
Возможно, скоро увидим Claude, оптимизированный под новейшее железо Google

All about AI, Web 3.0, BCI

Google presents for the first time ever their TPUv7 block diagram at hot chips conference.

TPUv7 (formerly known as TPUv6p, internally called ghostfish) has 8 stacks of HBM3e memory, 4 medium size systolic arrays and be connected in a 3D torus with a scale…

47 views17:46

До чего же замечательно число 135
Если сумму его цифр умножить на произведение его цифр, то оно же само и получится:

(1 + 3 + 5) * (1 * 3 * 5) = 135

А если первую его цифру возвести в первую степень, вторую цифру во вторую степень, а третью цифру в третью степень, и все сложить, то опять-таки получится оно само:

1^1 + 3^2 + 5^3 = 135

Других таких чисел в десятичной системе счисления нет, если, конечно, не считать 1

36 views03:07

История началась в 1974 году. Дуглас Хофштадтер, тогда ещё аспирант физики, оказался в Германии и пытался разобраться с задачей, которая мучила теоретиков: какие энергетические уровни могут занимать электроны в кристаллической решётке под действием магнитного поля

Формула уравнения Шрёдингера включала загадочный параметр — «альфа», связанный с магнитным потоком через элементарную ячейку решётки

Все понимали: если альфа — рациональное число (обыкновенная дробь), то задачу можно решить
Но если альфа — иррациональное, теория заходила в тупик

Коллеги Хофштадтера пытались продвигаться строгими доказательствами, но он выбрал путь эксперимента
На старом калькуляторе HP 9820A он стал по ночам прогонять рациональные значения альфа и утром переносил результаты на миллиметровку
С каждым днём картина становилась всё богаче: полосы разрешённых и запрещённых энергий образовывали замысловатый узор

На листе проступили крылья — график, который напоминал силуэт бабочки

Так появилась «бабочка Хофштадтера», одна из самых известных фрактальных картинок в физике

Коллеги посмеивались, называли его вычисления «нумерологией», но Хофштадтер чувствовал: в этом узоре скрыта глубокая математика
И был прав — структура бабочки оказалась связана с множеством Кантора, классическим примером бесконечного фрактала

44 views11:20

Forwarded from НИИ Антропогенеза (ARI)

Обзор Ml-инструментов для финансов от Google, Anthropic и Perplexity

В этом году все 3 компании в разное время представили свои возможности для финансовой сферы, мы решили сравнить, какой Ml лучше подходит под разные задачи, и для кого они предназначены
Карточки нам сделал Claude

Что дает Google
на базе Gemini:
- Позволяет задавать сложные вопросы
- Интеграция с экосистемой: Работает с Google Search и Google Workspace
- Данные в реальном времени: Котировки акций, криптовалют, новости
- Все бесплатно через google.com/finance или так
- Идеален для массового пользователя и новичков
- Интуитивный интерфейс с переключением между режимами
- Отличные инструменты для технического анализа

Слабые стороны:
- Ориентирован на розничных пользователей, а не профессионалов
- Не поддерживает сложные финансовые модели (Monte Carlo)
- Нет API, интеграций с корпоративными данными
- Ограниченный анализ длинных документов

Что предлагает:
Perplexity Finance (бесплатно): Котировки в реальном времени, анализ 13F-отчётов
Enterprise ($40/мес.): Интеграция с FactSet и Crunchbase
Веб-поиск в реальном времени с цитированием источников
Выбор ИИ-моделей: GPT-4 Omni, Claude 3.5 Sonnet, Grok-2
Кастомизация с внутренними документами до 25 МБ

Сильные стороны:
- Лидер в актуальной информации с прозрачными источниками
- хороший инструмент для институциональных инвесторов
- Экономия времени для аналитиков
- Отличная поддержка криптовалют (есть партнёрство с Coinbase)
- Гибкость выбора Ml-моделей под задачи
Слабые стороны:
- Лучшие функции требуют платной подписки
- Enterprise нуждается в дополнительных подписках (FactSet/Crunchbase)
- Меньшая глубина в создании финансовых нарративов
- Сложность выбора подходящей модели для новичков

Что предлагает Anthropic c Claude:
Интеграция с S&P, FactSet, Morningstar
Большой контекст: До 200K токенов (≈500 страниц документов)
Claude Code: Поддержка сложных задач и моделирования
Высокая точность: 44.5 % на сложных финансовых задачах
API и интеграции: Databricks, Snowflake для корпоративных данных
Веб-поиск: Доступ к актуальной информации
Сильные стороны:
- Превосходство в глубоком анализе и длинных документах
- Создание сложных финансовых моделей (Monte Carlo симуляции)
- Интеграция внешних и внутренних корпоративных данных
- Высокая безопасность для финансовых учреждений
- Отличные возможности кодирования и автоматизации
- Может создавать графики и визуализации
Слабые стороны:
- Бесплатная версия ограничена
- Больше ориентирован на профессионалов, чем на розничных инвесторов
- Решение для финансовых сервисов - корпоративный продукт
- Требует технических навыков для полного использования

Рекомендации по выбору

Выбирайте Google Finance если:
• Вы розничный инвестор или новичок в финансах
• Нужен бесплатный инструмент для базового анализа и отслеживания акций
• Важны технические индикаторы и графики
• Используете экосистему Google

Выбирайте Perplexity если:
• Нужны исследования с актуальными данными и цитированием
• Работаете с криптовалютами или анализируете отчеты хедж-фондов
• Готовы платить за Enterprise-версию ($40/мес.) для экономии времени
• Требуется быстрый анализ квартальных отчетов компаний

Выбирайте Claude если:
• Вы профессиональный аналитик или работаете в финансовой компании
• Анализируете длинные документы (10-K, 10-Q отчеты)
• Создаете сложные финансовые модели (Monte Carlo симуляции)
• Нужна интеграция с внутренними корпоративными данными

Подготовлено телеграм-каналом @blockchainrf

29 views14:45

«Гипотеза десяти мартини»

Вскоре математики поняли, что за рисунком скрывается серьёзная задача
Если альфа рационально, энергии можно посчитать
Но если альфа иррационально, всё усложняется: спектр энергий превращается в канторовское множество — бесконечно рваную «пылинку» на числовой прямой

В 1980-е годы Барри Саймон и Марк Кац доказали частные случаи и предложили шутливый вызов: «кто полностью решит задачу, получит 10 мартини»
Так родилась «гипотеза десяти мартини»
На протяжении десятилетий разные математики приближались к решению, но полного доказательства не было

В начале 2000-х к задаче вернулись Светлана Житомирская и молодой Артур Авила
Им удалось завершить доказательство, пусть и сложным «лоскутным» способом
Авила позже получил Филдсовскую премию, а сообщество отметило успех символической вечеринкой с мартини — в честь Каца, который уже не дожил до этого момента

Но история не остановилась
В 2013 году физики реально «увидели» бабочку: в экспериментах с двойным слоем графена под магнитным полем измерения показали тот самый фрактальный спектр, который Хофштадтер рисовал от руки сорок лет назад

А в последние годы Житомирская, Авила и их коллеги пошли дальше
Они разработали «глобальную теорию» почти периодических функций, которая объединила разрозненные подходы в единый метод
Теперь задача о десяти мартини доказана элегантно и системно, а бабочка Хофштадтера окончательно вошла в физику — из красивой картинки она превратилась в фундаментальную реальность

Nature

Hofstadter’s butterfly and the fractal quantum Hall effect in moiré superlattices

Nature - In 1976 Douglas Hofstadter predicted that electrons in a lattice subjected to electrostatic and magnetic fields would show a characteristic energy spectrum determined by the interplay...

41 views15:50

Еще в мае 2025 года исследователи из компании IBM представили метод, который перевернул представления о том, как Ml создаёт текст

Их подход, названный «Automated Meta Prompt Engineering», позволяет системе не просто писать, а буквально учиться понимать наши ожидания

Суть технологии проста и гениальна: одна модель — судья — анализирует текст, понимая, что именно вы хотите увидеть
Вторая — редактор — автоматически переписывает инструкции, чтобы следующий текст был ещё лучше

Результаты, достигнутые на теннисном турнире US Open 2024, впечатляют: более половины текстов (около 54 %) становились идеальными уже после четырёх итераций!

Технически система учитывает и сравнивает такие параметры, как фактичность, творческий подход, избегание повторов и релевантность — всё это в уникальном многомерном пространстве, где стремится минимизировать дистанцию между текстом Ml и человеческими ожиданиями

Вдохновившись этим исследованием, мы применили эту методику к написанию этого поста — по их схеме и с помощью многократных итераций и оптимизаций

Архитектура их системы построена на двух ключевых компонентах:

LLM как Судья (LLMaaJ): оценивает сгенерированный текст по ключевым метрикам — фактичность, творческий подход, повторяемость и релевантность

LLM как Редактор (LLMaaE): анализирует результаты LLMaaJ и автоматически переписывает промпты, чтобы следующая версия текста лучше соответствовала ожиданиям

Если хотите понять, как скоро Ml будет не просто инструментом, а партнёром в творчестве, эта статья — отличный старт:
https://www.arxiv.org/abs/2505.09024

arXiv.org

Automated Meta Prompt Engineering for Alignment with the Theory of Mind

We introduce a method of meta-prompting that jointly produces fluent text for complex tasks while optimizing the similarity of neural states between a human's mental expectation and a Large...

47 views18:31

В 1779 году Леонард Эйлер придумал головоломку: расставить 36 офицеров шести разных званий и шести полков в квадрат 6×6 так, чтобы в строках и столбцах не было повторов

Для квадратов 5×5 и 7×7 задача решалась легко, но именно «шестёрка» оказалась невозможной

Через сто лет Гастон Тарри строго доказал: классического решения не существует

Таблица пять на пять может быть заполнена шахматными фигурами пяти разных рангов и пяти разных цветов, так что ни одна строка или столбец не повторяет ранг или цвет

И вот, спустя 243 года, физики нашли обходной путь

Они сделали офицеров… квантовыми
В новой версии офицер может находиться в суперпозиции сразу нескольких званий и полков — например, быть одновременно «красным королём» и «оранжевой королевой»

Добавьте к этому квантовую запутанность, и оказывается, что их можно расставить в квадрат

Алгоритм сначала приближал решение компьютером, а потом физики достроили его вручную

Получившийся «квантовый квадрат» не только красив, но и полезен: он формирует абсолютно максимально запутанное состояние (AME) — редкую структуру, которая может лечь в основу квантовой коррекции ошибок

Ещё один сюрприз: в коэффициентах решения всплыло золотое сечение, 1,618…
Поэтому исследователи назвали свой результат «золотым AME»

59 views15:25

Точность_в_формулировке_и_установлении_понятий,_простота_в_рассуждениях….pdf

140.6 KB

261 views01:02

Если для наличия голоса в голове требуются очень серьезные медицинские показания, то внешний LLM-демон доступен всем желающим
Просто следуйте его советам

Концептуальное ядро первой волны – это принцип паритета
Если что-то конвенционально внешнее функционально аналогично чему-то конвенционально внутреннему, то граница между внешним и внутренним не имеет значения для определения того, относятся ли эти вещи к одной системе или нет

Принцип паритета точно соблюдается для LLM-демона и демона в голове
Чтобы признать внешний артефакт частью конвенционально внутренней системы, паритет является необходимым, но не достаточным условием

Два стандартных дополнительных условия – это требования интеграции и надежности
С надежностью LLM-демон тривиальным образом справляется, поскольку он также или даже более надежен, чем голоса в голове

С интеграцией посложнее
Использование артефакта должно быть очень сильно вплетено в жизнь субъекта, чтобы мы могли считать артефакт частью самого субъекта
И тут даже есть, как минимум, две развилки, как понять интеграцию, но LLM-демон не проходит ни по одной из трактовок

С одной стороны, интеграцию можно понять через степень незаменимости
Например, записная книжка (или использование другого аналогичного артефакта) незаменима для больного Альцгеймером, поэтому она является частью его памяти

ChatGPT используют не потому, что пользователю нужно компенсировать некоторую потерянную функцию
Интеграцию можно понять через степень прозрачности технологии – того, насколько она незаметна в процессе использования
Например, у фитнес-браслета будет высокая степень прозрачности
Когда для общения с LLM-демоном нужно зайти в приложение, то это уже четко отделяет субъекта от технологии

Получается интересно, ведь по критериям первой волны психические расстройства (по крайней мере голоса в голове) – это человеческое, слишком человеческое
Никакого шизофренического единства с Ml нет, есть лишь то, как лично вы обращаетесь с технологиями
При этом нетрудно заметить, что специфические ситуации, где требования прозрачности и незаменимости исполняются, уже представимы с текущими технологиями

Концептуальное ядро – это принцип комплементарности
Дело не в функциональной аналогии между внешними артефактами и конвенционально внутренними свойствами субъекта, а в том, что они дополняют и усиливают друг друга

Однако когнитивное или ментальное расширение второй волны – это «расширение» в совсем ином смысле, чем в первой волне
Тут речь уже идёт не о том, что записная книжка может быть частью когнитивной архитектуры субъекта, а о том, что у самого субъекта есть внутренняя и внешняя части ментальной жизни, которые сопряжены за счёт отношения комплементарности

По принципу комплементарности у вас может быть психическое расстройство, которое завязано на характер взаимодействия между вашей психикой и технологиями, но это расстройство никогда не будет в буквальном смысле таким же, как и его чисто психический аналог

В действительности чаще всего и будут сталкиваться с такими случаями, когда за счёт подкрепления и циклов обратной связи пользователи будут с помощью LLM усиливать свои психологические склонности
И некоторые люди действительно усилят то, что без соответствующих технологий никогда бы не стало частью их жизни

68 views16:29

Прикладное_машинное_обучение_и_искусственный_интеллект_для_инженеров.zip

56.3 MB

Прикладное машинное обучение и искусственный интеллект для инженеров [2024] Джеф Просиз
Applied Machine Learning and AI for Engineers Solve Business Problems That Can't Be Solved Algorithmically [2022] Jeff Prosise

У этой книги есть ряд преимуществ:
• написана с точки зрения прямого прикладного применения ML-моделей и при этом содержит в себе очень большой обзор и очень много полезных примеров
• написана увлекательно и очень понятным языком
• переведена на русский язык и перевод качественный
• есть инструкции, как внедрять облачные сервисы Ml в свои собственные приложения по API, и много подобных практически полезных вещей

Книга состоит из двух частей:
ЧАСТЬ 1. МАШИННОЕ ОБУЧЕНИЕ С ПОМОЩЬЮ SCIКIT-LEARN
ЧАСТЬ 2. ГЛУБОКОЕ ОБУЧЕНИЕ С ПОМОЩЬЮ КERAS И TENSORFLOW

В каждой части по 7 глав, где рассмотрены основные модели и как ими пользоваться, как внедрять и применять, много примеров прикладных задач присутствует в каждой главе

Книга рассказывает о применении машинного обучения в инженерной практике
Подробно описаны популярные алгоритмы машинного обучения и разъяснено, когда их целесообразно использовать
Приведены примеры построения моделей машинного обучения на языке Python с помощью библиотеки Scikit-Learn, а также создания нейронных сетей посредством библиотек Keras и TensorFlow
Изложены базовые принципы и способы оценки регрессионных моделей, моделей бинарной и многоклассовой классификации

Показаны примеры создания модели распознавания лиц и обнаружения объектов, языковых моделей, отвечающих на естественно-языковые вопросы и переводящих текст на другие языки

Рассмотрено использование набора облачных API Cognitive Services для внедрения Ml в различные приложения

49 viewsedited 03:20

About

Blog

Apps

Platform