Доцент Центра ИИ Сколтеха, руководитель лаборатории суперкомпьютеров в искусственном интеллекте Сергей Рыковaнов расскажет, почему этот механизм сегодня считается одним из самых перспективных путей к ярким узкополосным источникам гамма- и рентгеновского излучения (ядерная фотоника, материаловедение и смежные области).
Что будет особенно полезно услышать:
Будем рады видеть вас на презентации — очно или онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
✍4🔥3👍2
Статья: "Эра дискретных диффузионных моделей: бенчмарк для Моста Шрёдингера и энтропийного оптимального транспорта" (Entering the Era of Discrete Diffusion Models: A Benchmark for Schrödinger Bridges and Entropic Optimal Transport). Среди авторов - младший инженер-исследователь Арамайо Карраско Хавиер (Xavier Aramayo Carrasco), младший инженер-исследователь Григорий Ксенофонтов, Алексей Леонов, Ярослав Кошелев и старший преподаватель и руководитель исследовательской группы по генеративному ИИ Александр Коротин.
По сути, это математический способ "перенести" одно распределение объектов в другое с минимальными затратами, заданными функцией стоимости. Особенно ценно, что такие методы умеют учиться без парных примеров: пары "вход - правильный выход" часто редки или слишком дороги в сборе.
Качество измеряется с помощью двух метрик из оценки табличных/дискретных генеративных моделей:
Обе метрики от 0 до 1: выше - лучше.
Отдельно, как побочный результат построенного фреймворка, авторы переносят в дискретный мир идеи LightSB и LightSB-M, получая DLightSB и DLightSB-M. А помимо этого они расширяют matching-направление, предлагая α-CSBM - отдельную модификацию уже существующего CSBM в духе α-DSBM, ориентированную на меньшую вычислительную стоимость.
Выводы по экспериментам на эталонных высокоразмерных дискретных "гауссовых смесях":
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍2🔥2
Речь о статье "Диффузионные и состязательные мосты Шредингера с помощью итеративной пропорциональной марковской подгонки" (Diffusion & Adversarial Schrödinger Bridges via Iterative Proportional Markovian Fitting).
Когда есть два набора картинок — "как сейчас” и “как должно быть” — часто хочется научиться превращать одно в другое без парных примеров (нет соответствий “вот это фото → вот такой результат”). Например: мужчина → женщина, один стиль → другой, один тип данных → другой.
И при этом важны две вещи:
Авторы разбирают популярную практику итеративного обучения “моста” между распределениями (подходы класса Schrödinger Bridge) и показывают, что широко используемое на практике чередование обучения “туда-обратно” — не просто хитрая эвристика, а осмысленный алгоритм, близкий по духу к классическим процедурам энтропийного оптимального транспорта.
Что это даёт на практике: стабильнее обучение и меньше “накопления ошибок”, которое часто ломает однонаправленные процедуры.
На каких задачах проверили:
и показывают предсказуемую динамику качества по итерациям: как улучшается попадание в целевой домен и как меняется сохранение признаков исходного изображения.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3✍2👍1
Что будет:
— обзорные лекции ведущих учёных + доклады молодых авторов;
— мастер-класс и круглый стол;
— традиционная школьная секция.
Тематики (очень широко, от «железа» до алгоритмов):
Вся информация и подача рефератов!
Контакты оргкомитета: [email protected], +7 (812) 499-82-10
Концерн «Электроприбор» — наш партнёр по школе-семинару NMC-2025 «Навигация и управление движением», которую мы проводили в Сколтехе 20–24 августа 2025 г.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8✍3👍1👌1
Речь о статье Proving the Limited Scalability of Centralized Distributed Optimization via a New Lower Bound Construction, среди авторов которой старший преподаватель Центра ИИ Сколтеха Александр Тюрин.
В централизованной архитектуре есть неизбежная плата: сервер не только собирает обновления от исполнителей, но и регулярно рассылает им новые параметры. Когда исполнителей становится много, именно эта обратная рассылка превращается в узкое место.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5⚡2✍1🔥1
Речь о статье InfoBridge: Mutual Information estimation via Bridge Matching, среди авторов которой сотрудники Центра ИИ Сколтеха - младший инженер-исследователь Сергей Холькин, инженер-исследователь Иван Бутаков, профессор, вице-президент по развитию ИИ, директор Центра искусственного интеллекта Сколтеха Евгений Бурнаев, инженер-исследователь Никита Гущин, старший преподаватель и руководитель исследовательской группы по генеративному ИИ Александр Коротин.
Проблема в том, что на высоких размерностях многие популярные нейросетевые оценки MI становятся нестабильными - одни дают большую дисперсию, другие требуют огромных батчей, третьи “не дотягиваются” до больших значений MI и систематически занижают результат.
Научный вклад:
На стандартных низкоразмерных бенчмарках InfoBridge даёт качество на уровне сильных подходов. На картинках и особенно в режиме высокой взаимной информации (когда многие методы перестают “видеть” большие значения) InfoBridge оказывается наиболее точным: в экспериментах авторы варьируют размерность до 160 и истинную MI до 80, и отмечают, что популярные подходы, MINE/InfoNCE/fDIME, в этих режимах не захватывают высокие значения, тогда как InfoBridge остаётся близок к истине.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥2✍1
В Сколтехе состоялась презентация докторской диссертации Сергея Рыкованова, руководителя лаборатории суперкомпьютеров в искусственном интеллекте Центра ИИ. Работа посвящена созданию узкополосных источников гамма-квантов и рентгеновского излучения на основе нелинейного обратного комптоновского рассеяния — технологии, которая откроет новые возможности в ядерной физике, материаловедении и медицине.
Сергей с коллегами разработали методы компенсации пондеромоторного уширения спектральной линии, возникающего при высокой интенсивности лазера. Это позволяет сохранить узкую полосу излучения даже при мощных импульсах
Практическое применение
Ядерная резонансная флюоресценция позволяет обнаруживать конкретные изотопы с высочайшей точностью.
На практике это означает:
Неинвазивный контроль грузов в портах;
— Выявление радиоактивных и взрывчатых веществ;
— Детектирование урана-235 без вскрытия контейнеров;
— Задачи фотоделения ядер для ядерной безопасности.
— Изучение структуры сплавов и композитов;
— Выявление дефектов в деталях двигателей;
— Неразрушающий контроль энергоустановок.
— Высокоточная радиотерапия опухолей;
— Минимальное повреждение здоровых тканей;
— Управляемая энергия излучения.
Аттосекундная физика: наблюдаем электроны в движении
Отдельная часть работы — генерация высоких гармоник при отражении лазера от плазменной поверхности.
Что удалось достичь:
Работа закладывает фундамент для компактных источников нового поколения:
— Вместо гигантских установок → лабораторные источники;
— Вместо целых зданий → небольшие лаборатории;
— Доступ для университетов и исследовательских центров.
Запись презентации и материалы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7⚡3👍2
В статье Asynchronous Policy Gradient Aggregation for Efficient Distributed Reinforcement Learning, среди авторов которой старший преподаватель Центра ИИ Сколтеха Александр Тюрин, предложены два алгоритма — Rennala NIGT и Malenia NIGT — для ситуации, когда RL обучают в распределённом режиме: много воркеров параллельно собирают опыт и считают градиенты, а затем их нужно агрегировать. На практике именно агрегация часто “убивает” скорость: синхронные схемы заставляют всех ждать самых медленных (stragglers), а частые обмены по сети превращаются в узкое место.
Что было предложено:
Главная идея - вместо “собрали обновления от всех → обновились” алгоритм работает следующим образом:
Это даёт прикладной эффект - если 10–20% воркеров стали медленнее или “пропали”, прогресс не останавливается. Важная практическая деталь из статьи - в однородном случае схема совместима с AllReduce (то есть её можно встраивать в стандартные HPC/GPU пайплайны, а не строить другую коммуникацию под один метод).
Результаты эксперимента:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥2⚡1
В статье Birch SGD: A Tree Graph Framework for Local and Asynchronous SGD Methods авторы старший преподаватель Центра ИИ Сколтеха Александр Тюрин и аспирант Данил Сивцов предлагают новый общий взгляд на то, как устроены современные методы распределённого обучения.
Работа даёт единый язык, на котором эти методы можно сравнивать и проектировать осознанно. Авторы предлагают описывать любой алгоритм SGD как дерево вычислений:
Скорость и устойчивость обучения определяется не “названием алгоритма”, а геометрией этого дерева — то есть тем, насколько далеко в прошлом находится точка, в которой вы вычислили градиент, относительно точки, которую сейчас обновляете.
Авторы вводят меру этого рассогласования: грубо говоря, насколько “устаревший” градиент вы используете. Именно эта величина (в статье она выражается через расстояние в дереве и параметр (R)) входит в общий результат: чем больше рассогласование, тем медленнее гарантированная сходимость.
Полезность на практике:
1. Один теоретический “калькулятор” для множества методов.
Вместо того чтобы доказывать сходимость каждого нового варианта SGD заново, авторы формулируют общий результат: достаточно проверить несколько условий про дерево (какие градиенты входят в какие обновления), и оценка скорости получается автоматически.
2. Сравнение не только по “скорости”, но по инженерным метрикам.
Авторы сводят методы в одну таблицу и сравнивают по нескольким осям:
3. Восемь новых методов и новые “комбинации компромиссов”.
Используя этот каркас, авторы находят 8 новых алгоритмов и показывают, что как минимум 6 из них достигают оптимальной по времени сложности в своём классе (то есть быстрее в худшем случае уже нельзя — можно лишь менять другие характеристики, например сеть/пиковую нагрузку).
Улучшения:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3🥰3⚡2👍1
Речь о статье Tighter Performance Theory of FedExProx, среди авторов которой старший преподаватель Центра ИИ Сколтеха Александр Тюрин.
В федеративном обучении данные остаются на устройствах, а на сервер отправляются только обновления модели. Главная цена здесь — не вычисления, а коммуникация: каждый раунд обмена сообщениями может быть медленным и дорогим. Поэтому ключевой вопрос заключается в том, как получить нужное качество за меньшее число раундов связи, особенно когда в каждом раунде доступна лишь часть клиентов.
Авторы показывают, что прежние теоретические оценки для FedExProx были слишком грубыми: в них не удавалось строго объяснить, за счёт чего метод должен выигрывать у стандартного градиентного спуска. В этой работе предлагается более точный анализ, который действительно выявляет условия, при которых FedExProx даёт ускорение, и описывает, как на скорость влияют:
— редкое участие клиентов,
— различия между клиентами,
— стоимость коммуникации.
Что еще важно на практике?
Эксперименты подтверждают практический вывод статьи — когда коммуникация “дорогая”, оптимальные настройки метода становятся нетривиальными (появляется характерная U-образная зависимость качества по параметру), и правильный выбор параметров действительно даёт выигрыш.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🤩2👍1🔥1
Forwarded from Сколтех
👨🔬 Ко Дню российской науки поговорили с учёными Сколтеха о главном — как они пришли в науку.
Наши герои из разных направлений поделились своими личными историями — читайте и вдохновляйтесь.
С праздником! Пусть каждый эксперимент будет удачным. ✨
Наши герои из разных направлений поделились своими личными историями — читайте и вдохновляйтесь.
С праздником! Пусть каждый эксперимент будет удачным. ✨
❤🔥5🥰3👍2🤩1👀1