LabADT | NSU
220 subscribers
91 links
Анонсы семинаров Лаборатории прикладных цифровых технологий ММЦ ММФ НГУ

Сайт: https://mca.nsu.ru/labadt/

Вк: https://vk.com/labcfdai/
Download Telegram
📌Анонс семинара Магистратуры 27 октября (14.30 в 5234):

🗒Статья для разбора:

L. Breiman, “Bagging predictors,” Machine Learning, vol. 24, pp. 123–140, 2004

Докладчик 1: Тютюльников Михаил
Докладчик 2: Кульбаченко Илья

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
👍31🔥1
📌Анонс семинара Лаборатории 30 октября (10.50 в 4105):

🗒
Как работает сервис оценки недвижимости?

В докладе поговорим про оценку вторичной недвижимости. Рассмотрим, что происходит когда вы оцениваете квартиру: какие сервисы для этого нужны, как они взаимодействуют между собой, что считается онлайн, а что мы готовим для вас по ночам. Поговорим о процессе разработки модели от гипотезы до прода. Обсудим, почему мы отказываемся от pandas в продакшн-системах и как справляемся с проблемами многопоточности в Python.

Докладчик:
Константин Носорев
🔥2
📌Анонс семинара Магистратуры 3 ноября (14.30 в 5234):

🗒Статья для разбора:

L. Breiman. Random forests. Machine learning, 45(1):5–32, 2001

Докладчик 1: Хотина Алисия
Докладчик 2: Сахаров Данил

Гость: Иван Комаров
Директор дирекции машинного отделения ЦФТ, один из основателей сибирского отделения Open Data Science.

Тема: Почему случайный лес работает и в каких случаях он хорош?

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥1
📌Анонс семинара Лаборатории 6 ноября (10.50 в 4105):

🗒 Применение методов NLP для работы с ЭЭГ-данными.

Электроэнцефалография (ЭЭГ) -- это неинвазивный метод изучения функций головного мозга с помощью регистрации его биоэлектрической активности. Ее широко используют для диагностики и контроля лечения различных патологий, таких как: эпилепсия, психические заболевания, алкоголизм и т.д.
В своем докладе Елена рассмотрит зачем и как применяются методы автоматического распознавания речи для работы с ЭЭГ-данными, а также разберет архитектуру и работу модели wav2vec, лежащую в основе данного метода.

Докладчица: Матвеева Елена

🗒 Классификация изображений колосьев пшеницы по признаку опушения колосковых чешуй с помощью сверточных нейросетей.

Высокопроизводительное фенотипирование при анализе больших объемов биологических данных становится необходимым иструментом. На данный момент умная теплица может обойтись обычному садоводу в сумму от 1 млн. евро, а гиперспектральная камера стоит столько же, сколько новая Kia Rio. Большие компании как Monsanto, Seminis, Syngenta Sinochem Holdings разрабатывают методы построения моделей растеней, но исследований по использованию изображений растений для предсказания каких-либо специфических фенотипических признаков совсем немного. В этой работе рассмотренна задача бинарной классификации изображений колосьев по признаку опушения колосковых чешуй. В своем докладе Никита расскажет про саму задачу, каких результатов получилось добиться. В чем трудности решения подобных задач и насколько нейросеть предсказывает круче биолога-эксперта, который визуально оценивает признак по тем же изображениям.

Докладчик:
Никита Артёменко
🔥3
📌Анонс семинара Магистратуры 10 ноября (14.30 в 5234):

🗒Статья для разбора:

P. Geurts, D. Ernst, and L. Wehenkel. Extremely randomized trees. Machine learning, 63(1): 3–42, 2006

Докладчик 1: Ипполитов Макар
Докладчик 2: Выдрин Антон

Гость: Юрий Бабуров
CTO компании DreamDocs, преподаватель НГУ

Тема: Выбор подходящих DL и ML алгоритмов для задачи

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥2👍1
📌Анонс семинара Лаборатории 13 ноября (10.50 в 4105):

🗒 Машинное обучение для повышения эффективности методов моделирования турбулентных течений.

Одной из актуальных инженерных задач во многих отраслях машиностроения является создание методов точного и надёжного предсказания параметров турбулентных течений с помощью численного моделирования. В настоящее время высокой точности результатов можно достичь с помощью прямого численного моделирования (DNS), однако данный метод крайне требователен к вычислительным ресурсам. Поэтому в прикладных задачах часто используют менее затратные алгоритмы по поиску приближённых решений, такие как метод крупных вихрей (LES), метод отсоединённых вихрей (DES) и решение систем уравнений Навье-Стокса, осреднённых по Рейнольдсу (RANS).
Несмотря на распространённость таких подходов, точность и универсальность многочисленных моделей турбулентности, имеющих полуэмпирическую природу, довольно низки, поэтому для улучшения прогнозирования осреднённых характеристик потока и расширения спектра рассматриваемых задач такие модели нуждаются в модификациях. В своём докладе Григорий расскажет о перспективах использования методов машинного обучения для повышения эффективности подобных приближенных схем на примере решения RANS-систем для симуляции потока в канале.

Докладчик: Григорий Гусев

🗒 Задача нахождения позиционных данных при помощи IMU и проблемы ее решения.

На дворе 2023 год, и у большинства из нас в кармане располагается смартфон, определяющий наши координаты в любой момент времени, обращаясь к спутникам 4 крупнейших систем навигации. Однако точность GPS по состоянию на 2020 год заявляется на уровне 2 метров. Что делать, если требуется собрать данные значительно точнее, и к тому же внутри здания? Одно из решений — использование датчика пространственного положения и математических алгоритмов. В этом докладе Кирилл расскажет о процессе реализации такого решения в биомед-проекте, где точность должна исчисляться в миллиметрах.

Докладчик:
Кирилл Тарасов

🗒 Применение нейросетевого алгоритма для прогнозирования центральной линии аневризмы аорты.

Одной из нерешенных проблем в медицине является прогнозирование рисков развития аневризмы аорты. В своем докладе Кирилл рассмотрит какие методы в решении этой проблемы применялись раньше и сейчас. А также подробно расскажет один из перспективных алгоритмов поиска центральной линии, основанный на нейросети U-Net и подходе attraction field.

Докладчик:
Мелихов Кирилл
🆒3🔥2👍1
📌Анонс семинара Магистратуры 17 ноября (14.30 в 5234):

🗒Статья для разбора:

J. Friedman, “Greedy function approximation: A gradient boosting machine,” Annals of Statistics, vol. 29, pp. 1189–1232, 2001

Докладчик 1: Чупров Илья
Докладчик 2: Максаковский Никита

Гость: Павловский Евгений
Заведующий Лабораторией аналитики потоковых данных и машинного обучения

Тема доклада: О непреложной итеративности разработки применимых моделей машинного обучения

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
👍21
📌Анонс семинара Лаборатории 20 ноября (10.50 в 4105):

🗒 Нейронные операторы для решения дифференциальных уравнений

Решение дифференциальных уравнений с использованием нейронных сетей приобретает значительную популярность. На текущий момент существует разнообразие методов решения, включая тот, который опирается на применение нейронных операторов — класса моделей, обучаемых выявлять отображения между пространствами функций. В своем докладе Тимур представит основные аспекты нейронных операторов, их математическую формулировку и интуитивное понимание, различные вариации, а также проведет сравнительный анализ с другим широко известным методом решения — PINN.

Докладчик: Тимур Еникеев
👍2🔥1
📌Анонс семинара Магистратуры 24 ноября (14.30 в 5234):

🗒Статья для разбора:

Jon Louis Bentley. 1975. Multidimensional binary search trees used for associative searching. Commun. ACM 18, 9 (Sept. 1975), 509–517

Докладчик 1: Попов Алексей
Докладчик 2: Жумагулова Ирина

Гость: Валентин Мамедов
ex-Tinkoff RecSys, Sber.Devices GigaChat

Тема: Приближенные методы поиска ближайших соседей и их применение на практике

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
👍1
📌Анонс семинара Лаборатории 27 ноября (10.50 в 4105):

🗒 Устойчивость свёрточного алгоритма генерации морфемных разборов к сдвигу данных

Определение морфемного состава слова – проблема, особенно актуальная при обучении русскому языку. Автоматическое построение морфемных разборов осложняется отсутствием согласия среди лингвистов в отдельных случаях. В то же время за последние годы опубликовано несколько работ, авторы которых используют различные методы машинного обучения для решения этой задачи в различных приложениях. В одной из таких работ была предложена архитектура на основе свёрточных нейронных сетей. Предложенный алгоритм показал достаточно высокое качество, из-за чего он часто использовался в последующих исследованиях как бейзлайн высокого уровня. В этой работе мы исследовали устойчивость данного алгоритма к сдвигу и нехватке данных и обнаружили, что качество алгоритма во многом зависит от совпадения морфемного состава обучающей и тестовой выборок.

Докладчик: Тимур Гарипов

🗒 Генеративные модели для оптимизации кристаллических структур

Доклад посвящен исследованию применения генеративных моделей в задаче оптимизации кристаллических структур в материаловедении. В работе рассматривается использование глубоких нейронных сетей для предсказания и улучшения структурных характеристик кристаллов, а также подходы к формированию набора данных и использованию функции потерь.

Докладчик: Михаил Тютюльников
🔥2❤‍🔥1👍1👏1
📌Анонс семинара Магистратуры 01 декабря (14.30 в 5234):

🗒Статья для разбора:

Crammer, Koby, Ofer Dekel, Joseph Keshet, Shai Shalev-Shwartz and Yoram Singer. “Online Passive-Aggressive Algorithms.” J. Mach. Learn. Res. 7 (2003): 551-585

Докладчик 1: Петоян Андраник
Докладчик 2: Ковалевский Данил

Гость: Андрей Гетманов
Сотрудник лаборатории автоматического машинного обучения ИТМО, руководитель студенческого клуба ITMO.Opensource, один из основных контрибьюторов https://github.com/aimclub/FEDOT

Тема: Открыть нельзя закрыть: ИИ + open source

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥3
📌 Анонс семинара Лаборатории 4 декабря (10.50 в 4105):

🗒 Обучение модели WaveNet решению задачи синтеза звука, параметризованной частотой основного тона и огибающей амплитуды

Задача генерации звука заданного тембра по последовательности управляющих параметров (например, MIDI поток) является одной из основных задач при создании программного обеспечения для создания музыки. Классические методы синтеза звука, иммитирующего существующие музыкальные инструменты, требуют либо сложных алгоритмов, либо объемную библиотеку сэмплов. Методы глубокого обучения способны предоставить решение задачи без указанных недостатков. Современные модели, синтезирующие звук обучены таким образом, чтобы максимально близко иммитированть тембр инструмента. К сожалению, точность передачи тона из-за этого страдает, а это не позволяет строить полифонические синтезаторы на основе ANN. В данной работе исследуется способы обучения модели на основе WaveNet для точной передачи тона тембрально простых звуков.

Докладчик: Олег Жуков

🗒 Затухание градиентов

Антон предлагает обсудить проблему затухания градиентов, рассмотреть методы ее преодоления и их влияние на результат. В докладе будет проведено сравнение подходов, анализ их воздействия на распределение градиентов, обсуждение недостатков популярных методов и значимость проблемы для различных архитектур. Основано на выступлении Влада Голощапова с датафеста.

Докладчик: Антон Легченко
🔥2👍1🆒1
📌Анонс семинара Магистратуры 08 декабря (14.30 в 5234):

🗒Статья для разбора:

Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. “Why should I trust you?: Explaining the predictions of any classifier.” Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. ACM (2016)

Докладчик 1: Муратов Владислав
Докладчик 2: Калачев Иван

Гость: Елена Бручес
Ведущий инженер, Huawei
Младший научный сотрудник, ИСИ СО РАН
Старший преподаватель, НГУ

Тема: Интерпретируемость и прозрачность машинного обучения: мой опыт

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥4
📌 Анонс семинара Лаборатории 11 декабря (10.50 в 4105):

🗒 Детоксикация русскоязычных текстов на основе комбинации контролируемой генерации с использованием предварительно обученного ruGPT3 и Delete-метода

В докладе будет рассказано про решение, полученное на конкурсе автоматической детоксикации текста на русском языке RUSSE Detoxification 2022. Соревнование проводилось в рамках конференции Dialog 2022. Рассматриваемый подход заключается в фильтрации предоставленного организаторами соревнования набора обучающих данных, переподготовке предварительно обученной модели ruGPT3 и отборе примеров детоксифицированных (нейтральных) предложений. Алгоритм сделан на основе косинусной близости и ROUGE-L к входному токсичному предложению и их последующей обработкой с использованием библиотеки ruPrompts для ruGPT-3. Заключительный этап обработки сгенерированных нейтральных комментариев проводится с использованием метода Delete — неконтролируемой модели детоксикации, основанной на правилах, которая удаляет все оставшиеся грубые и отсутствующие слова, хранящиеся в словаре, предоставленном организаторами.

Докладчица: Екатерина Тотмина

🗒 Исследование и разработка нейросетевого алгоритма синтеза ЭЭГ-сигнала

ЭЭГ сигнал широко используется в задачах предсказывания различных заболеваний, например эпилепсии или депрессии. Однако получение чистых ЭЭГ сигналов зачастую бывает проблематичным ввиду дорогостоящего оборудования, а также имеется дефицит данных непосредственно предприступных состояний (если речь идет о предсказывании эпилепсии). Поэтому многие проблемы могли бы решиться, если бы мы могли генерировать похожие, медицински-верные ЭЭГ сигналы, дополняя уже имеющиеся данные. На эту тему существуют статьи, в которых исследователи используют для этих целей генеративно-состязательные нейронные сети. Докладчик же решил попробовать использовать аудио диффузионную модель ввиду сходства ЭЭГ сигнала с аудио сигналом. В докладе будет рассказано о предобработке данных для последующего обучения и генерации ЭЭГ сигнала с помощью аудио диффузионной модели.

Докладчик: Артем Шмаков
🔥2
📌Анонс семинара Магистратуры 15 декабря (14.30 в 5234):

🗒Статья для разбора:
Lundberg, Scott M., and Su-In Lee. “A unified approach to interpreting model predictions.” Advances in Neural Information Processing Systems (2017)

Докладчик 1: Коробов Александр
Докладчик 2: Аношин Сергей

Гость: Владимир Борисович Бериков
доктор технических наук, главный научный сотрудник лаборатории анализа данных Института математики СО РАН

Тема: "Обучение со слабой разметкой"

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
📌 Анонс семинара Лаборатории 18 декабря (10.50 в 4105):

🗒 Платон, припоминание и сильный искусственный интеллект: алгоритм создания мультимодального диалогового агента общего назначения

Докладчик: Иван Бондаренко

🗒 Оценка времени готовки блюда в Я.Еда

Задача оценки времени готовки еды является одной из важнейших в любом сервисе доставки еды. Решение данной проблемы является достаточно сложным по причине многочисленных факторов: тип блюда (первое, второе, ...), класс ресторана (фаст-фуд, премиум, ...), время заказа пользователя (час пик/выходной) и количество порций. Все факторы, кроме первого, довольно просто описать и использовать в любой модели, но вот передать произвольной модели информацию о блюде довольно сложно. Более того, сложность задаче добавляет требование на ограничение работы модели в рантайме с предельно быстрым инференсом. В своем докладе Влад расскажет как поставленная задача решается в команде Я.Еда.

Докладчик: Владислав Калинин

🗒 Применение предиктивной аналитики для оптимизации работы роторных частей авиационных двигателей

Предиктивная аналитика использует методы машинного обучения для предсказания будущих событий на основе прошлых данных. В данной работе акцент делается на возможности её применения к промышленным данным, а если быть точнее, к данным роторных частей авиационного двигателя. В области авиастроения необходимо заранее знать о возможных неисправностях, а также важна информация об остаточном ресурсе двигателя. Именно с задачами локализации дефектов и оценки остаточного ресурса предлагает ознакомиться в этом докладе.

Докладчик: Илья Кульбаченко
🔥4🤯21
📌Анонс семинара Магистратуры 22 декабря (14.30 в 5234):

🗒Статья для разбора:
Mikhail Belkin, et al Reconciling modern machine-learning practice and the classical bias–variance trade-off (2018)

Докладчик 1: Перминов Павел
Докладчик 2: Тарасенко Александр

Гость: Дмитрий Бугайченко
эксперт в области больших данных и машинного обучения, управляющий директор по аналитике данных направления B2C Сбера.

Тема: Петля обратной связи и другие эффекты при внедрении рекомендательных систем

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥1🤯1
📌Анонс семинара Магистратуры 14 февраля (18.10 в 5234):

🗒Статья для разбора:
LeCun, Y., Bottou, L., Orr, G. B., & Müller, K. R. (2002). Efficient backprop. In Neural networks: Tricks of the trade (pp. 9-50). Berlin, Heidelberg: Springer Berlin Heidelberg.

Докладчик 1: Владислав Калинин
Докладчик 2: Артём Болдинов

Гость: Иван Шмаков
руководитель департамента по машинному обучению в ЦФТ

Тема: Efficient Backprop двадцать пять лет спустя

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
21
📌 Анонс семинара Лаборатории 12 февраля (10.50 в 5222):

🗒 Про Neural Operator и ML in physics в целом

В своем докладе Данил расскажет о применении методов машинного обучения к решению физических задач. В частности, о набирающем популярность подходе Neural Operator. Это data-driven подход, в основе которого лежит аппроксимация оператора решения PDE. В отличие от нейронных сетей, которые аппроксимируют решение на фиксированной сетке, neural operator строит отображение между бесконечномерными пространствами и инвариантен к дискретизации. Благодаря этому свойству, подходы на основе NO могут стать хорошим инструментом для суррогатного моделирования и ускорения численных расчетов.

Докладчик: Сахаров Данил
🔥6❤‍🔥1
📌 Анонс семинара Лаборатории 19 февраля (10.50 в 5222):

🗒 Подбор условий синтеза металл-органических координационных полимеров: от химической интуиции к анализу данных

Металл-органические координационные полимеры (МОКП) — это класс соединений, за счет своей регулярной и пористой структуры выделяющийся количеством своих областей применения: люминесценция, катализ, адсорбция и т.д. Направленный поиск условий синтеза МОКП с определёнными структурными блоками (металлокластерами) - задача, которая в настоящее время не имеет решения. Синтезы очень разных МОКП могут протекать в очень похожих условиях, поэтому даже опытные специалисты с трудом могут ограничить пространство поиска условий синтеза МОКП с определённым металлокластером. В своем докладе Лев продемонстрирует, как он пытался получить количественную оценку условий синтеза МОКП с кластерами Zn4O с помощью методов классического машинного обучения.

Докладчик: Лев Жуков

🗒 Деформируемая регистрация аневризмов брюшной аорты

Аневризма брюшной аорты — опасное патологическое расширение брюшной аорты, требующее регулярного медицинского наблюдения. В настоящее время в клинической практике используются только визуальные оценки скорости роста и методы, основанные на оценке изменения максимального диаметра аневризмы. В своем докладе Иван расскажет об использовании нейросетевого подхода к регистрации аневризмы. В основе такого подхода лежит поиск отображения между двумя изображениями компьютерной томографии. Особо важным является получение физически обоснованного отображения. Для этого предлагается введение дополнительного функционала в функцию потерь, который учитывает слабое изменение формы кальцинатов в области брюшной аорты со временем. Помимо этого, планируется ввести функционал, учитывающий динамику нелинейно упругой среды. Таким образом, ожидается, что использование такого подхода позволит внедрить нейросетевые алгоритмы для регистрации аневризмов брюшной аорты.

Докладчик: Иван Калачев
🔥3🤝1
📌Анонс семинара Магистратуры 21 февраля (18.10 в 5234):

🗒Статья для разбора:
Xavier Glorot, and Yoshua Bengio, Understanding the difficulty of training deep feedforward neural networks. In Proceedings of the 13th International Conference on Artificial Intelligence and Statistics (AISTATS), vol. 9 of JMLR, 2010, pp. 249-256

Докладчик 1 Артеменко Никита
Докладчик 2 Максаковский Никита

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥5