LabADT | NSU
220 subscribers
91 links
Анонсы семинаров Лаборатории прикладных цифровых технологий ММЦ ММФ НГУ

Сайт: https://mca.nsu.ru/labadt/

Вк: https://vk.com/labcfdai/
Download Telegram
Channel created
📌Анонс семинара Магистратуры 15 сентября (14.30 в 5234):

🗒 Статья для разбора:

Micci-Barreca D. A preprocessing scheme for high-cardinality categorical attributes in classification and prediction problems, 2001

Докладчик: Влад Калинин
Оппонент: Игорь Бусов

Гость: Дмитрий Колодезев
Основатель сибирского филиала ODS сообщества. Директор компании Promsoft.
Тема: Датафест и ML сообщество в Академгородке.
1🔥1
📌Анонс семинара Лаборатории 18 сентярбя (10.50 в 4105):

🗒 Linear transformer и RetNet, альтернативы трансформеру с ускорением инференса с O(N^2) до O(N)

Олег подробно расскажет, как выглядит шаг инференса для различных архитектур, и покажет, какие практические выводы из этого можно сделать.

Докладчик: Олег Седухин
👍5🔥1
📌Анонс семинара Магистратуры 22 сентября (14.30 в 5234):

🗒Статья для разбора:

Marc G. Genton. Classes of kernels for machine learning: A statistics perspective, 2001

Докладчик
: Владислав Астахов
Оппонент: Дмитрий Цыбульский

Гость: Иван Комаров
Директор дирекции машинного отделения ЦФТ, один из основателей сибирского отделения Open Data Science.
Тема: Насколько помогают новые методы при решении задачи кредитного скоринга.
👍1🔥1
📌Анонс семинара Лаборатории 25 сентярбя (10.50 в 4105):

🗒 НейроКРЯ: развитие корпусной лингвистики.

Появление корпусов — больших коллекций текстов с интерфейсом поиска по ним — необратимо изменило лингвистику и мотивировало создание языковых моделей. Стремительное развитие NLP в свою очередь позволяет внедрять в классическую лингвистику новые способы исследования. В своём докладе Дмитрий расскажет о том, как они с командой разрабатывают инструменты для НКРЯ, и немного о том, как НКРЯ может пригодится при разработке NLP-приложений.

Докладчик: Дмитрий Морозов

🗒 Рекомендательная модель для операторов поддержки клиентов.

Валентин расскажет про свою магистерскую диссертацию, где помогал операторам поддержки Тинькофф быстрее искать информацию. Помимо простых рекомендательных бейзлайнов, он расскажет про генеративные трансформеры на кликах в графическом интерфейсе. Также, в докладе будет немного про мультимодальные способы внедрения текстовых сообщений в модель.

Докладчик: Валентин Мамедов
🔥11🆒1😎1
📌Анонс семинара Магистратуры 29 сентября (14.30 в 5234):

🗒 Статья для разбора:

Audigier et al. Multiple imputation for multilevel data with continuous and binary variables, 2017

Докладчик
: Болдинов Артем
Оппонент: Тарасов Артем

❗️Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209

Гость: Иван Бондаренко
научный сотрудник лаборатории прикладных цифровых технологий, старший преподаватель кафедры фундаментальной и прикладной лингвистики и кафедры применения математических методов в экономике и планировании НГУ. Ранее работал специалистом по анализу данных в компании 2ГИС, архитектором решений в компании Data Monsters, техлидом команды AutoML для больших данных в компании Huawei, научным сотрудником в МФТИ, преподавателем в ДонНТУ.

Тема выступления: "О предобработке данных вообще и о восстановлении пропущенных значений в частности в практических ML-пайплайнах".
🔥3👍1
📌Анонс семинара Лаборатории 02 октября (10.50 в 4105):

🗒 Применение белковых языковых моделей для предсказания определённых семейств белков

Одной из задач биоинформатики является выравнивание аминокислотных или нуклеотидных последовательностей. По сути, речь идет об их сравнении для выявления сходства или различия. В рамках рассматриваемой проблемы, для упрощения задачи, возможно использование языковых моделей. Об одной из таких моделей и пойдет речь в презентации Эльзары.

Докладчик: Мазинова Эльзара

🗒 Как внедрять ML в физику и наоброт

Роман расскажет с какой стороны можно подойти к решению дифференциальных уравнений с помощью нейросетей, и какие основные проблемы при этом можно встретить. Кроме этого, он покажет в какую сторону движется это направление.

Докладчик: Дерунец Роман

🗒
Технический доклад о состоянии дел в биомедицинских грантах РНФ

Ростислав расскажет о недавнем результате по анализу морфологии аневризм брюшной аорты и ее связи с постоперационными осложнениями. Кроме того, он расскажет о текущем направлении исследования и попытках обучить гибридную модель для генерации поверхностных сеток, о дальнейших планах и открытых задачах.

Докладчик: Епифанов Ростислав
2👍1🔥1
📌Анонс семинара Магистратуры 6 октября (14.30 в 5234):

🗒Статья для разбора:

MacKay D. J. C. Bayesian interpolation, 1992.

Докладчик: Родионов Владислав
Оппонент:
Носорев Константин

❗️Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209

Гость: Валентин Малых
сотрудник МТС.ai (ex Huawei, VK, DeepPavlov).

Тема выступления: "Байесовские подходы в NLP (и их отсутствие)"
🔥4
📌Анонс семинара Лаборатории 09 октября (10.50 в 4105):

🗒
Учимся понимать диалоги на основе реальных данных

Антон расскажет о self-supervised методах обучения NLU моделей на основе больших объёмов реальных диалогов клиентов с ботом и операторами поддержки сервиса. Задача делалась в рамках чат-бота денежных переводов и других сервисов ЦФТ. В презентации будут показаны различные идеи к постановке задач для адаптации моделей к домену без привлечения разметчиков. В частности, будет показано как именно предобучали модельку для лучшей работы с контекстом диалога.

Докладчик: Антон Легченко

🗒 Сбор и разметка корпуса голосовых команд

В своем докладе Сюзанна опишет процесс создания набора голосовых команд с точки зрения датацентрического подхода, а также рассмотрит основные ошибки, совершенные на каждом этапе проделанной работы. Будет полезно всем, кто хоть раз в жизни сталкивался или планирует столкнуться с задачей сбора данных, но не знает, с чего начать.

Докладчик: Сюзанна Мартиросян
👍2🔥1
📌Анонс семинара Магистратуры 13 октября (14.30 в 5234):

🗒Статья для разбора:

A. P. Dawid. The well-calibrated Bayesian. Journal of the American Statistical Association, 1982.

Докладчик: Ковалевский Данил
Оппонент: Травников Владислав

Гость: Андрей Зубков
Руководитель ML-направления в "Евраз"

Тема выступления: Почему калибровка ("точность") алгоритма - не важна

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥1
📌Анонс семинара Лаборатории 16 октября (10.50 в 4105):

🗒
The cake is a lie: когда табличный AutoML не работает?

Современный табличный AutoML основан на принципе оценки качества по кросс-валидации или out-of-time валидации. Этот принцип красив, удобен и часто вполне применим в тех случаях, когда с данными работает ML-специалист, который может их правильно подготовить. Но в наши дни ML широко распространяется, в том числе пытаются создать AutoML-системы "для народа", ориентированные на неспециалистов. При этом принцип кросс-валидации притягивается за уши. В своем докладе Олег продемонстрирует 5 типов табличных данных, которые с точки зрения неспециалиста выглядят нормально, однако обученная на них autoML-система будет бесполезна на практике, потому что принцип кросс-валидации на них не работает.

Докладчик: Седухин Олег

🗒 Кросс-доменная устойчивость алгоритма на основе Transformer в задаче генерации ключевых слов.

Использование генеративных алгоритмов в задаче аннотирования текстов ключевыми словами позволяет достичь более релевантных результатов. Классические алгоритмы лишь выбирают ключевые из самого текста, но практика показывает, что более, чем в трети научных статей используются ключевые, не встретившиеся в тексте самой статьи. В рамках работы была исследована устойчивость алгоритма генерации ключевых на основе Transformer к сдвигу данных на примере шести корпусов из трёх различных доменов.

Докладчик: Морозов Дмитрий
🔥4👍1
📌Анонс семинара Магистратуры 20 октября (14.30 в 5234):

🗒Статья для разбора:

J. R. Quinlan, “Induction of decision trees,” Machine Learning, vol. 1, pp. 81–106, 1986

Докладчик: Гарипов Тимур
Оппонент: Артеменко Никита

Гость: Юрий Кацер
Руководитель направления предиктивной аналитики (Lead DS) в стартапе, а также научный сотрудник ЛабПЦТ ММФ НГУ.

Тема выступления: Применение машинного обучения в задачах промышленности

Ссылка для подключения к трансляции.
Идентификатор конференции: 830 3569 8413
Код доступа: 258209
🔥3👏1
📌Анонс семинара Лаборатории 23 октября (10.50 в 4105):

🗒
Использование Байесовских методов для адаптивной квантизации моделей нейронных сетей.

Нейронные сети имеют большой потенциал для использования на устройствах таких как мобильные телефоны, бытовая техника, сетевое оборудование и другие. Однако, обычно такие устройства имеют не очень мощные процессоры и ограниченное количество памяти, поэтому необходимо решить задачу сжатия нейронных сетей. Одним из методов сжатия является квантизация нейронных сетей. Мы предлагаем использовать Байесовские методы для определения степени квантизации слоев модели.

Докладчики: Иван Плохих , Данил Таранец
👍2🔥2❤‍🔥1