Открытый код ФКН ВШЭ
815 subscribers
28 photos
90 links
Показываем новости по открытому коду ФКН ВШЭ.

Контакты: Михаил Гущин @mhushchyn
Download Telegram
Channel name was changed to «Открытый код ФКН ВШЭ»
Добро пожаловать в канал!

Здесь мы публикуем разные проекты с открытым кодом сотрудников и студентов ФКН ВШЭ. Этот канал будет полезен тем, кто хочет больше узнать о научных проектах и ПО, создаваемых на ФКН. Мы будем размещать ссылки на код, анонсы мероприятий и полезные материалы.

Полезные ссылки:
- Наша страница на github
- Наш сайт
LaNeta

Библиотека для оценки времен примешивания между двумя популяциями при двух пульсах миграции. Метод построен на математической теории неравновесного сцепления трех генетических локусов при примешивании популяций. Он позволяет точно исследовать недавнюю (в пределах нескольких десятков поколений) историю примешивания популяций в сложных сценариях, для которых существовавшие ранее методы были неприменимы или неточны. Библиотека будет интересна всем, кто занимается популяционной геномикой.

статья | код
🔥5
Fulu

Библиотека для python, в которой собраны несколько методов для аппроксимации кривых блеска астрономических объектов с использованием машинного обучения.
В библиотеке имплементирован алгоритм на основе гауссовских процессов, а так же некоторые другие, с использованием нормализующих потоков и баесовских сетей.

Библиотека будет полезна астрономам и прикладным исследователям на стыке машинного обучения и астрофизики.

код | статья
🔥5
Probaforms

В этой библиотеке имплементированы несколько архитектур условных генеративных моделей, включая, CVAE, WGAN, Real NVP. Интерфейс, схожий с интерфейсом библиотеки sklearn, позволяет быстро реализовать и проверять идеи. Инструмент ориентирован на работу с табличными данными и подойдет для различных инженерных и научных задач и приложений.

код
🔥4❤‍🔥1
Linda

Библиотека на python, предназначенная для генерации синтетических табличных данных. В библиотеке реализованы несколько глубоких генеративных моделей. Модели выучивают статистические свойства входных данных и сохраняют эти свойства в синтетически сгенерированных. Библиотека может быть полезна аналитикам данных, инженерам и исследователям, занимающимся табличными и/или синтетическими данными.

код
❤‍🔥2👍2🔥1
TabDDPM

Статья сотрудников лаборатории Яндекс, в которой исследуется применимость диффузионных моделей для задач генерации синтетических табличных данных. Авторы сравнивают свою работу с многочисленными бейзлайнами - VAE и GAN-ми. Для этого они семплируют синтетические данные из генеративных моделей и затем обучают на этих данных классические модели: случайный лес, CatBoost и т.п. Авторы показывают, что их метод обходит другие по качеству в различных сценариях, в том числе в сценарии защиты приватных данных.
Работа может быть полезна исследователем, МЛ инженерам и аналитикам данных.

статья | код
🔥7
Star-shaped DDPM

Статья, выполненная в коллаборации коллег из Bayesgroup с другими научными центрами. Авторы исследуют возможность обучения диффузионных моделей с использованием распределений, отличных от гауссовского. Для этого они показывают дуальность между диффузионным процессом в виде звезды (star-shaped) и обычным марковским процессом. Это позволяет получать эффективные алгоритмы для тренировки и семплирования диффузионных моделей в случае, если данные лежат на ограниченном многообразии.
В своих экспериментах исследователи показывают состоятельность своей гипотезы, проверяя ее на простых синтетических данных, а также на гео- и картиночных данных.
Работа будет полезна исследователям, чьи научные интересы лежат в сфере генеративных моделей, а так же ML-инженерам.

статья | код
🔥72
gflownet-rl

Статья коллег их HDI lab и Bayesgroup на стыке генеративного моделирования и обучения с подкреплением. В статье исследуется относительно новый подход в генеративном моделировании — GenerativeFlowNetworks. В своих экспериментах авторы сравнивают предложенный подход к обучению — через алгоритм M-DQN — с предыдущими работами по GFlowNets. В результате обученная модель оказывается не только конкурентной, но и показывает превосходство в ряде случаев.
Статья может быть полезна исследователям из областей обучения с подкреплением и глубоких генеративных моделей, математикам и DL-инженерам.

статья|код
🔥9👍2🥰2