Добро пожаловать в канал!
Здесь мы публикуем разные проекты с открытым кодом сотрудников и студентов ФКН ВШЭ. Этот канал будет полезен тем, кто хочет больше узнать о научных проектах и ПО, создаваемых на ФКН. Мы будем размещать ссылки на код, анонсы мероприятий и полезные материалы.
Полезные ссылки:
- Наша страница на github
- Наш сайт
Здесь мы публикуем разные проекты с открытым кодом сотрудников и студентов ФКН ВШЭ. Этот канал будет полезен тем, кто хочет больше узнать о научных проектах и ПО, создаваемых на ФКН. Мы будем размещать ссылки на код, анонсы мероприятий и полезные материалы.
Полезные ссылки:
- Наша страница на github
- Наш сайт
LaNeta
Библиотека для оценки времен примешивания между двумя популяциями при двух пульсах миграции. Метод построен на математической теории неравновесного сцепления трех генетических локусов при примешивании популяций. Он позволяет точно исследовать недавнюю (в пределах нескольких десятков поколений) историю примешивания популяций в сложных сценариях, для которых существовавшие ранее методы были неприменимы или неточны. Библиотека будет интересна всем, кто занимается популяционной геномикой.
статья | код
Библиотека для оценки времен примешивания между двумя популяциями при двух пульсах миграции. Метод построен на математической теории неравновесного сцепления трех генетических локусов при примешивании популяций. Он позволяет точно исследовать недавнюю (в пределах нескольких десятков поколений) историю примешивания популяций в сложных сценариях, для которых существовавшие ранее методы были неприменимы или неточны. Библиотека будет интересна всем, кто занимается популяционной геномикой.
статья | код
GitHub
GitHub - hse-cs/LaNeta
Contribute to hse-cs/LaNeta development by creating an account on GitHub.
🔥5
Fulu
Библиотека для python, в которой собраны несколько методов для аппроксимации кривых блеска астрономических объектов с использованием машинного обучения.
В библиотеке имплементирован алгоритм на основе гауссовских процессов, а так же некоторые другие, с использованием нормализующих потоков и баесовских сетей.
Библиотека будет полезна астрономам и прикладным исследователям на стыке машинного обучения и астрофизики.
код | статья
Библиотека для python, в которой собраны несколько методов для аппроксимации кривых блеска астрономических объектов с использованием машинного обучения.
В библиотеке имплементирован алгоритм на основе гауссовских процессов, а так же некоторые другие, с использованием нормализующих потоков и баесовских сетей.
Библиотека будет полезна астрономам и прикладным исследователям на стыке машинного обучения и астрофизики.
код | статья
GitHub
GitHub - hse-cs/fulu: Fulu is a python library of supernova light curves approximation methods based on machine learning.
Fulu is a python library of supernova light curves approximation methods based on machine learning. - hse-cs/fulu
🔥5
Probaforms
В этой библиотеке имплементированы несколько архитектур условных генеративных моделей, включая, CVAE, WGAN, Real NVP. Интерфейс, схожий с интерфейсом библиотеки sklearn, позволяет быстро реализовать и проверять идеи. Инструмент ориентирован на работу с табличными данными и подойдет для различных инженерных и научных задач и приложений.
код
В этой библиотеке имплементированы несколько архитектур условных генеративных моделей, включая, CVAE, WGAN, Real NVP. Интерфейс, схожий с интерфейсом библиотеки sklearn, позволяет быстро реализовать и проверять идеи. Инструмент ориентирован на работу с табличными данными и подойдет для различных инженерных и научных задач и приложений.
код
GitHub
GitHub - hse-cs/probaforms: Conditional normalizing flows (NFs), conditional GANs, and conditional variational autoencoders (CVAEs)…
Conditional normalizing flows (NFs), conditional GANs, and conditional variational autoencoders (CVAEs) with sklearn-like interface - hse-cs/probaforms
🔥4❤🔥1
Linda
Библиотека на python, предназначенная для генерации синтетических табличных данных. В библиотеке реализованы несколько глубоких генеративных моделей. Модели выучивают статистические свойства входных данных и сохраняют эти свойства в синтетически сгенерированных. Библиотека может быть полезна аналитикам данных, инженерам и исследователям, занимающимся табличными и/или синтетическими данными.
код
Библиотека на python, предназначенная для генерации синтетических табличных данных. В библиотеке реализованы несколько глубоких генеративных моделей. Модели выучивают статистические свойства входных данных и сохраняют эти свойства в синтетически сгенерированных. Библиотека может быть полезна аналитикам данных, инженерам и исследователям, занимающимся табличными и/или синтетическими данными.
код
GitHub
GitHub - hse-cs/LINDA: Tabular synthetic data generation
Tabular synthetic data generation. Contribute to hse-cs/LINDA development by creating an account on GitHub.
❤🔥2👍2🔥1
TabDDPM
Статья сотрудников лаборатории Яндекс, в которой исследуется применимость диффузионных моделей для задач генерации синтетических табличных данных. Авторы сравнивают свою работу с многочисленными бейзлайнами - VAE и GAN-ми. Для этого они семплируют синтетические данные из генеративных моделей и затем обучают на этих данных классические модели: случайный лес, CatBoost и т.п. Авторы показывают, что их метод обходит другие по качеству в различных сценариях, в том числе в сценарии защиты приватных данных.
Работа может быть полезна исследователем, МЛ инженерам и аналитикам данных.
статья | код
Статья сотрудников лаборатории Яндекс, в которой исследуется применимость диффузионных моделей для задач генерации синтетических табличных данных. Авторы сравнивают свою работу с многочисленными бейзлайнами - VAE и GAN-ми. Для этого они семплируют синтетические данные из генеративных моделей и затем обучают на этих данных классические модели: случайный лес, CatBoost и т.п. Авторы показывают, что их метод обходит другие по качеству в различных сценариях, в том числе в сценарии защиты приватных данных.
Работа может быть полезна исследователем, МЛ инженерам и аналитикам данных.
статья | код
GitHub
GitHub - yandex-research/tab-ddpm: [ICML 2023] The official implementation of the paper "TabDDPM: Modelling Tabular Data with Diffusion…
[ICML 2023] The official implementation of the paper "TabDDPM: Modelling Tabular Data with Diffusion Models" - yandex-research/tab-ddpm
🔥7
Star-shaped DDPM
Статья, выполненная в коллаборации коллег из Bayesgroup с другими научными центрами. Авторы исследуют возможность обучения диффузионных моделей с использованием распределений, отличных от гауссовского. Для этого они показывают дуальность между диффузионным процессом в виде звезды (star-shaped) и обычным марковским процессом. Это позволяет получать эффективные алгоритмы для тренировки и семплирования диффузионных моделей в случае, если данные лежат на ограниченном многообразии.
В своих экспериментах исследователи показывают состоятельность своей гипотезы, проверяя ее на простых синтетических данных, а также на гео- и картиночных данных.
Работа будет полезна исследователям, чьи научные интересы лежат в сфере генеративных моделей, а так же ML-инженерам.
статья | код
Статья, выполненная в коллаборации коллег из Bayesgroup с другими научными центрами. Авторы исследуют возможность обучения диффузионных моделей с использованием распределений, отличных от гауссовского. Для этого они показывают дуальность между диффузионным процессом в виде звезды (star-shaped) и обычным марковским процессом. Это позволяет получать эффективные алгоритмы для тренировки и семплирования диффузионных моделей в случае, если данные лежат на ограниченном многообразии.
В своих экспериментах исследователи показывают состоятельность своей гипотезы, проверяя ее на простых синтетических данных, а также на гео- и картиночных данных.
Работа будет полезна исследователям, чьи научные интересы лежат в сфере генеративных моделей, а так же ML-инженерам.
статья | код
GitHub
GitHub - andrey-okhotin/star-shaped: Official PyTorch implementation for the paper Star-Shaped Denoising Diffusion Probabilistic…
Official PyTorch implementation for the paper Star-Shaped Denoising Diffusion Probabilistic Models - andrey-okhotin/star-shaped
🔥7❤2
gflownet-rl
Статья коллег их HDI lab и Bayesgroup на стыке генеративного моделирования и обучения с подкреплением. В статье исследуется относительно новый подход в генеративном моделировании — GenerativeFlowNetworks. В своих экспериментах авторы сравнивают предложенный подход к обучению — через алгоритм M-DQN — с предыдущими работами по GFlowNets. В результате обученная модель оказывается не только конкурентной, но и показывает превосходство в ряде случаев.
Статья может быть полезна исследователям из областей обучения с подкреплением и глубоких генеративных моделей, математикам и DL-инженерам.
статья|код
Статья коллег их HDI lab и Bayesgroup на стыке генеративного моделирования и обучения с подкреплением. В статье исследуется относительно новый подход в генеративном моделировании — GenerativeFlowNetworks. В своих экспериментах авторы сравнивают предложенный подход к обучению — через алгоритм M-DQN — с предыдущими работами по GFlowNets. В результате обученная модель оказывается не только конкурентной, но и показывает превосходство в ряде случаев.
Статья может быть полезна исследователям из областей обучения с подкреплением и глубоких генеративных моделей, математикам и DL-инженерам.
статья|код
GitHub
GitHub - d-tiapkin/gflownet-rl: Repository for "Generative Flow Networks as Entropy-Regularized RL" (AISTATS-2024, Oral)
Repository for "Generative Flow Networks as Entropy-Regularized RL" (AISTATS-2024, Oral) - d-tiapkin/gflownet-rl
🔥9👍2🥰2