AI для Всех

Есть такой пакет DeepTables.

Для работы с табличными данными, содержит реализации нескольких красивых решений.

На соревновании сверху почти с нуля добивается топ-качества.

Части совсем новых сетей (типа TabNet) не имплементировано + реализации в принципе на tensorflow. Что немного затрудняет внедрение их в курс - сложно будет делать transfer learning и прочее.

Плюс качество они меряют на этом датасете в основном, а датасет по отзывам почти не содержит взаимодействия признаков и тд.
Потому можно пока упомянуть вскользь, пока/если никто из нас на реальной задаче не обнаружит, что пакет - топыч

#tabular

GitHub

GitHub - DataCanvasIO/DeepTables: DeepTables: Deep-learning Toolkit for Tabular data

DeepTables: Deep-learning Toolkit for Tabular data - DataCanvasIO/DeepTables

96 viewsDmitry Penzar, edited 22:15

AI для Всех

Насчет датасетов - набор датасетов для демонстраций ML на химии.

К сожалению, есть нюанс - все датасеты очень простые. Но именно для иллюстрации - почему бы и нет

#ScientificML #chemistry #datasets

83 viewsDmitry Penzar, edited 03:03

AI для Всех

Так же стоит отметить ициативу DeepChem, которые автоматизируют обучение на химических веществах.

GitHub

Там много неликвида или упрощенных схем, которые часто не будут работать, но как пример, что в принципе можно делать - они подходят.

#ScientificML #chemistry

GitHub

deepchem

deepchem has 19 repositories available. Follow their code on GitHub.

92 viewsDmitry Penzar, edited 03:15

AI для Всех

Также в нем есть полезные фишки хотя бы для понимания - например, реализован один из правильных способов разбиение химических молекул

89 viewsDmitry Penzar, 03:20

AI для Всех

Wasserstein WGAN-GP для генерации молекул. Опять же, датасет используется довольно бесмысленный, но можем адаптировать этот пример с tensorflow на pytorch.
Ну и взять что-нить хоть чуть осмысленнее, типа ингибиторов киназ

#ScientificML #chemistry #graph #GAN

keras.io

Keras documentation: WGAN-GP with R-GCN for the generation of small molecular graphs

138 viewsDmitry Penzar, edited 04:04

AI для Всех

Perceiver IO: позволяет работать с различными модальностями (текст, картинки, звук, видео), в том числе одновременно

Блог-пост DeepMind
GitHub (код, колабы, предобученные модели JAX)
GitHub (реплика на PyTorch)

#transformer #multimodal

103 viewsArtemii, edited 06:12

AI для Всех

Моя версия блокнота VQGAN+CLIP добралась до 🤗 Spaces.

Поиграться можно хоть с телефона

#text2image #GAN #CLIP #demo

Twitter

VQGAN + CLIP public now on @huggingface Spaces using @Gradio link: huggingface.co/spaces/akhaliq…

126 viewsArtemii, edited 13:34

AI для Всех

SpeechBrain - классный репозиторий для всего связанного со звуком. Сам им пользовался пару раз.

#sound #speech #audio

Twitter

Philip Vollet

SpeechBrain an open-source and all-in-one speech toolkit based on PyTorch Develop state-of-the-art speech technologies, including systems for speech recognition, speaker recognition, speech enhancement, multi-microphone signal processing @SpeechBrain1 gi…

152 viewsArtemii, edited 18:18

AI для Всех

Где машинка применяется в drug design
Довольно по верхам имхо. Только общее представление получить.

И, да, генерация молекул упоминается.

YouTube
NeurIPS

#ScientificML #medicine

116 viewsDmitry Penzar, edited 19:12

AI для Всех

Ну или вот талк от главы Insilico Medicine. Про то, как у них пайплайн по разработке лекарств работает
Про longevity я бы не слушал, но это у меня аллергия.

YouTube

#ScientificML #medicine

YouTube

Alex Zhavoronkov - From AI-Powered Drug Discovery to Longevity Medicine

Alex Zhavoronkov, Insilico Medicine, Hong Kong, presents at the 2020 Aging Research and Drug Discovery conference.

About the Aging Research and Drug Discovery meeting:
According to the United Nations, the proportion of people aged over 65 now outnumber…

102 viewsDmitry Penzar, edited 19:17

AI для Всех

На NeurIPS будет целая отдельная секция про AI for Science:

https://ai4sciencecommunity.github.io

Шикарный line-up и до 18 сентября можно подать абстракты

#ScientificML #conference

86 viewsArtemii, edited 19:49

AI для Всех

Немного растянуто, но зато на русском. Текст про применение ML в астрономии.

#ScientificML #astronomy

education.yandex.ru

Космическая работа: как решать задачи астрономов с помощью машинного обучения

Улучшение данных, полученных с телескопов, и автоматизация рутины учёных

87 viewsArtemii, edited 22:42

AI для Всех

StyleGAN-NADA преобразует предварительно обученный генератор в новые домены, используя только текстовую подсказку и без обучающих данных.

Естественно направляет его CLIP.

Project

#GAN #CLIP #multimodal

91 viewsArtemii, edited 05:55

AI для Всех

Kaggle про патологии растений.

#ScientificML #biology #botany #images

Medium

Practical Lighting Tips to Rank on Kaggle Image Challenges

This post outlines some PyTorch Lightning best practices from the recent Kaggle Plant Pathology image classification challenge that enabled

85 viewsArtemii, edited 21:44

AI для Всех

Репозиторий для fine-tuning (ну и обучения с нуля, если надо) CLIP.

#CLIP #multimodal #training

GitHub

GitHub - Zasder3/train-CLIP-FT

Contribute to Zasder3/train-CLIP-FT development by creating an account on GitHub.

89 viewsArtemii, edited 07:32

AI для Всех

Так же стоит отметить ициативу DeepChem, которые автоматизируют обучение на химических веществах. GitHub Там много неликвида или упрощенных схем, которые часто не будут работать, но как пример, что в принципе можно делать - они подходят. #ScientificML…

Туториал + Colab по DeepChem от Weights & Biases

#ScientificML #chemistry #tutorial

W&B

Using W&B with DeepChem: Molecular Graph Convolutional Networks

A quick tutorial on using W&B to track DeepChem molecular deep learning experiments. Made by Kevin Shen using Weights & Biases

87 viewsArtemii, edited 09:20

AI для Всех

Датасет жужжания москитов. Видимо что бы по звуку можно было определять виды этих комаров.

#datasets #ScientificML #sound #audio

86 viewsArtemii, edited 19:05

AI для Всех

10ого августа в 10 утра PT состоится live demo Open AI copilot

#news

Twitch

OpenAI - Twitch

OpenAI’s mission is to ensure that artificial general intelligence benefits all of humanity.

86 viewsArtemii, edited 19:35

77 viewsArtemii, edited 23:11

AI для Всех

#SSL
#noise
#LNL

Contrast to Divide

Статья про то, как использовать self-supervised метод, если у вас много данных, но они все шумные (Learning with noisy labels, LNL)
Обычно в таких случаях пытаются пользоваться допущением, что на нейросеть поначалу будет учить лучше правильные примеры, а на тех, где метка неверна - будет выдавать большую ошибку. Потом же она войдет в memoization phase, где эта разница пропадет.
Потому главная проблема в таком подходе - "поймать момент", когда нейросеть уже выучила правильное, не запомнила кучу мусора.
Авторы показывают, что в общем случае это сделать сложно.
Кроме того они разбирают вариант, когда для LNL используется не архитектура с нуля, а self-superised предобученная на близком домене нейросеть. Первая проблема подхода в том, что не всегда такая сеть / чистый набор данных в принципе есть. Вторая - что он тоже может не работать.
Авторы предлагают использовать предобучение на именно целевом датасете и показывают, что это работает лучше других подходов.

Тема может очень подойти части студентов - у биологов часто данные получены с огромным шумом из-за артефактов эксперимента, неправильной аннотации, врущих пациентов и тд

89 viewsDmitry Penzar, edited 10:52

About

Blog

Apps

Platform