Градиентное погружение

Интерпретируемость моделей

Некоторая абстрактная оценка с которой человек может быть уверен в предсказаниях модели. Она позволяет выявить взаимосвязи в реальных данных и описать больше чем стандартные метрики.

Необходимость интерпретируемости возникает из-за неполноты формализации проблемы, потому что предсказание лишь частично решает исходную проблему.

И наоборот, в случаях когда проблема хорошо изучена и ошибка не оказывает существенного влияния, можно пренебречь объяснениями.

@gradientdip

👍10

2.35K viewsМаксим Герасимов, 22:48

Градиентное погружение

Интересно, что интерпретируемость можно разделить на внутреннею и внешнюю. Внутренняя - веса модели, сводная статистика за цикл обучения. Внешняя - анализ объектов на входе и выходе после обучения.

При этом мы можем пытаться рассматривать прогноз как на уровне всей модели, её частей/модулей, так и на конкретном примере, с усреднением на весь набор данных.

Единичные предсказания иногда способны объяснять прогноз лучше, чем обобщенные, т.к. в них содержится информация о локальной группе.

Но как же нам оценивать саму интерпретацию? Можно выдать группе и оценить изменения (профессионалы или непрофессионалы), либо оценивать на уровне функционала задачи без участия человека (корреляция между численным значением интерпретируемости и других важных параметров).

Интерпретация обладает свойствами:
выразительность, прозрачность (черный ящик), переносимость (специфика метода), вычислительная сложность.

Характеристика хороших предсказаний: контрастность (каким было бы предсказание, если бы входные данные были другими), короткость (никто не ожидает полный список объяснений, достаточно 1-3 причин), социальный характер (группа людей для которых делается предсказание), аномальные или вероятные объяснения.

@gradientdip

Более подробные разборы конкретных кейсов, алгоритмов и статей по теме можно найти в книге (советую к прочтению):

Molnar, C. (2022). Interpretable Machine Learning

👍23❤3🔥1

3.02K viewsМаксим Герасимов, edited 22:49

Градиентное погружение

🔥 Первая модель для генерации картинок для 100+ языков

Представляю вам модель Кандинский 2.0, над которой мы в Сбере много работали. Весь код и веса модели в опенсурсе!

Принцип её работы - латентная диффузия. Мы взяли мультиязычный CLIP и mt5-small, сделав из них ансамбль.

Вы можете проверить её прямо в браузере без какой-либо регистрации! На ваш выбор: генерация картинок или inpainting.

@gradientdip

статья на хабр
гитхаб

🔥34👍10🎉3😐3🤨2❤‍🔥1🤩1💯1🏆1

4.86K viewscene655, 14:33

Градиентное погружение

Forwarded from Complete AI

Всем привет!

Мой первый пост в канале начинается в самый разгар конференции AIJ🎉

Сегодня 24.11.2022 года - второй день конференции AI Journey, к которой наши команды готовились весь год. У меня будет доклад в секции «Science&Business» в 16.00 (мск).

Расскажу про «Технологии компьютерного зрения в задачах высококачественного синтеза мультимедийного контента». Будут детали про две наших ключевых модели генерации изображений за 2022 год: Kandinsky и Kandinsky 2.0 (кстати, официальный пресс-релиз состоялся вчера - пресс-релиз, Хабр, GitHub, платформа fusionbrain).

Залетайте на прямую трансляцию на сайте AIJ - будет очень интересно!👨‍💻

Буду рад ответить на вопросы по докладу!🎉

P.S. Кстати, на платформе fusionbrain можно поиграть с новым Кандинским в режимах генерации и inpainting/outpainting.

Please open Telegram to view this post

VIEW IN TELEGRAM

AI Journey

Конференция AI Journey 19-21 ноября 2025. Ключевые спикеры в сфере технологий искусственного интеллекта

Конференция AI Journey 19-21 ноября 2025. Ключевые спикеры в сфере технологий искусственного интеллекта.

👍18🔥2🤡2😁1

3.41K viewscene655, 07:21

Градиентное погружение

Kandinsky2.0

Теперь можно попробовать в HF Spaces.
Один запрос - 4 фотки. Бегом пробовать -> тык

@gradientdip

huggingface.co

Kandinsky2.0 - a Hugging Face Space by AlexWortega

Discover amazing ML apps made by the community

🔥21🌚5🤡2👍1🐳1

23K viewsМаксим Герасимов, 17:11

Градиентное погружение

10 месяцев

Именно столько мы шли к цифре в 2к подписчиков. Чудесный день, не иначе. Спасибо всем тем кто помогал нам репостами.

Пройдя рубеж в 1к, мы обещали "радовать постами", что же, самое время собрать обратную связь.

Расскажите, что нравится или не нравится в нашем контенте, что стояло бы улучшить.

Вы также можете задавать свои вопросы к нам в комментариях, мы постараемся ответить.

🔥38🎉14👍7❤4🐳1

3.13K viewsМаксим Герасимов, edited 10:46

Градиентное погружение

Forwarded from Я у мамы аналитик (Stas Valuev)

Нашел прикольную штуку для создания дата-пайплайнов прямо из интерфейса JupyterLab - Elyra.

Причем интересно, что собирать их можно не только из готового кода, но еще и из самих ноутбуков, а также каких-то базовых действий над элементами (скачать, сгруппировать, разделить, соединить файлы и тому подобное).
А еще можно пробросить выполнение пайплайна в оркестраторы вроде Airflow или даже (прости, господи) Kubeflow.

Кажется перспективной штукой, буду подробнее изучать.

В статье ниже можно посмотреть как это выглядит в интерфейсе.

🔗Ссылка

#инструменты

👍33🤡10🔥1😁1

3.84K viewsМаксим Герасимов, 18:59

Градиентное погружение

Forwarded from Love. Death. Transformers.

Самое полезное что есть у трансформера как у архитектры - устойчивость, оч сложно сделать так чтобы градиенты взорвались или на инференсе он разошёлся, поэтому 8бит обучение и инференс, вполне себе рабочая схема(скоро выйдет 4бит инференс, но его пока карты не поддерживают)

Ноутбук сборник всяких хаков

Автор: @kaggling

Kaggle

Optimization approaches for Transformers [Part 2]

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

🔥25🤔1

3.32K viewsМаксим Герасимов, 14:40

Градиентное погружение

Бац и вот теперь я frontend

Сейчас я нахожусь на хакатоне по разработке приложений для вк.

За ночь сделали обучающее приложение на тему ML. Есть тесты и теоретическая информация по основным разделам как классического МО, так и DL.

Потыкать приложение можно -> тут

Баги, отзывы, комментарии под постом

UPD: всем спасибо за переходы

Машинное обучение

C помощью этого приложения вы можете прокачать свои навыки в машинном обучение!

🔥24🤡15👎9👍1🤔1

2.94K viewscene655, edited 03:49

Градиентное погружение

Forwarded from Complete AI (Andrey Kuznetsov)

🔥 Scalable Diffusion Models with Transformers

Вчера вышла интересная работа от ребят из UC Berkeley и NY University про комбинацию диффузии и трансформеров (Diffusion Transformers или DiT).

Ребята заменяют U-Net на трансформер и работают с патчами в латентном пространстве. DiT-XL/2 превосходит все class-conditional диффузионные модели на ImageNet 512x512 и 256x256 бенчмарках и достигает FID=2.27 для низкого разрешения. Более вычислительно тяжёлые DiT позволяют генерировать сэмплы очень высокого качества.

статья
гитхаб
колаб

👍25🤔6🍌1

2.87K viewscene655, 20:40

Градиентное погружение

Forwarded from Градиент обреченный (Sergei Averkiev)

🔺 TAPE

Подъехал первый бенчмарк для оценки моделей во few-shot на русском языке (!) от SberDevices.

〰️ Что это?

Сейчас большие языковые модели все чаще используют, добавляя в затравку один или несколько примеров (few-shot). TAPE позволяет оценить, насколько хорошо модель работает в таком режиме.

〰️ Устойчивость к шуму

В датасете шесть задач (RuOpenBookQA, RuWorldTree, MultiQ, CheGeKa, Ethics, Winograd) + можно оценить насколько модель устойчива к зашумлению и атакам (опечатки, эмодзи, перестановки слов и т.д.).

👉 Хабр | GitHub | HF

Хабр

TAPE: первый бенчмарк для few-shot оценки языковых моделей на русском языке

Мы в SberDevices обучаем и оцениваем языковые модели для русского языка уже давно — так, например, за два года существования бенчмарка Russian SuperGLUE через его систему оценки прошли более 1500...

🔥15👍2

4.35K viewsМаксим Герасимов, 11:51

Градиентное погружение

Кажется на другом конце линии вовсе не нейронка

😁66🔥9👍3

4.6K viewsМаксим Герасимов, 16:14

Градиентное погружение

👍28🔥8🎉6

4.05K viewsМаксим Герасимов, 15:09

Градиентное погружение

💻 Russian Texts Statistics (ruts)

👉 Библиотека разработанная для извлечения признаков из произвольного текста. Работает на русском, но ничего не мешает применить для другого языка.

В комплект входят:
• Базовые статистики (количество слогов, букв, пробелов и тд)
• Метрики удобочитаемости (уже писал о них)
• Метрики лексического разнообразия (Индекс Симпсона и тд)
• Морфологические статистики

Визуализации:
— Закон Ципфа
— Литературная дактилоскопия
— Дерево слов

Подойдет в качестве экстрактора для фича инжиниринга к обычному tf-idf или эмбеддингам.

github

👍39❤1🤡1

4.72K viewsМаксим Герасимов, 19:15

Градиентное погружение

Forwarded from Love. Death. Transformers.

Babenko_M._Vvedenie_v_teoriyu_algoritmov_i_struktur_dannykh.pdf

1.1 MB

В руки попала топавая шадовая книжка по алгосам, го ботат

🔥19👍3🥱3

3.5K viewscene655, 19:48

About

Blog

Apps

Platform