Машинное обучение RU
17.7K subscribers
1.58K photos
209 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
Learning from others' mistakes: Avoiding dataset biases without modeling them
Sanh et al. [Hugging Face]
Статья

В больших датасетах вроде MNLI с моделями случаются плохие вещи из-за низкого качества данных. Многие примеры можно правильно классифицировать с помощью эвристик, не имеющих ничего общего с задачей. Например, наличие слова “no” очень повышает вероятность класса “противоречие”.

Эту проблему можно решить очисткой датасета или нахождением конкретных эвристик и построением adversarial примеров для них. Но авторы этой статьи предложили метод, который не требует никакой ручной работы для исправления этой проблемы.

Идея в том, что в начале вы тренируете небольшую модель для классификации w, например TinyBERT из двух слоёв. Она выучивает самые простые зависимости в данных. Далее вы замораживаете эту модель и учите большую модель b на вот таком лоссе: CrossEntropy(p_w * p_b, label).

Идея в том, что градиенты для тех примеров, где простая модель ошибается будут большими, а там, где простая модель справля
🐍 Анимация градиентного спуска и ландшафта функции потерь на Python

Демонстрация работающих примеров визуализации ландшафта функции потерь и анимации процесса градиентного спуска.

Читать

@machinelearning_ru
Разработка и развёртывание приложения машинного обучения: полное руководство

Читать

@machinelearning_ru
Создаем юнит-тесты с помощью ИИ-инструмента

Читать

@machinelearning_ru
RL-Theory-book (rus)

Книга обучение с подкреплением

https://github.com/FortsAndMills/RL-Theory-book

@machinelearning_ru