Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.39K photos
119 videos
64 files
4.83K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Долгосрочный план Data Science, который НЕ поможет вам стать экспертом всего за несколько месяцев

#статьядня

https://clc.am/3pkS_g
​​Типичные распределения вероятности: шпаргалка data scientist-а
Разбираемся, что такое распределение вероятности, какие виды бывают и в чем отличия?!

#статьядня

https://clc.am/yConHg
В этом блоге автор рассказывает, как ODE можно использовать для решения задач моделирования данных. Автор глубоко погружается в проблему моделирования данных и представляет ODE как альтернативу регрессии. А также представляет расширение для нейронных ODE.

#полезностьдня

https://clc.am/SSmPmA
Введение в Convex Optimization

Этот курс направлен на то, чтобы дать студентам инструменты и обучение для распознавания выпуклых задач оптимизации, возникающих в научных и инженерных приложениях, представляя основную теорию и концентрируясь на аспектах моделирования и результатах.
Темы включают:
- выпуклые множества,
- выпуклые функции,
- задачи оптимизации, наименьших квадратов,
- линейные и квадратичные программы,
- условия оптимальности,
- теория двойственности.

Представлены приложения для обработки сигналов, управления, машинного обучения, финансов, проектирования цифровых и аналоговых схем, вычислительной геометрии, статистики и машиностроения.

#полезностьдня

https://clc.am/-gqpHQ
Генеративные Состязательные Сети
Генеративные Состязательные Сети - это мощный класс нейронных сетей. По сути, они состоят из системы двух нейронных сетей - Генератора и Дискриминатора, которые противостоят друг другу.
Рассмотрим последние достижения в Генеративных Состязательных Сетях.

#статьядня

https://clc.am/RQP7YA
Обучение с подкреплением (reinforcement learning, RL) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой.
Данный курс - это версия для студентов YSDA и ВШЭ (весна 2019 года). Для полных материалов курса необходимо переключиться на главную ветвь. Для всех материалов, которые мало описаны, есть ссылки на дополнительную информацию и связанные материалы (D.Silver / Sutton / blogs / и т.д.).

#полезностьдня

https://clc.am/FsQFzw
Лучшая визуализация методов градиентного спуска
На это можно смотреть вечно!

#статьядня

https://clc.am/UWymLQ
​​Большие данные трансформируют мир! Здесь вы изучите методы интеллектуального анализа данных и машинного обучения для обработки больших наборов данных и извлечения из них ценных знаний.

#полезностьдня

https://clc.am/3eaJoQ
​​Пожалуй, самое понятное объяснение простых математических понятий, да еще и с красивой визуализацией

#полезностьдня

https://clc.am/MxdlUw
Чтобы не пришлось арендовать сервера, небольшой гайд по настройке Ubuntu и GPU для тренировки нейросетей

#статьядня

https://clc.am/EbKZmw
HDFS (the Hadoop Distributed File System) представляет собой распределенную файловую систему, предназначенную для хранения очень больших объемов данных (терабайты или даже петабайты) и обеспечения высокопроизводительного доступа к этой информации.

Цели данного курса:
Научиться понимать основную структуру HDFS и ее связь с основными понятиями распределенной файловой системы.
Понять, как настроить и использовать HDFS из командной строки.
Понять, как использовать HDFS в ваших приложениях

#полезностьдня

https://clc.am/rwesHA
Открытый курс машинного обучения. Композиции: бэггинг, случайный лес
Это пятая статья из серии, которая посвящена простым методам композиции: бэггингу и случайному лесу. А вообще, рекомендуем ознакомиться со всей серией!

#статьядня

https://clc.am/t9JRUA
Это самые простые методы увеличения данных в обработке естественного языка, которые вы можете себе представить - и они работают.
Простые методы редактирования текста могут значительно повысить производительность для небольших наборов данных.

#статьядня

https://clc.am/K1L2Rw
​​ Фреймворк глубокого обучения в 2019: выбираем из 10 лучших
Как выбрать фреймворк глубокого обучения? Сравниваем 10 популярных сред тренировки нейросетей. Преимущества, недостатки, подводные камни.

#статьядня

https://prglb.ru/eoxc
Интерактивные элементы управления в Jupyter Notebooks
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных

#статьядня

https://prglb.ru/cld1
Классификация настроений с обработкой естественного языка на LSTM
В данной статье автор будет использовать Рекуррентные Нейронные Сети, и в частности LSTM, для проведения анализа настроений в Keras.

#полезностьдня

 https://prglb.ru/3xokl
​​ Построение клиентской маршрутизации / семантического поиска на Profi.ru
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.

#статьядня

https://prglb.ru/1yrr3