Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.39K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Большие данные трансформируют мир! Здесь вы изучите методы интеллектуального анализа данных и машинного обучения для обработки больших наборов данных и извлечения из них ценных знаний.

#полезностьдня

https://clc.am/3eaJoQ
​​Пожалуй, самое понятное объяснение простых математических понятий, да еще и с красивой визуализацией

#полезностьдня

https://clc.am/MxdlUw
Чтобы не пришлось арендовать сервера, небольшой гайд по настройке Ubuntu и GPU для тренировки нейросетей

#статьядня

https://clc.am/EbKZmw
HDFS (the Hadoop Distributed File System) представляет собой распределенную файловую систему, предназначенную для хранения очень больших объемов данных (терабайты или даже петабайты) и обеспечения высокопроизводительного доступа к этой информации.

Цели данного курса:
Научиться понимать основную структуру HDFS и ее связь с основными понятиями распределенной файловой системы.
Понять, как настроить и использовать HDFS из командной строки.
Понять, как использовать HDFS в ваших приложениях

#полезностьдня

https://clc.am/rwesHA
Открытый курс машинного обучения. Композиции: бэггинг, случайный лес
Это пятая статья из серии, которая посвящена простым методам композиции: бэггингу и случайному лесу. А вообще, рекомендуем ознакомиться со всей серией!

#статьядня

https://clc.am/t9JRUA
Это самые простые методы увеличения данных в обработке естественного языка, которые вы можете себе представить - и они работают.
Простые методы редактирования текста могут значительно повысить производительность для небольших наборов данных.

#статьядня

https://clc.am/K1L2Rw
​​ Фреймворк глубокого обучения в 2019: выбираем из 10 лучших
Как выбрать фреймворк глубокого обучения? Сравниваем 10 популярных сред тренировки нейросетей. Преимущества, недостатки, подводные камни.

#статьядня

https://prglb.ru/eoxc
Интерактивные элементы управления в Jupyter Notebooks
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных

#статьядня

https://prglb.ru/cld1
Классификация настроений с обработкой естественного языка на LSTM
В данной статье автор будет использовать Рекуррентные Нейронные Сети, и в частности LSTM, для проведения анализа настроений в Keras.

#полезностьдня

 https://prglb.ru/3xokl
​​ Построение клиентской маршрутизации / семантического поиска на Profi.ru
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.

#статьядня

https://prglb.ru/1yrr3
Несколько полезных вещей о машинном обучении
Автор: Pedro Domingos
Данный гайд содержит много полезной информации, но стоит выделить две основные идеи:
- одних данных недостаточно,
- большой объем данных превосходит более умный алгоритм.

#статьядня

https://prglb.ru/54mi2
​​R Projects For Dummies
Автор: Joseph Schmuller
R – не только язык программирования, используемый для работы с графикой и статистической обработки данных, но и бесплатная среда разработки с открытым кодом. Автор поможет вам создать несколько собственных проектов применяя графику R, а также интерактивные инструменты и инструменты машинного обучения.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/1427
Пара задач HeadHunter на Data Science Week
Организаторы Data Science Week 2015 решили провести двухдневный дататон (datathon) – соревнование, где команды программистов и аналитиков решали бизнес-задачи из области Data Science. На дататоне было три задачи, две из которых подготовила команда HeadHunter.
Можете поробовать решить самостоятельно! Но, если что, в статье есть решение)

#полезностьдня

https://prglb.ru/43ghw
Применение основ ML на примерах с пояснениями в питоне
Материалы были разработаны для курса General Assembly's Data Science в Вашингтоне.
Лектор: Sinan Ozdemir и Kevin Markham

#статьядня

https://prglb.ru/4a6ur
Эта шпаргалка содержит множество классических уравнений и диаграмм, которые помогут вам быстро восстановить знания и вспомнить основные идеи по машинному обучению.
Шпаргалка также отлично подойдет тем, кто готовится к собеседованию.

#полезностьдня

https://prglb.ru/3tot6
​​Python и машинное обучение
Автор: Себастьян Рашка

Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.

#книгадня

Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
​​Советы от Гугла по построению систем ML
Этот документ призван помочь тем, кто обладает базовыми знаниями в области машинного обучения, и хочет получить
преимущества передового опыта от Google.

#книгадня #статьядня

Файл прикреплен ниже!