Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​ Построение клиентской маршрутизации / семантического поиска на Profi.ru
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.

#статьядня

https://prglb.ru/1yrr3
Несколько полезных вещей о машинном обучении
Автор: Pedro Domingos
Данный гайд содержит много полезной информации, но стоит выделить две основные идеи:
- одних данных недостаточно,
- большой объем данных превосходит более умный алгоритм.

#статьядня

https://prglb.ru/54mi2
​​R Projects For Dummies
Автор: Joseph Schmuller
R – не только язык программирования, используемый для работы с графикой и статистической обработки данных, но и бесплатная среда разработки с открытым кодом. Автор поможет вам создать несколько собственных проектов применяя графику R, а также интерактивные инструменты и инструменты машинного обучения.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/1427
Пара задач HeadHunter на Data Science Week
Организаторы Data Science Week 2015 решили провести двухдневный дататон (datathon) – соревнование, где команды программистов и аналитиков решали бизнес-задачи из области Data Science. На дататоне было три задачи, две из которых подготовила команда HeadHunter.
Можете поробовать решить самостоятельно! Но, если что, в статье есть решение)

#полезностьдня

https://prglb.ru/43ghw
Применение основ ML на примерах с пояснениями в питоне
Материалы были разработаны для курса General Assembly's Data Science в Вашингтоне.
Лектор: Sinan Ozdemir и Kevin Markham

#статьядня

https://prglb.ru/4a6ur
Эта шпаргалка содержит множество классических уравнений и диаграмм, которые помогут вам быстро восстановить знания и вспомнить основные идеи по машинному обучению.
Шпаргалка также отлично подойдет тем, кто готовится к собеседованию.

#полезностьдня

https://prglb.ru/3tot6
​​Python и машинное обучение
Автор: Себастьян Рашка

Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.

#книгадня

Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
​​Советы от Гугла по построению систем ML
Этот документ призван помочь тем, кто обладает базовыми знаниями в области машинного обучения, и хочет получить
преимущества передового опыта от Google.

#книгадня #статьядня

Файл прикреплен ниже!
Обучайте, оценивайте, повторяйте: создание системы обнаружения мошенничества с кредитными картами
В этом выступлении рассматриваются три основные проблемы ML, с которыми столкнулся (и решил!) Stripe при создании своей системы обнаружения мошенничества с кредитными картами: выбор меток для мошенничества, которые распространяются на всех продавцов, устранение дисбаланса классов (допустимые обвинения значительно превышают число мошеннических) и проведение контрфактивной оценки ( для измерения производительности и получения данных обучения, когда система ML сама меняет результаты).

#видеодня

Speaker: Лила Сентил Натан

https://prglb.ru/5dgfl
​​Как изучать Data Science в 2019: ответы на частые вопросы
Мысль о том, чтобы изучать Data Science, не даёт вам покоя? Возможно, не зря. В этой статье мы ответили на ряд популярных вопросов новичков.

#статьядня

https://prglb.ru/5pet6
Любой сервис, на котором вообще есть поиск, рано или поздно приходит к потребности научиться исправлять ошибки в пользовательских запросах. Пользователи постоянно опечатываются и ошибаются, и качество поиска от этого неизбежно страдает — а с ним и пользовательский опыт.

При этом каждый сервис обладает своей спецификой, своим лексиконом, которым должен уметь оперировать исправитель опечаток.

#статьядня

https://prglb.ru/4afrh
Анализ изображений и видео (часть 2)
Лекция 1. Поиск изображений по содержанию
Лекция 2. Детектирование объектов
Лекция 3. Детектирование объектов 2
Лекция 4. Цифровой фотомонтаж
Лекция 5. Сегментация изображений
Лекция 6. Генеративные сети
Лекция 7. Генеративные сети 2
Лекция 8. Трекинг объектов
Лекция 9. Трекинг объектов часть 2

Преподаватель курса: Алексей Сергеевич Артамонов

А вот ссылочка на первую часть:
https://prglb.ru/49wyy

#youtubeдня

https://prglb.ru/2ivrt
​​The Data Science Handbook
Автор: Field Cady

Книга направлена на более опытных специалистов и рассматривает классические алгоритмы машинного обучения, от их математических основ до реальных приложений, инструменты визуализации, а также классическую статистику, помогающую читателю критически подумать об интерпретации данных.

В книге рассматриваются следующие темы:
✔️ дорожная карта разработчика в области data science;
✔️ языки программирования, необходимые для data science (scala, python, etc);
✔️ визуализация и простая метрика;
✔️ машинное обучение;
✔️ техническая документация и многое другое.

Скачать книгу:
 https://t.iss.one/progbook/1574
​​ 11 must-have алгоритмов машинного обучения для Data Scientist
Статья содержит в себе список одиннадцати алгоритмов машинного обучения. К каждому прилагается краткое описание, гайды и полезные ссылки.

#статьядня

https://prglb.ru/4z1ns
Руководство хакера по нейронным сетям
Автор работал над глубоким обучением в течение нескольких лет в рамках своего исследования, и среди его проектов - ConvNetJS - библиотека Javascript для обучения нейронных сетей.
Javascript позволяет наглядно представить, что происходит, и поэкспериментировать с различными настройками гиперпараметра

#книгадня

https://prglb.ru/5e9lo
​​Machine Learning with Python Cookbook: Practical Solutions from Preprocessing to Deep Learning
Автор: Chris Albon

Это руководство рассматривает современные подходы языка к решению актуальных проблем в данной области, принятые стандарты и практики, а также реальные примеры применения.

#книгадня

Скачать книгу:
https://prglb.ru/2x68k
SC-FEGAN: Генеративная состязательная сеть редактирования лица с эскизом и цветом пользователя
Система редактирования изображений, которая генерирует изображения, когда пользователь предоставляет маску произвольной формы, эскиз и цвет в качестве входных данных.

#статьядня

https://prglb.ru/5c5eu