Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​ Jupyter Notebook: галерея лучших блокнотов по ML и Data Science

Подборка примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных.

#статьядня

 https://proglib.io/p/jupyter-notebook-best/
​​Real-World Machine Learning
Авторы: Хенрик Бринк, Джозеф Ричардс, Марк Феверолф

Книга написана для тех, кто уже знаком с языком программирования Python и хотел бы попробовать свои силы в обработке реальных данных, моделировании, оптимизации и развертке систем машинного обучения. Она содержит в себе хороший теоретический материал, описывающий математическую основу глубокого обучения, различные алгоритмы и понятия. Также даётся описание библиотек pandas и scikit-learn.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/121
Методы предварительной обработки данных, которые вы должны знать
Data Preprocessing - это метод интеллектуального анализа данных, который преобразует необработанные данные в понятный формат. Исходные данные (данные реального мира) всегда неполны и не могут быть промоделированы, т.к. это вызовет определенные ошибки. Вот почему необходимо предварительно обработать данные перед отправкой их в модель.

#статьядня

https://towardsdatascience.com/data-pre-processing-techniques-you-should-know-8954662716d6
Model Serving for Deep Learning

- Model Serving является ключевым в производстве моделей глубокого обучения,
- проблемы, связанные с масштабируемостю моделей

Event: Nordic Data Science and Machine Learning Summits 2018
Speaker: Hagay Lupesko, Amazon AI

#видеодня

https://youtu.be/O5I-DP4_L1s
В данной статье автор делится своим опытом прохождения интервью на позицию Data Science.
Он выделил 7 важных моментов, о которых подробно рассказал:

Совет 1: Найдите нужную роль.
Совет 2: Вам будут отказывать, поэтому наберитесь терпения. Будьте ПОСТОЯННЫМ.
Совет 3: Изучайте статистику, Machine Learning, SQL и Python.
Совет 4: Если вы хотите получить работу, развивайтесь.
Совет 5: Изучите культуру компании, людей и бизнес-модели.
Совет 6: Переговоры и рычаги.
Совет 7: Выберите роль, которая лучше подходит для ВАС.

#статьядня

https://towardsdatascience.com/7-steps-to-landing-your-dream-job-as-a-data-scientist-5ef1724c4137
Как построить имитатор рынка с использованием цепей Маркова и Python
Модель поведения клиентов, визуализация результатов теста A/B, прогнозирование пользовательских показателей ... все с использованием простой марковской структуры!

#статьядня

https://towardsdatascience.com/how-to-build-a-market-simulator-using-markov-chains-and-python-7923256f8d29
Gridworlds - набор обучающих сред подкрепления, иллюстрирующих различные защитные свойства интеллектуальных агентов и классифицирующих проблемы безопасности ИИ, связанные с надежностью (прерывания, побочные эффекты, отсутствующий супервизор, надежность для самомодификации).

#youtubeдня

AI Gridworlds
https://www.youtube.com/watch?v=eElfR_BnL5k&list=PLzH6n4zXuckquVnQ0KlMDxyT5YE-sA8Ps&index=12

EXTRA BITS: AI Gridworlds
https://www.youtube.com/watch?v=py5VRagG6t8&list=PLzH6n4zXuckquVnQ0KlMDxyT5YE-sA8Ps&index=13
​​Новый подход в Deep Learning: популяционное обучение нейросетей
Из данной статьи вы узнатете о подходе, предложенном компанией DeepMind для настройки гиперпараметров в моделях Deep Learning: популяционное обучение нейросетей.

#статьядня

https://proglib.io/p/population-deep-learning/
​​Python для сложных задач. Наука о данных и машинное обучение
Автор: Дж. Вандер Плас
Если вы работаете в сфере Data Science или хотите узнать что-то новое, то обучение можно начать с данной книги Python. В ней вы найдете ответы на вопросы по вычислительным и статистическим методам, передовым алгоритмам разработки, манипулированию данными и т. д.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/120
​​ Наглядное введение в нейросети на примере распознавания цифр
При помощи множества анимаций на примере задачи распознавания цифр и модели перцептрона дано наглядное введение в процесс обучения нейросети.

#статьядня

https://proglib.io/p/neural-network-course/
Кто как использует возможности искусственного интеллекта, а автор проекта использует глубокое обучение для создания лиц аниме-девушек!
Ну что ж....полезненько)

#полезностьдня

https://towardsdatascience.com/drawing-anime-girls-with-deep-learning-4fa6523eb4d4
​​Классификация, регрессия и другие алгоритмы Data Mining с использованием R
Автор: Шитиков В. К., Мастицкий С. Э.

Показана технология применения таких методов бутстреп-агрегирования деревьев решений, как бэггинг, случайный лес и бустинг. Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей значений гиперпараметров моделей с использованием пакета caret для статистической среды R. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей.

#книгадня

Почитать книгу онлайн:
https://ranalytics.github.io/data-mining/index.html
​​Keras.js — это машинное обучение в браузере!
Он поможет при изучении и позволит потрогать руками работу алгоритмов машинного обучения.

#полезностьдня

https://transcranial.github.io/keras-js/#/
​​В данной статье представлен обзор методов оптимизации градиентным спуском на практике.
Разбираемся, какие методы действительно работают!

#статьядня

https://ruder.io/optimizing-gradient-descent/index.html
Машинное обучение для геймеров: прогнозы подземелий и регрессии драконов

В докладе автор объяснит виды проблем, которые можно решить с помощью ML, какие данные требуются для их решения и как выглядят результаты.
С помощью забавных примеров, автор рассмотрит пять основных типов проблем, которые может решить машинное обучение: регрессия, прогнозирование, анализ воздействия, классификация и обнаружение аномалий.

#видеодня

EVENT: IndyPy 2018
SPEAKER: Guy Royse

https://www.youtube.com/watch?v=nsjXLYtCIpg
Математические методы обучения по прецедентам (теория обучения машин)
Автор: К. В. Воронцов

Теория обучения машин (machine learning, машинное обучение) находится на стыке прикладной статистики, численных методов оптимизации, дискретного анализа, и за последние 50 лет оформилась в самостоятельную математическую дисциплину.
В курсе рассматриваются основные задачи обучения по прецедентам: классификация, кластеризация, регрессия, понижение размерности. Изучаются методы их решения.
Вообщем....рекомендуем!

#книгадня

Скачать лекции:
https://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf
​​Несколько полезных концептов, которые нужно изучить начинающему и не очень специалисту по машинному обучению и нейронным сетям.

#статьядня

https://proglib.io/p/machine-learning-concepts/