Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Алгоритмы машинного обучения
Данное видео поможет вам разобраться, какие проблемы есть в Machine Learning, и познакомит с различными алгоритмами.
Ключевые алгоритмы машинного обучения - это линейная регрессия, логистическая регрессия, дерево решений, случайный лес и алгоритм KNN.
Все алгоритмы представлены с простыми примерами и реализованы на языке Python.

#видеодня

https://www.youtube.com/watch?v=I7NrVwm3apg
Если к 2020 году рынок IoT достигнет трехкратного размера и массово увеличатся вычислительные мощности на небольших устройствах, пересечение IoT и машинного обучения станет тенденцией, на которую должны обратить внимание все разработчики.
Доклад охватывает три важных вопроса:
- как управлять поиском данных с устройств IoT для управления моделями машинного обучения;
- как развернуть и использовать обученные модели на мобильных устройствах;
- как сделать обучение на устройстве с помощью компьютера Raspberry Pi.

#видеодня

https://www.youtube.com/watch?v=avxpkFUXIfA
​​TensorFlow for Deep Learning
Автор: Bharath Ramsundar, Reza Bosagh Zadeh

Если вы хорошо владеете линейной алгеброй и у вас есть опыт в программировании на Python, то освоить это руководство не составит для вас большого труда. В нём представлены основы машинного обучения, показывающие вам, как создавать системы, способные обнаруживать объекты в изображениях, распознавать текст, анализировать видео и даже прогнозировать свойства потенциальных лекарств.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/1419
​​Как создать нейронную сеть c библиотекой Keras на Python: пример

1. Что такое Keras?
2. Что такое анализ настроений (сентимент-анализ)?
3. Импорт зависимостей и получение данных
4. Изучение данных
5. Подготовка данных
6. Создание и обучение модели

#статьядня

https://neurohive.io/ru/machine-learning-cases/nejronnaya-set-keras-python/
Anaconda − самая популярная data science-платформа в Python.
Кроме обучающих видео, канал содержит видеозаписи конференций AnacondaCon с выступлениями представителей комьюнити по анализу данных, IT-профессионалов, аналитиков, разработчиков и бизнес-лидеров.

#youtubeдня

Веб-сайт: anaconda.com

https://www.youtube.com/channel/UCND4vKhJssAtK8p1Blfj14Q
​​ Jupyter Notebook: галерея лучших блокнотов по ML и Data Science

Подборка примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных.

#статьядня

 https://proglib.io/p/jupyter-notebook-best/
​​Real-World Machine Learning
Авторы: Хенрик Бринк, Джозеф Ричардс, Марк Феверолф

Книга написана для тех, кто уже знаком с языком программирования Python и хотел бы попробовать свои силы в обработке реальных данных, моделировании, оптимизации и развертке систем машинного обучения. Она содержит в себе хороший теоретический материал, описывающий математическую основу глубокого обучения, различные алгоритмы и понятия. Также даётся описание библиотек pandas и scikit-learn.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/121
Методы предварительной обработки данных, которые вы должны знать
Data Preprocessing - это метод интеллектуального анализа данных, который преобразует необработанные данные в понятный формат. Исходные данные (данные реального мира) всегда неполны и не могут быть промоделированы, т.к. это вызовет определенные ошибки. Вот почему необходимо предварительно обработать данные перед отправкой их в модель.

#статьядня

https://towardsdatascience.com/data-pre-processing-techniques-you-should-know-8954662716d6
Model Serving for Deep Learning

- Model Serving является ключевым в производстве моделей глубокого обучения,
- проблемы, связанные с масштабируемостю моделей

Event: Nordic Data Science and Machine Learning Summits 2018
Speaker: Hagay Lupesko, Amazon AI

#видеодня

https://youtu.be/O5I-DP4_L1s
В данной статье автор делится своим опытом прохождения интервью на позицию Data Science.
Он выделил 7 важных моментов, о которых подробно рассказал:

Совет 1: Найдите нужную роль.
Совет 2: Вам будут отказывать, поэтому наберитесь терпения. Будьте ПОСТОЯННЫМ.
Совет 3: Изучайте статистику, Machine Learning, SQL и Python.
Совет 4: Если вы хотите получить работу, развивайтесь.
Совет 5: Изучите культуру компании, людей и бизнес-модели.
Совет 6: Переговоры и рычаги.
Совет 7: Выберите роль, которая лучше подходит для ВАС.

#статьядня

https://towardsdatascience.com/7-steps-to-landing-your-dream-job-as-a-data-scientist-5ef1724c4137
Как построить имитатор рынка с использованием цепей Маркова и Python
Модель поведения клиентов, визуализация результатов теста A/B, прогнозирование пользовательских показателей ... все с использованием простой марковской структуры!

#статьядня

https://towardsdatascience.com/how-to-build-a-market-simulator-using-markov-chains-and-python-7923256f8d29
Gridworlds - набор обучающих сред подкрепления, иллюстрирующих различные защитные свойства интеллектуальных агентов и классифицирующих проблемы безопасности ИИ, связанные с надежностью (прерывания, побочные эффекты, отсутствующий супервизор, надежность для самомодификации).

#youtubeдня

AI Gridworlds
https://www.youtube.com/watch?v=eElfR_BnL5k&list=PLzH6n4zXuckquVnQ0KlMDxyT5YE-sA8Ps&index=12

EXTRA BITS: AI Gridworlds
https://www.youtube.com/watch?v=py5VRagG6t8&list=PLzH6n4zXuckquVnQ0KlMDxyT5YE-sA8Ps&index=13
​​Новый подход в Deep Learning: популяционное обучение нейросетей
Из данной статьи вы узнатете о подходе, предложенном компанией DeepMind для настройки гиперпараметров в моделях Deep Learning: популяционное обучение нейросетей.

#статьядня

https://proglib.io/p/population-deep-learning/
​​Python для сложных задач. Наука о данных и машинное обучение
Автор: Дж. Вандер Плас
Если вы работаете в сфере Data Science или хотите узнать что-то новое, то обучение можно начать с данной книги Python. В ней вы найдете ответы на вопросы по вычислительным и статистическим методам, передовым алгоритмам разработки, манипулированию данными и т. д.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/120
​​ Наглядное введение в нейросети на примере распознавания цифр
При помощи множества анимаций на примере задачи распознавания цифр и модели перцептрона дано наглядное введение в процесс обучения нейросети.

#статьядня

https://proglib.io/p/neural-network-course/
Кто как использует возможности искусственного интеллекта, а автор проекта использует глубокое обучение для создания лиц аниме-девушек!
Ну что ж....полезненько)

#полезностьдня

https://towardsdatascience.com/drawing-anime-girls-with-deep-learning-4fa6523eb4d4
​​Классификация, регрессия и другие алгоритмы Data Mining с использованием R
Автор: Шитиков В. К., Мастицкий С. Э.

Показана технология применения таких методов бутстреп-агрегирования деревьев решений, как бэггинг, случайный лес и бустинг. Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей значений гиперпараметров моделей с использованием пакета caret для статистической среды R. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей.

#книгадня

Почитать книгу онлайн:
https://ranalytics.github.io/data-mining/index.html
​​Keras.js — это машинное обучение в браузере!
Он поможет при изучении и позволит потрогать руками работу алгоритмов машинного обучения.

#полезностьдня

https://transcranial.github.io/keras-js/#/