Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.39K photos
119 videos
64 files
4.83K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Python и машинное обучение (2017)
Автор: Себастьян Рашка

Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.

#книгадня

Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
​​#статьядня

В данной статье расскажем, как стать аналитиком данных за 12 недель по курсам Microsoft и др.

https://proglib.io/p/ds-in-3months/
​​Pandas - библиотека на языке Python для обработки и анализа данных. Работа Pandas с данными строится поверх библиотеки NumPy, являющейся инструментом более низкого уровня.

#cheatsheet

Если работаете (или планируете поработать в ближайшее время) с данной библиотекой, то эти шпаргалки точно вам пригодятся!
Введение в анализ данных с использованием Pandas
В данном семинаре рассмотрен практический подход к проведению исследований в Pandas.
Автор начинает с импорта реальных данных, затем чистит их, преобразует и анализирует, испольуя некоторую визуализацию.

#видеодня

EVENT: PyData Seattle 2017
SPEAKER: Quentin Caudron

https://www.youtube.com/watch?v=WrAkpobchUk&index=9&list=PLFjq8z-aGyQ5ijq6ZD2CEkqWoOBgHi9qG
​​Practical Data Science
Авторы: Andreas François Vermeulen

Данное руководство подробно расскажет о том, как большие наборы данных превратить в бизнес-активы. Вы научитесь разбираться в основных понятиях и терминах Data Science, познакомитесь с основными принципами и моделями построения сложных систем.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/1513
​​#вакансия

Открытые IT-вакансии Райффайзенбанка в Москве и Омске:

– Старший специалист по тестированию, Москва: https://vk.cc/8HNF8W
– .Net разработчик, Омск: https://vk.cc/8HNETp
– Frontend-разработчик, Москва: https://vk.cc/8HNFli
– iOS-разработчик мобильного банка для юрлиц, Москва: https://vk.cc/8HNDLX

Условия:
– Полный рабочий день
– Офис в одной минуте от ст.метро «Технопарк» (Москва)
– Соцпакет, ДМС, оплата больничных и другие льготы
– Высокий уровень свободы
– Бесплатное дополнительное обучение
– Бесплатный тренажерный зал в офисе (Москва)
Актуальная математика – это курс, который поможет понять, как работает анализ данных и поиск информации на примерах специалистов.

1. Кластеризация
2. Коллективные эффекты в топологии
3. Математика в нейронных сетях
4. Изгибаемые многогранники
5. Интегрируемая геометрия
6. Многомасштабные взаимодействия

#youtubeдня

https://www.youtube.com/watch?v=2bjD0noF_DY&list=PLh6dVTO7f4FZvB_nildtxmVBWzNLr4Un_
​​Хотите стать специалистом в области Data Science?

У SkillFactory в честь Черной пятницы скидка 50% на курс “Практический Machine learning”.

Преподаватель: Senior Data Scientist в Lamoda Петр Ермаков.

На курсе вы научитесь:

1️⃣ Уверенно использовать Python и Pandas для прохождения курса и боевых задач
2️⃣ Применять различные алгоритмы машинного обучения: классификация, регрессии, работа с данными, текстами и другими моделями. Подбирать и настраивать модели под конкретную задачу на Python
3️⃣ Тонкостям применения машинного обучения в реальном бизнесе. Создадите http api-модель, освоите автоматическое переобучения модели и мониторинг результатов
4️⃣ Генерировать гипотезы, работать в команде и в условиях жестких дедлайнов. Создадите MVP реальной модели, которую можно запускать в продакшн

Получить полную программу курса можно по ссылке → https://bit.ly/2yNa0ow
​​#статьядня

При помощи анимированных изображений и визуализаций слоев CNN-сетей раскрываем широко применяемое в моделях глубокого обучения понятие свертки.

https://proglib.io/p/convolution/
Топ-10 алгоритмов машинного обучения
В машинном обучении есть нечто, называемое теоремой «No Free Lunch». Вкратце, в ней говорится, что ни один алгоритм не работает лучше всего для каждой проблемы, и это особенно важно для контролируемого обучения (т.е. predictive modeling).

#статьядня
 https://towardsdatascience.com/a-tour-of-the-top-10-algorithms-for-machine-learning-newbies-dde4edffae11
​​Анализ социальных медиа на Python
Автор: Марко Бонцанини

#книгадня

книга рассказывает, как с помощью научного инструментария Python получать и анализировать данные из наиболее популярных сетей, таких как Facebook, Twitter, Stack Exchange и др.
Из этой книги вы узнаете, как:
- взаимодействовать с социально-медийными платформами посредством публичного API из приложений на Python;
- анализировать социальные данные и извлекать из них выборки, используя инструменты Python;
- с помощью приемов обработки текстов понять, о чем люди говорят в социальных медиа;
- применять продвинутые статистические и аналитические приемы для извлечения полезной информации из данных;
- как с применением технологий веба отображать данные в удобном графическом виде для их исследования и представления результатов обработки.
​​Настраиваем Python для машинного обучения на Windows
В этой статье рассказываем о возможностях Python для машинного обучения на Windows, описание дистрибутива Anaconda, процесс его установки и создание нейронной сети.

#статьядня

https://proglib.io/p/ml-python-setup/
​​Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем
Автор: Орельен Жерон

Книга поможет получить интуитивное представление о концепциях и инструментах, предназначенных для построения современных интеллектуальных систем.
Из данной книги вы узнаете:
- как использовать библиотеку Scikit-Learn для отслеживания проекта машинного обучения от начала до конца,
- как применять библиотеку TensorFlow для построения и обучения нейронных сетей,
- что такое метод опорных векторов, деревья решений, случайные леса и ансамблевые методы,
- об архитектуре нейронных сетей, включая свёрточные сети, рекуррентные сети и глубокое обучение с подкреплением.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/196
Пишем нейронную сеть быстро с использованием только библиотеки NumPy
В данной статье вы узнаете, как построить полностью действующую нейронную сеть, используя только NumPy, и протестируете модель. А именно, вместе с автором постараетесь решить проблему простой классификации и сравнить ее производительность с NN, построенным с помощью Keras.

#статьядня

https://towardsdatascience.com/lets-code-a-neural-network-in-plain-numpy-ae7e74410795
​​SciPy — библиотека для языка программирования Python с открытым исходным кодом, предназначенная для выполнения научных и инженерных расчётов.
Если используете данную библиотеку, то эта шпаргалка вам точно пригодится!!

#cheatsheet