Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.39K photos
119 videos
64 files
4.83K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Введение в анализ данных с использованием Pandas
В данном семинаре рассмотрен практический подход к проведению исследований в Pandas.
Автор начинает с импорта реальных данных, затем чистит их, преобразует и анализирует, испольуя некоторую визуализацию.

#видеодня

EVENT: PyData Seattle 2017
SPEAKER: Quentin Caudron

https://www.youtube.com/watch?v=WrAkpobchUk&index=9&list=PLFjq8z-aGyQ5ijq6ZD2CEkqWoOBgHi9qG
​​Practical Data Science
Авторы: Andreas François Vermeulen

Данное руководство подробно расскажет о том, как большие наборы данных превратить в бизнес-активы. Вы научитесь разбираться в основных понятиях и терминах Data Science, познакомитесь с основными принципами и моделями построения сложных систем.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/1513
​​#вакансия

Открытые IT-вакансии Райффайзенбанка в Москве и Омске:

– Старший специалист по тестированию, Москва: https://vk.cc/8HNF8W
– .Net разработчик, Омск: https://vk.cc/8HNETp
– Frontend-разработчик, Москва: https://vk.cc/8HNFli
– iOS-разработчик мобильного банка для юрлиц, Москва: https://vk.cc/8HNDLX

Условия:
– Полный рабочий день
– Офис в одной минуте от ст.метро «Технопарк» (Москва)
– Соцпакет, ДМС, оплата больничных и другие льготы
– Высокий уровень свободы
– Бесплатное дополнительное обучение
– Бесплатный тренажерный зал в офисе (Москва)
Актуальная математика – это курс, который поможет понять, как работает анализ данных и поиск информации на примерах специалистов.

1. Кластеризация
2. Коллективные эффекты в топологии
3. Математика в нейронных сетях
4. Изгибаемые многогранники
5. Интегрируемая геометрия
6. Многомасштабные взаимодействия

#youtubeдня

https://www.youtube.com/watch?v=2bjD0noF_DY&list=PLh6dVTO7f4FZvB_nildtxmVBWzNLr4Un_
​​Хотите стать специалистом в области Data Science?

У SkillFactory в честь Черной пятницы скидка 50% на курс “Практический Machine learning”.

Преподаватель: Senior Data Scientist в Lamoda Петр Ермаков.

На курсе вы научитесь:

1️⃣ Уверенно использовать Python и Pandas для прохождения курса и боевых задач
2️⃣ Применять различные алгоритмы машинного обучения: классификация, регрессии, работа с данными, текстами и другими моделями. Подбирать и настраивать модели под конкретную задачу на Python
3️⃣ Тонкостям применения машинного обучения в реальном бизнесе. Создадите http api-модель, освоите автоматическое переобучения модели и мониторинг результатов
4️⃣ Генерировать гипотезы, работать в команде и в условиях жестких дедлайнов. Создадите MVP реальной модели, которую можно запускать в продакшн

Получить полную программу курса можно по ссылке → https://bit.ly/2yNa0ow
​​#статьядня

При помощи анимированных изображений и визуализаций слоев CNN-сетей раскрываем широко применяемое в моделях глубокого обучения понятие свертки.

https://proglib.io/p/convolution/
Топ-10 алгоритмов машинного обучения
В машинном обучении есть нечто, называемое теоремой «No Free Lunch». Вкратце, в ней говорится, что ни один алгоритм не работает лучше всего для каждой проблемы, и это особенно важно для контролируемого обучения (т.е. predictive modeling).

#статьядня
 https://towardsdatascience.com/a-tour-of-the-top-10-algorithms-for-machine-learning-newbies-dde4edffae11
​​Анализ социальных медиа на Python
Автор: Марко Бонцанини

#книгадня

книга рассказывает, как с помощью научного инструментария Python получать и анализировать данные из наиболее популярных сетей, таких как Facebook, Twitter, Stack Exchange и др.
Из этой книги вы узнаете, как:
- взаимодействовать с социально-медийными платформами посредством публичного API из приложений на Python;
- анализировать социальные данные и извлекать из них выборки, используя инструменты Python;
- с помощью приемов обработки текстов понять, о чем люди говорят в социальных медиа;
- применять продвинутые статистические и аналитические приемы для извлечения полезной информации из данных;
- как с применением технологий веба отображать данные в удобном графическом виде для их исследования и представления результатов обработки.
​​Настраиваем Python для машинного обучения на Windows
В этой статье рассказываем о возможностях Python для машинного обучения на Windows, описание дистрибутива Anaconda, процесс его установки и создание нейронной сети.

#статьядня

https://proglib.io/p/ml-python-setup/
​​Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем
Автор: Орельен Жерон

Книга поможет получить интуитивное представление о концепциях и инструментах, предназначенных для построения современных интеллектуальных систем.
Из данной книги вы узнаете:
- как использовать библиотеку Scikit-Learn для отслеживания проекта машинного обучения от начала до конца,
- как применять библиотеку TensorFlow для построения и обучения нейронных сетей,
- что такое метод опорных векторов, деревья решений, случайные леса и ансамблевые методы,
- об архитектуре нейронных сетей, включая свёрточные сети, рекуррентные сети и глубокое обучение с подкреплением.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/196
Пишем нейронную сеть быстро с использованием только библиотеки NumPy
В данной статье вы узнаете, как построить полностью действующую нейронную сеть, используя только NumPy, и протестируете модель. А именно, вместе с автором постараетесь решить проблему простой классификации и сравнить ее производительность с NN, построенным с помощью Keras.

#статьядня

https://towardsdatascience.com/lets-code-a-neural-network-in-plain-numpy-ae7e74410795
​​SciPy — библиотека для языка программирования Python с открытым исходным кодом, предназначенная для выполнения научных и инженерных расчётов.
Если используете данную библиотеку, то эта шпаргалка вам точно пригодится!!

#cheatsheet
​​Язык R в задачах науки о данных. Импорт, подготовка, обработка, визуализация и моделирование данных
Автор: Хэдли Уикем , Гарретт Гроулмунд

Эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse - коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных.
Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов.

#книгадня
​​The 25 Best Data Visualizations of 2018
Data visualization experts and artists are creating amazing things in the world of data design every single day.
In honor of all the artists and designers making amazing data visualizations around the world, here is a collection of the best data visualizations of 2018. We included a few from 2017 and earlier, because they were just too good to pass up.

#статьядня

https://towardsdatascience.com/the-25-best-data-visualizations-of-2018-93643f0aad04
А вы слышали, что теперь  Amazon бесплатно предоставляет курсы машинного обучения всем разработчикам, использующим платформу AWS?!

#новостьдня

Целевая аудитория: разработчики, аналитики, бизнес-профессионалы и инженеры данных.
Программа включает 30 курсов продолжительностью 45 часов.
Также есть возможность (правда, платно) сдать экзамен и получить сертификат «AWS Certified Machine Learning — Specialty».

Всю информацию найдете здесь:
https://aws.amazon.com/ru/training/learning-paths/machine-learning/
Извлечение данных, особенно из Интернета, является одной из жизненно важных задач научного сотрудника.
Wget - бесплатная утилита для неинтерактивных загрузок файлов из Интернета. Она поддерживает протоколы HTTP, HTTPS и FTP, а также поиск через HTTP-прокси. Поскольку утилита не является интерактивной, она может работать в фоновом режиме, даже если пользователь не вошел в систему.

#полезностьдня

$ pip install wget

import wget

url = 'https://www.futurecrew.com/skaven/song\_files/mp3/razorback.mp3'

filename = wget.download(url)
100% [................................................] 3841532 / 3841532

filename
'razorback.mp3'

Официальная страница:
https://pypi.org/project/wget/