Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.39K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​#статьядня

При помощи анимированных изображений и визуализаций слоев CNN-сетей раскрываем широко применяемое в моделях глубокого обучения понятие свертки.

https://proglib.io/p/convolution/
Топ-10 алгоритмов машинного обучения
В машинном обучении есть нечто, называемое теоремой «No Free Lunch». Вкратце, в ней говорится, что ни один алгоритм не работает лучше всего для каждой проблемы, и это особенно важно для контролируемого обучения (т.е. predictive modeling).

#статьядня
 https://towardsdatascience.com/a-tour-of-the-top-10-algorithms-for-machine-learning-newbies-dde4edffae11
​​Анализ социальных медиа на Python
Автор: Марко Бонцанини

#книгадня

книга рассказывает, как с помощью научного инструментария Python получать и анализировать данные из наиболее популярных сетей, таких как Facebook, Twitter, Stack Exchange и др.
Из этой книги вы узнаете, как:
- взаимодействовать с социально-медийными платформами посредством публичного API из приложений на Python;
- анализировать социальные данные и извлекать из них выборки, используя инструменты Python;
- с помощью приемов обработки текстов понять, о чем люди говорят в социальных медиа;
- применять продвинутые статистические и аналитические приемы для извлечения полезной информации из данных;
- как с применением технологий веба отображать данные в удобном графическом виде для их исследования и представления результатов обработки.
​​Настраиваем Python для машинного обучения на Windows
В этой статье рассказываем о возможностях Python для машинного обучения на Windows, описание дистрибутива Anaconda, процесс его установки и создание нейронной сети.

#статьядня

https://proglib.io/p/ml-python-setup/
​​Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем
Автор: Орельен Жерон

Книга поможет получить интуитивное представление о концепциях и инструментах, предназначенных для построения современных интеллектуальных систем.
Из данной книги вы узнаете:
- как использовать библиотеку Scikit-Learn для отслеживания проекта машинного обучения от начала до конца,
- как применять библиотеку TensorFlow для построения и обучения нейронных сетей,
- что такое метод опорных векторов, деревья решений, случайные леса и ансамблевые методы,
- об архитектуре нейронных сетей, включая свёрточные сети, рекуррентные сети и глубокое обучение с подкреплением.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/196
Пишем нейронную сеть быстро с использованием только библиотеки NumPy
В данной статье вы узнаете, как построить полностью действующую нейронную сеть, используя только NumPy, и протестируете модель. А именно, вместе с автором постараетесь решить проблему простой классификации и сравнить ее производительность с NN, построенным с помощью Keras.

#статьядня

https://towardsdatascience.com/lets-code-a-neural-network-in-plain-numpy-ae7e74410795
​​SciPy — библиотека для языка программирования Python с открытым исходным кодом, предназначенная для выполнения научных и инженерных расчётов.
Если используете данную библиотеку, то эта шпаргалка вам точно пригодится!!

#cheatsheet
​​Язык R в задачах науки о данных. Импорт, подготовка, обработка, визуализация и моделирование данных
Автор: Хэдли Уикем , Гарретт Гроулмунд

Эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse - коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных.
Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов.

#книгадня
​​The 25 Best Data Visualizations of 2018
Data visualization experts and artists are creating amazing things in the world of data design every single day.
In honor of all the artists and designers making amazing data visualizations around the world, here is a collection of the best data visualizations of 2018. We included a few from 2017 and earlier, because they were just too good to pass up.

#статьядня

https://towardsdatascience.com/the-25-best-data-visualizations-of-2018-93643f0aad04
А вы слышали, что теперь  Amazon бесплатно предоставляет курсы машинного обучения всем разработчикам, использующим платформу AWS?!

#новостьдня

Целевая аудитория: разработчики, аналитики, бизнес-профессионалы и инженеры данных.
Программа включает 30 курсов продолжительностью 45 часов.
Также есть возможность (правда, платно) сдать экзамен и получить сертификат «AWS Certified Machine Learning — Specialty».

Всю информацию найдете здесь:
https://aws.amazon.com/ru/training/learning-paths/machine-learning/
Извлечение данных, особенно из Интернета, является одной из жизненно важных задач научного сотрудника.
Wget - бесплатная утилита для неинтерактивных загрузок файлов из Интернета. Она поддерживает протоколы HTTP, HTTPS и FTP, а также поиск через HTTP-прокси. Поскольку утилита не является интерактивной, она может работать в фоновом режиме, даже если пользователь не вошел в систему.

#полезностьдня

$ pip install wget

import wget

url = 'https://www.futurecrew.com/skaven/song\_files/mp3/razorback.mp3'

filename = wget.download(url)
100% [................................................] 3841532 / 3841532

filename
'razorback.mp3'

Официальная страница:
https://pypi.org/project/wget/
​​7 эффективных способов зарабатывать на искусственном интеллекте

Кто и сколько зарабатывает на искусственном интеллекте? Рассматриваем AI-экосистему и 7 способов превратить свои знания в прибыль.

#статьядня

https://proglib.io/p/make-money-with-ai/
Недавний прогресс в искусственном интеллекте (ИИ) вновь вызвал интерес к построению систем, которые учатся и думают как люди.
Многое было достигнуто благодаря использованию глубоких нейронных сетей в таких задачах, как распознавание объектов, видеоигры и настольные игры. Несмотря на достижения в производительности, эти системы отличаются от человеческого интеллекта критическими способами.
Об этом в данном видео.

#видеодня

Event:
Inaugural AI Research Week, hosted by the MIT-IBM Watson AI Lab

Speaker: Joshua Tenenbaum

https://www.youtube.com/watch?v=Pg1H3dkSVZA
​​Если вы давно страдаете при работе с datetimes, обратите внимание на эту библиотеку!
pendulum - библиотека для простой работы с datetimes.

Подробнее можно прочесть здесь:
 https://pendulum.eustace.io
От просмотра к прослушиванию: аудиовизуальное разделение речи
Известно, что люди даже в шумной обстановке умеют сосредотачивать свое внимание на конкретном человеке, мысленно «заглушая» все остальные голоса и звуки. Однако та же задача до сих пор представляет челлендж для машинного обучения. В посте описывается аудиовизуальная модель, позволяющая, в частности, выбирать на видео лица, на чьей речи мы хотим сосредоточиться, чтобы выделить их голоса из общего шума.

#видеодня

https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
​​Keras - открытая нейросетевая библиотека, написанная на языке Python. Она представляет собой надстройку над фреймворками Deeplearning4j, TensorFlow и Theano. Нацелена на оперативную работу с сетями глубинного обучения, при этом спроектирована так, чтобы быть компактной, модульной и расширяемой.

#библиотекадня #cheatsheet

Официальная страница:
https://keras.io/

Ниже прикрепляем шпаргалку, чтобы лучше работалось!)
Алгоритмы машинного обучения
Данное видео поможет вам разобраться, какие проблемы есть в Machine Learning, и познакомит с различными алгоритмами.
Ключевые алгоритмы машинного обучения - это линейная регрессия, логистическая регрессия, дерево решений, случайный лес и алгоритм KNN.
Все алгоритмы представлены с простыми примерами и реализованы на языке Python.

#видеодня

https://www.youtube.com/watch?v=I7NrVwm3apg