Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.39K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем
Автор: Орельен Жерон

Книга поможет получить интуитивное представление о концепциях и инструментах, предназначенных для построения современных интеллектуальных систем.
Из данной книги вы узнаете:
- как использовать библиотеку Scikit-Learn для отслеживания проекта машинного обучения от начала до конца,
- как применять библиотеку TensorFlow для построения и обучения нейронных сетей,
- что такое метод опорных векторов, деревья решений, случайные леса и ансамблевые методы,
- об архитектуре нейронных сетей, включая свёрточные сети, рекуррентные сети и глубокое обучение с подкреплением.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/196
Пишем нейронную сеть быстро с использованием только библиотеки NumPy
В данной статье вы узнаете, как построить полностью действующую нейронную сеть, используя только NumPy, и протестируете модель. А именно, вместе с автором постараетесь решить проблему простой классификации и сравнить ее производительность с NN, построенным с помощью Keras.

#статьядня

https://towardsdatascience.com/lets-code-a-neural-network-in-plain-numpy-ae7e74410795
​​SciPy — библиотека для языка программирования Python с открытым исходным кодом, предназначенная для выполнения научных и инженерных расчётов.
Если используете данную библиотеку, то эта шпаргалка вам точно пригодится!!

#cheatsheet
​​Язык R в задачах науки о данных. Импорт, подготовка, обработка, визуализация и моделирование данных
Автор: Хэдли Уикем , Гарретт Гроулмунд

Эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse - коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных.
Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов.

#книгадня
​​The 25 Best Data Visualizations of 2018
Data visualization experts and artists are creating amazing things in the world of data design every single day.
In honor of all the artists and designers making amazing data visualizations around the world, here is a collection of the best data visualizations of 2018. We included a few from 2017 and earlier, because they were just too good to pass up.

#статьядня

https://towardsdatascience.com/the-25-best-data-visualizations-of-2018-93643f0aad04
А вы слышали, что теперь  Amazon бесплатно предоставляет курсы машинного обучения всем разработчикам, использующим платформу AWS?!

#новостьдня

Целевая аудитория: разработчики, аналитики, бизнес-профессионалы и инженеры данных.
Программа включает 30 курсов продолжительностью 45 часов.
Также есть возможность (правда, платно) сдать экзамен и получить сертификат «AWS Certified Machine Learning — Specialty».

Всю информацию найдете здесь:
https://aws.amazon.com/ru/training/learning-paths/machine-learning/
Извлечение данных, особенно из Интернета, является одной из жизненно важных задач научного сотрудника.
Wget - бесплатная утилита для неинтерактивных загрузок файлов из Интернета. Она поддерживает протоколы HTTP, HTTPS и FTP, а также поиск через HTTP-прокси. Поскольку утилита не является интерактивной, она может работать в фоновом режиме, даже если пользователь не вошел в систему.

#полезностьдня

$ pip install wget

import wget

url = 'https://www.futurecrew.com/skaven/song\_files/mp3/razorback.mp3'

filename = wget.download(url)
100% [................................................] 3841532 / 3841532

filename
'razorback.mp3'

Официальная страница:
https://pypi.org/project/wget/
​​7 эффективных способов зарабатывать на искусственном интеллекте

Кто и сколько зарабатывает на искусственном интеллекте? Рассматриваем AI-экосистему и 7 способов превратить свои знания в прибыль.

#статьядня

https://proglib.io/p/make-money-with-ai/
Недавний прогресс в искусственном интеллекте (ИИ) вновь вызвал интерес к построению систем, которые учатся и думают как люди.
Многое было достигнуто благодаря использованию глубоких нейронных сетей в таких задачах, как распознавание объектов, видеоигры и настольные игры. Несмотря на достижения в производительности, эти системы отличаются от человеческого интеллекта критическими способами.
Об этом в данном видео.

#видеодня

Event:
Inaugural AI Research Week, hosted by the MIT-IBM Watson AI Lab

Speaker: Joshua Tenenbaum

https://www.youtube.com/watch?v=Pg1H3dkSVZA
​​Если вы давно страдаете при работе с datetimes, обратите внимание на эту библиотеку!
pendulum - библиотека для простой работы с datetimes.

Подробнее можно прочесть здесь:
 https://pendulum.eustace.io
От просмотра к прослушиванию: аудиовизуальное разделение речи
Известно, что люди даже в шумной обстановке умеют сосредотачивать свое внимание на конкретном человеке, мысленно «заглушая» все остальные голоса и звуки. Однако та же задача до сих пор представляет челлендж для машинного обучения. В посте описывается аудиовизуальная модель, позволяющая, в частности, выбирать на видео лица, на чьей речи мы хотим сосредоточиться, чтобы выделить их голоса из общего шума.

#видеодня

https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
​​Keras - открытая нейросетевая библиотека, написанная на языке Python. Она представляет собой надстройку над фреймворками Deeplearning4j, TensorFlow и Theano. Нацелена на оперативную работу с сетями глубинного обучения, при этом спроектирована так, чтобы быть компактной, модульной и расширяемой.

#библиотекадня #cheatsheet

Официальная страница:
https://keras.io/

Ниже прикрепляем шпаргалку, чтобы лучше работалось!)
Алгоритмы машинного обучения
Данное видео поможет вам разобраться, какие проблемы есть в Machine Learning, и познакомит с различными алгоритмами.
Ключевые алгоритмы машинного обучения - это линейная регрессия, логистическая регрессия, дерево решений, случайный лес и алгоритм KNN.
Все алгоритмы представлены с простыми примерами и реализованы на языке Python.

#видеодня

https://www.youtube.com/watch?v=I7NrVwm3apg
Если к 2020 году рынок IoT достигнет трехкратного размера и массово увеличатся вычислительные мощности на небольших устройствах, пересечение IoT и машинного обучения станет тенденцией, на которую должны обратить внимание все разработчики.
Доклад охватывает три важных вопроса:
- как управлять поиском данных с устройств IoT для управления моделями машинного обучения;
- как развернуть и использовать обученные модели на мобильных устройствах;
- как сделать обучение на устройстве с помощью компьютера Raspberry Pi.

#видеодня

https://www.youtube.com/watch?v=avxpkFUXIfA
​​TensorFlow for Deep Learning
Автор: Bharath Ramsundar, Reza Bosagh Zadeh

Если вы хорошо владеете линейной алгеброй и у вас есть опыт в программировании на Python, то освоить это руководство не составит для вас большого труда. В нём представлены основы машинного обучения, показывающие вам, как создавать системы, способные обнаруживать объекты в изображениях, распознавать текст, анализировать видео и даже прогнозировать свойства потенциальных лекарств.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/1419
​​Как создать нейронную сеть c библиотекой Keras на Python: пример

1. Что такое Keras?
2. Что такое анализ настроений (сентимент-анализ)?
3. Импорт зависимостей и получение данных
4. Изучение данных
5. Подготовка данных
6. Создание и обучение модели

#статьядня

https://neurohive.io/ru/machine-learning-cases/nejronnaya-set-keras-python/
Anaconda − самая популярная data science-платформа в Python.
Кроме обучающих видео, канал содержит видеозаписи конференций AnacondaCon с выступлениями представителей комьюнити по анализу данных, IT-профессионалов, аналитиков, разработчиков и бизнес-лидеров.

#youtubeдня

Веб-сайт: anaconda.com

https://www.youtube.com/channel/UCND4vKhJssAtK8p1Blfj14Q
​​ Jupyter Notebook: галерея лучших блокнотов по ML и Data Science

Подборка примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных.

#статьядня

 https://proglib.io/p/jupyter-notebook-best/