Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Numsense! Data Science for the Layman
Автор: Annalyn Ng, Kenneth Soo

Хотите разобраться в Data Science? Эта книга для всех, кто желает познакомиться с основами без математической сложности. Она охватывает важные темы, такие как регрессионный анализ, нейронные сети, деревья решений, A/B тестирование и т. д. На легкость чтения влияют иллюстрации, которые соответствуют реальным процессам. Книга рекомендуется к прочтению новичкам.

#книгадня
​​Импульсные нейронные сети: мозг в компьютере
Всякий, кто следит за текущим прогрессом в анализе данных, слышал о применении в машинном обучении искусственных нейронных сетей второго поколения. Эти сети обычно полносвязные, принимающие и выдающие непрерывно изменяющиеся значения.
В данной статье рассмотрим их особенности, преимущества и перспективы.

#статьядня

https://proglib.io/p/spiking-neural-networks/
В статье описан репозиторий Homemade Machine Learning, который содержит примеры популярных алгоритмов и подходов машинного обучения, таких как линейная регрессия, логистическая регрессия, метод K-средних и нейронная сеть (многослойный перцептрон).
Каждый алгоритм содержит интерактивные демо-странички, запускаемые в Jupyter NBViewer-e или Binder-e.

#полезностьдня

https://habr.com/post/433886/
SmartData – конференция, посвященная техническим вопросам из мира Big Data и обработки данных. Здесь нет разговоров о том, насколько те или иные технологии/подходы перспективны или полезны. У нас уже есть стек: выбирай инструмент, бери и делай. Доклады посвящены применению Big Data подходов в приложении к реальным задачам

#youtubeдня

https://www.youtube.com/channel/UCfCOJWNC_ipu34-LVvPUeCg/about
​​Глубокое обучение. Погружение в мир нейронных сетей
Авторы: Сергей Николенко, А. Кадурин, Екатерина Архангельская

В книге много математики, теории, основ и рассуждений, охватывающих большую часть того, что касается машинного обучения. Подойдёт, в основном, новичкам, желающим подробнее разобраться в этом вопросе.

#книгадня
​​Scikit-Learn Tutorial: Statistical-Learning for Scientific Data Processing
Автор: Andreas Mueller
В книге представлено описание использования методов машинного обучения с целью статистического вывода. Учебник доступен в Интернете бесплатно.

#книгадня

https://gael-varoquaux.info/scikit-learn-tutorial/
Bayesian methods for hackers
Автор: Cam Davidson-Pilon
Эта книга познакомит вас с байесовскими методами и вероятностным программированием с вычислительной точки зрения. Книга в основном является находкой для тех, кто свободно владеет математикой.

#книгадня

https://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/
artificial-adversary позволяет создавать тексты и моделировать атаки на модели машинного обучения. Предоставив свою модель этим текстам в автономном режиме, вы сможете лучше подготовиться к ним, когда столкнетесь с ними в реальном времени.

#полезностьдня

Ссылка на GitHub:
https://github.com/airbnb/artificial-adversary
​​Говорят и показывают сеньоры: обучение Junior Data Scientist
Как начать изучение Data Science? Что и где читать? Какие есть подводные камни, советы и уловки? Статья в помощь для Junior Data Scientist.

#статьядня

https://proglib.io/p/senior-says/
Искусственный интеллект - это новое электричество
Форум будущего - это серия дискуссий, в которой рассматриваются тенденции, которые меняют будущее. В своем выступлении профессор Нг рассказал о том, как искусственный интеллект (ИИ) трансформируется от индустрии к индустрии.

Speaker: главный научный сотрудник Baidu, соучредитель Coursera и адъюнкт-профессор Стэнфордского университета Эндрю Нг.
Event: Stanford MSx Future Forum.

#видеодня

https://www.youtube.com/watch?v=21EiKfQYZXc
vid2vid - это реализация Pytorch для работы с видео высокого разрешения (например, 2048×1024) и перевода его в фотореалистичный формат. ПО может быть использовано для превращения семантических меток в photo-realistic-videos, генерации человеческих движений, поз и т. д.

#полезностьдня

Ссылка на Girhub:
https://github.com/NVIDIA/vid2vid
​​Покажем, как использовать docker-compose для Python и Jupyter
В данной статье мы рассмотрим, что такое docker-compose, и как этот инструмент можно использовать для языка Python и Jupyter.

#статьядня

https://proglib.io/p/docker-compose/
​​Любой может научиться кодировать LSTM-RNN в Python
Традиционные нейронные сети не обладают этим свойством, и в этом их главный недостаток. Решить эту проблемы помогают рекуррентые нейронные сети.
Долгая краткосрочная память (LSTM) – особая разновидность архитектуры рекуррентных нейронных сетей, способная к обучению долговременным зависимостям.

#статьядня

https://iamtrask.github.io/2015/11/15/anyone-can-code-lstm/
TensorFlow поддерживает все необходимые этапы работы с моделями нейросетей, позволяя осуществлять не только их построение, но и тестирование, обучение и хранение обученных моделей для применения в промышленных проектах.
Чтобы познкомиться с фреймворком поближе, рекомендуем Стэнфордский курс CS 20: Tensorflow for Deep Learning Research

#youtubeдня

https://www.youtube.com/playlist?list=PLDuNt91tg0urwwTQNKyUbncSDvMEl74ww
Машинное обучение: анализ временных рядов Azure Machine Learning для поиска аномалий
В данной статье автор рассказывает, как использовать модуль Time Series Anomaly Detection сервиса машинного обучения Azure Machine Learning для определения аномальных показателей датчиков.

#статьядня

https://habr.com/company/microsoft/blog/343188/
Математика в машинном обучении
В данном видео автор ответит на вопрос, нужно ли знать математику, чтобы заниматься машинным обучением и рассмотрит 4 основные математические дисциплины, составляющие машинное обучение - линейная алгебра, теория вероятностей, исчисление и статистика. А также, на примерах, покажет, как их использовать.

#видеодня

https://www.youtube.com/watch?v=8onB7rPG4Pk
​​AI and Analytics: Accelerating Business Decisions
Автор: Sameer Dhanrajani
Необходимая к прочтению книга, предназначенная для руководителей и начинающих предпринимателей в области ИИ и Data Science. Она располагает бизнес-идеями, которые помогут стимулировать изменения в организации, используя популярные технологии: чат-боты, блокчейн и криптовалюту. Основное внимание уделено комплексным стратегиям и методологиям в аналитике. Автор охватывает большинство популярных отраслей бизнеса, таких как банковское дело, здравоохранение, страхование, розничная торговля и т. д.

#книгадня
На пути к виртуальному каскадеру
Проблемы контроля динамики движения в последнее время вошли в круг стандартных задач обучения с подкреплением. Методы глубокого обучения показали здесь высокую эффективность для широкого круга проблем.

#видеодня

https://www.youtube.com/watch?v=vppFvq2quQ0