Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Gridworlds - набор обучающих сред подкрепления, иллюстрирующих различные защитные свойства интеллектуальных агентов и классифицирующих проблемы безопасности ИИ, связанные с надежностью (прерывания, побочные эффекты, отсутствующий супервизор, надежность для самомодификации).

#youtubeдня

AI Gridworlds
https://www.youtube.com/watch?v=eElfR_BnL5k&list=PLzH6n4zXuckquVnQ0KlMDxyT5YE-sA8Ps&index=12

EXTRA BITS: AI Gridworlds
https://www.youtube.com/watch?v=py5VRagG6t8&list=PLzH6n4zXuckquVnQ0KlMDxyT5YE-sA8Ps&index=13
​​Новый подход в Deep Learning: популяционное обучение нейросетей
Из данной статьи вы узнатете о подходе, предложенном компанией DeepMind для настройки гиперпараметров в моделях Deep Learning: популяционное обучение нейросетей.

#статьядня

https://proglib.io/p/population-deep-learning/
​​Python для сложных задач. Наука о данных и машинное обучение
Автор: Дж. Вандер Плас
Если вы работаете в сфере Data Science или хотите узнать что-то новое, то обучение можно начать с данной книги Python. В ней вы найдете ответы на вопросы по вычислительным и статистическим методам, передовым алгоритмам разработки, манипулированию данными и т. д.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/120
​​ Наглядное введение в нейросети на примере распознавания цифр
При помощи множества анимаций на примере задачи распознавания цифр и модели перцептрона дано наглядное введение в процесс обучения нейросети.

#статьядня

https://proglib.io/p/neural-network-course/
Кто как использует возможности искусственного интеллекта, а автор проекта использует глубокое обучение для создания лиц аниме-девушек!
Ну что ж....полезненько)

#полезностьдня

https://towardsdatascience.com/drawing-anime-girls-with-deep-learning-4fa6523eb4d4
​​Классификация, регрессия и другие алгоритмы Data Mining с использованием R
Автор: Шитиков В. К., Мастицкий С. Э.

Показана технология применения таких методов бутстреп-агрегирования деревьев решений, как бэггинг, случайный лес и бустинг. Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей значений гиперпараметров моделей с использованием пакета caret для статистической среды R. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей.

#книгадня

Почитать книгу онлайн:
https://ranalytics.github.io/data-mining/index.html
​​Keras.js — это машинное обучение в браузере!
Он поможет при изучении и позволит потрогать руками работу алгоритмов машинного обучения.

#полезностьдня

https://transcranial.github.io/keras-js/#/
​​В данной статье представлен обзор методов оптимизации градиентным спуском на практике.
Разбираемся, какие методы действительно работают!

#статьядня

https://ruder.io/optimizing-gradient-descent/index.html
Машинное обучение для геймеров: прогнозы подземелий и регрессии драконов

В докладе автор объяснит виды проблем, которые можно решить с помощью ML, какие данные требуются для их решения и как выглядят результаты.
С помощью забавных примеров, автор рассмотрит пять основных типов проблем, которые может решить машинное обучение: регрессия, прогнозирование, анализ воздействия, классификация и обнаружение аномалий.

#видеодня

EVENT: IndyPy 2018
SPEAKER: Guy Royse

https://www.youtube.com/watch?v=nsjXLYtCIpg
Математические методы обучения по прецедентам (теория обучения машин)
Автор: К. В. Воронцов

Теория обучения машин (machine learning, машинное обучение) находится на стыке прикладной статистики, численных методов оптимизации, дискретного анализа, и за последние 50 лет оформилась в самостоятельную математическую дисциплину.
В курсе рассматриваются основные задачи обучения по прецедентам: классификация, кластеризация, регрессия, понижение размерности. Изучаются методы их решения.
Вообщем....рекомендуем!

#книгадня

Скачать лекции:
https://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf
​​Несколько полезных концептов, которые нужно изучить начинающему и не очень специалисту по машинному обучению и нейронным сетям.

#статьядня

https://proglib.io/p/machine-learning-concepts/
​​Обработка естественного языка с Python
Автор: Steven Bird, Ewan Klein, and Edward Loper

Основная цель книги - показать, что такое анализ текста с использованием набора естественных языков. Данная версия книги обновлена для Python 3 и NLTK 3.

#книгадня

Читать книгу онлайн:
https://www.nltk.org/book/
👍1
​​Введение в статистическое обучение с примерами на языке R
Автор: Гарет Джеймс, Даниела Уиттон, Тревор Хасти, Роберт Тибширани

В этой книге описаны одни из наиболее важных методов моделирования и прогнозирования, а также примеры их практического применения.
Рассмотренные темы включают линейную регрессию, классификацию, создание повторных выборок, регуляризацию, деревья решений, машины опорных векторов, кластеризацию и др.

#книгадня
👏1
​​21 урок из курса по глубокому машинному обучению от Andrew Ng
21 урок, который извлек ведущий аналитик Национального банка Канады из курса по глубокому машинному обучению, от Andrew Ng.

#статьядня

https://proglib.io/p/dmm-course-review/
​​Визуализация данных с помощью ggplot2
Автор: Сергей Мастицкий

Настоящая книга посвящена ggplot2 - одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R. В 2015 г. ggplot2 был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с ggplot2 и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд.

#книгадня
Python vs R: Head to Head Data
Если хотели разобраться, какой язык - Python или R - лучше применим для решения тех или иных проблем в Data Scienceчем, то данная статья обязательна к прочтению!

#статьядня

https://www.dataquest.io/blog/python-vs-r/
#статьядня

Глубокое обучение для повышения качества представления медицинских изображений
Трудность работы с архивами медицинских изображений заключается в том, что в своей массе они представлены клиническими предположениями. Это означает, что когда вы хотите извлечь какое-то изображение (например, фронтальный рентгеновский снимок грудной клетки), часто вместо этого вы получаете папку из многих разнородных изображений: с горизонтальными и вертикальными отражениями, инвертированными значениями пикселей, поворотами на некоторый угол и т. д.

https://lukeoakdenrayner.wordpress.com/2018/04/30/the-unreasonable-usefulness-of-deep-learning-in-medical-image-datasets/?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
​​ 10 рецептов машинного обучения от разработчиков Google

В десяти коротких видеоуроках курса машинного обучения от разработчиков Google рассмотрены приемы Machine Learning для начинающих аналитиков данных.

#статьядня

https://proglib.io/p/google-ml-recipes/