Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Обработка естественного языка с Python
Автор: Steven Bird, Ewan Klein, and Edward Loper

Основная цель книги - показать, что такое анализ текста с использованием набора естественных языков. Данная версия книги обновлена для Python 3 и NLTK 3.

#книгадня

Читать книгу онлайн:
https://www.nltk.org/book/
👍1
​​Введение в статистическое обучение с примерами на языке R
Автор: Гарет Джеймс, Даниела Уиттон, Тревор Хасти, Роберт Тибширани

В этой книге описаны одни из наиболее важных методов моделирования и прогнозирования, а также примеры их практического применения.
Рассмотренные темы включают линейную регрессию, классификацию, создание повторных выборок, регуляризацию, деревья решений, машины опорных векторов, кластеризацию и др.

#книгадня
👏1
​​21 урок из курса по глубокому машинному обучению от Andrew Ng
21 урок, который извлек ведущий аналитик Национального банка Канады из курса по глубокому машинному обучению, от Andrew Ng.

#статьядня

https://proglib.io/p/dmm-course-review/
​​Визуализация данных с помощью ggplot2
Автор: Сергей Мастицкий

Настоящая книга посвящена ggplot2 - одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R. В 2015 г. ggplot2 был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с ggplot2 и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд.

#книгадня
Python vs R: Head to Head Data
Если хотели разобраться, какой язык - Python или R - лучше применим для решения тех или иных проблем в Data Scienceчем, то данная статья обязательна к прочтению!

#статьядня

https://www.dataquest.io/blog/python-vs-r/
#статьядня

Глубокое обучение для повышения качества представления медицинских изображений
Трудность работы с архивами медицинских изображений заключается в том, что в своей массе они представлены клиническими предположениями. Это означает, что когда вы хотите извлечь какое-то изображение (например, фронтальный рентгеновский снимок грудной клетки), часто вместо этого вы получаете папку из многих разнородных изображений: с горизонтальными и вертикальными отражениями, инвертированными значениями пикселей, поворотами на некоторый угол и т. д.

https://lukeoakdenrayner.wordpress.com/2018/04/30/the-unreasonable-usefulness-of-deep-learning-in-medical-image-datasets/?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
​​ 10 рецептов машинного обучения от разработчиков Google

В десяти коротких видеоуроках курса машинного обучения от разработчиков Google рассмотрены приемы Machine Learning для начинающих аналитиков данных.

#статьядня

https://proglib.io/p/google-ml-recipes/
​​ 11 книг по ИИ и Data Science для изучения в 2019
С революционными возможностями в области ИИ и Data Science трудно разобраться! В статье вы найдёте  подборку лучших книг в данной области, которая поможет сделать этот путь короче и продуктивнее!

#статьядня

https://proglib.io/p/ai-and-datascience/
​​Neural Networks and Deep Learning
Автор: Michael Nielsen

Нейронные сети и глубокое обучение - это бесплатная онлайн-книга, которая расскроет следующие темы:
- нейронные сети, красивая биологически вдохновленная парадигма программирования, которая позволяет компьютеру учиться на данных наблюдений,
- глубокое обучение - мощный набор методов обучения в нейронных сетях,
- нейронные сети и глубокое обучение в настоящее время.

#книгадня

Ссылка на книгу:
https://neuralnetworksanddeeplearning.com/index.html
​​Введение в PyText
Facebook годами сталкивается с проблемами построения масштабируемых NLP приложений. Недавно команда разработчиков Facebook открыла первую версию PyText - фреймворка на основе PyTorch для создания более быстрых и более эффективных NLP-решений.

Конечная цель PyText - предоставить более простое решение для сквозной реализации рабочих процессов NLP.

#библиотекадня

https://towardsdatascience.com/introducing-pytext-d8f404f1745
Совсем недавно команда Google представила методику предварительной тренировки систем обработки естественного языка.
BERT (Bidirectional Encoder Representations from Transformers) помогает ИИ-моделям получить «общее представление о языке» на больших объемах
неразмеченного текста.

#новостьдня

Ссылка на GitHub:
https://github.com/google-research/bert

А здесь можно посмотреть как работает BERT:
https://jalammar.github.io/illustrated-bert/
OpenAI Gym – это инструментарий для разработки и сравнения алгоритмов обучения с подкреплением. Это библиотека с открытым исходным кодом, которая дает доступ к стандартизованному набору сред.

#полезностьдня

Ссылка на исходники:
https://github.com/openai/gym
​​Обучение с подкреплением
Автор: Ричард С. Саттон, Эндрю Г. Барто
Дается исчерпывающее и ясное изложение идей, методов и алгоритмов обучения с подкреплением, при этом диапазон излагаемого материала - от истоков возникновения рассматриваемых концепций до современных результатов в данной области.

#книгадня