Большие данные трансформируют мир! Здесь вы изучите методы интеллектуального анализа данных и машинного обучения для обработки больших наборов данных и извлечения из них ценных знаний.
#полезностьдня
https://clc.am/3eaJoQ
#полезностьдня
https://clc.am/3eaJoQ
Пожалуй, самое понятное объяснение простых математических понятий, да еще и с красивой визуализацией
#полезностьдня
https://clc.am/MxdlUw
#полезностьдня
https://clc.am/MxdlUw
Чтобы не пришлось арендовать сервера, небольшой гайд по настройке Ubuntu и GPU для тренировки нейросетей
#статьядня
https://clc.am/EbKZmw
#статьядня
https://clc.am/EbKZmw
HDFS (the Hadoop Distributed File System) представляет собой распределенную файловую систему, предназначенную для хранения очень больших объемов данных (терабайты или даже петабайты) и обеспечения высокопроизводительного доступа к этой информации.
Цели данного курса:
Научиться понимать основную структуру HDFS и ее связь с основными понятиями распределенной файловой системы.
Понять, как настроить и использовать HDFS из командной строки.
Понять, как использовать HDFS в ваших приложениях
#полезностьдня
https://clc.am/rwesHA
Цели данного курса:
Научиться понимать основную структуру HDFS и ее связь с основными понятиями распределенной файловой системы.
Понять, как настроить и использовать HDFS из командной строки.
Понять, как использовать HDFS в ваших приложениях
#полезностьдня
https://clc.am/rwesHA
Yahoo
Hadoop Tutorial - YDN
Module 2: The Hadoop Distributed File System
Открытый курс машинного обучения. Композиции: бэггинг, случайный лес
Это пятая статья из серии, которая посвящена простым методам композиции: бэггингу и случайному лесу. А вообще, рекомендуем ознакомиться со всей серией!
#статьядня
https://clc.am/t9JRUA
Это пятая статья из серии, которая посвящена простым методам композиции: бэггингу и случайному лесу. А вообще, рекомендуем ознакомиться со всей серией!
#статьядня
https://clc.am/t9JRUA
Это самые простые методы увеличения данных в обработке естественного языка, которые вы можете себе представить - и они работают.
Простые методы редактирования текста могут значительно повысить производительность для небольших наборов данных.
#статьядня
https://clc.am/K1L2Rw
Простые методы редактирования текста могут значительно повысить производительность для небольших наборов данных.
#статьядня
https://clc.am/K1L2Rw
Towards Data Science
These are the Easiest Data Augmentation Techniques in Natural Language Processing you can think of — and they work.
Data augmentation is commonly used in computer vision. In vision, you can almost certainly flip, rotate, or mirror an image without risk…
Русский тезаурус, который действительно работает
Он знает так много своеобразных / старомодных и дерзких синонимов нецензурных слов!
#полезностьдня
https://prglb.ru/11qlk
Он знает так много своеобразных / старомодных и дерзких синонимов нецензурных слов!
#полезностьдня
https://prglb.ru/11qlk
NLPub
Russian Distributional Thesaurus
Russian Distributional Thesaurus (сокр. RDT) — проект создания открытого дистрибутивного тезауруса русского языка. На данный момент ресурс содержит несколько компонент: вектора слов (word embeddings), граф подобия слов (дистрибутивный тезаурус), множество…
Фреймворк глубокого обучения в 2019: выбираем из 10 лучших
Как выбрать фреймворк глубокого обучения? Сравниваем 10 популярных сред тренировки нейросетей. Преимущества, недостатки, подводные камни.
#статьядня
https://prglb.ru/eoxc
Как выбрать фреймворк глубокого обучения? Сравниваем 10 популярных сред тренировки нейросетей. Преимущества, недостатки, подводные камни.
#статьядня
https://prglb.ru/eoxc
Интерактивные элементы управления в Jupyter Notebooks
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных
#статьядня
https://prglb.ru/cld1
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных
#статьядня
https://prglb.ru/cld1
Классификация настроений с обработкой естественного языка на LSTM
В данной статье автор будет использовать Рекуррентные Нейронные Сети, и в частности LSTM, для проведения анализа настроений в Keras.
#полезностьдня
https://prglb.ru/3xokl
В данной статье автор будет использовать Рекуррентные Нейронные Сети, и в частности LSTM, для проведения анализа настроений в Keras.
#полезностьдня
https://prglb.ru/3xokl
Построение клиентской маршрутизации / семантического поиска на Profi.ru
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.
#статьядня
https://prglb.ru/1yrr3
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.
#статьядня
https://prglb.ru/1yrr3
Несколько полезных вещей о машинном обучении
Автор: Pedro Domingos
Данный гайд содержит много полезной информации, но стоит выделить две основные идеи:
- одних данных недостаточно,
- большой объем данных превосходит более умный алгоритм.
#статьядня
https://prglb.ru/54mi2
Автор: Pedro Domingos
Данный гайд содержит много полезной информации, но стоит выделить две основные идеи:
- одних данных недостаточно,
- большой объем данных превосходит более умный алгоритм.
#статьядня
https://prglb.ru/54mi2
R Projects For Dummies
Автор: Joseph Schmuller
R – не только язык программирования, используемый для работы с графикой и статистической обработки данных, но и бесплатная среда разработки с открытым кодом. Автор поможет вам создать несколько собственных проектов применяя графику R, а также интерактивные инструменты и инструменты машинного обучения.
#книгадня
Скачать книгу:
https://t.iss.one/progbook/1427
Автор: Joseph Schmuller
R – не только язык программирования, используемый для работы с графикой и статистической обработки данных, но и бесплатная среда разработки с открытым кодом. Автор поможет вам создать несколько собственных проектов применяя графику R, а также интерактивные инструменты и инструменты машинного обучения.
#книгадня
Скачать книгу:
https://t.iss.one/progbook/1427
Пара задач HeadHunter на Data Science Week
Организаторы Data Science Week 2015 решили провести двухдневный дататон (datathon) – соревнование, где команды программистов и аналитиков решали бизнес-задачи из области Data Science. На дататоне было три задачи, две из которых подготовила команда HeadHunter.
Можете поробовать решить самостоятельно! Но, если что, в статье есть решение)
#полезностьдня
https://prglb.ru/43ghw
Организаторы Data Science Week 2015 решили провести двухдневный дататон (datathon) – соревнование, где команды программистов и аналитиков решали бизнес-задачи из области Data Science. На дататоне было три задачи, две из которых подготовила команда HeadHunter.
Можете поробовать решить самостоятельно! Но, если что, в статье есть решение)
#полезностьдня
https://prglb.ru/43ghw
Хабр
Две задачи HeadHunter на Data Science Week: попробуйте решить сами
В конце августа после серии бесплатных лекций на Data Science Week 2015, организаторы решили провести двухдневный дататон (datathon) – соревнование, где команды...
Применение основ ML на примерах с пояснениями в питоне
Материалы были разработаны для курса General Assembly's Data Science в Вашингтоне.
Лектор: Sinan Ozdemir и Kevin Markham
#статьядня
https://prglb.ru/4a6ur
Материалы были разработаны для курса General Assembly's Data Science в Вашингтоне.
Лектор: Sinan Ozdemir и Kevin Markham
#статьядня
https://prglb.ru/4a6ur
Эта шпаргалка содержит множество классических уравнений и диаграмм, которые помогут вам быстро восстановить знания и вспомнить основные идеи по машинному обучению.
Шпаргалка также отлично подойдет тем, кто готовится к собеседованию.
#полезностьдня
https://prglb.ru/3tot6
Шпаргалка также отлично подойдет тем, кто готовится к собеседованию.
#полезностьдня
https://prglb.ru/3tot6
Python и машинное обучение
Автор: Себастьян Рашка
Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.
#книгадня
Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
Автор: Себастьян Рашка
Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.
#книгадня
Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
Советы от Гугла по построению систем ML
Этот документ призван помочь тем, кто обладает базовыми знаниями в области машинного обучения, и хочет получить
преимущества передового опыта от Google.
#книгадня #статьядня
Файл прикреплен ниже!
Этот документ призван помочь тем, кто обладает базовыми знаниями в области машинного обучения, и хочет получить
преимущества передового опыта от Google.
#книгадня #статьядня
Файл прикреплен ниже!