Это самые простые методы увеличения данных в обработке естественного языка, которые вы можете себе представить - и они работают.
Простые методы редактирования текста могут значительно повысить производительность для небольших наборов данных.
#статьядня
https://clc.am/K1L2Rw
Простые методы редактирования текста могут значительно повысить производительность для небольших наборов данных.
#статьядня
https://clc.am/K1L2Rw
Towards Data Science
These are the Easiest Data Augmentation Techniques in Natural Language Processing you can think of — and they work.
Data augmentation is commonly used in computer vision. In vision, you can almost certainly flip, rotate, or mirror an image without risk…
Русский тезаурус, который действительно работает
Он знает так много своеобразных / старомодных и дерзких синонимов нецензурных слов!
#полезностьдня
https://prglb.ru/11qlk
Он знает так много своеобразных / старомодных и дерзких синонимов нецензурных слов!
#полезностьдня
https://prglb.ru/11qlk
NLPub
Russian Distributional Thesaurus
Russian Distributional Thesaurus (сокр. RDT) — проект создания открытого дистрибутивного тезауруса русского языка. На данный момент ресурс содержит несколько компонент: вектора слов (word embeddings), граф подобия слов (дистрибутивный тезаурус), множество…
Фреймворк глубокого обучения в 2019: выбираем из 10 лучших
Как выбрать фреймворк глубокого обучения? Сравниваем 10 популярных сред тренировки нейросетей. Преимущества, недостатки, подводные камни.
#статьядня
https://prglb.ru/eoxc
Как выбрать фреймворк глубокого обучения? Сравниваем 10 популярных сред тренировки нейросетей. Преимущества, недостатки, подводные камни.
#статьядня
https://prglb.ru/eoxc
Интерактивные элементы управления в Jupyter Notebooks
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных
#статьядня
https://prglb.ru/cld1
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных
#статьядня
https://prglb.ru/cld1
Классификация настроений с обработкой естественного языка на LSTM
В данной статье автор будет использовать Рекуррентные Нейронные Сети, и в частности LSTM, для проведения анализа настроений в Keras.
#полезностьдня
https://prglb.ru/3xokl
В данной статье автор будет использовать Рекуррентные Нейронные Сети, и в частности LSTM, для проведения анализа настроений в Keras.
#полезностьдня
https://prglb.ru/3xokl
Построение клиентской маршрутизации / семантического поиска на Profi.ru
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.
#статьядня
https://prglb.ru/1yrr3
Краткое резюме о том, что автору и его команде удалось сделать примерно за 2 месяца в отделе Profi.ru DS.
#статьядня
https://prglb.ru/1yrr3
Несколько полезных вещей о машинном обучении
Автор: Pedro Domingos
Данный гайд содержит много полезной информации, но стоит выделить две основные идеи:
- одних данных недостаточно,
- большой объем данных превосходит более умный алгоритм.
#статьядня
https://prglb.ru/54mi2
Автор: Pedro Domingos
Данный гайд содержит много полезной информации, но стоит выделить две основные идеи:
- одних данных недостаточно,
- большой объем данных превосходит более умный алгоритм.
#статьядня
https://prglb.ru/54mi2
R Projects For Dummies
Автор: Joseph Schmuller
R – не только язык программирования, используемый для работы с графикой и статистической обработки данных, но и бесплатная среда разработки с открытым кодом. Автор поможет вам создать несколько собственных проектов применяя графику R, а также интерактивные инструменты и инструменты машинного обучения.
#книгадня
Скачать книгу:
https://t.iss.one/progbook/1427
Автор: Joseph Schmuller
R – не только язык программирования, используемый для работы с графикой и статистической обработки данных, но и бесплатная среда разработки с открытым кодом. Автор поможет вам создать несколько собственных проектов применяя графику R, а также интерактивные инструменты и инструменты машинного обучения.
#книгадня
Скачать книгу:
https://t.iss.one/progbook/1427
Пара задач HeadHunter на Data Science Week
Организаторы Data Science Week 2015 решили провести двухдневный дататон (datathon) – соревнование, где команды программистов и аналитиков решали бизнес-задачи из области Data Science. На дататоне было три задачи, две из которых подготовила команда HeadHunter.
Можете поробовать решить самостоятельно! Но, если что, в статье есть решение)
#полезностьдня
https://prglb.ru/43ghw
Организаторы Data Science Week 2015 решили провести двухдневный дататон (datathon) – соревнование, где команды программистов и аналитиков решали бизнес-задачи из области Data Science. На дататоне было три задачи, две из которых подготовила команда HeadHunter.
Можете поробовать решить самостоятельно! Но, если что, в статье есть решение)
#полезностьдня
https://prglb.ru/43ghw
Хабр
Две задачи HeadHunter на Data Science Week: попробуйте решить сами
В конце августа после серии бесплатных лекций на Data Science Week 2015, организаторы решили провести двухдневный дататон (datathon) – соревнование, где команды...
Применение основ ML на примерах с пояснениями в питоне
Материалы были разработаны для курса General Assembly's Data Science в Вашингтоне.
Лектор: Sinan Ozdemir и Kevin Markham
#статьядня
https://prglb.ru/4a6ur
Материалы были разработаны для курса General Assembly's Data Science в Вашингтоне.
Лектор: Sinan Ozdemir и Kevin Markham
#статьядня
https://prglb.ru/4a6ur
Эта шпаргалка содержит множество классических уравнений и диаграмм, которые помогут вам быстро восстановить знания и вспомнить основные идеи по машинному обучению.
Шпаргалка также отлично подойдет тем, кто готовится к собеседованию.
#полезностьдня
https://prglb.ru/3tot6
Шпаргалка также отлично подойдет тем, кто готовится к собеседованию.
#полезностьдня
https://prglb.ru/3tot6
Python и машинное обучение
Автор: Себастьян Рашка
Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.
#книгадня
Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
Автор: Себастьян Рашка
Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.
#книгадня
Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
Советы от Гугла по построению систем ML
Этот документ призван помочь тем, кто обладает базовыми знаниями в области машинного обучения, и хочет получить
преимущества передового опыта от Google.
#книгадня #статьядня
Файл прикреплен ниже!
Этот документ призван помочь тем, кто обладает базовыми знаниями в области машинного обучения, и хочет получить
преимущества передового опыта от Google.
#книгадня #статьядня
Файл прикреплен ниже!
Обучайте, оценивайте, повторяйте: создание системы обнаружения мошенничества с кредитными картами
В этом выступлении рассматриваются три основные проблемы ML, с которыми столкнулся (и решил!) Stripe при создании своей системы обнаружения мошенничества с кредитными картами: выбор меток для мошенничества, которые распространяются на всех продавцов, устранение дисбаланса классов (допустимые обвинения значительно превышают число мошеннических) и проведение контрфактивной оценки ( для измерения производительности и получения данных обучения, когда система ML сама меняет результаты).
#видеодня
Speaker: Лила Сентил Натан
https://prglb.ru/5dgfl
В этом выступлении рассматриваются три основные проблемы ML, с которыми столкнулся (и решил!) Stripe при создании своей системы обнаружения мошенничества с кредитными картами: выбор меток для мошенничества, которые распространяются на всех продавцов, устранение дисбаланса классов (допустимые обвинения значительно превышают число мошеннических) и проведение контрфактивной оценки ( для измерения производительности и получения данных обучения, когда система ML сама меняет результаты).
#видеодня
Speaker: Лила Сентил Натан
https://prglb.ru/5dgfl
Как изучать Data Science в 2019: ответы на частые вопросы
Мысль о том, чтобы изучать Data Science, не даёт вам покоя? Возможно, не зря. В этой статье мы ответили на ряд популярных вопросов новичков.
#статьядня
https://prglb.ru/5pet6
Мысль о том, чтобы изучать Data Science, не даёт вам покоя? Возможно, не зря. В этой статье мы ответили на ряд популярных вопросов новичков.
#статьядня
https://prglb.ru/5pet6
Любой сервис, на котором вообще есть поиск, рано или поздно приходит к потребности научиться исправлять ошибки в пользовательских запросах. Пользователи постоянно опечатываются и ошибаются, и качество поиска от этого неизбежно страдает — а с ним и пользовательский опыт.
При этом каждый сервис обладает своей спецификой, своим лексиконом, которым должен уметь оперировать исправитель опечаток.
#статьядня
https://prglb.ru/4afrh
При этом каждый сервис обладает своей спецификой, своим лексиконом, которым должен уметь оперировать исправитель опечаток.
#статьядня
https://prglb.ru/4afrh
Анализ изображений и видео (часть 2)
Лекция 1. Поиск изображений по содержанию
Лекция 2. Детектирование объектов
Лекция 3. Детектирование объектов 2
Лекция 4. Цифровой фотомонтаж
Лекция 5. Сегментация изображений
Лекция 6. Генеративные сети
Лекция 7. Генеративные сети 2
Лекция 8. Трекинг объектов
Лекция 9. Трекинг объектов часть 2
Преподаватель курса: Алексей Сергеевич Артамонов
А вот ссылочка на первую часть:
https://prglb.ru/49wyy
#youtubeдня
https://prglb.ru/2ivrt
Лекция 1. Поиск изображений по содержанию
Лекция 2. Детектирование объектов
Лекция 3. Детектирование объектов 2
Лекция 4. Цифровой фотомонтаж
Лекция 5. Сегментация изображений
Лекция 6. Генеративные сети
Лекция 7. Генеративные сети 2
Лекция 8. Трекинг объектов
Лекция 9. Трекинг объектов часть 2
Преподаватель курса: Алексей Сергеевич Артамонов
А вот ссылочка на первую часть:
https://prglb.ru/49wyy
#youtubeдня
https://prglb.ru/2ivrt
The Data Science Handbook
Автор: Field Cady
Книга направлена на более опытных специалистов и рассматривает классические алгоритмы машинного обучения, от их математических основ до реальных приложений, инструменты визуализации, а также классическую статистику, помогающую читателю критически подумать об интерпретации данных.
В книге рассматриваются следующие темы:
✔️ дорожная карта разработчика в области data science;
✔️ языки программирования, необходимые для data science (scala, python, etc);
✔️ визуализация и простая метрика;
✔️ машинное обучение;
✔️ техническая документация и многое другое.
Скачать книгу:
https://t.iss.one/progbook/1574
Автор: Field Cady
Книга направлена на более опытных специалистов и рассматривает классические алгоритмы машинного обучения, от их математических основ до реальных приложений, инструменты визуализации, а также классическую статистику, помогающую читателю критически подумать об интерпретации данных.
В книге рассматриваются следующие темы:
✔️ дорожная карта разработчика в области data science;
✔️ языки программирования, необходимые для data science (scala, python, etc);
✔️ визуализация и простая метрика;
✔️ машинное обучение;
✔️ техническая документация и многое другое.
Скачать книгу:
https://t.iss.one/progbook/1574
Telegram
Книги для программистов