Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Полное руководство по бинарной классификации метрик

Выбор правильной метрики является ключевой частью проектов по машинному обучению. Из этой статьи вы узнаете о ряде распространенных и менее известных метрик и диаграмм производительности, а также о типичных решениях, когда дело доходит до выбора одного их них для вашего проекта.

#статьядня

https://prglb.ru/4fwb2
Использование ArcGIS API for Python в Jupyter Notebook

Эта статья будет полезна как аналитикам, желающим изучить примеры работы с ГИС, так и картографам и ГИС-специалистам, которым интересно попробовать себя в написании кода.

#статьядня

https://prglb.ru/4qnc5
Поиск аномалий (Anomaly Detection)

Строго говоря, в анализе данных есть два направления, которые занимаются поиском аномалий: детектирование выбросов (Outlier Detection) и «новизны» (Novelty Detection). Как и выброс «новый объект» — это объект, который отличается по своим свойствам от объектов (обучающей) выборки. Но в отличие от выброса, его в самой выборке пока нет

#статьядня

https://prglb.ru/kakl
Простая реализация стекинга/блендинга по ранее обученным сохраненным моделям

#полезностьдня

https://prglb.ru/1f2lq
Построение системы автоматического машинного обучения

Антон Кленицкий рассказывает про опыт участия в SDSJ AutoML 2018, где он занял второе место. Задача соревнования заключалась в построении системы автоматического машинного обучения. Из видео вы сможете узнать:
- Подробнее о задачах соревнования: 3 задачи на регрессию и 5 задач на классификацию
- Почему было тяжело валидироваться
- Детали решения второго места

#видеодня

https://prglb.ru/19aq6
Воры используют deepfakes для обмана компаний, заставляя посылать себе деньги
C момента своего появления в декабре 2017-го дипфейки, видео с почти идеальной заменой лица, созданные нейросетью, наводили на экспертов панику. По данным Wall Street Journal, в марте этого года состоялось первое deepfake-преступление.

#статьядня

https://prglb.ru/4klkm
Как оптимизировать pandas при работе с большими datasetами (очерк)

Когда памяти вагоны и/или dataset небольшой можно смело закидывать его безо всяких оптимизаций. Однако, если данные большие, остро встает вопрос, как их обрабатывать или хотя бы считать.

#статьядня

https://prglb.ru/5c5kw
Карты активации для моделей глубокого обучения в несколько строк кода

Автор расскажет, как показать карты активации различных слоев в глубокой модели CNN с помощью всего лишь нескольких строк кода.

#статьядня

https://prglb.ru/5q8ho
​​Мы немного посовещались и решили увеличить призовой фонд нашего конкурса 😉
Для тех, кто все пропустил:

Конкурс на
📍 2 лучших статьи сайте proglib.io
📍 1 лучший комментарий на сайте proglib.io

Что нужно? Написать статью или оставить комментарий под любой из статей сайта. Победитель выбирается по количеству просмотров и лайков НА сайте. Любители накручивать дисквалифицируются!

Для самых крутых авторов статей мы подготовили подарки:

1 место - годовая подписка на ВСЕ продукты Jetbrains, либо издание по архитектуре ("Архитектура программного обеспечения на практике" или "Чистый код" или "Искусство программирования").
2 место - годовая подписка на какой-то один из продуктов Jetbrains, либо издание про базы данных ("Рефакторинг баз данных или Эволюционное проектирование" или "Базы данных: Проектирование, реализация и сопровождение. Теория и практика" или "Работа с PostgreSQL. Настройка и масштабирование").

А комментатор “не в бровь, а в глаз” получит бумажную книгу на выбор: "Думай медленно...Решай быстро" Канемана, "Музыка мозг. Правила гармоничного развития" или "Мозг во сне. Что происходит с мозгом, пока мы спим".

🔵 Статьи должны быть по теме сайта, от 4к до 8к знаков без пробелов, с уникальностью 90%+ по text.ru, без рекламы и брани. Предпочтение туториалам на базе личного опыта, интересным подборкам и обзорам.
🔵 Комментарий должен быть без рекламы и брани.

И да победят лучшие! 😊
Дедлайн конкурса — 18 октября 2019
Если у вас проблемы с написанием материала, пишите нашему главному редактору @lavafloor
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «​​Мы немного посовещались и решили увеличить призовой фонд нашего конкурса 😉 Для тех, кто все пропустил: Конкурс на 📍 2 лучших статьи сайте proglib.io 📍 1 лучший комментарий на сайте proglib.io Что нужно? Написать статью или оставить комментарий под любой…»
Доклад Pandas за 10 минут

Пакет pandas является наиболее важным инструментом в распоряжении ученых и аналитиков данных, работающих сегодня в Python. Мощные инструменты машинного обучения и визуализации могут привлечь все внимание, но pandas является основой большинства проектов обработки данных.

EVENT:PyData 2019
SPEAKER: Wes McKinney

#видеодня

https://prglb.ru/4jp0u
Применение сиамских нейросетей в поиске

Автор расскажет, какие подходы они используют в Поиске Mail.ru для сравнения текстов и для чего это нужно?

#статьядня

https://prglb.ru/1uwsl
Примечания к iMAML: мета-обучение с неявными градиентами

На этой неделе я прочитал эту классную новую статью о метаобучении: это немного другой подход по сравнению с его предшественниками, основанный на некоторых наблюдениях о дифференциации оптимальной регуляризованной оптимизации.

#статьядня

https://prglb.ru/48e1b
Как превзойти системы распознавания лиц с помощью анонимизации лица.

В этой статье мы будем обсуждать одно из самых последних и, на мой взгляд, захватывающих событий в области безопасности и искусственного интеллекта.

#статьядня

https://prglb.ru/4ia5k
Написание вашей первой генеративной состязательной сети с помощью Keras.

Хотя это и не совсем необходимо для этого учебного пособия, здорово иметь четкое теоретическое понимание того, как работают GAN, прежде чем приступать к программной реализации.

#статьядня

https://prglb.ru/f8vb
​​Освойте самую востребованную технологию искусственного интеллекта!

Хотите в сжатые сроки получить практические навыки по программированию глубоких нейронных сетей? Приходите в SkillFactory на онлайн-курс "Deep Learning и нейронные сети" https://clc.to/qnwSiw (при поддержке NVIDIA Corporation).

Здесь вы: попробуете свои силы в создании нейронной сети для распознавания рукописных цифр, обучении рекурентной сети задачам прогнозирования временных рядов, разработке нейросетевого чат-бота, создании модели для идентификации лиц и др.

Курс основан на практике. Фокус и упор мы делаем не на математическом фундаменте, а именно на понимании задач и практическом применении решений.

Узнайте подробности: https://clc.to/qnwSiw
​​Небольшая шпаргалка по распределению случайных величин