Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Pyspider - практическое использование метрик мониторинга конкурентов

Основные плюсы данного пакета:
- Проще отладить - у него есть пользовательский интерфейс, чтобы вы знали, какая часть работает не так, как надо.
- Встроенная панель инструментов - для целей мониторинга.
- Совместим с Javascript, в отличие от Scrapy.
- Pyspider предоставляет Puppeteer, очень известную и мощную библиотеку, разработанную Google для JavaScript для веб-сканирования.
- Поддержка баз данных - MySQL, MongoDB и PostgreSQL.
Масштабируемость - распределенная архитектура.

#статьядня

https://prglb.ru/3tbt6
​​Машинное обучение — это просто!
Убедись в этом сам на бесплатном интенсиве.

Ссылка для регистрации 🔜 https://clc.to/OfNRaA

🐍 Проведем экспресс-введение в Python.
🛠 Построим модель от начала до конца.
💲 Вручим грант на 30 000 рублей для обучения в Skillbox!

Сделай шаг в будущее!
BlazeFace: Нейронное распознавание лица с точностью до миллисекунды на мобильных графических процессорах

BlazeFace - легкий и хорошо работающий детектор лица, специально разработанный для мобильных графических процессоров. Он работает на скорости 200-1000 + FPS на флагманских устройствах.

#полезностьдня

https://prglb.ru/cfze
Понимание метрик оценки ML - точность и отзыв

В мире машинного обучения используется набор терминов, чтобы определить, насколько хорошо работают модели. Возникает вопрос - зачем нам что-либо, кроме термина «точность»?

#статьядня

https://prglb.ru/322a6
Как мы боремся с копированием контента, или первая adversarial attack в проде
Копирование контента с Авито на другие платформы существует в нескольких категориях товаров и услуг. В этой статье речь пойдет только про автомобили.

#статьядня

https://prglb.ru/lb3x
7 фреймворков автоматического машинного обучения

Чем интересны системы автоматического машинного обучения? Какие фреймворки годятся для AutoML? В чем пока есть ограничения? Отвечаем в статье.

#статьядня

https://prglb.ru/260pu
Обмануть автомобиль: спуфинг дорожных знаков и Deep Learning

Мы атаковали реальные авто, используя Deep Learning для генерации знаков дорожного движения. В этом помогли мощный GPU и коммерческая печать.

#статьядня

https://prglb.ru/19hio
Ускорение ИИ

Доклад Bill Dally, представленный на Matroid Scaled Machine Learning Conference 2019

#видеодня

https://prglb.ru/52bnk
Видеокурс по нейронным сетям в Университете Шербрук

Данный курс включает:
обучающие нейронные сети
условные случайные поля - фактор-граф
обучение CRFs
ограниченная машина Больцмана
глубокое обучение
Компьютерное зрение
обработка естественного языка

#видеодня

https://prglb.ru/1qnna
Автоматическое определение эмоций в текстовых беседах с использованием нейронных сетей

В первой части статьи рассматривается поставленная в EmoContext задача и предоставленные организаторами данные. Во второй и третьей частях - предварительная обработка текста и способы векторного представления слов. В четвёртой части - архитектура LSTM, которую автор использовал в соревновании. Код написан на языке Python с использованием библиотеки Keras. 

#статьядня

https://prglb.ru/5ja4j
4 Python библиотеки для интерпретируемого машинного обучения

Хотите добиться лучшего объяснения моделей машинного обучения? Нужна хорошая визуализация? Используйте эти Python библиотеки.

#статьядня

https://prglb.ru/5gd3a
Breaking Pandas

В первой части доклада речь пойдет о pandas, ее компонентах и архитектуре. Это даст необходимый контекст для второй части, которая объяснит связанные проекты, как они взаимодействуют с пандами, и что вся экосистема может предложить пользователям.

#видеодня

EVENT: PyLondinium19
SPEAKER: Marc Garcia

https://prglb.ru/19i2s
BigQuery ML documentation

BigQuery ML — набор простых расширений языка SQL, который позволяет использовать основные возможности машинного обучения, например, для предсказательной аналитики. Платформа поддерживает линейную регрессию и бинарную логистическую регрессию.

#полезностьдня

https://prglb.ru/5bqf4
Интерактивная визуализация данных

Создание интерактивных графиков и виджетов для визуализации данных с использованием библиотек Python, таких как: Plotly, Bokeh, nbinteract и т. д.

#статьядня

https://prglb.ru/22nuq
Задумывались ли вы о том, что покебол является идеальным автоэнкодером? По сути, он кодирует покемона в то, что может находиться внутри шара до тех пор, пока не будет вызвано тренером и декодировано обратно?

Примерно такие размышления посетили автора статьи, когда он ставил опыты с автоэнкодером и покемонами. Что из этого получилось — читайте в материале
https://clck.ru/HeDK6
Массивный набор трёхмерных данных помогает роботам разбираться в устройстве вещей

PartNet – новая семантическая база данных повседневных объектов, выводящая степень понимания роботами окружающего мира на новый уровень

#статьядня

https://prglb.ru/3hv5u
​​Привычная ситуация: заходите в соц.сеть и видите блок с аккаунтами людей, которых можете знать. Реализовать такую фичу — пример рабочей задачи Data Scientist'а.
Есть желание войти в профессию и делать более крутые штуки?

В SkillFactory готово решение: специализация Data Science, где проработаете навыки, с которыми в будущем сможете взяться за задачи обучения сервиса распознавания речи, выявления мошеннических транзакций , прогнозированию спроса на товары и даже генерации музыки или стихов.

Здесь вы проработаете маст-хэв для Data Scientist'а: Python, машинное обучение, нейросети и deep learning, Big Data и Data engineering. А еще: математика, статистика для Data Sciencе и модуль менеджмента.

Хватит тянуть, получите возможность уже через 12 месяцев работать над крутыми проектами в востребованной сфере работы с данными.

🔥 До конца недели действует супер-скидка 30%. Узнайте подробности: https://clc.to/ZHB0-A
​​Guide to Big Data Applications
Автор: S. Srinivasan

В этом большом руководстве собран коллективный опыт по работе с большими данными специалистов из разных областей науки, медицины и бизнеса. Эта книга не для начинающих, в ней вы не найдёте информацию об основах работы с большими данными, а только советы, как оптимизировать процесс обработки данных, как увеличить эффективность и уменьшить нагрузки.

#книгадня

https://t.iss.one/progbook/3613