Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Подход к ранжированию результатов поиска без аннотации

Просто небольшая статья с новой идеей:
- вместо обучения сети с CE - просто тренируйте ее с BCE;
- Исходная дополнительная структура из внутренней структуры вашего домена (теги, методы декомпозиции матрицы, эвристика и т. Д.).
Лучше всего работает, если ваша онтология относительно проста.

#статьядня

https://prglb.ru/2wxc2
PCI Express и Thunderbolt. Какое падение производительности вашего графического процессора произойдет, если вы поместите его в eGPU?
В данной статье автор даст ответ на вопрос, который многие пользователи хотят знать: насколько сильно понизится производительность моей видеокарты, если я положу ее в eGPU с Thunderbolt 1, Thunderbolt 2 или Thunderbolt 3?

#статьядня

https://prglb.ru/51y16
Полезная шпаргалка по tmux для тех, кто любит работать в консоли
tmux - cвободная консольная утилита-мультиплексор, предоставляющая пользователю доступ к нескольким терминалам в рамках одного экрана. tmux может быть отключен от экрана: в этом случае он продолжит исполняться в фоновом режиме; имеется возможность вновь подключиться к tmux, находящемуся в фоне.

#полезностьдня

https://prglb.ru/qtqu
​​Автор приложил много усилий, чтобы задокументировать каждый шаг, связанный с процессом прогнозирования.
Эти записи послужат хорошей отправной точкой для новых Kagglers и новых энтузиастов машинного обучения.

#githubдня
#полезностьдня

https://prglb.ru/37zqy
​​Готовы уже 30 октября перейти на новый уровень зарплаты?
80 000 рублей — зарплата аналитика данных (даже в регионах — по данным hh.ru).

С 22 марта будем учить с нуля собирать, анализировать и презентовать данные. Ваши ключевые навыки после прохождения курса «Аналитик данных»:
— Сбор и подготовка данных для анализа.
— Визуализация данных.
— Сбор и понимание бизнес-требований заказчика.
— Подготовка ad-hoc исследований и аналитики.
— Тестирование гипотез.
— Умение писать сложные запросы на SQL.
— Python для анализа данных.
— Знание основ работы с Hadoop.

Каждый выпускник получает помощь и поддержку Центра развития карьеры.

До 14 марта — скидка: https://netolo.gy/eQ5
​​​​Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Авторы: Дэви Силен, Арно Мейсман, Мохамед Али

Наука о данных является одной из наиболее востребованных и высокооплачиваемых сфер IT, где постоянно требуются специалисты, способные работать над разноплановыми проектами любого уровня, и если вы ищите с чего начать, то книга подойдет вам как нельзя лучше.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/2576
Делаем проект по распознаванию рукописных цифр с моделями, которые дообучаются на нарисованных пользователями цифрах.
Используется две модели: простая нейронная сеть (FNN) на чистом numpy и сверточная сеть (CNN) на Tensorflow.
Гайд для не совсем начинающих

#статьядня

https://prglb.ru/4jh4g
​​Хочешь стать программистом с высоким чеком оплаты? Пришло время действовать!
Онлайн-университет Skillbox с 11 по 29 марта проводит ряд бесплатных вебинаров по программированию.

Регистрация по ссылке ▶️https://goo.gl/7kxaeC

Лучшие преподаватели-практики страны поделятся своими знаниями и секретами!

Каждый участник получит электронный сертификат!
​​Model Zoo предоставляет платформу для глубоких знаний исследователей, чтобы легко найти предварительно обученные модели для различных платформ и применений. Сайт регулярно обновляется.

#полезностьдня

https://prglb.ru/4dlhb
​​statsmodels - это модуль Python, который предоставляет классы и функции для оценки множества различных статистических моделей, а также для проведения статистических тестов и исследования статистических данных.

#библиотекадня

https://prglb.ru/1lv4p
Deep Learning with Keras and Tensorflow
Примеры нейросетей в виде .ipynb тетрадок.
Контролируемое обучение, CNN, обучение без учителя, RNN и еще много всего интересного!

Автор: Valerio Maggio

#полезностьдня

https://prglb.ru/3j44n
​​От «R против Python» к «R и Python»: два в одном
Привыкли противопоставлять R и Python? Узнайте, как объединить сильные стороны этих языков и использовать их оба в одном проекте.

#статьядня

https://prglb.ru/1v6i0
Kaggle подходы для CV в проде: внедрить нельзя выпилить
В ходе дискуссии рассмариваются сильные и слабые стороны кэгглеров с точки зрения переноса их навыков в продакшен. Также будет произведено сравнение кэггл подхода для решения соревнований с разработкой в области компьютерного зрения.

Speaker: Арсений Кравченко vs Артур Кузин

#видеодня

https://prglb.ru/389xb
Серия статей "Открытый курс машинного обучения"

Курс состоит из:
10 статей на Хабре
10 лекций (Youtube-канал на русском + более свежие лекции на англ.),
воспроизводимых материалов (Jupyter notebooks) в репозитории mlcourse.ai и в виде Kaggle Dataset
отличных соревнований Kaggle Inclass (не на "стаканье xgboost-ов", а на построение признаков)
домашних заданий по каждой теме (в репозитории — список демо-версий заданий)

#статьядня

https://prglb.ru/3ktje
Новый большой набор данных для вашего домашнего проекта GAN или pix2pix

500 тыс. Модных изображений + метаданные + достопримечательности

#полезностьдня

https://prglb.ru/4d5e4