Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
ParaText - это быстрый способ получения данных с диска в оперативную памят.
Она легко интегрируется с библиотекой Pandas, предоставляет возможность быстрого чтения файлов в формате CSV размером до 2.5GB, а также
удобную реализацию чтения файлов в параллельных процессах на многоядерных машинах.

#библиотекадня

https://prglb.ru/42zre
​​Практика Deep Learning для разработчиков
Из данного курса вы познакомитесь с основными понятиями глубокого обучения и закрепите эти знания на практике.

#youtubeдня

https://prglb.ru/1jn52
​​Подход к ранжированию результатов поиска без аннотации

Просто небольшая статья с новой идеей:
- вместо обучения сети с CE - просто тренируйте ее с BCE;
- Исходная дополнительная структура из внутренней структуры вашего домена (теги, методы декомпозиции матрицы, эвристика и т. Д.).
Лучше всего работает, если ваша онтология относительно проста.

#статьядня

https://prglb.ru/2wxc2
PCI Express и Thunderbolt. Какое падение производительности вашего графического процессора произойдет, если вы поместите его в eGPU?
В данной статье автор даст ответ на вопрос, который многие пользователи хотят знать: насколько сильно понизится производительность моей видеокарты, если я положу ее в eGPU с Thunderbolt 1, Thunderbolt 2 или Thunderbolt 3?

#статьядня

https://prglb.ru/51y16
Полезная шпаргалка по tmux для тех, кто любит работать в консоли
tmux - cвободная консольная утилита-мультиплексор, предоставляющая пользователю доступ к нескольким терминалам в рамках одного экрана. tmux может быть отключен от экрана: в этом случае он продолжит исполняться в фоновом режиме; имеется возможность вновь подключиться к tmux, находящемуся в фоне.

#полезностьдня

https://prglb.ru/qtqu
​​Автор приложил много усилий, чтобы задокументировать каждый шаг, связанный с процессом прогнозирования.
Эти записи послужат хорошей отправной точкой для новых Kagglers и новых энтузиастов машинного обучения.

#githubдня
#полезностьдня

https://prglb.ru/37zqy
​​Готовы уже 30 октября перейти на новый уровень зарплаты?
80 000 рублей — зарплата аналитика данных (даже в регионах — по данным hh.ru).

С 22 марта будем учить с нуля собирать, анализировать и презентовать данные. Ваши ключевые навыки после прохождения курса «Аналитик данных»:
— Сбор и подготовка данных для анализа.
— Визуализация данных.
— Сбор и понимание бизнес-требований заказчика.
— Подготовка ad-hoc исследований и аналитики.
— Тестирование гипотез.
— Умение писать сложные запросы на SQL.
— Python для анализа данных.
— Знание основ работы с Hadoop.

Каждый выпускник получает помощь и поддержку Центра развития карьеры.

До 14 марта — скидка: https://netolo.gy/eQ5
​​​​Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Авторы: Дэви Силен, Арно Мейсман, Мохамед Али

Наука о данных является одной из наиболее востребованных и высокооплачиваемых сфер IT, где постоянно требуются специалисты, способные работать над разноплановыми проектами любого уровня, и если вы ищите с чего начать, то книга подойдет вам как нельзя лучше.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/2576
Делаем проект по распознаванию рукописных цифр с моделями, которые дообучаются на нарисованных пользователями цифрах.
Используется две модели: простая нейронная сеть (FNN) на чистом numpy и сверточная сеть (CNN) на Tensorflow.
Гайд для не совсем начинающих

#статьядня

https://prglb.ru/4jh4g
​​Хочешь стать программистом с высоким чеком оплаты? Пришло время действовать!
Онлайн-университет Skillbox с 11 по 29 марта проводит ряд бесплатных вебинаров по программированию.

Регистрация по ссылке ▶️https://goo.gl/7kxaeC

Лучшие преподаватели-практики страны поделятся своими знаниями и секретами!

Каждый участник получит электронный сертификат!
​​Model Zoo предоставляет платформу для глубоких знаний исследователей, чтобы легко найти предварительно обученные модели для различных платформ и применений. Сайт регулярно обновляется.

#полезностьдня

https://prglb.ru/4dlhb
​​statsmodels - это модуль Python, который предоставляет классы и функции для оценки множества различных статистических моделей, а также для проведения статистических тестов и исследования статистических данных.

#библиотекадня

https://prglb.ru/1lv4p
Deep Learning with Keras and Tensorflow
Примеры нейросетей в виде .ipynb тетрадок.
Контролируемое обучение, CNN, обучение без учителя, RNN и еще много всего интересного!

Автор: Valerio Maggio

#полезностьдня

https://prglb.ru/3j44n
​​От «R против Python» к «R и Python»: два в одном
Привыкли противопоставлять R и Python? Узнайте, как объединить сильные стороны этих языков и использовать их оба в одном проекте.

#статьядня

https://prglb.ru/1v6i0