Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Открытый курс машинного обучения. Линейные модели классификации и регрессии
Основное преимущество данного открытого курса - это акцент на практическом применении линейных моделей в реальных задачах (хотя и математики тоже будет немало).

#статьядня

https://prglb.ru/yicl
PyText - это основанная на PyTorch платформа моделирования НЛП с глубоким обучением. PyText отвечает на часто противоречивые требования обеспечения быстрого экспериментирования и обслуживания моделей в масштабе.

#библиотекадня

https://prglb.ru/1v1qu

В документе также упоминается тот же ограниченный API, что и в AllenNLP.
https://prglb.ru/4bkkw
​​Капсульные сети встряхивают AI: вот как их использовать
Если вы изучаете ИИ, возможно, вы также слышали о появлении такого революционного явления, как капсульные сети. Начните их использовать уже сегодня!

#статьядня

https://prglb.ru/5d73x
​​Профессия Data Scientist стартует 8 апреля в Нетологии.

Достигнутые результаты после обучения:
— Построена полносвязная нейросеть
— Создан чат-бот для поиска авиабилетов
— Построен классификатор изображений
— Созданы рекомендательные системы для музыкального и киносайта
— Создан готовый к внедрению ml-проект

Скидка 15% для по промокоду datascience15. Действует до конца марта и суммируется с остальными сезонными скидками.

Зарегистрируйтесь на курс здесь: https://netolo.gy/eQb
​​​​Deep Learning for Computer Vision with Python
Автор: Dr. Adrian Rosebrock

Тем, кто знает Python и профессионально на нём программирует, невероятно повезло: вы можете делать обычное программное обеспечение, можете обрабатывать естественные языки, рисовать графики, производить сложные математические вычисления, составлять фото-роботы, а теперь ещё и создавать программы компьютерного зрения с помощью глубокого обучения. Это руководство познакомит вас с основами компьютерного зрения, с библиотеками и лучшими практиками.

#книгадня

Скачать книгу:
 https://t.iss.one/progbook/1504
ParaText - это быстрый способ получения данных с диска в оперативную памят.
Она легко интегрируется с библиотекой Pandas, предоставляет возможность быстрого чтения файлов в формате CSV размером до 2.5GB, а также
удобную реализацию чтения файлов в параллельных процессах на многоядерных машинах.

#библиотекадня

https://prglb.ru/42zre
​​Практика Deep Learning для разработчиков
Из данного курса вы познакомитесь с основными понятиями глубокого обучения и закрепите эти знания на практике.

#youtubeдня

https://prglb.ru/1jn52
​​Подход к ранжированию результатов поиска без аннотации

Просто небольшая статья с новой идеей:
- вместо обучения сети с CE - просто тренируйте ее с BCE;
- Исходная дополнительная структура из внутренней структуры вашего домена (теги, методы декомпозиции матрицы, эвристика и т. Д.).
Лучше всего работает, если ваша онтология относительно проста.

#статьядня

https://prglb.ru/2wxc2
PCI Express и Thunderbolt. Какое падение производительности вашего графического процессора произойдет, если вы поместите его в eGPU?
В данной статье автор даст ответ на вопрос, который многие пользователи хотят знать: насколько сильно понизится производительность моей видеокарты, если я положу ее в eGPU с Thunderbolt 1, Thunderbolt 2 или Thunderbolt 3?

#статьядня

https://prglb.ru/51y16
Полезная шпаргалка по tmux для тех, кто любит работать в консоли
tmux - cвободная консольная утилита-мультиплексор, предоставляющая пользователю доступ к нескольким терминалам в рамках одного экрана. tmux может быть отключен от экрана: в этом случае он продолжит исполняться в фоновом режиме; имеется возможность вновь подключиться к tmux, находящемуся в фоне.

#полезностьдня

https://prglb.ru/qtqu
​​Автор приложил много усилий, чтобы задокументировать каждый шаг, связанный с процессом прогнозирования.
Эти записи послужат хорошей отправной точкой для новых Kagglers и новых энтузиастов машинного обучения.

#githubдня
#полезностьдня

https://prglb.ru/37zqy
​​Готовы уже 30 октября перейти на новый уровень зарплаты?
80 000 рублей — зарплата аналитика данных (даже в регионах — по данным hh.ru).

С 22 марта будем учить с нуля собирать, анализировать и презентовать данные. Ваши ключевые навыки после прохождения курса «Аналитик данных»:
— Сбор и подготовка данных для анализа.
— Визуализация данных.
— Сбор и понимание бизнес-требований заказчика.
— Подготовка ad-hoc исследований и аналитики.
— Тестирование гипотез.
— Умение писать сложные запросы на SQL.
— Python для анализа данных.
— Знание основ работы с Hadoop.

Каждый выпускник получает помощь и поддержку Центра развития карьеры.

До 14 марта — скидка: https://netolo.gy/eQ5
​​​​Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Авторы: Дэви Силен, Арно Мейсман, Мохамед Али

Наука о данных является одной из наиболее востребованных и высокооплачиваемых сфер IT, где постоянно требуются специалисты, способные работать над разноплановыми проектами любого уровня, и если вы ищите с чего начать, то книга подойдет вам как нельзя лучше.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/2576
Делаем проект по распознаванию рукописных цифр с моделями, которые дообучаются на нарисованных пользователями цифрах.
Используется две модели: простая нейронная сеть (FNN) на чистом numpy и сверточная сеть (CNN) на Tensorflow.
Гайд для не совсем начинающих

#статьядня

https://prglb.ru/4jh4g