Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.6K subscribers
2.33K photos
119 videos
64 files
4.76K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Виртуальные стажировки – это онлайн-симуляторы работы в топовых компаниях, в ходе которых ты: в случае со Сбером – реализуешь проект по построению модели, оценивающей объем стабильной части средств на счетах клиентов, а в случае с КРОК – реализуешь проект по разработке витрины производственных данных для металлургической компании.

Виртуальные стажировки позволят тебе:
❗️ Получить опыт работы над проектом Сбера или КРОК и включить его в свое резюме;
❗️ Попасть на реальную стажировку в Сбер или КРОК в приоритетном порядке, пропустив первые этапы отбора;
❗️ Научиться выполнять реальные задачи стажера по направлению Data Science Сбера или Big Data КРОК и получить практические навыки.

Виртуальная стажировка:
🔓 Доступна для всех желающих: чтобы начать достаточно просто зарегистрироваться;
📆 Не привязана к временным срокам и не имеет внутренних дедлайнов: можешь начать в любое время и стажироваться в комфортном для тебя режиме.

Начать виртуальную стажировку:
👉 Data Science в Сбере
👉 Big Data в КРОК
🐦 BigBird от Google: еще одна важная веха в NLP?

Разбираемся, что такое Google BigBird, какие задачи она может решать, и насколько она важна для отрасли.

https://proglib.io/sh/8y3Pxf1R94
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2019)
Автор: Aurélien Géron
Количество страниц: 856

Благодаря недавней серии прорывов глубокое обучение расширило всю область машинного обучения в целом. Теперь программисты, которые почти ничего не знают о работе этой технологии, могут использовать простые и эффективные инструменты для реализации программ, обучающихся на данных. Книга показывает читателю, как это делается. Используя конкретные примеры, минимум теории и два фреймворка Python — Scikit-Learn и TensorFlow — автор поможет вам получить интуитивное понимание концепций и инструментов для построения интеллектуальных систем. Книга была обновлена после выхода TensorFlow 2.0.

Скачать книгу
⚖️ Что такое лицензирование ПО и как оно работает?

Рассказываем о классификации лицензий и даем практические советы по лицензированию программного обеспечения.

https://proglib.io/sh/6KQ4TnvaNb
Группировка тысяч похожих ячеек с текстом в таблице за секунды.

https://proglib.io/w/77c1cc06
🤖 Вариационные автоэнкодеры (VAE) для чайников – пошаговое руководство

Практическое руководство в стиле "сделай сам" с работающим кодом создания и обучения VAE для лиц знаменитостей на Keras.

https://proglib.io/sh/VJG12sCQ4E
Deep Learning: A Visual Approach (2021)
Автор: Andrew Glassner
Количество страниц: 776

Данный учебник предназначен для всех, кто хочет понять область Deep Learning, но без какой-либо сложной математики и программирования, которые обычно требуются для понимания ее внутреннего устройства. Если вы хотите знать, как работают популярные инструменты, и использовать их самостоятельно, ответы на все вопросы находятся на страницах книги. И если вы готовы писать свои собственные программы, в прилагаемом репозитории есть множество дополнительных ноутбуков Python, которые помогут вам начать работу.

Скачать книгу
Python and R for the Modern Data Scientist (2021)
Авторы: Rick J. Scavetta, Boyan Angelov
Количество страниц: 275

Успех в науке о данных зависит от гибкого и правильного использования инструментов. Сюда входят Python и R, два основных языка программирования в этой области. Эта книга направляет специалистов по данным из сообществ Python и R на пути к двуязычию. Признавая сильные стороны обоих языков, вы откроете для себя новые способы решения задач в области науки о данных и расширите свой набор навыков.

Скачать книгу
Продолжаем следить за конкурсами с денежными призами. «Цифровой прорыв» совместно с Mail.Ru Group запускают IT-чемпионат по ML, AI и Data Science. Есть три задачи:

- Модель прогноза средних цен и объемов потребления товаров (ФНС России и Росстат)
- ИИ для поиска самолетов на снимках местности при проведении поисково-спасательных операций (Росавиация)
- ИИ для распознавания категории предмета музейного фонда (Минкультуры России)

Как видите, задачи практичные и важные, на решение дается целый месяц — с 14 июля по 14 августа. В каждой из трех задач есть 25 призовых мест, за первое место дают 100 тыс. ₽. Регистрация и подробности здесь: https://proglib.io/w/ed5565c7