Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.6K subscribers
2.32K photos
116 videos
64 files
4.75K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Нужен опытный парфюмер!

Ищем специалиста, который точно знает, как должны пахнуть полезные сервисы и новейшие технологии. Ты сможешь создать аромат, который станет новым символом продуктов Сбера. Подробнее — узнаешь по ссылке.
👉 А пока подпишись на «Карьеру в Сбере», у нас много классных вакансий!
🤖 Применение искусственного интеллекта для общественного блага

Рассказываем о том, как использование технологий искусственного интеллекта в различных областях приносит пользу обществу и способствует решению глобальных социальных проблем.

https://proglib.io/sh/0sh39qGt6m
#вопросы_с_собеседований
В чем разница между машинным обучением с учителем и без учителя?
Для обучения с учителем требуются данные, помеченные для обучения. Например, чтобы провести классификацию (задача обучения с учителем), вам нужно сначала пометить данные, которые вы будете использовать для обучения модели, для классификации данных по помеченным группам; в то же время обучение без учителя не требует явной маркировки данных.
Machine Learning with R, the tidyverse, and mlr (2020)
Автор: Hefin I. Rhys
Количество страниц: 536

Машинное обучение - это набор методов программирования для обнаружения взаимосвязей в данных. С помощью алгоритмов машинного обучения вы можете кластеризовать и классифицировать данные для таких задач, как нахождение рекомендаций или обнаружение мошенничества, а также прогнозирование тенденций продаж и анализ рисков. Такие инструменты, как простой в освоении язык программирования R, позволяют любому программисту выполнять высококачественный анализ данных. Автор научит вас широко использовать методы машинного обучения и применять их к вашим собственным наборам данных с помощью языка программирования R и его мощной экосистемы инструментов.

Скачать книгу
Хотите больше мемов от пикчера Библиотеки программиста? Подписывайтесь: @itmemlib
Открываем виртуальные двери для вас!

Приглашаем на онлайн-ивент «День открытых дверей» от IT One – нового амбициозного разработчика ПО, который сочетает в себе преимущества крупной компании и энергию молодого стартапа.

🧩 Мы строим цифровое будущее России. Лично участвуем в проектах, которые коснутся почти всех жителей страны.
🧩 За 3 месяца существования выросли в полтора раза – до команды из 350 спецов.
🧩 Передовой стек: Java 8, Spring Boot, Docker, Kubernetes, Cassandra и др.
🧩 Каждый день работаем с highload-проектами, микросервисной архитектурой, ресайзингом окружения средствами самой системы и другими интересными вызовами.

Как выглядит такая работа изнутри? Присоединяйтесь к трансляции 5 апреля в 18:00 (МСК) – расскажем подробно!

🔥 Место встречи изменить нельзя: https://is.gd/EpSXeu
Data Science on AWS (2021)
Авторы: Chris Fregly, Antje Barth
Количество страниц: 522

Из этой практической книги специалисты в области искусственного интеллекта и машинного обучения узнают, как успешно создавать и развертывать проекты в области науки о данных в Amazon Web Services. Стек Amazon AI и машинного обучения объединяет науку о данных, инженерию данных и разработку приложений, чтобы помочь вам повысить уровень ваших навыков. В этом руководстве показано, как создавать и запускать конвейеры в облаке, а затем интегрировать результаты в приложения за считанные минуты, а не дни. На протяжении всей книги авторы демонстрируют, как снизить затраты ресурсов и повысить производительность.

Скачать книгу
Process Mining: Data Science in Action (2018)
Автор: Wil M. P. van der Aalst
Количество страниц: 486

Это второе издание книги по процессной аналитике, в которой теперь эта область обсуждается также в более широком контексте науки о данных и подходов к большим данным. Книга включает в себя несколько дополнений и обновлений, например по индуктивным методам, понятию согласований, значительно расширенному разделу программных инструментов и совершенно новой главе о процессах интеллектуального анализа данных в целом. Книга охватывает весь спектр знаний из процессной аналитики.

Скачать книгу
Кросс-валидация: что она оценивает и насколько хорошо она это делает?

https://proglib.io/w/15f8e6e1
Аналитика данных используется во многих областях и требует людей с самым разным бэкграундом, поэтому в Data Science каждый может найти себя.

7 апреля в Нетологии пройдет «Онлайн-день открытых дверей и презентация новых программ по Аналитике и Data Science», на котором подробно расскажут о профессиях в этой сфере — data scientist, продуктовый аналитик, игровой аналитик, дата-журналист, маркетолог-аналитик, инженер данных, аналитик bi, — и где они нужны.

Вы найдете подходящее именно вам направление, выберете для себя трек развития карьеры и узнаете, какие шаги нужно сделать для входа в новую профессию.

Регистрируйтесь и постройте свой план карьерного роста ↓
https://netolo.gy/gnF
Linear Algebra Done Right (2015)
Автор: Sheldon Axler
Количество страниц: 357

Этот популярный учебник по линейной алгебре второго курса предназначен для студентов-математиков и аспирантов. Применяемый здесь новаторский подход оставляет определители на конец книги. Текст посвящен главной цели линейной алгебры: пониманию структуры линейных операторов в конечномерных векторных пространствах. Автор сильно постарался мотивировать созданные концепции и упростить доказательства. Различные интересные упражнения в каждой главе помогут студентам глубже понимать объекты линейной алгебры и управлять ими.

Скачать книгу
📊 Инструменты дата-журналиста #1: Jupyter Notebook и библиотека Pandas

В первой части серии публикаций мы разберемся с фильтрацией, сортировкой и очисткой датафреймов. Займемся декодированием текста с помощью библиотеки ftfy и определением языка через библиотеку googletransnew. Блокнот Jupyter и наша шпаргалка по pandas прилагаются.

https://proglib.io/sh/XhHE1xqMnf
C 12 по 25 апреля приглашаем принять участие в EPAM Data Hiring Weeks!
Станьте частью команды EPAM и получите welcome-бонус в размере одного оклада.

Направления:
Big Data: https://epa.ms/bigdata-hw
Data Quality: https://epa.ms/dq-hw

Как подать заявку:
1. Заполните регистрационную форму и получите подтверждение;
2. Пройдите интервью и получите оффер в течение 24 часов.

Мы ценим ваше время, и эта одна из причин проведения мероприятия – не нужно долго ждать решения. После успешного прохождения интервью в течение 24 часов вам будет сделан оффер. Если вы примете его в период с 12 по 25 апреля, вы получите welcome-бонус.
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «C 12 по 25 апреля приглашаем принять участие в EPAM Data Hiring Weeks! Станьте частью команды EPAM и получите welcome-бонус в размере одного оклада. Направления: Big Data: https://epa.ms/bigdata-hw Data Quality: https://epa.ms/dq-hw Как подать заявку: 1.…»
Data Governance: The Definitive Guide (2021)
Авторы: Evren Eryurek, Uri Gilad, Valliappa Lakshmanan, Anita Kibunguchy-Grant, Jessi Ashdown
Количество страниц: 254

При перемещении данных в облако вам необходимо рассмотреть комплексный подход к управлению данными, наряду с четко определенными и согласованными политиками, чтобы гарантировать соответствие вашей организации определенным требованиям. Управление данными включает способы совместной работы людей, процессов и технологий для обеспечения надежности данных и их эффективного использования. В этом практическом руководстве показано, как эффективно реализовать и масштабировать управление данными в масштабах всего бизнеса.

Скачать книгу