Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Повышение производительности TensorFlow на Mac

Новый форк TensorFlow 2.4 от Apple, оптимизированный для Mac, позволяет ускорить обучение, в результате чего производительность на платформах с новым чипом M1 повышается до 7 раз!

https://proglib.io/w/da28241c
🐍 Линейное программирование. Практика решения задач оптимизации на Python

Рассмотрим на примере максимизации прибыли характерные особенности задач линейного программирования. В качестве высокоуровневых инструментов – Python, библиотеки SciPy и PuLP.

https://proglib.io/sh/T90VYvCdJU
📈 Почему Big data так быстро развивается?

Чтобы пройти обучение и получить высокооплачиваемую профессию, необходимо понять тенденции развития отрасли. Рассказываем о Big Data – одном из самых перспективных направлений в сфере ИТ.

https://proglib.io/sh/3b5RTvA9ci
Hands-On Unsupervised Learning Using Python (2020)
Автор: Ankur A. Patel
Количество страниц: 362

Многие отраслевые эксперты считают, что машинное обучение без учителя - это новый рубеж в области искусственного интеллекта, который может стать ключом к святому Граалю в исследованиях ИИ, так называемому общему искусственному интеллекту. Поскольку большая часть мировых данных немаркирована, традиционное обучение с учителем часто не может быть применено; здесь помогает Unsupervised Learning. Неконтролируемое обучение может быть применено в работе с немаркированными наборами данных, чтобы обнаруживать значимые закономерности, скрытые глубоко в данных, шаблоны, которые могут быть почти никогда не раскрыты людьми.

Скачать книгу
📈 История успеха: как я стал специалистом по Data Science

Специалист по анализу данных рассказывает историю своего обучения, а также дает советы и приводит ссылки на курсы, практикумы, рассылки и сообщества для начинающих Data Scientists.

https://proglib.io/sh/SwpkMIL7gH
Декабрьский интенсив по SRE🦎

Формат: онлайн-интенсив (Zoom, записи занятий, git, стенды для практики, техподдержка и помощь спикеров).

На интенсиве разбираем SRE-подход к разработке и эксплуатации высоконагруженного сайта:
✔️будем настраивать и поддерживать сайт из нескольких микросервисов.
✔️сформулируем показатели SLO, SLI, SLA, разработаем архитектуру и инфраструктуру, соберем, протестируем и задеплоим сайт, настроим мониторинг и алертинг.
✔️определим причины ухудшения SLO, разберем устойчивость, error budget, практику тестирования, управление прерываниями и операционной нагрузкой.
✔️проработаем порядок действий в случае аварии.
✔️примем решения по дальнейшему предотвращению инцидентов.

Дата интенсива: 11–13 декабря 2020

Программа и регистрация на сайте - https://slurm.club/3mD04V4
📱 Создание приложения Flutter, интегрированного с ИИ

Предлагаем подробно разобрать, как объединить Flutter c технологиями искусственного интеллекта и рассмотреть, к чему приведет эта интеграция.

https://proglib.io/sh/jIrO849s5T
🤖 Анализ тональности текста: прошлое, настоящее и будущее

Статья описывает методы решения одной из самых популярных задач машинного обучения - анализа тональности текста, на примере популярного датасета отзывов зрителей на фильмы IMDb.

https://proglib.io/sh/p25bGKThRD
Как научиться правильно разрабатывать и запускать приложения в K8s? Есть несколько путей, но, пожалуй, самый быстрый — это пройти трёхдневный онлайн-интенсив «Kubernetes для разработчиков» от Слёрм.

Чем ещё хорош этот путь?
– Материал курса основан на практическом опыте. Учим тому, что делаем на своих проектах.
– Никаких админских штучек и историй про обслуживание кластера. Только инструментарий и знания, которые требуются разработчикам.
– Никто не уйдёт без результата. Спикеры и техподдержка помогут каждому студенту справиться с заданиями.

Интенсив стартует 3 марта. Сейчас можно записаться по минимальной цене – 20 000 рублей.

Посмотреть программу и подать заявку.
Создание фильтра Pandoc на Python, который превращает данные CSV в форматированные таблицы.

https://proglib.io/w/bbf1c115
💽 Git для Data Science: контроль версий моделей и датасетов с помощью DVC

Подробный туториал о том, как с помощью DVC и Git эффективно хранить датасеты и модели машинного обучения, чтобы перемещаться между разными их версиями посредством пары команд.

https://proglib.io/sh/k2ELx6Fwgu
Kubeflow for Machine Learning: From Lab to Production (2020)
Авторы: Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko
Количество страниц: 264

Если вы тренируете модель машинного обучения, но не знаете, как запустить ее в производство, эта книга поможет вам в этом. Kubeflow предоставляет набор облачных инструментов для различных этапов жизненного цикла модели, от исследования данных, подготовки функций и обучения до обслуживания модели. Это руководство поможет специалистам по обработке данных создавать реализации машинного обучения производственного уровня с помощью Kubeflow; авторы также показывают, как делать модели масштабируемыми и надежными.

Скачать книгу
This media is not supported in your browser
VIEW IN TELEGRAM
Видите гифку? Это Паша притворяется аналитиком, который умеет ставить ТЗ разработчикам 😅
Но Совкомбанку такой Паша не нужен.
Совкомбанку нужен настоящий аналитик с опытом от 1 года, пониманием сферы инвестбизнеса и казначейства и опытом работы с СУБД MSSQL или Oracle. Команда банка предлагает офис на Ленинском в Москве, приятных коллег, хорошую зарплату, фитнес, изучение языков и серьёзный ДМС со стоматологией.
Если хотите работать с приятными людьми и чувствовать себя хорошо, нажимайте сюда:
https://bit.do/fLBzE
The Self-Service Data Roadmap (2020)
Автор: Sandeep Uttamchandani
Количество страниц: 438

Аналитика, основанная на данных, является ключевым конкурентным преимуществом в любой отрасли, но получение информации из необработанных данных все еще может занять дни или недели. С помощью этой практической книги специалисты по обработке данных и менеджеры команд узнают, как создать платформу для самостоятельного анализа, которая поможет любому сотруднику вашей организации извлекать информацию из данных. Эта книга перекидывает мост между учеными, занимающимися данными, и инженерами.

Скачать книгу