Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.41K photos
121 videos
64 files
4.86K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Что объединяет журналиста, маркетолога и разработчика игр?

Возможность улучшить свою работу, используя данные. Хотите узнать как это сделать — приходите в Нетологию на бесплатный день открытых дверей «Как начать в аналитике и Data Science». 

Вы узнаете, кому стоит учиться и работать в сфере аналитики. Поймёте, кто такие Data Scientist, продуктовый аналитик, игровой аналитик, дата-журналист, маркетолог-аналитик, инженер данных, аналитик BI, — и где они нужны. А ещё — увидите перспективы развития в аналитике, сможете выбрать направление по душе и получите пошаговый план развития карьеры → https://netolo.gy/hAS
Создание фильтра Pandoc на Python, который превращает данные CSV в форматированные таблицы.

https://proglib.io/w/bbf1c115
Митап «Основы работы с PostGIS, Hadoop и Spark»

Компания «Синимекс» приглашает принять участие в онлайн-митапе, где эксперты компании поделятся своим опытом применения современных инструментов в разработке.

В рамках митапа выступят:

- Александр Мещеряков, специалист отдела по анализу данных, с темой «PostGIS: Как обрабатывать и хранить геоданные». В ходе выступления будут рассмотрены основные функции PostGIS в теории и на практике.

- Александр Сайков, разработчик отдела по анализу данных, с темой «Hadoop и Spark». В рамках доклада будет продемонстрировано как работают самые популярные инструменты для обработки и хранения больших данных.

Когда: 2 февраля 2022 в 16:00. Подключайтесь онлайн и участвуйте в обсуждении.

Регистрация по ссылке.
🧩 5 интересных головоломок и задач, чтобы отвлечься от рутины и немного пошевелить извилинами (выпуск 15)

В нашей еженедельной подборке мы подготовили 5 новых интересных алгоритмических, логических и математических задачек для отдыха и прокачки мозгов.

https://proglib.io/sh/ak1X027h5f
☄️Друзья! 1 марта в NewProLab стартует флагманский 12-недельный онлайн-курс "Специалист по большим данным".

А это значит, вас вновь ждет самая глубокая и обьемная программа на рынке Big Data, заслужившая множество восторженных отзывов!

👉Оставляйте заявку и задавайте вопросы: https://clck.ru/XLjph 👈

Вы:
☑️Владеете основами Python?
☑️Уже умеете создавать SQL-запросы?
☑️ Знакомы с прикладными понятиями мат. анализа и линейной алгебры?
☑️Понимаете базовые операции ОС Linux?

Тогда мы приглашаем вас систематизировать текущие навыки и получить полное практическое руководство для подготовки собственных полноценных проектов.

Вы научитесь: строить модели машинного обучения, писать MapReduce-джобы, используя Hadoop Streaming и Python, работать с данными на HDFS, проводить анализ при помощи Apache Spark, строить алгоритмы рекомендательных систем.
❗️И все это на реальных дата-сетах и живых бизнес-кейсах с преподавателями и нетворком в сообществе единомышленников❗️

Эту программу уже прошли более 300 дата аналитиков и разработчиков. Присоединяйтесь и вы!
Математик (разработчик алгоритмов оптимизации)

Условия: от 250.000 + премии, удаленка.

Задачи: Разработка моделей и алгоритмов для нахождения оптимальных решений логистических, оптимизационных задач (задач оптимизации потока, задач графикования и их реализация на базе промышленных платформ, работа с данными, прототипирование и проверка гипотез. Прототипирование, моделирование предметной области, разработка алгоритмов, разработка ТЗ и спецификаций, интеграция моделей в цифровые продукты.

Требования: Опыт работы с библиотеками линейной оптимизации/машинного обучения (Gurobi, GLPK, IBM ILOG, Oracle SNO, SAP APO) - обязательное требование;
Хорошая математическая подготовка в области теории алгоритмов и теории оптимизации;
Фундаментальные знания языка Python, умение писать поддерживаемый, читаемый и тестируемый код;
Навыки написания SQL-запросов.

Подробнее: https://hh.ru/vacancy/51891212?from=employer&hhtmFrom=employer
Контакт: @zakharovaMI
Natural Language Processing with Transformers (2022)
Авторы: Lewis Tunstall, Leandro von Werra, Thomas Wolf
Количество страниц: 410

С момента своего появления в 2017 году трансформеры быстро стали доминирующей архитектурой для достижения самых современных результатов в различных задачах обработки естественного языка. Если вы специалист по данным или кодер, эта практическая книга покажет вам, как обучать и масштабировать эти большие модели с помощью Hugging Face Transformers, библиотеки глубокого обучения на основе Python.

Скачать книгу
🚄 Сравнение 6 алгоритмов сортировки: пузырьком, выбором, кучей, вставками, слиянием и быстрая

В этой статье мы начнем изучение алгоритмов сортировки, разберем 6 методов сортировки и ознакомимся с оценкой их эффективности.

https://proglib.io/sh/MleBkGR4VW
👁👁 11 советов для программиста, которые помогут сохранить зрение при длительной работе за компьютером

Делимся советами, как айтишнику сохранить здоровье глаз при работе за компьютером.

https://proglib.io/sh/zSksJ948QD
🐘 Руководство по SQL для начинающих. Часть 1: создание базы данных, таблиц и установка связей между таблицами

Пошаговая инструкция по установке, настройке и наполнению базы данных PostgreSQL с помощью pgAdmin и SQL-запросов.

https://proglib.io/sh/7tl9sATS2f