Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.39K photos
119 videos
64 files
4.83K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Очный курс для всех, кто хочет разобраться в машинном обучении → «Практический Machine Learning» (https://bit.ly/2yNa0ow) от SkillFactory

Cтартует курс по машинному обучению от SkillFactory. Длительность курса - 1,5 месяца. Занятия будут проходить в Москве.

На курсе вы получите практические знания по применению машинного обучения в бизнесе. И сможете начать карьеру как Data Scientist.

Программа курса:

1️⃣ Работа с языком Python
2️⃣ Применение различных алгоритмов машинного обучения: классификация, регрессии, работа с данными, текстами и другими моделями.
3️⃣ Создание http api-модели. Автоматическое переобучения модели и мониторинг результатов.
4️⃣ Выпускной хакатон. Командная работа.

Записаться на курс и получить полную программу можно по ссылке → https://bit.ly/2yNa0ow
Анализ данных на Python в примерах и задачах

1. Описательные статистики. Квантили, квартили. Гистограммы. Ядерные оценки плотности.
2. Описательные статистики. Ящики с усами. Выбросы. Медиана и среднее арифметическое как типичные наблюдения.
3. Иерархический кластерный анализ. Кластер, расстояния между объектами, расстояния между кластерами.
4. Метод к-средних. Примеры.
5. Проверка статистических гипотез). Гипотезы согласия, однородности, независимости, гипотезы о параметрах распределения.
6. Проверка статистических гипотез (процедуры Python).
7. A/B тестирование. Тест для пропорций.
8. Линейный регрессионный анализ. Модель, интерпретация оценок коэффициентов, множественный коэффициент детерминации.
9. Прогнозирование на основе регрессионной модели с сезонными индикаторными (фиктивными, структурными) переменными.

Лекции доступны по ссылке:
https://vk.com/videos288422991?section=album_7
Нейронные сети — мощный и многофункциональный инструмент, который применим в любой современной отрасли.
В лекциях представлены основные алгоритмы, задачи и методы, которые помогут лучше понять нейронные сети.

https://proglib.io/p/plain-neural-networks/
Вероятностный язык построения моделей машинного обучения

1. Байесовский подход к теории вероятностей. Байесовские рассуждения. Понятие о графических моделях.
2. Сопряженные распределения. Экспоненциальный класс распределений. Аналитический байесовский вывод.
3. Задача выбора модели в машинном обучении. Принцип наибольшей обоснованности.
4. Использование байесовского выбора модели в обобщенных линейных моделях регрессии и классификации.
5. ЕМ-алгоритм. Вариационный байесовский вывод. Примеры использования.
6. Латентное размещение Дирихле. Байесовская смесь гауссиан. Байесовский метод главных компонент.
7. Байесовские и марковские сети. Основные задачи и методы вывода в графических моделях.
8. Обучение графических моделей. Структурный метод опорных векторов.

Ссылка на плейлист:
https://www.youtube.com/playlist?list=PLlb7e2G7aSpR8mbaShVBods-hGaFGifkl
Подборка материалов по нейронным сетям с нашего сайта

Импульсные нейронные сети: мозг в компьютере
https://proglib.io/p/spiking-neural-networks/

Самый понятный видеокурс о том, как работают нейросети
https://proglib.io/p/clear-neural-networks/

Капсульные сети встряхивают AI: вот как их использовать
https://proglib.io/p/capsule-networks/

Учебный план освоения глубокого обучения и нейросетей за 6 недель
https://proglib.io/p/deep-learning-in-6-weeks/
TensorFlow.js: машинное обучение на JavaScript с доставкой в браузер

Для обучения модели обычно как разработчику, так и конечному потребителю моделей машинного обучения, требуется установка соответствующих библиотек. Однако в TensorFlow.js интерфейсом является браузер, поэтому при подключении скриптового файла исчезает необходимость в установке библиотек и отслеживании зависимостей, все «доставляется на дом».

https://proglib.io/p/tensorflow-js/
Анализ данных и Deep Learning

1. Примеры применения анализа данных, стандартные задачи и методы
2. Методы решения задачи классификации и регрессии
3. Кластеризация
4. Преобразование признаков
5. Введение в Text Mining
6. Введение в Deep Learning
7. Deep Learning for Data with Sequence Structure
8. Рекомендательные системы
9. Прогнозирование временных рядов

Ссылка на YouTube канал с видео: https://www.youtube.com/channel/UCop3CelRVvrchG5lsPyxvHg/videos
​​🚀 Быстрый, надежный, хостинг в Европе !

Ищете хороший, и при этом недорогой хостинг для сайтов?
Хотите быстрый, по-европейски надежный и самый лучший для вашего проекта?
Компания FORNEX рада Вам помочь.

Мы предлагаем быстрый, качественный Hosting за рубежом. В качестве серверов для виртуального хостинга мы используем быстрые дисковые массивы из SSD дисков, что обеспечивает надежную и быструю работу ваших сайтов.
Наши инженеры помогут вам с переносом сайтов абсолютно бесплатно.
Мы заботимся о будущем вашего сайта!

У нас вы арендуете исключительно серверное оборудование Supermicro с бесплатной панелью управления и круглосуточным KVM;
• Вы можете заказать сервер в Германии и не только;
• Удобство панели управления, все просто и доступно;
• Скидки и акции для постоянных клиентов;
• Бесплатное базовое администрирование;
• Мгновенная отзывчивость техподдержки.

У нас нет минусов !
• Убедитесь в этом сами !
• Присоединяйтесь к FORNEX !

Промокод для регистрации: NOVEMBERRAIN

https://fornex.com/?from=tg-dsproglib-nov
Анализ изображений и видео (2017)

1. Введение в анализ изображений
2. Обработка изображений. Часть 1
3. Обработка изображений. Часть 2
4. Глобальные признаки
5. Локальные признаки
6. Параметрические модели
7. Классификация объектов на изображении
8. Глубокие нейронные сети
9. Представления и современные архитектуры сверточных сетей

Ссылка на плейлист с видео: https://www.youtube.com/playlist?list=PLlb7e2G7aSpQc4CW-9BI9L_jZVyUbbSWX
​​Программист из Google Клиф Янг объясняет, как взрывное развитие алгоритмов глубинного обучения совпадает с отказом закона Мура, десятилетиями работавшего эмпирического правила прогресса компьютерных чипов, и заставляет разрабатывать принципиально новые вычислительные схемы.

#статьядня

https://m.habr.com/post/429794/
​​Python и машинное обучение (2017)
Автор: Себастьян Рашка

Книга идеально подходит для тех, кто хочет погрузиться в мир прогнозной аналитики и машинного обучения. Охватывается широкий круг мощных библиотек Python, в том числе scikit-learn, Theano и Keras.

#книгадня

Скачать книгу на русском по ссылке: https://t.iss.one/progbook/55
​​#статьядня

В данной статье расскажем, как стать аналитиком данных за 12 недель по курсам Microsoft и др.

https://proglib.io/p/ds-in-3months/
​​Pandas - библиотека на языке Python для обработки и анализа данных. Работа Pandas с данными строится поверх библиотеки NumPy, являющейся инструментом более низкого уровня.

#cheatsheet

Если работаете (или планируете поработать в ближайшее время) с данной библиотекой, то эти шпаргалки точно вам пригодятся!
Введение в анализ данных с использованием Pandas
В данном семинаре рассмотрен практический подход к проведению исследований в Pandas.
Автор начинает с импорта реальных данных, затем чистит их, преобразует и анализирует, испольуя некоторую визуализацию.

#видеодня

EVENT: PyData Seattle 2017
SPEAKER: Quentin Caudron

https://www.youtube.com/watch?v=WrAkpobchUk&index=9&list=PLFjq8z-aGyQ5ijq6ZD2CEkqWoOBgHi9qG