Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

В интернете множество датасетов, но порой приходится выгружать данные из интернета. Большая подборка уроков по парсингу с помощью популярных инструментов языка программирования Python в нашей статье:

https://proglib.io/p/parsing-course/

Библиотека программиста

Парсинг сайтов на Python: подробный видеокурс и программный код

В видеокурсе из семи уроков описывается парсинг сайтов с различной структурой при помощи Python третьей версии, библиотек requests и BeautifulSoup.

1.88K views17:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Больше шпаргалок богу шпаргалок! Команда курса CS 229 Стенфордского университета приготовила шпаргалки на все случаи жизни:

Глубокое обучение — https://stanford.io/2BsQ91Q
Обучение с учителем — https://stanford.io/2nRlxxp
и без учителя — https://stanford.io/2MmP6FN
Трюки и советы — https://stanford.io/2MEHwFM

stanford.edu

CS 229 - Deep Learning Cheatsheet

Teaching page of Shervine Amidi, Graduate Student at Stanford University.

⚡1👍1

1.81K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Команда NVIDIA выложила модели нейросетей, применяемых в компьютерном зрении, NLP, рекомендательных системах, генеративно-состязательных сетях, а также их реализация с открытым кодом.

Используйте данные примеры для понимания принципов построения и обучения со своими собственными данными либо интегрируйте их в свои программные продукты.

https://developer.nvidia.com/deep-learning-examples

NVIDIA Developer

Deep Learning Examples

1.73K views17:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

#советдня

Если вы используете модель из глубокого обучения, используйте малые скорости обучения для предобученных моделей.

Заранее настроенные веса – это не то же самое, что инициализированные случайным образом. Изменяйте их значения более деликатно. Выбор скорости зависит от модели обучения и того, насколько хорошо прошло предобучение.

1.44K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

#алгоритмдня

Ограниченная линейная регрессия
Метод наименьших квадратов может смутить выбросами, ложными полями и т. д. Нужны ограничения, чтобы уменьшить дисперсию линии, которую мы помещаем в набор данных. Правильное решение состоит в том, чтобы соответствовать модели линейной регрессии, которая гарантирует, что веса не будут вести себя “плохо”.

Модели могут иметь норму L1 (LASSO) или L2 (Ridge Regression) или обе (elastic regression).
Используйте этот алгоритм для соответствия линиям регрессии с ограничениями, избегая переопределения.

Полезные ссылки
Документация по обобщенным линейным моделям в sklearn
Ридж-регрессия
LASSO регрессия

YouTube

Ridge Regression

My Patreon : https://www.patreon.com/user?u=49277905

1.72K views17:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Машинное обучение — как секс в старших классах. Все говорят о нем по углам, единицы понимают, а занимается только препод. Статьи о машинном обучении делятся на два типа: это либо трёхтомники с формулами и теоремами, которые я ни разу не смог дочитать даже до середины, либо сказки об искусственном интеллекте, профессиях будущего и волшебных дата-саентистах.

Эта статья — большое введение для тех, кто хочет наконец разобраться в машинном обучении — простым языком, без формул-теорем, зато с примерами реальных задач и их решений.

Читать: https://vas3k.ru/blog/machine_learning/

vas3k.blog

Машинное обучение для людей

None

2.04K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Всем вечера пятницы! Немного обработки естественного языка в ленту. Ребята пытались натренировать бота на сообщениях с двача, получилось очень весело, но тут, как говорится, лучше один раз увидеть, чем сто раз услышать:

https://www.youtube.com/watch?v=1LcdA0Y7IEk

YouTube

028. Deep2ch: чатботы в естественной среде обитания — М. Свешников, А. Киселев, С.Королев

2.25K viewsedited 18:27

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

#книгадня

Neural Networks and Deep Learning — онлайн-книга, как вы уже догадались, о нейронных сетях и глубоком обучении. Основная задача книги — познакомить вас с ключевыми идеями, заложенными в работе нейронных сетей. Книга ориентирована на практику, предполагая что у вас уже есть некоторый опыт в программировании на Python. Можем ли мы любую математическую функцию аппроксимировать нейросетями? Как выбрать гиперпараметры для нейросетей?

Узнать ответы на эти вопросы и многое другое: https://neuralnetworksanddeeplearning.com/

1.65K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Все наслышаны про Jupyter Notebook, однако существует еще более мощное решение на базе jupyter — Jupyter Lab — среда разработки для задач Data Science и смежных областей, о чем и будет рассказано в данной статье:

https://proglib.io/p/jupyter/

Библиотека программиста

JupyterLab и Jupyter Notebook — мощные инструменты Data Science

Подробно рассказываем об инструментах семейства Jupyter – эффективных средствах разработки для задач Data Science и смежных областей.

1.81K views17:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

#алгоритмдня

Метод k-средних

Всеми любимый неконтролируемый алгоритм кластеризации. Учитывая набор данных в виде векторов, мы можем создавать кластеры точек на основе расстояний между ними. Это один из алгоритмов машинного обучения, который последовательно перемещает центры кластеров, а затем группирует точки с каждым центром кластера. Входные данные – количество кластеров, которые должны быть созданы, и количество итераций.

Документация на scikit по K-Means
Видео по кластеризации
Введение в кластеризацию

1.71K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Kaggle является самой популярной платформой для соревнований в сфере анализа данных. Освоившись там, вы сможете получать предложения о работе в крупных западных фирмах с солидными окладами. 5 дельных советов о том, как добиться успехов на этой платформе в выступлении одного из самых успешных участников этой платформы:

https://www.youtube.com/watch?v=fXnzjJMbujc

YouTube

5 secrets to becoming a Kaggle grandmaster — Pavel Pleskov

Pavel Pleskov shares five secrets to becoming a Kaggle grandmaster. This video discusses:
— Whether you should strive to earn the title.
— The difference between the academic and the business approach to machine learning contests.
— What the best practical…

1.97K views17:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

В статье на примере диагностики болезни Паркинсона рассматривается применение популярной библиотеки машинного обучения XGBoost:

https://proglib.io/p/xgboost/

Библиотека программиста

10 строк для диагностики болезни Паркинсона при помощи XGBoost

В статье на примере диагностики болезни Паркинсона рассматривается применение популярной библиотеки машинного обучения XGBoost.

2.12K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Для тех, кто хочет быстро освежить знания в математике, применяемой в машинном обучении, мы нашли шпаргалку:

https://gwthomas.github.io/docs/math4ml.pdf

2.57K views17:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Самый наглядный курс по нейросетям от одного из лучших образовательных каналов на ютубе по математике 3blue1brown:

https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi

YouTube

Neural networks

Learn the basics of neural networks and backpropagation, one of the most important algorithms for the modern world.

2.59K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Очень хороший курс по глубоким нейросетям в Python!

В лекциях изложены теоретические основы работы глубоких нейронных сетей и особенности их обучения, описаны популярные в настоящее время типы глубоких нейронных сетей (сверточные сети, сети долго-краткосрочной памяти (LSTM)), библиотеки для языка Python, реализующие глубокие нейронные сети (Keras, TensorFlow, Theano), а также методы использования глубоких нейронных сетей для анализа изображений и текстов.

Практические работы содержат задания для самостоятельного выполнения на анализ открытых наборов данных (MNIST, CIFAR-10 и IMDB Movie Review Dataset) с использованием глубоких нейронных сетей и примеры программ, которые можно использовать в качества образца.

Смотреть курс: https://www.youtube.com/playlist?list=PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_

YouTube

Нейросети на Python

Курс начального уровня по программированию глубоких нейронных сетей на Python в Keras. Страница с материалами курса - https://www.asozykin.ru/courses/nnpython

3.09K views10:17

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Давно думали разобраться в науке о данных, но не знали, с чего начать? Мы собрали материалы, которые помогут стать специалистом по Data Science:

https://proglib.io/p/data-science-basics/

Библиотека программиста

6 шагов, которые помогут стать специалистом по Data Science

Давно думали разобраться в науке о данных, но не знали, с чего начать? Мы собрали материалы, которые помогут стать специалистом по Data Science.

2.28K views13:19

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

27 лучших шпаргалок по машинному обучению и Python.
Шпаргалки освободят ваш разум для более важных задач.

https://proglib.io/p/ds-cheatsheets

Действительно полезный контент!

Библиотека программиста

27 шпаргалок по машинному обучению и Python в 2017

Шпаргалки освободят ваш разум для более важных задач. Мы собрали 27 лучших шпаргалок, которые можно и нужно использовать.

2.96K views15:08

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Русскоязычный курс по глубокому обучению от МФТИ. Рекомендуем!

https://deepmipt.github.io/dlschl/

2.3K views18:57

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Математика больших данных

Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию "на лету", не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.

Доклад доступен по ссылке: https://youtu.be/lkh7bLUc30g

YouTube

[Коллоквиум]: Математика больших данных: тензоры, нейросети, байесовский вывод - Ветров Д.П.

Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание…

1.98K views18:51

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Нейронные сети за 30 минут: от теории до практики.

Автор видео расскажет что такое нейронные сети, и как они используются. За 30 минут вы узнаете минимально необходимую теорию, а так же сможете написать свою первую многослойную нейронную сеть самостоятельно (она займет не более 50 строк кода!).

https://www.youtube.com/watch?v=AZG0j0pNY-4

YouTube

Нейронные сети за 30 минут: от теории до практики.

Я расскажу вам что такое нейронные сети, и как они используются. За 30 минут вы узнаете минимально необходимую теорию а так же сможете написать свою первую многослойную нейронную сеть самостоятельно (она займет не более 50 строк кода!).

• Запись на наш бесплатный…

2.07K views08:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

История искусственного интеллекта

1. Рождение теории 1936-1956
2. Золотой век 1956-1976
3. Кризис нейронных сетей 1969-1980
4. Первая зима 1975-1980
5. Краткое возвращение 1980-1984
6. Вторая зима 1984-1993
7. Новая эра 1993-н.в.

Плейлист с видео доступен по ссылке: https://www.youtube.com/watch?v=UlVoZVakmYs&list=PLDCR37g8W9nHI3LDgZ6xRexrCHgUzBnvz

YouTube

AIML-1-1-1 Рождение теории 1936-1956

Смотрите другие видео этого курса, выполняйте упражнения и изучайте интеллектуальные системы и машинное обучение на нашем сайте! https://ulearn.azurewebsites.net/Slide/b2bf5cc9-3309-42b9-bc08-70bd9d19eb3e

2.33K views17:01

About

Blog

Apps

Platform