Всем вечера пятницы! Немного обработки естественного языка в ленту. Ребята пытались натренировать бота на сообщениях с двача, получилось очень весело, но тут, как говорится, лучше один раз увидеть, чем сто раз услышать:
https://www.youtube.com/watch?v=1LcdA0Y7IEk
https://www.youtube.com/watch?v=1LcdA0Y7IEk
YouTube
028. Deep2ch: чатботы в естественной среде обитания — М. Свешников, А. Киселев, С.Королев
#книгадня
Neural Networks and Deep Learning — онлайн-книга, как вы уже догадались, о нейронных сетях и глубоком обучении. Основная задача книги — познакомить вас с ключевыми идеями, заложенными в работе нейронных сетей. Книга ориентирована на практику, предполагая что у вас уже есть некоторый опыт в программировании на Python. Можем ли мы любую математическую функцию аппроксимировать нейросетями? Как выбрать гиперпараметры для нейросетей?
Узнать ответы на эти вопросы и многое другое: https://neuralnetworksanddeeplearning.com/
Neural Networks and Deep Learning — онлайн-книга, как вы уже догадались, о нейронных сетях и глубоком обучении. Основная задача книги — познакомить вас с ключевыми идеями, заложенными в работе нейронных сетей. Книга ориентирована на практику, предполагая что у вас уже есть некоторый опыт в программировании на Python. Можем ли мы любую математическую функцию аппроксимировать нейросетями? Как выбрать гиперпараметры для нейросетей?
Узнать ответы на эти вопросы и многое другое: https://neuralnetworksanddeeplearning.com/
Все наслышаны про Jupyter Notebook, однако существует еще более мощное решение на базе jupyter — Jupyter Lab — среда разработки для задач Data Science и смежных областей, о чем и будет рассказано в данной статье:
https://proglib.io/p/jupyter/
https://proglib.io/p/jupyter/
Библиотека программиста
JupyterLab и Jupyter Notebook — мощные инструменты Data Science
Подробно рассказываем об инструментах семейства Jupyter – эффективных средствах разработки для задач Data Science и смежных областей.
#алгоритмдня
Метод k-средних
Всеми любимый неконтролируемый алгоритм кластеризации. Учитывая набор данных в виде векторов, мы можем создавать кластеры точек на основе расстояний между ними. Это один из алгоритмов машинного обучения, который последовательно перемещает центры кластеров, а затем группирует точки с каждым центром кластера. Входные данные – количество кластеров, которые должны быть созданы, и количество итераций.
Документация на scikit по K-Means
Видео по кластеризации
Введение в кластеризацию
Метод k-средних
Всеми любимый неконтролируемый алгоритм кластеризации. Учитывая набор данных в виде векторов, мы можем создавать кластеры точек на основе расстояний между ними. Это один из алгоритмов машинного обучения, который последовательно перемещает центры кластеров, а затем группирует точки с каждым центром кластера. Входные данные – количество кластеров, которые должны быть созданы, и количество итераций.
Документация на scikit по K-Means
Видео по кластеризации
Введение в кластеризацию
Kaggle является самой популярной платформой для соревнований в сфере анализа данных. Освоившись там, вы сможете получать предложения о работе в крупных западных фирмах с солидными окладами. 5 дельных советов о том, как добиться успехов на этой платформе в выступлении одного из самых успешных участников этой платформы:
https://www.youtube.com/watch?v=fXnzjJMbujc
https://www.youtube.com/watch?v=fXnzjJMbujc
YouTube
5 secrets to becoming a Kaggle grandmaster — Pavel Pleskov
Pavel Pleskov shares five secrets to becoming a Kaggle grandmaster. This video discusses:
— Whether you should strive to earn the title.
— The difference between the academic and the business approach to machine learning contests.
— What the best practical…
— Whether you should strive to earn the title.
— The difference between the academic and the business approach to machine learning contests.
— What the best practical…
В статье на примере диагностики болезни Паркинсона рассматривается применение популярной библиотеки машинного обучения XGBoost:
https://proglib.io/p/xgboost/
https://proglib.io/p/xgboost/
Библиотека программиста
10 строк для диагностики болезни Паркинсона при помощи XGBoost
В статье на примере диагностики болезни Паркинсона рассматривается применение популярной библиотеки машинного обучения XGBoost.
Для тех, кто хочет быстро освежить знания в математике, применяемой в машинном обучении, мы нашли шпаргалку:
https://gwthomas.github.io/docs/math4ml.pdf
https://gwthomas.github.io/docs/math4ml.pdf
Самый наглядный курс по нейросетям от одного из лучших образовательных каналов на ютубе по математике 3blue1brown:
https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
YouTube
Neural networks
Learn the basics of neural networks and backpropagation, one of the most important algorithms for the modern world.
Очень хороший курс по глубоким нейросетям в Python!
В лекциях изложены теоретические основы работы глубоких нейронных сетей и особенности их обучения, описаны популярные в настоящее время типы глубоких нейронных сетей (сверточные сети, сети долго-краткосрочной памяти (LSTM)), библиотеки для языка Python, реализующие глубокие нейронные сети (Keras, TensorFlow, Theano), а также методы использования глубоких нейронных сетей для анализа изображений и текстов.
Практические работы содержат задания для самостоятельного выполнения на анализ открытых наборов данных (MNIST, CIFAR-10 и IMDB Movie Review Dataset) с использованием глубоких нейронных сетей и примеры программ, которые можно использовать в качества образца.
Смотреть курс: https://www.youtube.com/playlist?list=PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_
В лекциях изложены теоретические основы работы глубоких нейронных сетей и особенности их обучения, описаны популярные в настоящее время типы глубоких нейронных сетей (сверточные сети, сети долго-краткосрочной памяти (LSTM)), библиотеки для языка Python, реализующие глубокие нейронные сети (Keras, TensorFlow, Theano), а также методы использования глубоких нейронных сетей для анализа изображений и текстов.
Практические работы содержат задания для самостоятельного выполнения на анализ открытых наборов данных (MNIST, CIFAR-10 и IMDB Movie Review Dataset) с использованием глубоких нейронных сетей и примеры программ, которые можно использовать в качества образца.
Смотреть курс: https://www.youtube.com/playlist?list=PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_
YouTube
Нейросети на Python
Курс начального уровня по программированию глубоких нейронных сетей на Python в Keras. Страница с материалами курса - https://www.asozykin.ru/courses/nnpython
Давно думали разобраться в науке о данных, но не знали, с чего начать? Мы собрали материалы, которые помогут стать специалистом по Data Science:
https://proglib.io/p/data-science-basics/
https://proglib.io/p/data-science-basics/
Библиотека программиста
6 шагов, которые помогут стать специалистом по Data Science
Давно думали разобраться в науке о данных, но не знали, с чего начать? Мы собрали материалы, которые помогут стать специалистом по Data Science.
27 лучших шпаргалок по машинному обучению и Python.
Шпаргалки освободят ваш разум для более важных задач.
https://proglib.io/p/ds-cheatsheets
Действительно полезный контент!
Шпаргалки освободят ваш разум для более важных задач.
https://proglib.io/p/ds-cheatsheets
Действительно полезный контент!
Библиотека программиста
27 шпаргалок по машинному обучению и Python в 2017
Шпаргалки освободят ваш разум для более важных задач. Мы собрали 27 лучших шпаргалок, которые можно и нужно использовать.
Математика больших данных
Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию "на лету", не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.
Доклад доступен по ссылке: https://youtu.be/lkh7bLUc30g
Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию "на лету", не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных выше задач надо хорошо знать математику? Ответы на эти вопросы будут рассмотрены в докладе.
Доклад доступен по ссылке: https://youtu.be/lkh7bLUc30g
YouTube
[Коллоквиум]: Математика больших данных: тензоры, нейросети, байесовский вывод - Ветров Д.П.
Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание…
Нейронные сети за 30 минут: от теории до практики.
Автор видео расскажет что такое нейронные сети, и как они используются. За 30 минут вы узнаете минимально необходимую теорию, а так же сможете написать свою первую многослойную нейронную сеть самостоятельно (она займет не более 50 строк кода!).
https://www.youtube.com/watch?v=AZG0j0pNY-4
Автор видео расскажет что такое нейронные сети, и как они используются. За 30 минут вы узнаете минимально необходимую теорию, а так же сможете написать свою первую многослойную нейронную сеть самостоятельно (она займет не более 50 строк кода!).
https://www.youtube.com/watch?v=AZG0j0pNY-4
YouTube
Нейронные сети за 30 минут: от теории до практики.
Я расскажу вам что такое нейронные сети, и как они используются. За 30 минут вы узнаете минимально необходимую теорию а так же сможете написать свою первую многослойную нейронную сеть самостоятельно (она займет не более 50 строк кода!).
• Запись на наш бесплатный…
• Запись на наш бесплатный…
История искусственного интеллекта
1. Рождение теории 1936-1956
2. Золотой век 1956-1976
3. Кризис нейронных сетей 1969-1980
4. Первая зима 1975-1980
5. Краткое возвращение 1980-1984
6. Вторая зима 1984-1993
7. Новая эра 1993-н.в.
Плейлист с видео доступен по ссылке: https://www.youtube.com/watch?v=UlVoZVakmYs&list=PLDCR37g8W9nHI3LDgZ6xRexrCHgUzBnvz
1. Рождение теории 1936-1956
2. Золотой век 1956-1976
3. Кризис нейронных сетей 1969-1980
4. Первая зима 1975-1980
5. Краткое возвращение 1980-1984
6. Вторая зима 1984-1993
7. Новая эра 1993-н.в.
Плейлист с видео доступен по ссылке: https://www.youtube.com/watch?v=UlVoZVakmYs&list=PLDCR37g8W9nHI3LDgZ6xRexrCHgUzBnvz
YouTube
AIML-1-1-1 Рождение теории 1936-1956
Смотрите другие видео этого курса, выполняйте упражнения и изучайте интеллектуальные системы и машинное обучение на нашем сайте! https://ulearn.azurewebsites.net/Slide/b2bf5cc9-3309-42b9-bc08-70bd9d19eb3e
Интенсивный курс по нейронным сетям от MailRu
1. Темы первой лекции:
— Нейронные сети прямого распространения;
— backpropagation;
— обучение глубоких нейронных сетей;
— сверочные сети.
2. Генеративные сети.
3. Детекция и сегментация.
4. Face Recognition.
5. DSSM-like модели. Нейронные сети для работы с текстами.
6. RNN. Нейронные сети для работы с текстами.
Ссылка на плейлист: https://vk.com/wall-54530371_211891
1. Темы первой лекции:
— Нейронные сети прямого распространения;
— backpropagation;
— обучение глубоких нейронных сетей;
— сверочные сети.
2. Генеративные сети.
3. Детекция и сегментация.
4. Face Recognition.
5. DSSM-like модели. Нейронные сети для работы с текстами.
6. RNN. Нейронные сети для работы с текстами.
Ссылка на плейлист: https://vk.com/wall-54530371_211891
VK
Библиотека программиста. Запись со стены.
Интенсивный курс по нейронным сетям от mail.ru
#data_analysis@proglib
#data_analysis@proglib
Начинаем утро вторника с отличного материала!
Как получить свою первую работу в Data Science:
https://semanti.ca/blog/?how-to-get-your-first-data-science-job
Как получить свою первую работу в Data Science:
https://semanti.ca/blog/?how-to-get-your-first-data-science-job
Semantic Bits
How to Get Your First Data Science Job
The ultimate guide to getting your first entry-level job as a Data Scientist
Подборка докладов со SmartData 2017
1. CatBoost — следующее поколение градиентного бустинга
Speaker: Анна Вероника Дорогуш
2. Нет данных? Нет проблем! Deep Learning на CGI
Speaker: Иван Дрокин
3. Deep Learning: Распознавание сцен и достопримечательностей на изображениях
Speaker: Андрей Бояров
4. Краудсорсинг: как приручить толпу?
Speaker: Артём Григорьев
5. Neurona: зачем мы научили нейросеть писать стихи в стиле Курта Кобейна?
Speaker: Иван Ямщиков
6. Глубокие свёрточные сети для обнаружения объектов и сегментации изображений
Speaker: Сергей Николенко
7. Распределённое ML на больших данных: опыт построения рекомендательной системы в ivi
Speaker: Борис Шминке
8. Имя — это фича
Speaker: Виталий Худобахшов
Ссылка на канал с докладами:
https://www.youtube.com/channel/UCfCOJWNC_ipu34-LVvPUeCg
1. CatBoost — следующее поколение градиентного бустинга
Speaker: Анна Вероника Дорогуш
2. Нет данных? Нет проблем! Deep Learning на CGI
Speaker: Иван Дрокин
3. Deep Learning: Распознавание сцен и достопримечательностей на изображениях
Speaker: Андрей Бояров
4. Краудсорсинг: как приручить толпу?
Speaker: Артём Григорьев
5. Neurona: зачем мы научили нейросеть писать стихи в стиле Курта Кобейна?
Speaker: Иван Ямщиков
6. Глубокие свёрточные сети для обнаружения объектов и сегментации изображений
Speaker: Сергей Николенко
7. Распределённое ML на больших данных: опыт построения рекомендательной системы в ivi
Speaker: Борис Шминке
8. Имя — это фича
Speaker: Виталий Худобахшов
Ссылка на канал с докладами:
https://www.youtube.com/channel/UCfCOJWNC_ipu34-LVvPUeCg
YouTube
SmartData
SmartData — конференция по инженерии данных (Conference on Data Engineering).
Конференция для дата-инженеров и тех, кто работает с большими данными. Эксперты из различных компаний обсуждают техническую конкретику по всем темам — от отказоустойчивости до…
Конференция для дата-инженеров и тех, кто работает с большими данными. Эксперты из различных компаний обсуждают техническую конкретику по всем темам — от отказоустойчивости до…
Machine Learning and Deep Learning Cheatsheets
Машинное обучение и нейронные сети сложны для начинающих как в плане понимания происходящих процессов, так и в использовании соответствующих библиотек.
Поэтому если вы интересуетесь данной темой, то скорее всего вам понравится новый репозиторий с шпаргалками на данную тему.
Ссылка на репозиторий: https://github.com/kailashahirwar/cheatsheets-ai
Машинное обучение и нейронные сети сложны для начинающих как в плане понимания происходящих процессов, так и в использовании соответствующих библиотек.
Поэтому если вы интересуетесь данной темой, то скорее всего вам понравится новый репозиторий с шпаргалками на данную тему.
Ссылка на репозиторий: https://github.com/kailashahirwar/cheatsheets-ai
GitHub
GitHub - kailashahirwar/cheatsheets-ai: Essential Cheat Sheets for deep learning and machine learning researchers https://medi…
Essential Cheat Sheets for deep learning and machine learning researchers https://medium.com/@kailashahirwar/essential-cheat-sheets-for-machine-learning-and-deep-learning-researchers-efb6a8ebd2e5 -...
Разбор лучших решений
(тренировки по Machine Learning)
Подобрали несколько интересных задач с подробным анализом их решения, которые были предложены участникам различных Хакатонов.
1. Kaggle Camera Model Identification
Speaker: Artur Fattakhov, Ilya Kibardin, Dmitriy Abulkhanov
2. Хакатон Whatever Hack, задача «Не смешно»
Speaker: Степан Драпак
3. Kaggle Recruit: прогнозирование количества посетителей ресторанов
Speaker: Никита Чуркин, Глеб Филатов
4. Data Science Game 2017: задача прогнозирования спроса
Speaker: Николай Попов, Никита Шаповалов
5. Home Credit Bank: Прогнозирование вероятности невозврата кредита
Speaker: Анзор Березгов
6. Boosters: предсказание кликов на шоу из поисковой выдачи сайта Ticketland
Speaker: Максим Келаскин
7. Kaggle Corporación Favorita Grocery: предсказание продаж сети супермаркетов
Speaker: Андрей Филимонов
8. Sberbank Holdem Challenge: хакатон по написанию покерных ботов
Speaker: Евгений Иванов
Ссылка на youtube канал с роликами: https://www.youtube.com/channel/UCeq6ZIlvC9SVsfhfKnSvM9w
(тренировки по Machine Learning)
Подобрали несколько интересных задач с подробным анализом их решения, которые были предложены участникам различных Хакатонов.
1. Kaggle Camera Model Identification
Speaker: Artur Fattakhov, Ilya Kibardin, Dmitriy Abulkhanov
2. Хакатон Whatever Hack, задача «Не смешно»
Speaker: Степан Драпак
3. Kaggle Recruit: прогнозирование количества посетителей ресторанов
Speaker: Никита Чуркин, Глеб Филатов
4. Data Science Game 2017: задача прогнозирования спроса
Speaker: Николай Попов, Никита Шаповалов
5. Home Credit Bank: Прогнозирование вероятности невозврата кредита
Speaker: Анзор Березгов
6. Boosters: предсказание кликов на шоу из поисковой выдачи сайта Ticketland
Speaker: Максим Келаскин
7. Kaggle Corporación Favorita Grocery: предсказание продаж сети супермаркетов
Speaker: Андрей Филимонов
8. Sberbank Holdem Challenge: хакатон по написанию покерных ботов
Speaker: Евгений Иванов
Ссылка на youtube канал с роликами: https://www.youtube.com/channel/UCeq6ZIlvC9SVsfhfKnSvM9w
YouTube
ML Trainings
Machine Learning Trainings is a meetup series about competitive Data Science. Authors of the best solutions of the ML contests are invited to talk about their solutions and share practices. We discuss competitions from Kaggle and other platforms, academic…