Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.39K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Machine Learning with Python Cookbook: Practical Solutions from Preprocessing to Deep Learning
Автор: Chris Albon

Это руководство рассматривает современные подходы языка к решению актуальных проблем в данной области, принятые стандарты и практики, а также реальные примеры применения.
В книге рассматриваются такие темы, как векторы, матрицы и массивы; обработка текста; линейная регрессия; работа с моделями и многое другое.

#книгадня

Скачать книгу:
https://t.iss.one/progbook/2359
​​​​Спешим сообщить, что мы запускаем целый ряд онлайн-соревнований по созданию алгоритмических торговых стратегий с большим призовым фондом - QuantNet Contest!
Вы можете принять участие в соревнованиях и получать денежные призы уже через месяц после их старта.

Для этого Вам нужно:

- Зарегистрироваться на сайте quantnet.ai

- Создать и отправить свою первую стратегию. Чтобы Вам было проще начать, мы подготовили для Вас шаблоны стратегий с разъяснениями.
Отметим, что для того, чтобы стратегия приняла участие в соревновании, она должна удовлетворять определенным критериям. Подробнее о них и других деталях можно прочитать в правилах соревнований. Первые соревнования стартуют после сбора 50 допущенных стратегий, а в каждый следующий месяц будет запущен ряд новых соревнований.

Желаем удачи!
​​TensorFlow.js: машинное обучение на JavaScript с доставкой в браузер
Кратко рассмотрены основные особенности JavaScript-версии популярного фреймворка машинного обучения от Google – TensorFlow.js.

#статьядня

https://proglib.io/p/tensorflow-js/
Keras2cpp - это небольшая библиотека для запуска обученных моделей Keras из C++ приложения без каких-либо зависимостей.

Цели дизайна:
1. Совместимость с сетями, сгенерированными Keras с использованием бэкэнда TensorFlow.
2. Только процессор, без GPU.
3. Нет внешних зависимостей, стандартная библиотека, C ++17.
4. Модель хранится на диске в двоичном формате и может быть быстро прочитана.
5. Модель хранится в памяти в непрерывном блоке для лучшей производительности кеша.

#библиотекадня

 https://goo-gl.ru/4MEV
​​Интерактивные элементы управления в Jupyter Notebooks
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных

#статьядня

 https://goo-gl.ru/4MMB
PyTorch Pretrained Bert

Этот репозиторий содержит операционную реализацию PyTorch Google TensorFlow для модели BERT.

 Эта реализация предоставляется с предварительно обученными моделями Google, примерами, записными книжками и интерфейсом командной строки для загрузки любой предварительно обученной контрольной точки TensorFlow для BERT.

#полезностьдня

https://clc.am/g2TCPA
Практическое глубокое обучение для программистов
Курс предполагает, что у вас есть, по крайней мере, год опыта программирования (желательно на Python).
Основное внимание в первой половине курса уделяется практическим методам, показывающим только теорию.
Затем, во второй половине курса, вы все глубже и глубже углубитесь в теорию, пока к последнему уроку вы не с нуля создадите и обучите «обновленную» нейронную сеть, которая приближается к современной точности.

#статьядня

clc.am/omxzPw
​​Open Neural Network Exchange (ONNX) - это открытая экосистема, которая позволяет разработчикам ИИ выбирать правильные инструменты по мере развития их проекта. ONNX предоставляет формат с открытым исходным кодом для моделей искусственного интеллекта, как глубокое обучение, так и традиционный ML.

#полезностьдня

https://clc.am/UhBkbg
Proof of Concept: Как проверить, что внедрение ML стоит свеч
Автор рассказывает, что такое рентабельность инвестиций, как оценить её для внутреннего проекта, какую роль в этом играет Proof of Concept, и почему в реальной жизни всё может пойти не так.

#статьядня

https://clc.am/1ZL7jQ
Долгосрочный план Data Science, который НЕ поможет вам стать экспертом всего за несколько месяцев

#статьядня

https://clc.am/3pkS_g
​​Типичные распределения вероятности: шпаргалка data scientist-а
Разбираемся, что такое распределение вероятности, какие виды бывают и в чем отличия?!

#статьядня

https://clc.am/yConHg
В этом блоге автор рассказывает, как ODE можно использовать для решения задач моделирования данных. Автор глубоко погружается в проблему моделирования данных и представляет ODE как альтернативу регрессии. А также представляет расширение для нейронных ODE.

#полезностьдня

https://clc.am/SSmPmA
Введение в Convex Optimization

Этот курс направлен на то, чтобы дать студентам инструменты и обучение для распознавания выпуклых задач оптимизации, возникающих в научных и инженерных приложениях, представляя основную теорию и концентрируясь на аспектах моделирования и результатах.
Темы включают:
- выпуклые множества,
- выпуклые функции,
- задачи оптимизации, наименьших квадратов,
- линейные и квадратичные программы,
- условия оптимальности,
- теория двойственности.

Представлены приложения для обработки сигналов, управления, машинного обучения, финансов, проектирования цифровых и аналоговых схем, вычислительной геометрии, статистики и машиностроения.

#полезностьдня

https://clc.am/-gqpHQ
Генеративные Состязательные Сети
Генеративные Состязательные Сети - это мощный класс нейронных сетей. По сути, они состоят из системы двух нейронных сетей - Генератора и Дискриминатора, которые противостоят друг другу.
Рассмотрим последние достижения в Генеративных Состязательных Сетях.

#статьядня

https://clc.am/RQP7YA
Обучение с подкреплением (reinforcement learning, RL) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой.
Данный курс - это версия для студентов YSDA и ВШЭ (весна 2019 года). Для полных материалов курса необходимо переключиться на главную ветвь. Для всех материалов, которые мало описаны, есть ссылки на дополнительную информацию и связанные материалы (D.Silver / Sutton / blogs / и т.д.).

#полезностьдня

https://clc.am/FsQFzw
Лучшая визуализация методов градиентного спуска
На это можно смотреть вечно!

#статьядня

https://clc.am/UWymLQ
​​Большие данные трансформируют мир! Здесь вы изучите методы интеллектуального анализа данных и машинного обучения для обработки больших наборов данных и извлечения из них ценных знаний.

#полезностьдня

https://clc.am/3eaJoQ
​​Пожалуй, самое понятное объяснение простых математических понятий, да еще и с красивой визуализацией

#полезностьдня

https://clc.am/MxdlUw