Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.39K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Keras2cpp - это небольшая библиотека для запуска обученных моделей Keras из C++ приложения без каких-либо зависимостей.

Цели дизайна:
1. Совместимость с сетями, сгенерированными Keras с использованием бэкэнда TensorFlow.
2. Только процессор, без GPU.
3. Нет внешних зависимостей, стандартная библиотека, C ++17.
4. Модель хранится на диске в двоичном формате и может быть быстро прочитана.
5. Модель хранится в памяти в непрерывном блоке для лучшей производительности кеша.

#библиотекадня

 https://goo-gl.ru/4MEV
​​Интерактивные элементы управления в Jupyter Notebooks
Как использовать интерактивные виджеты IPython для улучшения исследования и анализа данных

#статьядня

 https://goo-gl.ru/4MMB
PyTorch Pretrained Bert

Этот репозиторий содержит операционную реализацию PyTorch Google TensorFlow для модели BERT.

 Эта реализация предоставляется с предварительно обученными моделями Google, примерами, записными книжками и интерфейсом командной строки для загрузки любой предварительно обученной контрольной точки TensorFlow для BERT.

#полезностьдня

https://clc.am/g2TCPA
Практическое глубокое обучение для программистов
Курс предполагает, что у вас есть, по крайней мере, год опыта программирования (желательно на Python).
Основное внимание в первой половине курса уделяется практическим методам, показывающим только теорию.
Затем, во второй половине курса, вы все глубже и глубже углубитесь в теорию, пока к последнему уроку вы не с нуля создадите и обучите «обновленную» нейронную сеть, которая приближается к современной точности.

#статьядня

clc.am/omxzPw
​​Open Neural Network Exchange (ONNX) - это открытая экосистема, которая позволяет разработчикам ИИ выбирать правильные инструменты по мере развития их проекта. ONNX предоставляет формат с открытым исходным кодом для моделей искусственного интеллекта, как глубокое обучение, так и традиционный ML.

#полезностьдня

https://clc.am/UhBkbg
Proof of Concept: Как проверить, что внедрение ML стоит свеч
Автор рассказывает, что такое рентабельность инвестиций, как оценить её для внутреннего проекта, какую роль в этом играет Proof of Concept, и почему в реальной жизни всё может пойти не так.

#статьядня

https://clc.am/1ZL7jQ
Долгосрочный план Data Science, который НЕ поможет вам стать экспертом всего за несколько месяцев

#статьядня

https://clc.am/3pkS_g
​​Типичные распределения вероятности: шпаргалка data scientist-а
Разбираемся, что такое распределение вероятности, какие виды бывают и в чем отличия?!

#статьядня

https://clc.am/yConHg
В этом блоге автор рассказывает, как ODE можно использовать для решения задач моделирования данных. Автор глубоко погружается в проблему моделирования данных и представляет ODE как альтернативу регрессии. А также представляет расширение для нейронных ODE.

#полезностьдня

https://clc.am/SSmPmA
Введение в Convex Optimization

Этот курс направлен на то, чтобы дать студентам инструменты и обучение для распознавания выпуклых задач оптимизации, возникающих в научных и инженерных приложениях, представляя основную теорию и концентрируясь на аспектах моделирования и результатах.
Темы включают:
- выпуклые множества,
- выпуклые функции,
- задачи оптимизации, наименьших квадратов,
- линейные и квадратичные программы,
- условия оптимальности,
- теория двойственности.

Представлены приложения для обработки сигналов, управления, машинного обучения, финансов, проектирования цифровых и аналоговых схем, вычислительной геометрии, статистики и машиностроения.

#полезностьдня

https://clc.am/-gqpHQ
Генеративные Состязательные Сети
Генеративные Состязательные Сети - это мощный класс нейронных сетей. По сути, они состоят из системы двух нейронных сетей - Генератора и Дискриминатора, которые противостоят друг другу.
Рассмотрим последние достижения в Генеративных Состязательных Сетях.

#статьядня

https://clc.am/RQP7YA
Обучение с подкреплением (reinforcement learning, RL) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой.
Данный курс - это версия для студентов YSDA и ВШЭ (весна 2019 года). Для полных материалов курса необходимо переключиться на главную ветвь. Для всех материалов, которые мало описаны, есть ссылки на дополнительную информацию и связанные материалы (D.Silver / Sutton / blogs / и т.д.).

#полезностьдня

https://clc.am/FsQFzw
Лучшая визуализация методов градиентного спуска
На это можно смотреть вечно!

#статьядня

https://clc.am/UWymLQ
​​Большие данные трансформируют мир! Здесь вы изучите методы интеллектуального анализа данных и машинного обучения для обработки больших наборов данных и извлечения из них ценных знаний.

#полезностьдня

https://clc.am/3eaJoQ
​​Пожалуй, самое понятное объяснение простых математических понятий, да еще и с красивой визуализацией

#полезностьдня

https://clc.am/MxdlUw
Чтобы не пришлось арендовать сервера, небольшой гайд по настройке Ubuntu и GPU для тренировки нейросетей

#статьядня

https://clc.am/EbKZmw
HDFS (the Hadoop Distributed File System) представляет собой распределенную файловую систему, предназначенную для хранения очень больших объемов данных (терабайты или даже петабайты) и обеспечения высокопроизводительного доступа к этой информации.

Цели данного курса:
Научиться понимать основную структуру HDFS и ее связь с основными понятиями распределенной файловой системы.
Понять, как настроить и использовать HDFS из командной строки.
Понять, как использовать HDFS в ваших приложениях

#полезностьдня

https://clc.am/rwesHA