Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
BigQuery ML documentation

BigQuery ML — набор простых расширений языка SQL, который позволяет использовать основные возможности машинного обучения, например, для предсказательной аналитики. Платформа поддерживает линейную регрессию и бинарную логистическую регрессию.

#полезностьдня

https://prglb.ru/5bqf4
Интерактивная визуализация данных

Создание интерактивных графиков и виджетов для визуализации данных с использованием библиотек Python, таких как: Plotly, Bokeh, nbinteract и т. д.

#статьядня

https://prglb.ru/22nuq
Задумывались ли вы о том, что покебол является идеальным автоэнкодером? По сути, он кодирует покемона в то, что может находиться внутри шара до тех пор, пока не будет вызвано тренером и декодировано обратно?

Примерно такие размышления посетили автора статьи, когда он ставил опыты с автоэнкодером и покемонами. Что из этого получилось — читайте в материале
https://clck.ru/HeDK6
Массивный набор трёхмерных данных помогает роботам разбираться в устройстве вещей

PartNet – новая семантическая база данных повседневных объектов, выводящая степень понимания роботами окружающего мира на новый уровень

#статьядня

https://prglb.ru/3hv5u
​​Привычная ситуация: заходите в соц.сеть и видите блок с аккаунтами людей, которых можете знать. Реализовать такую фичу — пример рабочей задачи Data Scientist'а.
Есть желание войти в профессию и делать более крутые штуки?

В SkillFactory готово решение: специализация Data Science, где проработаете навыки, с которыми в будущем сможете взяться за задачи обучения сервиса распознавания речи, выявления мошеннических транзакций , прогнозированию спроса на товары и даже генерации музыки или стихов.

Здесь вы проработаете маст-хэв для Data Scientist'а: Python, машинное обучение, нейросети и deep learning, Big Data и Data engineering. А еще: математика, статистика для Data Sciencе и модуль менеджмента.

Хватит тянуть, получите возможность уже через 12 месяцев работать над крутыми проектами в востребованной сфере работы с данными.

🔥 До конца недели действует супер-скидка 30%. Узнайте подробности: https://clc.to/ZHB0-A
​​Guide to Big Data Applications
Автор: S. Srinivasan

В этом большом руководстве собран коллективный опыт по работе с большими данными специалистов из разных областей науки, медицины и бизнеса. Эта книга не для начинающих, в ней вы не найдёте информацию об основах работы с большими данными, а только советы, как оптимизировать процесс обработки данных, как увеличить эффективность и уменьшить нагрузки.

#книгадня

https://t.iss.one/progbook/3613
Сравнение сложных NLP-моделей для сложных языков на множестве реальных задач

Имеет ли смысл предварительно обучать модели на базе трансформаторов? Можете ли вы сделать лучше, чем BPE? Какая архитектура лучше для какой задачи?

#статьядня

https://prglb.ru/5pjkw
Стэнфордский курс «Сверточные нейронные сети для визуального распознавания»

#полезностьдня

https://prglb.ru/57kng
Шпаргалка OpenCV-Python: от импорта изображений до распознавания лиц

Обрезка, изменение размера, вращение, определение порога, размытие, рисование и запись на изображении, распознавание лиц и контурная обработка для обнаружения объектов.

#статьядня

https://prglb.ru/2w05w
Анимированные переходы изображений StyleGAN с помощью RunwayML

Как создать бесконечный цикл синтетически сгенерированных ландшафтов StyleGAN с плавными переходами, используя RunwayML и P5.js

#статьядня

https://prglb.ru/5eixq
Нейросети и глубокое обучение: онлайн-учебник, послесловие: существует ли простой алгоритм для создания интеллекта?

Существует ли простой набор принципов, которые можно использовать для объяснения такого явления, как интеллект? В частности, более конкретно, существует ли простой алгоритм для создания интеллекта?

#статьядня

https://prglb.ru/38noh
Построение модели атрибутов лица с использованием многозадачного обучения

В одном из недавних проектов автор использовал многозадачное обучение для обучения модели, позволяющей определить возраст, пол и этническую принадлежность человека. Автор делится важными компонентами, которые заставили эту систему работать.

#статьядня

https://prglb.ru/4bcy9
Отладка моделей машинного обучения

При отладке моделей машинного обучения нам необходимо убедиться, что наши входные данные подготовлены должным образом. О том, как это сделать, описано в данной серии статей.

#статьядня

Часть 1
https://prglb.ru/22bk2

Часть 2
https://prglb.ru/3yoyj
OpenGPT-2: мы реплицировали GPT-2

В последнее время большие языковые модели, такие как BERT¹, XLNet², GPT-2³ и Grover⁴, продемонстрировали впечатляющие результаты при генерации текста и выполнении нескольких задач NLP. Поскольку в настоящее время Open-AI не выпустил свою самую большую модель (но выпустил модель 774M param), авторы стремятся воспроизвести их модель 1.5B, чтобы позволить другим основываться на этой предварительно обученной модели и улучшать ее.

#статьядня

https://prglb.ru/24p26
​​Прими участие в бесплатном интенсиве по Data Science и построй модель машинного обучения на Python, способную предсказывать курс доллара!

Ссылка для регистрации 🔜 https://clc.to/JQmDCw

✔️ Настроим рабочее окружение.
✔️ Проведем экспресс-введение в Python.
✔️ Построим модель от начала до конца.
✔️ Проведем ревью работ участников.

Получи грант на 30 000 рублей для обучения в Skillbox!
​​Machine Learning and Security
Авторы: Clarence Chio, David Freeman

Данное руководство научит вас использовать машинное обучения в деле безопасности, обнаруживая вторжения, классифицируя угрозы и проводя сетевой анализ.

#книгадня

https://t.iss.one/progbook/3619
Data Analysis and Data Science with Python and Pandas

Автор подберет несколько наборов данных и выполнит некоторые из общих задач анализа данных, используя пакет Pandas.

#видеодня

https://prglb.ru/3iioa
Новый искусственный интеллект TabNine допишет код за программиста. И исправит все ошибки!

Группа инженеров разработала искусственный интеллект TabNine, поддерживающий 22 самых популярных на сегодняшний день языка программирования. Он может быть интегрирован в большинство редакторов кода и дописывать код за программиста

#статьядня

https://prglb.ru/4ennk
Ускоряем распределенную обработку больших графов с помощью вероятностных структур данных и не только

В данной статье автор расскажет о некоторых трюках, используемых для обработки больших графов в OK.ru.

#статьядня

https://prglb.ru/3pbvy