Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Анимированные переходы изображений StyleGAN с помощью RunwayML

Как создать бесконечный цикл синтетически сгенерированных ландшафтов StyleGAN с плавными переходами, используя RunwayML и P5.js

#статьядня

https://prglb.ru/5eixq
Нейросети и глубокое обучение: онлайн-учебник, послесловие: существует ли простой алгоритм для создания интеллекта?

Существует ли простой набор принципов, которые можно использовать для объяснения такого явления, как интеллект? В частности, более конкретно, существует ли простой алгоритм для создания интеллекта?

#статьядня

https://prglb.ru/38noh
Построение модели атрибутов лица с использованием многозадачного обучения

В одном из недавних проектов автор использовал многозадачное обучение для обучения модели, позволяющей определить возраст, пол и этническую принадлежность человека. Автор делится важными компонентами, которые заставили эту систему работать.

#статьядня

https://prglb.ru/4bcy9
Отладка моделей машинного обучения

При отладке моделей машинного обучения нам необходимо убедиться, что наши входные данные подготовлены должным образом. О том, как это сделать, описано в данной серии статей.

#статьядня

Часть 1
https://prglb.ru/22bk2

Часть 2
https://prglb.ru/3yoyj
OpenGPT-2: мы реплицировали GPT-2

В последнее время большие языковые модели, такие как BERT¹, XLNet², GPT-2³ и Grover⁴, продемонстрировали впечатляющие результаты при генерации текста и выполнении нескольких задач NLP. Поскольку в настоящее время Open-AI не выпустил свою самую большую модель (но выпустил модель 774M param), авторы стремятся воспроизвести их модель 1.5B, чтобы позволить другим основываться на этой предварительно обученной модели и улучшать ее.

#статьядня

https://prglb.ru/24p26
​​Прими участие в бесплатном интенсиве по Data Science и построй модель машинного обучения на Python, способную предсказывать курс доллара!

Ссылка для регистрации 🔜 https://clc.to/JQmDCw

✔️ Настроим рабочее окружение.
✔️ Проведем экспресс-введение в Python.
✔️ Построим модель от начала до конца.
✔️ Проведем ревью работ участников.

Получи грант на 30 000 рублей для обучения в Skillbox!
​​Machine Learning and Security
Авторы: Clarence Chio, David Freeman

Данное руководство научит вас использовать машинное обучения в деле безопасности, обнаруживая вторжения, классифицируя угрозы и проводя сетевой анализ.

#книгадня

https://t.iss.one/progbook/3619
Data Analysis and Data Science with Python and Pandas

Автор подберет несколько наборов данных и выполнит некоторые из общих задач анализа данных, используя пакет Pandas.

#видеодня

https://prglb.ru/3iioa
Новый искусственный интеллект TabNine допишет код за программиста. И исправит все ошибки!

Группа инженеров разработала искусственный интеллект TabNine, поддерживающий 22 самых популярных на сегодняшний день языка программирования. Он может быть интегрирован в большинство редакторов кода и дописывать код за программиста

#статьядня

https://prglb.ru/4ennk
Ускоряем распределенную обработку больших графов с помощью вероятностных структур данных и не только

В данной статье автор расскажет о некоторых трюках, используемых для обработки больших графов в OK.ru.

#статьядня

https://prglb.ru/3pbvy
Автоматический поиск лучшей нейронной сети для вашей сети

В данной статье представлены 2 раздела. Первый объясняет, как работают GAN и как они в настоящее время разрабатываются вручную. Второй - это демонстрация нового исследования Deep Learning - AutoGAN, в котором применяется Neural Architecture Search для автоматического поиска лучших архитектур GAN.

#статьядня

https://prglb.ru/29lrm
​​Почему все говорят о Data Science и есть ли там перспективы?
Почему профессия Data Scientist'a — самая сексуальная профессия 2019 года?
Как должно выглядеть резюме, чтобы получить работу в Data?

Регистрируйтесь на закрытый онлайн-митап «Карьера в Data Science: с чего начать» и задайте эксперту самые популярные вопросы о том, как построить карьеру в модной индустрии: https://clc.to/VBqd4A

Вы узнаете:
— сколько получают Data Science специалисты и кто их ищет
— какими навыками должен обладать крутой кандидат в Data
— как перейти в Data Science из другой сферы
— как учиться самостоятельно, где брать информацию и за кем следить
+ в программе реальные кейсы, разбор ошибок из практики, хитрости аналитики.

Все зрители получат закрытый демодоступ к специализации Data Science.

Участие бесплатно, по регистрации.
11 сентября в 19:00
Присоединяйтесь: https://clc.to/VBqd4A
Ищем контент-менеджера для ведения этого телеграм-канала

Требования:
нужно поверхностно хотя бы разбираться в IT в целом, английский язык на уровне чтения документации, грамотный русский язык, желание экспериментировать с поиском источников и форматов

Источники для контента:
toster.ru
habr.ru
proglib.io
см. тематические чаты отсюда https://netology.ru/blog/prg-tg

Приветствуются короткие форматы, типа тех, что на @pythonetc, либо оформленные в teletype.in статьи с обратными ссылками, либо свои (на ваше усмотрение).

Объем: 1-2 поста в сутки для одного канала

Вилка зарплат: от 6000 до 10000 рублей за один канал в зависимости от бэкграунда соискателя и готовности тратить время на канал

В качестве тестового задания нужно предложить 2-3 поста под этот канал

В любом случае, пишите @theasder
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «Ищем контент-менеджера для ведения этого телеграм-канала Требования: нужно поверхностно хотя бы разбираться в IT в целом, английский язык на уровне чтения документации, грамотный русский язык, желание экспериментировать с поиском источников и форматов Источники…»
Насколько ты хорош в Data Science?

Сможете предугадать развитие нейросетей так хорошо, как Data Scientist? SkillFactory обучат науке о данных, расскажут, что такое ML и ИИ. Но сперва проверим ваш уровень знаний ;)

https://proglib.io/tests/naskolko-ty-horosh-v-data-science
Полное руководство по бинарной классификации метрик

Выбор правильной метрики является ключевой частью проектов по машинному обучению. Из этой статьи вы узнаете о ряде распространенных и менее известных метрик и диаграмм производительности, а также о типичных решениях, когда дело доходит до выбора одного их них для вашего проекта.

#статьядня

https://prglb.ru/4fwb2
Использование ArcGIS API for Python в Jupyter Notebook

Эта статья будет полезна как аналитикам, желающим изучить примеры работы с ГИС, так и картографам и ГИС-специалистам, которым интересно попробовать себя в написании кода.

#статьядня

https://prglb.ru/4qnc5
Поиск аномалий (Anomaly Detection)

Строго говоря, в анализе данных есть два направления, которые занимаются поиском аномалий: детектирование выбросов (Outlier Detection) и «новизны» (Novelty Detection). Как и выброс «новый объект» — это объект, который отличается по своим свойствам от объектов (обучающей) выборки. Но в отличие от выброса, его в самой выборке пока нет

#статьядня

https://prglb.ru/kakl