Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.85K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Автоматический поиск лучшей нейронной сети для вашей сети

В данной статье представлены 2 раздела. Первый объясняет, как работают GAN и как они в настоящее время разрабатываются вручную. Второй - это демонстрация нового исследования Deep Learning - AutoGAN, в котором применяется Neural Architecture Search для автоматического поиска лучших архитектур GAN.

#статьядня

https://prglb.ru/29lrm
​​Почему все говорят о Data Science и есть ли там перспективы?
Почему профессия Data Scientist'a — самая сексуальная профессия 2019 года?
Как должно выглядеть резюме, чтобы получить работу в Data?

Регистрируйтесь на закрытый онлайн-митап «Карьера в Data Science: с чего начать» и задайте эксперту самые популярные вопросы о том, как построить карьеру в модной индустрии: https://clc.to/VBqd4A

Вы узнаете:
— сколько получают Data Science специалисты и кто их ищет
— какими навыками должен обладать крутой кандидат в Data
— как перейти в Data Science из другой сферы
— как учиться самостоятельно, где брать информацию и за кем следить
+ в программе реальные кейсы, разбор ошибок из практики, хитрости аналитики.

Все зрители получат закрытый демодоступ к специализации Data Science.

Участие бесплатно, по регистрации.
11 сентября в 19:00
Присоединяйтесь: https://clc.to/VBqd4A
Ищем контент-менеджера для ведения этого телеграм-канала

Требования:
нужно поверхностно хотя бы разбираться в IT в целом, английский язык на уровне чтения документации, грамотный русский язык, желание экспериментировать с поиском источников и форматов

Источники для контента:
toster.ru
habr.ru
proglib.io
см. тематические чаты отсюда https://netology.ru/blog/prg-tg

Приветствуются короткие форматы, типа тех, что на @pythonetc, либо оформленные в teletype.in статьи с обратными ссылками, либо свои (на ваше усмотрение).

Объем: 1-2 поста в сутки для одного канала

Вилка зарплат: от 6000 до 10000 рублей за один канал в зависимости от бэкграунда соискателя и готовности тратить время на канал

В качестве тестового задания нужно предложить 2-3 поста под этот канал

В любом случае, пишите @theasder
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «Ищем контент-менеджера для ведения этого телеграм-канала Требования: нужно поверхностно хотя бы разбираться в IT в целом, английский язык на уровне чтения документации, грамотный русский язык, желание экспериментировать с поиском источников и форматов Источники…»
Насколько ты хорош в Data Science?

Сможете предугадать развитие нейросетей так хорошо, как Data Scientist? SkillFactory обучат науке о данных, расскажут, что такое ML и ИИ. Но сперва проверим ваш уровень знаний ;)

https://proglib.io/tests/naskolko-ty-horosh-v-data-science
Полное руководство по бинарной классификации метрик

Выбор правильной метрики является ключевой частью проектов по машинному обучению. Из этой статьи вы узнаете о ряде распространенных и менее известных метрик и диаграмм производительности, а также о типичных решениях, когда дело доходит до выбора одного их них для вашего проекта.

#статьядня

https://prglb.ru/4fwb2
Использование ArcGIS API for Python в Jupyter Notebook

Эта статья будет полезна как аналитикам, желающим изучить примеры работы с ГИС, так и картографам и ГИС-специалистам, которым интересно попробовать себя в написании кода.

#статьядня

https://prglb.ru/4qnc5
Поиск аномалий (Anomaly Detection)

Строго говоря, в анализе данных есть два направления, которые занимаются поиском аномалий: детектирование выбросов (Outlier Detection) и «новизны» (Novelty Detection). Как и выброс «новый объект» — это объект, который отличается по своим свойствам от объектов (обучающей) выборки. Но в отличие от выброса, его в самой выборке пока нет

#статьядня

https://prglb.ru/kakl
Простая реализация стекинга/блендинга по ранее обученным сохраненным моделям

#полезностьдня

https://prglb.ru/1f2lq
Построение системы автоматического машинного обучения

Антон Кленицкий рассказывает про опыт участия в SDSJ AutoML 2018, где он занял второе место. Задача соревнования заключалась в построении системы автоматического машинного обучения. Из видео вы сможете узнать:
- Подробнее о задачах соревнования: 3 задачи на регрессию и 5 задач на классификацию
- Почему было тяжело валидироваться
- Детали решения второго места

#видеодня

https://prglb.ru/19aq6
Воры используют deepfakes для обмана компаний, заставляя посылать себе деньги
C момента своего появления в декабре 2017-го дипфейки, видео с почти идеальной заменой лица, созданные нейросетью, наводили на экспертов панику. По данным Wall Street Journal, в марте этого года состоялось первое deepfake-преступление.

#статьядня

https://prglb.ru/4klkm
Как оптимизировать pandas при работе с большими datasetами (очерк)

Когда памяти вагоны и/или dataset небольшой можно смело закидывать его безо всяких оптимизаций. Однако, если данные большие, остро встает вопрос, как их обрабатывать или хотя бы считать.

#статьядня

https://prglb.ru/5c5kw
Карты активации для моделей глубокого обучения в несколько строк кода

Автор расскажет, как показать карты активации различных слоев в глубокой модели CNN с помощью всего лишь нескольких строк кода.

#статьядня

https://prglb.ru/5q8ho
​​Мы немного посовещались и решили увеличить призовой фонд нашего конкурса 😉
Для тех, кто все пропустил:

Конкурс на
📍 2 лучших статьи сайте proglib.io
📍 1 лучший комментарий на сайте proglib.io

Что нужно? Написать статью или оставить комментарий под любой из статей сайта. Победитель выбирается по количеству просмотров и лайков НА сайте. Любители накручивать дисквалифицируются!

Для самых крутых авторов статей мы подготовили подарки:

1 место - годовая подписка на ВСЕ продукты Jetbrains, либо издание по архитектуре ("Архитектура программного обеспечения на практике" или "Чистый код" или "Искусство программирования").
2 место - годовая подписка на какой-то один из продуктов Jetbrains, либо издание про базы данных ("Рефакторинг баз данных или Эволюционное проектирование" или "Базы данных: Проектирование, реализация и сопровождение. Теория и практика" или "Работа с PostgreSQL. Настройка и масштабирование").

А комментатор “не в бровь, а в глаз” получит бумажную книгу на выбор: "Думай медленно...Решай быстро" Канемана, "Музыка мозг. Правила гармоничного развития" или "Мозг во сне. Что происходит с мозгом, пока мы спим".

🔵 Статьи должны быть по теме сайта, от 4к до 8к знаков без пробелов, с уникальностью 90%+ по text.ru, без рекламы и брани. Предпочтение туториалам на базе личного опыта, интересным подборкам и обзорам.
🔵 Комментарий должен быть без рекламы и брани.

И да победят лучшие! 😊
Дедлайн конкурса — 18 октября 2019
Если у вас проблемы с написанием материала, пишите нашему главному редактору @lavafloor
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «​​Мы немного посовещались и решили увеличить призовой фонд нашего конкурса 😉 Для тех, кто все пропустил: Конкурс на 📍 2 лучших статьи сайте proglib.io 📍 1 лучший комментарий на сайте proglib.io Что нужно? Написать статью или оставить комментарий под любой…»
Доклад Pandas за 10 минут

Пакет pandas является наиболее важным инструментом в распоряжении ученых и аналитиков данных, работающих сегодня в Python. Мощные инструменты машинного обучения и визуализации могут привлечь все внимание, но pandas является основой большинства проектов обработки данных.

EVENT:PyData 2019
SPEAKER: Wes McKinney

#видеодня

https://prglb.ru/4jp0u
Применение сиамских нейросетей в поиске

Автор расскажет, какие подходы они используют в Поиске Mail.ru для сравнения текстов и для чего это нужно?

#статьядня

https://prglb.ru/1uwsl
Примечания к iMAML: мета-обучение с неявными градиентами

На этой неделе я прочитал эту классную новую статью о метаобучении: это немного другой подход по сравнению с его предшественниками, основанный на некоторых наблюдениях о дифференциации оптимальной регуляризованной оптимизации.

#статьядня

https://prglb.ru/48e1b