Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.4K photos
119 videos
64 files
4.84K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Визуализация нейросетей
В данной статье описывается, что ключом к созданию изображений с оптимизацией является хорошее естественное изображение.

Также к статье добавлен код и видео!

#статьядня

https://prglb.ru/e61n
Методы и алгоритмы решения задач классификации и рекомендации текстов
В докладе, на примере сайта кулинарных рецептов, будут описаны шаги преобразования и очистки данных. Исследованы методы классификации и определения сходства текстов на основе: Mean word2vec, Tf-idf weighted word2vec, Doc2vec, fastText, Word Mover’s Distance. Сравнение качества итоговых моделей. Также поговорим про внедрения в проект моделей классификации и рекомендаций

#видеодня

Speaker: Виталий Зайчук
Event: Moscow Python Meetup 62

https://prglb.ru/1yif0
​​TensorFlow умер. Да здравствует TensorFlow 2.0!
Вышло долгожданное обновление фреймворка машинного обучения – TensorFlow 2.0. Что же предлагают разработчики Google в альфа-версии?

#статьядня

https://prglb.ru/32sl8
​​6 советов, которые спасут специалиста Data Science
Устроиться на работу, связанную с анализом данных, – просто. Лучшие советы, которые спасут начинающего специалиста Data Science.

#статьядня

https://prglb.ru/5u37y
Знакомство с Neural ODE
Значительная доля процессов описывается дифференциальными уравнениями. Данные о таких процессах, как правило, последовательны и непрерывны, но есть и другой тип последовательных данных - дискретные данные обрабатываются рекуррентными сетями, несмотря на то, что они отличны по своей природе, и требуют различных подходов. Авторы статьи предлагают подход, который они назвали Нейронные Обыкновенные Дифференциальные Уравнения (Neural ODE).

#статьядня

https://prglb.ru/1llon
​​Только за последнюю неделю на HeadHunter открылось более 1500 вакансий аналитика, при этом владение инструментами аналитики нужны и для многих других позиций. Грамотный анализ информации нужен вне зависимости от индустрии.

В SkillFactory запустили специализацию «Аналитик данных», которая включает сквозной курс и тренажёры по инструментам для анализа данных.
В сквозном курсе 3 полноценных проекта разной длительности и 48 бизнес-задач.

Тренажёры, где суммарно более 1500 упражнений, помогут освоить SQL, Python, продвинутый Excel, различные BI-системы и познакомиться с основами математической статистики.

Вы не просто изучите алгоритмы, а научитесь использовать их в решении реальных бизнес-задач.
Ознакомьтесь с программой обучения → https://bit.ly/2IhtlUg
До 24 апреля скидка 20%.
Топ 10 алгоритмов в ML
Здесь представлено описание алгоритмов, обсуждение их влияния и обзор текущих и дальнейших исследований в данном направлении.

#полезностьдня

https://prglb.ru/5rnjq
▪️Data Analysts в Москве
от 150 000 ₽
высшее техническое/математическое/экономическое образование; желателен практический опыт работы аналитиком данных / Data Scientist / в управлении проектами big data; знание матчасти ML и умение работать с большими массивами качественных и количественных данных.

➡️ Подробности: https://telegra.ph/Data-Analysts-v-Departament-Finansov-Sberbanka-04-10
​​Data Science за 3 месяца: эффективный учебный план
Data Science за 3 месяца? В своем ли мы уме? Вполне. Расскажем, как стать аналитиком данных за 12 недель по курсам Microsoft и др.

#статьядня

https://prglb.ru/23qrk
Что такое преобразование Фурье? Иллюстрированное введение
Рассказ о преобразовании Фурье и кривых, наматывающихся на окружность.

#видеодня

https://prglb.ru/5o2of
​​Чек-лист для отладки нейронной сети: 5 шагов на пути к успеху

Список шагов для устранения проблем, связанных с обучением, обобщением и оптимизацией модели глубокого обучения и отладки нейронной сети.

#статьядня

https://prglb.ru/1txg3
Чтобы обеспечить потокобезопасное выполнение, потоки Python конкурируют за глобальную блокировку, необходимую для интерпретации команд Python.
Это проблематично для запуска нескольких процессов в рамках одного (например, процесс загрузки данных + многократное выполнение параллельного вычислительного графа) и может отрицательно повлиять на производительность. Чтобы обойти это, используется параллельная обучающая парадигма распределенных данных с 1 процессом Python на процессор, чтобы каждый вычислительный блок имел полный доступ к интерпретатору Python.

#полезностьдня

https://prglb.ru/21izs
Обзор алгоритмов оптимизации градиентного спуска
В данной статье рассказывается о том, сколько самых популярных алгоритмов оптимизации на самом деле работает на основе метода градиентного спуска.

#статьядня

https://prglb.ru/5y5yw
От новичка к мастеру, от хемометриста к Head of DS
Валерий рассказал, как он добился 118 места в мировом рейтинге Kaggle и стал грандмастером, а также про то, как участие в конкурсах помогло ему построить карьеру.

Speaker: Валерий Бабушкин

#видеодня

https://prglb.ru/2xdzb
Данный туториал по программированию на R для начинающих поможет вам понять основы R и создать прочную основу для R.

#видеодня

https://prglb.ru/14pxs
Исследование аудитории Telegram 2019

Друзья, команда TGStat проводит масштабное исследование аудитории мессенджера. Кто же он — пользователь Telegram 2019 года? Страдает ли он из-за блокировки, каково на сегодня распределение по полу, возрасту, интересам и десятку других параметров?

Исследование поможет удовлетворить не только научный интерес, и не только интерес брендов, но и интерес всего сообщества, противостоящего блокировкам.

Опрос займет всего 5 минут! Не поленитесь)
Ваше мнение очень важно!

Ссылка на опрос:
https://tgstat.ru/research