Big data world
2.34K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Как я изучаю машинное обучение
Контекст совета, которым я собираюсь поделиться, таков: я начал без инженерного образования и благодаря упорному труду и большой удаче стал инженером по машинному обучению... Моя главная цель как MLE состоит в том, чтобы постоянно работать над проектированием и развертыванием хорошо спроектированных и прозрачных систем машинного обучения и изучать передовые методы разработки программного обеспечения для этого... Так что, как всегда, воспринимайте этот пост в блоге в основном как совет самому себе в прошлом, который может сработать, а может и не сработать для вас в зависимости от ваших целей...
https://shly.link/Zg11h
Супермагистраль данных

Я работаю в сфере науки о данных с 2015 года. За последние 7–8 лет индустрия данных претерпела множество изменений. Тем не менее, самым частым вопросом остается: что такое наука о данных?

(если пост не открывается полностью, откройте в режиме инкогнито
)

https://shly.link/mdmWNxc
Памятка по Linux для науки о данных

Настоящая хитрость в освоении командной строки Linux, помимо изучения доступных команд, состоит в том, чтобы иметь под рукой справочные материалы по этому вопросу. Вот тут и вступает в игру последняя шпаргалка KDnuggets.

Эта шпаргалка охватывает 16 наиболее полезных команд терминала Linux, и этого достаточно, чтобы вы прямо сейчас могли выполнять большую часть своих повседневных операций с ОС из командной строки. Немного потренировавшись, вы обнаружите, что все это делает вашу повседневную деятельность более быстрой, легкой и податливой благодаря указыванию и щелчку.

https://shly.link/Tbyje
👍3
500 проектов ИИ Машинное обучение Глубокое обучение Компьютерное зрение НЛП

Проекты с кодом

https://shly.link/ghono2
🧬 Присоединяйтесь к онлайн-митапу ВТБ «Применение ML-инструментов в бизнес-процессах», который пройдёт 8 декабря 2022 года в 18:30 по мск. Митап будет полезен всем, кто интересуется Data Science и Machine Learning.

Темы митапа:

📌 «Инструменты для автоматизации решения бизнес задач»

Спикер: Дмитрий Тимохин, Data Scientist, ВТБ

📌«Модель для матчинга резюме и вакансий»

Спикер: Ярослав Пудяков, Data Scientist, ВТБ

📌 «Модель предсказания связанности компаний для привлечения клиентов в Банк»

Спикер: Роман Гончар, лидер команды Графовой аналитики стрима КиБ и СМБ моделирования, ВТБ

📌 Q&A-сессия, модератор: Артём Летин, лидер стрима КиБ и СМБ моделирования, ВТБ

👉 Зарегистрируйтесь по ссылке, и мы пришлём вам напоминание о митапе: https://cnrlink.com/dsmeetup25

🎁 Авторы самых интересных вопросов получат фирменный мерч
Узнайте, как ответственно разрабатывать, развертывать и поддерживать рабочие приложения машинного обучения.

Изучите основы машинного обучения с помощью интуитивно понятных объяснений, чистого кода и визуализаций.
https://shly.link/ghJ30f
Готовится PyCaret 3… Что нового?

PyCaret — это библиотека машинного обучения с открытым исходным кодом на Python, которая автоматизирует рабочие процессы машинного обучения. Это комплексный инструмент машинного обучения и управления моделями, который экспоненциально ускоряет цикл экспериментов и повышает вашу продуктивность.
https://shly.link/mdmDRHz
Python против R против Scala для науки о данных

Наука о данных — динамичная, увлекательная и многообещающая область. Влияние и варианты использования науки о данных постоянно растут, и набор инструментов, необходимых для достижения этих приложений, быстро расширяется. В результате специалисты по данным должны знать лучшие решения для каждого задания.

Хотя существует множество языков, которые могут быть полезны исследователю данных , Python для науки о данных является одним из широко используемых решений для обработки данных. Однако R и Scala также являются мощными решениями с мощными библиотеками. Мы хотим сосредоточиться на пакетах обработки данных, которые лучше всего подходят для машинного обучения, основанные на анализе данных, визуализации размера проекта и воспроизводимых исследованиях для реализации надлежащих решений машинного обучения.

https://shly.link/PePK7
Шпаргалка Scikit-learn по машинному обучению

Вы хотите начать работу с машинным обучением. У вас есть базовое понимание концепций машинного обучения. Вы знаете Питон. Что вы делаете?

Самый очевидный ответ — начать работать с Scikit-learn . Scikit-learn — это библиотека Python с открытым исходным кодом для всех видов прогнозного анализа данных. Вы можете выполнять задачи классификации, регрессии, кластеризации, уменьшения размерности, настройки модели и предварительной обработки данных.

Унифицированный API-интерфейс Scikit-learn значительно упрощает изучение реализации различных алгоритмов и задач. Как только вы изучите шаблон того, как делать вызовы Scikit-learn, вы готовы к работе. Единственное, что вам нужно после этого, помимо вашего воображения и решимости, это удобный справочник.

KDnuggets собрал именно то, что вам нужно. Эта шпаргалка охватывает основы того, что необходимо для изучения того, как использовать Scikit-learn для машинного обучения, и предоставляет справочную информацию для продвижения ваших проектов машинного обучения. Охвачена большая часть наиболее распространенных функций, которые вы будете использовать снова и снова. Посмотрите ниже для подтверждения.

https://shly.link/43a87
👍6
Что такое теорема Чебычева и как она применяется в науке о данных?

Теорема Чебышева применима к каждому набору данных и активно используется статистиками, специалистами по данным и инженерами по машинному обучению.


https://shly.link/2BCJX
👍2
Flux Julia против TensorFlow Python: как они сравниваются?

В этой статье рассматривается проблема глубокого обучения классификации изображений от начала до конца как в TensorFlow, так и в Flux (родной эквивалент TensorFlow Джулии). Это должно дать хороший обзор того, как два языка сравниваются в общем использовании, и, надеюсь, поможет вам понять, является ли Джулия потенциальным вариантом (или преимуществом) для вас в этом контексте.

Я также постараюсь выделить преимущества и, что более важно, пробелы или недостатки, которые в настоящее время существуют в экосистеме Julia по сравнению с проверенным сочетанием Python и TensorFlow.

https://shly.link/VoUqE
Media is too big
VIEW IN TELEGRAM
Perceiver-Actor: многозадачный преобразователь для роботизированных манипуляций

Документ: https://arxiv.org/abs/2209.05451
Веб-сайт: https://peract.github.io/
Код: https://github.com/peract/peract
Colab: https://colab.research.google.com/drive/1wpaosDS94S0rmtGmdnP0J1TjS7mEM14V?usp=sharing
🔥2
⚡️Приглашаем на вебинар «Обучение с подкреплением: от игр к реальным задачам», который пройдет 13 декабря в 10:00

В настоящее время технологии обучения с подкреплением активно применяются во многих сферах: от ритейла до автономных транспортных средств. Может быть лучше: основной сложностью этого подхода является отсутствие размеченных данных, и, к сожалению, нет формализованного подхода как данные могут быть размечены для этой задачи. Другая сложность — это формализация функции вознаграждения. От удачного ее выбора зависит конечный успех настройки алгоритма управления.

В докладе будет рассказано о применении алгоритмов обучения с подкреплением к различным задачам: от простых игровых задач до задачи навигации мобильного робота. Также будут представлены результаты сравнения различных алгоритмов в задачах избежания столкновения и навигации мобильного робота MIT RACECAR, оснащенного лидаром.

Регистрируйтесь тут👈
🔥1
Анализ данных стал проще: учебник по Python Pandas

Python Pandas — один из самых важных и востребованных инструментов, который необходимо изучить любому начинающему аналитику данных. Сегодня мы познакомим вас с основами Pandas.
https://shly.link/devoQkh
5 библиотек Python, которые стоит изучить, чтобы начать карьеру в науке о данных

Итак, если вы хотите начать карьеру в Data Science, в этой статье я покажу вам пять библиотек Python, которые вам обязательно нужно знать.
https://shly.link/WsnsJ

(если пост не открывается полностью, откройте в режиме инкогнито)
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем ChatGPT!
Революционно новый инструмент для создания разговоров

Сегодня я хочу демистифицировать ChatGPT — увлекательное новое приложение GAN* (генеративно-состязательные сети), которое вызвало много шума в сообществе ИИ.

Для тех, кто не знаком с GAN, это тип нейронной сети, которая использует две конкурирующие сети — генератор и дискриминатор — для создания реалистичных результатов. Генератор создает поддельные выходные данные, а дискриминатор пытается отличить поддельные выходные данные от реальных данных. Благодаря этому обратному процессу GAN может создавать выходные данные, которые неотличимы от реальных данных.
https://shly.link/E8c5n

(если пост не открывается полностью, откройте в режиме инкогнито)
Яндекс Практикум разработал практический курс по аналитике для тех, кто работает с продуктом. В нём можно набить руку на исследованиях, ad-hoc запросах и А/В тестах для реальной сферы бизнеса.

Научитесь растить продукт на основе данных за 2,5 месяца. После курса студенты смогут:
— разбираться в метриках продукта, рассчитывать их и влиять на них;
— проводить продуктовые исследования, сегментировать пользователей и определять, какой сегмент что покупает;
— считать юнит-экономику и находить точки роста в продукте;
— готовиться к A/B-тестам, интерпретировать результаты и улучшать анализ.

Проекты на курсе будут из разных сфер: онлайн-кинотеатр, маркет-плейс или сервис доставки еды. Каждые 2-3 недели студенты будут получать обратную связь от менторов — ведущих аналитиков российских компаний. Они поделятся кейсами и дадут советы по вашим проектам.

→Начать учиться
5 этапов проверки машинного обучения

—Введение
—Что такое проверка машинного обучения?
—5 этапов проверки машинного обучения
— проверка данных машинного
обучения
— проверка обучения
— проверка перед развертыванием
— проверка после развертывания
— проверка управления и соответствия
—Преимущества наличия политики проверки машинного обучения

https://shly.link/fwXzR
Давно задумываетесь об интересной карьере в сфере IT? Хотите узнать, как с помощью data-аналитики повышать эффективность бизнеса? Познакомьтесь с основами обработки и анализа данных на бесплатном онлайн-интенсиве Skillbox: 👉 https://clc.to/6gOUXA

📢 Встречаемся в прямом эфире 12 декабря в 19:00 по московскому времени!

Регистрируйтесь и получите чек-лист по Data Science с полезными ресурсами и советами, где найти первые заказы для портфолио.

Вы научитесь:

💫 применять язык программирования Python для data-аналитики;
💫 находить аномалии в данных;
💫 использовать библиотеки Pandas и Matplotlib;
💫 решать реальные задачи, с которыми сталкивается Data Scientist.


🏆 Всем участникам, дошедшим до финала интенсива, отправим в подарок электронную книгу Пола Доэрти и Джеймса Уилсона «Человек + машина» издательства МИФ.

Подключайтесь к прямым эфирам и используйте возможность получить сертификат на 10 000 рублей на любой курс Skillbox.
Добро пожаловать в крупнейшую библиотеку алгоритмов с открытым исходным кодом на GitHub

https://the-algorithms.com/ru
This media is not supported in your browser
VIEW IN TELEGRAM
Отслеживание футболистов с помощью YOLOv5 + ByteTRACK

Видео на YouTube: https://youtu.be/QCG8QMhga9k
Сообщение в блоге: https://blog.roboflow.com/track-football-players/
Блокнот Jupyter: https://github.com/roboflow-ai/notebooks/blob/main/notebooks/how-to-track-football-players.ipynb