Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
🧬 Присоединяйтесь к онлайн-митапу ВТБ «Применение ML-инструментов в бизнес-процессах», который пройдёт 8 декабря 2022 года в 18:30 по мск. Митап будет полезен всем, кто интересуется Data Science и Machine Learning.

Темы митапа:

📌 «Инструменты для автоматизации решения бизнес задач»

Спикер: Дмитрий Тимохин, Data Scientist, ВТБ

📌«Модель для матчинга резюме и вакансий»

Спикер: Ярослав Пудяков, Data Scientist, ВТБ

📌 «Модель предсказания связанности компаний для привлечения клиентов в Банк»

Спикер: Роман Гончар, лидер команды Графовой аналитики стрима КиБ и СМБ моделирования, ВТБ

📌 Q&A-сессия, модератор: Артём Летин, лидер стрима КиБ и СМБ моделирования, ВТБ

👉 Зарегистрируйтесь по ссылке, и мы пришлём вам напоминание о митапе: https://cnrlink.com/dsmeetup25

🎁 Авторы самых интересных вопросов получат фирменный мерч
Узнайте, как ответственно разрабатывать, развертывать и поддерживать рабочие приложения машинного обучения.

Изучите основы машинного обучения с помощью интуитивно понятных объяснений, чистого кода и визуализаций.
https://shly.link/ghJ30f
Готовится PyCaret 3… Что нового?

PyCaret — это библиотека машинного обучения с открытым исходным кодом на Python, которая автоматизирует рабочие процессы машинного обучения. Это комплексный инструмент машинного обучения и управления моделями, который экспоненциально ускоряет цикл экспериментов и повышает вашу продуктивность.
https://shly.link/mdmDRHz
Python против R против Scala для науки о данных

Наука о данных — динамичная, увлекательная и многообещающая область. Влияние и варианты использования науки о данных постоянно растут, и набор инструментов, необходимых для достижения этих приложений, быстро расширяется. В результате специалисты по данным должны знать лучшие решения для каждого задания.

Хотя существует множество языков, которые могут быть полезны исследователю данных , Python для науки о данных является одним из широко используемых решений для обработки данных. Однако R и Scala также являются мощными решениями с мощными библиотеками. Мы хотим сосредоточиться на пакетах обработки данных, которые лучше всего подходят для машинного обучения, основанные на анализе данных, визуализации размера проекта и воспроизводимых исследованиях для реализации надлежащих решений машинного обучения.

https://shly.link/PePK7
Шпаргалка Scikit-learn по машинному обучению

Вы хотите начать работу с машинным обучением. У вас есть базовое понимание концепций машинного обучения. Вы знаете Питон. Что вы делаете?

Самый очевидный ответ — начать работать с Scikit-learn . Scikit-learn — это библиотека Python с открытым исходным кодом для всех видов прогнозного анализа данных. Вы можете выполнять задачи классификации, регрессии, кластеризации, уменьшения размерности, настройки модели и предварительной обработки данных.

Унифицированный API-интерфейс Scikit-learn значительно упрощает изучение реализации различных алгоритмов и задач. Как только вы изучите шаблон того, как делать вызовы Scikit-learn, вы готовы к работе. Единственное, что вам нужно после этого, помимо вашего воображения и решимости, это удобный справочник.

KDnuggets собрал именно то, что вам нужно. Эта шпаргалка охватывает основы того, что необходимо для изучения того, как использовать Scikit-learn для машинного обучения, и предоставляет справочную информацию для продвижения ваших проектов машинного обучения. Охвачена большая часть наиболее распространенных функций, которые вы будете использовать снова и снова. Посмотрите ниже для подтверждения.

https://shly.link/43a87
👍6
Что такое теорема Чебычева и как она применяется в науке о данных?

Теорема Чебышева применима к каждому набору данных и активно используется статистиками, специалистами по данным и инженерами по машинному обучению.


https://shly.link/2BCJX
👍2
Flux Julia против TensorFlow Python: как они сравниваются?

В этой статье рассматривается проблема глубокого обучения классификации изображений от начала до конца как в TensorFlow, так и в Flux (родной эквивалент TensorFlow Джулии). Это должно дать хороший обзор того, как два языка сравниваются в общем использовании, и, надеюсь, поможет вам понять, является ли Джулия потенциальным вариантом (или преимуществом) для вас в этом контексте.

Я также постараюсь выделить преимущества и, что более важно, пробелы или недостатки, которые в настоящее время существуют в экосистеме Julia по сравнению с проверенным сочетанием Python и TensorFlow.

https://shly.link/VoUqE
Media is too big
VIEW IN TELEGRAM
Perceiver-Actor: многозадачный преобразователь для роботизированных манипуляций

Документ: https://arxiv.org/abs/2209.05451
Веб-сайт: https://peract.github.io/
Код: https://github.com/peract/peract
Colab: https://colab.research.google.com/drive/1wpaosDS94S0rmtGmdnP0J1TjS7mEM14V?usp=sharing
🔥2
⚡️Приглашаем на вебинар «Обучение с подкреплением: от игр к реальным задачам», который пройдет 13 декабря в 10:00

В настоящее время технологии обучения с подкреплением активно применяются во многих сферах: от ритейла до автономных транспортных средств. Может быть лучше: основной сложностью этого подхода является отсутствие размеченных данных, и, к сожалению, нет формализованного подхода как данные могут быть размечены для этой задачи. Другая сложность — это формализация функции вознаграждения. От удачного ее выбора зависит конечный успех настройки алгоритма управления.

В докладе будет рассказано о применении алгоритмов обучения с подкреплением к различным задачам: от простых игровых задач до задачи навигации мобильного робота. Также будут представлены результаты сравнения различных алгоритмов в задачах избежания столкновения и навигации мобильного робота MIT RACECAR, оснащенного лидаром.

Регистрируйтесь тут👈
🔥1
Анализ данных стал проще: учебник по Python Pandas

Python Pandas — один из самых важных и востребованных инструментов, который необходимо изучить любому начинающему аналитику данных. Сегодня мы познакомим вас с основами Pandas.
https://shly.link/devoQkh
5 библиотек Python, которые стоит изучить, чтобы начать карьеру в науке о данных

Итак, если вы хотите начать карьеру в Data Science, в этой статье я покажу вам пять библиотек Python, которые вам обязательно нужно знать.
https://shly.link/WsnsJ

(если пост не открывается полностью, откройте в режиме инкогнито)
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем ChatGPT!
Революционно новый инструмент для создания разговоров

Сегодня я хочу демистифицировать ChatGPT — увлекательное новое приложение GAN* (генеративно-состязательные сети), которое вызвало много шума в сообществе ИИ.

Для тех, кто не знаком с GAN, это тип нейронной сети, которая использует две конкурирующие сети — генератор и дискриминатор — для создания реалистичных результатов. Генератор создает поддельные выходные данные, а дискриминатор пытается отличить поддельные выходные данные от реальных данных. Благодаря этому обратному процессу GAN может создавать выходные данные, которые неотличимы от реальных данных.
https://shly.link/E8c5n

(если пост не открывается полностью, откройте в режиме инкогнито)
Яндекс Практикум разработал практический курс по аналитике для тех, кто работает с продуктом. В нём можно набить руку на исследованиях, ad-hoc запросах и А/В тестах для реальной сферы бизнеса.

Научитесь растить продукт на основе данных за 2,5 месяца. После курса студенты смогут:
— разбираться в метриках продукта, рассчитывать их и влиять на них;
— проводить продуктовые исследования, сегментировать пользователей и определять, какой сегмент что покупает;
— считать юнит-экономику и находить точки роста в продукте;
— готовиться к A/B-тестам, интерпретировать результаты и улучшать анализ.

Проекты на курсе будут из разных сфер: онлайн-кинотеатр, маркет-плейс или сервис доставки еды. Каждые 2-3 недели студенты будут получать обратную связь от менторов — ведущих аналитиков российских компаний. Они поделятся кейсами и дадут советы по вашим проектам.

→Начать учиться
5 этапов проверки машинного обучения

—Введение
—Что такое проверка машинного обучения?
—5 этапов проверки машинного обучения
— проверка данных машинного
обучения
— проверка обучения
— проверка перед развертыванием
— проверка после развертывания
— проверка управления и соответствия
—Преимущества наличия политики проверки машинного обучения

https://shly.link/fwXzR
Давно задумываетесь об интересной карьере в сфере IT? Хотите узнать, как с помощью data-аналитики повышать эффективность бизнеса? Познакомьтесь с основами обработки и анализа данных на бесплатном онлайн-интенсиве Skillbox: 👉 https://clc.to/6gOUXA

📢 Встречаемся в прямом эфире 12 декабря в 19:00 по московскому времени!

Регистрируйтесь и получите чек-лист по Data Science с полезными ресурсами и советами, где найти первые заказы для портфолио.

Вы научитесь:

💫 применять язык программирования Python для data-аналитики;
💫 находить аномалии в данных;
💫 использовать библиотеки Pandas и Matplotlib;
💫 решать реальные задачи, с которыми сталкивается Data Scientist.


🏆 Всем участникам, дошедшим до финала интенсива, отправим в подарок электронную книгу Пола Доэрти и Джеймса Уилсона «Человек + машина» издательства МИФ.

Подключайтесь к прямым эфирам и используйте возможность получить сертификат на 10 000 рублей на любой курс Skillbox.
Добро пожаловать в крупнейшую библиотеку алгоритмов с открытым исходным кодом на GitHub

https://the-algorithms.com/ru
This media is not supported in your browser
VIEW IN TELEGRAM
Отслеживание футболистов с помощью YOLOv5 + ByteTRACK

Видео на YouTube: https://youtu.be/QCG8QMhga9k
Сообщение в блоге: https://blog.roboflow.com/track-football-players/
Блокнот Jupyter: https://github.com/roboflow-ai/notebooks/blob/main/notebooks/how-to-track-football-players.ipynb
Amazon AutoML против статистических методов с открытым исходным кодом

Вкратце: мы заплатили 800 долларов США и провели 4 часа в консоли AWS Forecast, чтобы вам не пришлось этого делать.

В этом воспроизводимом эксперименте мы сравниваем Amazon Forecast и StatsForecast — библиотеку Python с открытым исходным кодом. Для этого эксперимента, учитывая активное использование AWS Forecast в прогнозировании спроса, мы использовали 30 490 серий ежедневных продаж в Walmart из конкурса M5 . Мы пришли к выводу, что для этой настройки Amazon Forecast на 60 % менее точен и в 669 раз дороже, чем запуск альтернативы с открытым исходным кодом на простом облачном сервере.
https://shly.link/ghvGN2
👍7
Это просто потрясающе! Посмотрите на RTutor ( https://RTutor.ai ) . Он может генерировать и тестировать код R, просто «общаясь» с ним. Затем RTutor сгенерирует функциональный код для ответа на ваш вопрос, что упростит задачу для тех, у кого нет опыта работы
https://rtutor.ai/
🔥4👍1
7 супер-шпаргалок, которые вам нужны, чтобы пройти собеседование по машинному обучению

В этом посте вы узнаете об алгоритмах и фреймворках машинного обучения и глубокого обучения. Кроме того, вы узнаете советы и рекомендации по обработке данных, выбору показателей и повышению производительности модели.

Последняя и самая важная шпаргалка посвящена вопросам и ответам на интервью с машинным обучением с наглядными примерами.

https://shly.link/nYU1n
👍2