Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Яндекс Практикум разработал практический курс по аналитике для тех, кто работает с продуктом. В нём можно набить руку на исследованиях, ad-hoc запросах и А/В тестах для реальной сферы бизнеса.

Научитесь растить продукт на основе данных за 2,5 месяца. После курса студенты смогут:
— разбираться в метриках продукта, рассчитывать их и влиять на них;
— проводить продуктовые исследования, сегментировать пользователей и определять, какой сегмент что покупает;
— считать юнит-экономику и находить точки роста в продукте;
— готовиться к A/B-тестам, интерпретировать результаты и улучшать анализ.

Проекты на курсе будут из разных сфер: онлайн-кинотеатр, маркет-плейс или сервис доставки еды. Каждые 2-3 недели студенты будут получать обратную связь от менторов — ведущих аналитиков российских компаний. Они поделятся кейсами и дадут советы по вашим проектам.

→Начать учиться
5 этапов проверки машинного обучения

—Введение
—Что такое проверка машинного обучения?
—5 этапов проверки машинного обучения
— проверка данных машинного
обучения
— проверка обучения
— проверка перед развертыванием
— проверка после развертывания
— проверка управления и соответствия
—Преимущества наличия политики проверки машинного обучения

https://shly.link/fwXzR
Давно задумываетесь об интересной карьере в сфере IT? Хотите узнать, как с помощью data-аналитики повышать эффективность бизнеса? Познакомьтесь с основами обработки и анализа данных на бесплатном онлайн-интенсиве Skillbox: 👉 https://clc.to/6gOUXA

📢 Встречаемся в прямом эфире 12 декабря в 19:00 по московскому времени!

Регистрируйтесь и получите чек-лист по Data Science с полезными ресурсами и советами, где найти первые заказы для портфолио.

Вы научитесь:

💫 применять язык программирования Python для data-аналитики;
💫 находить аномалии в данных;
💫 использовать библиотеки Pandas и Matplotlib;
💫 решать реальные задачи, с которыми сталкивается Data Scientist.


🏆 Всем участникам, дошедшим до финала интенсива, отправим в подарок электронную книгу Пола Доэрти и Джеймса Уилсона «Человек + машина» издательства МИФ.

Подключайтесь к прямым эфирам и используйте возможность получить сертификат на 10 000 рублей на любой курс Skillbox.
Добро пожаловать в крупнейшую библиотеку алгоритмов с открытым исходным кодом на GitHub

https://the-algorithms.com/ru
This media is not supported in your browser
VIEW IN TELEGRAM
Отслеживание футболистов с помощью YOLOv5 + ByteTRACK

Видео на YouTube: https://youtu.be/QCG8QMhga9k
Сообщение в блоге: https://blog.roboflow.com/track-football-players/
Блокнот Jupyter: https://github.com/roboflow-ai/notebooks/blob/main/notebooks/how-to-track-football-players.ipynb
Amazon AutoML против статистических методов с открытым исходным кодом

Вкратце: мы заплатили 800 долларов США и провели 4 часа в консоли AWS Forecast, чтобы вам не пришлось этого делать.

В этом воспроизводимом эксперименте мы сравниваем Amazon Forecast и StatsForecast — библиотеку Python с открытым исходным кодом. Для этого эксперимента, учитывая активное использование AWS Forecast в прогнозировании спроса, мы использовали 30 490 серий ежедневных продаж в Walmart из конкурса M5 . Мы пришли к выводу, что для этой настройки Amazon Forecast на 60 % менее точен и в 669 раз дороже, чем запуск альтернативы с открытым исходным кодом на простом облачном сервере.
https://shly.link/ghvGN2
👍7
Это просто потрясающе! Посмотрите на RTutor ( https://RTutor.ai ) . Он может генерировать и тестировать код R, просто «общаясь» с ним. Затем RTutor сгенерирует функциональный код для ответа на ваш вопрос, что упростит задачу для тех, у кого нет опыта работы
https://rtutor.ai/
🔥4👍1
7 супер-шпаргалок, которые вам нужны, чтобы пройти собеседование по машинному обучению

В этом посте вы узнаете об алгоритмах и фреймворках машинного обучения и глубокого обучения. Кроме того, вы узнаете советы и рекомендации по обработке данных, выбору показателей и повышению производительности модели.

Последняя и самая важная шпаргалка посвящена вопросам и ответам на интервью с машинным обучением с наглядными примерами.

https://shly.link/nYU1n
👍2
15 совершенно бесплатных книг по машинному обучению и глубокому обучению

К счастью, в Интернете доступно множество совершенно бесплатных электронных книг, которые охватывают большинство тем и концепций; нам нужно учиться как специалисты по данным.

https://shly.link/SiNjK
26 наборов данных для ваших проектов по науке о данных

Пусть эта статья станет для вас справочным материалом, чтобы вы могли попробовать набор данных для нового алгоритма, который вы изучаете и с которым хотите поэкспериментировать.

Однако , пожалуйста, не думайте, что это исчерпывающий список наборов данных для задач машинного обучения — ни я, ни кто-либо другой не может просмотреть каждый отдельный набор данных, доступный на каждом веб-сайте.

https://shly.link/11e1b
Бесплатный ускоренный курс по машинному обучению от Berkeley. Настоятельно рекомендуется для тех, кто хочет начать!
https://shly.link/3ks6Z
Все говорят о #ChatGPT и #GPT3 , но знаете ли вы, что существует бесплатная версия GPT-3 с открытым исходным кодом под названием OPT-175B? Нет входа в систему, кредитная карта не требуется!
https://opt.alpa.ai/
🔥3
Обучение с подкреплением (RL) — это вид машинного обучения, наиболее близкий к тому, как учатся люди и животные. Это также один из компонентов ChatGPT. В этом практическом бесплатном курсе я проведу вас от основ к продвинутым темам ↓

https://shly.link/ZrZjc

Весь код курса https://github.com/Paulescu/hands-on-rl
🔥3
«Вероятности» для машинного обучения . Из Гарварда. Бесплатно.

Изучите теорию вероятностей, необходимую для специалиста по обработке и анализу данных, на примере финансового кризиса 2007–2008 годов.
https://www.edx.org/course/data-science-probability
😱3
Глубокое обучение с PyTorch — Университет Амстердама (UvA) Фантастическая серия учебных пособий, охватывающих широкий спектр тем: основы PyTorch, основы нейронных сетей, архитектуры (CNN, преобразователи, GNN), генеративные сети

https://uvadlc-notebooks.readthedocs.io/en/latest/index.html

https://www.youtube.com/playlist?list=PLdlPlO1QhMiAkedeu0aJixfkknLRxk1nA
👍4
7 лучших инструментов кодирования на базе ИИ

ИИ теперь может делать так много, не нуждаясь в тоннах знаний в области программирования.

Эти модели чрезвычайно умны и могут анализировать огромные объемы данных, обучаться и адаптироваться и даже принимать решения. Безумно думать обо всех способах, которыми они могут улучшить технологии.

Мы вступаем в новую эру, когда люди и машины могут удивительным образом работать вместе.

https://shly.link/8DGPp
На Хабре вышла статья о разных способах развёртывания Apache Superset (Docker, ВМ, Kubernetes). Автор рассказал обо всех плюсах и минусах и поделился подробной инструкцией на примере облака VK Cloud.

Это очень актуально, учитывая вставшую перед компаниями задачу по полному перестраиванию системы бизнес-аналитики. В современных реалиях развитие BI-решений российских вендоров осуществляются максимально быстро и качественно. У них есть лицензионная поддержка, регулярные обновления и возможность влиять на roadmap.

Читать
Изучите науку о данных из этих репозиториев GitHub

Если вы хотите начать карьеру в области науки о данных, вам, вероятно, интересно, какой путь обучения выбрать. Вы, наверное, видели, как появляются учебные курсы по науке о данных, курсы по Udemy, степени и многое другое. Трудно выбрать один маршрут, когда их так много.

Что может быть лучше для обучения, чем репозитории GitHub? Для тех из вас, кто не знает, GitHub — это платформа для размещения кода для контроля версий и совместной работы. Кто использует GitHub? Вы увидите отдельных специалистов, компании, студентов университетов и учебных курсов, преподавателей и не только, использующих платформу для совместной работы и отслеживания кода.

Хотя GitHub — не единственная в своем роде платформа, она очень популярна по следующим причинам: она проста в использовании, поддерживает как общедоступные, так и частные репозитории, а также бесплатна для небольших проектов. У GitHub также есть сообщество , которое помогает всем пользователям GitHub поддерживать вопросы, проблемы и их общий образовательный путь. За прошедшие годы люди стали по-разному относиться к GitHub: одни рассматривают его в первую очередь для совместной работы, другие видят в нем учебный портал или приходят туда за вдохновением.

Итак, теперь, когда мы немного узнали о GitHub, давайте посмотрим, как вы можете изучать науку о данных с помощью репозиториев GitHub.

https://shly.link/5xzZ6
Создайте свой собственный мини-ChatGPT с помощью OpenAI и Gradio Зачем ждать в очереди, если вы можете создать своего собственного бота ChatGPT всего за 5 шагов с помощью Python. Для создания этого бота я использовал движок text-davinci-003.

https://shly.link/ghbNju

https://www.youtube.com/shorts/qRELzmT3biI
👍3