Big data world
2.34K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Отслеживание футболистов с помощью YOLOv5 + ByteTRACK

Видео на YouTube: https://youtu.be/QCG8QMhga9k
Сообщение в блоге: https://blog.roboflow.com/track-football-players/
Блокнот Jupyter: https://github.com/roboflow-ai/notebooks/blob/main/notebooks/how-to-track-football-players.ipynb
Amazon AutoML против статистических методов с открытым исходным кодом

Вкратце: мы заплатили 800 долларов США и провели 4 часа в консоли AWS Forecast, чтобы вам не пришлось этого делать.

В этом воспроизводимом эксперименте мы сравниваем Amazon Forecast и StatsForecast — библиотеку Python с открытым исходным кодом. Для этого эксперимента, учитывая активное использование AWS Forecast в прогнозировании спроса, мы использовали 30 490 серий ежедневных продаж в Walmart из конкурса M5 . Мы пришли к выводу, что для этой настройки Amazon Forecast на 60 % менее точен и в 669 раз дороже, чем запуск альтернативы с открытым исходным кодом на простом облачном сервере.
https://shly.link/ghvGN2
👍7
Это просто потрясающе! Посмотрите на RTutor ( https://RTutor.ai ) . Он может генерировать и тестировать код R, просто «общаясь» с ним. Затем RTutor сгенерирует функциональный код для ответа на ваш вопрос, что упростит задачу для тех, у кого нет опыта работы
https://rtutor.ai/
🔥4👍1
7 супер-шпаргалок, которые вам нужны, чтобы пройти собеседование по машинному обучению

В этом посте вы узнаете об алгоритмах и фреймворках машинного обучения и глубокого обучения. Кроме того, вы узнаете советы и рекомендации по обработке данных, выбору показателей и повышению производительности модели.

Последняя и самая важная шпаргалка посвящена вопросам и ответам на интервью с машинным обучением с наглядными примерами.

https://shly.link/nYU1n
👍2
15 совершенно бесплатных книг по машинному обучению и глубокому обучению

К счастью, в Интернете доступно множество совершенно бесплатных электронных книг, которые охватывают большинство тем и концепций; нам нужно учиться как специалисты по данным.

https://shly.link/SiNjK
26 наборов данных для ваших проектов по науке о данных

Пусть эта статья станет для вас справочным материалом, чтобы вы могли попробовать набор данных для нового алгоритма, который вы изучаете и с которым хотите поэкспериментировать.

Однако , пожалуйста, не думайте, что это исчерпывающий список наборов данных для задач машинного обучения — ни я, ни кто-либо другой не может просмотреть каждый отдельный набор данных, доступный на каждом веб-сайте.

https://shly.link/11e1b
Бесплатный ускоренный курс по машинному обучению от Berkeley. Настоятельно рекомендуется для тех, кто хочет начать!
https://shly.link/3ks6Z
Все говорят о #ChatGPT и #GPT3 , но знаете ли вы, что существует бесплатная версия GPT-3 с открытым исходным кодом под названием OPT-175B? Нет входа в систему, кредитная карта не требуется!
https://opt.alpa.ai/
🔥3
Обучение с подкреплением (RL) — это вид машинного обучения, наиболее близкий к тому, как учатся люди и животные. Это также один из компонентов ChatGPT. В этом практическом бесплатном курсе я проведу вас от основ к продвинутым темам ↓

https://shly.link/ZrZjc

Весь код курса https://github.com/Paulescu/hands-on-rl
🔥3
«Вероятности» для машинного обучения . Из Гарварда. Бесплатно.

Изучите теорию вероятностей, необходимую для специалиста по обработке и анализу данных, на примере финансового кризиса 2007–2008 годов.
https://www.edx.org/course/data-science-probability
😱3
Глубокое обучение с PyTorch — Университет Амстердама (UvA) Фантастическая серия учебных пособий, охватывающих широкий спектр тем: основы PyTorch, основы нейронных сетей, архитектуры (CNN, преобразователи, GNN), генеративные сети

https://uvadlc-notebooks.readthedocs.io/en/latest/index.html

https://www.youtube.com/playlist?list=PLdlPlO1QhMiAkedeu0aJixfkknLRxk1nA
👍4
7 лучших инструментов кодирования на базе ИИ

ИИ теперь может делать так много, не нуждаясь в тоннах знаний в области программирования.

Эти модели чрезвычайно умны и могут анализировать огромные объемы данных, обучаться и адаптироваться и даже принимать решения. Безумно думать обо всех способах, которыми они могут улучшить технологии.

Мы вступаем в новую эру, когда люди и машины могут удивительным образом работать вместе.

https://shly.link/8DGPp
На Хабре вышла статья о разных способах развёртывания Apache Superset (Docker, ВМ, Kubernetes). Автор рассказал обо всех плюсах и минусах и поделился подробной инструкцией на примере облака VK Cloud.

Это очень актуально, учитывая вставшую перед компаниями задачу по полному перестраиванию системы бизнес-аналитики. В современных реалиях развитие BI-решений российских вендоров осуществляются максимально быстро и качественно. У них есть лицензионная поддержка, регулярные обновления и возможность влиять на roadmap.

Читать
Изучите науку о данных из этих репозиториев GitHub

Если вы хотите начать карьеру в области науки о данных, вам, вероятно, интересно, какой путь обучения выбрать. Вы, наверное, видели, как появляются учебные курсы по науке о данных, курсы по Udemy, степени и многое другое. Трудно выбрать один маршрут, когда их так много.

Что может быть лучше для обучения, чем репозитории GitHub? Для тех из вас, кто не знает, GitHub — это платформа для размещения кода для контроля версий и совместной работы. Кто использует GitHub? Вы увидите отдельных специалистов, компании, студентов университетов и учебных курсов, преподавателей и не только, использующих платформу для совместной работы и отслеживания кода.

Хотя GitHub — не единственная в своем роде платформа, она очень популярна по следующим причинам: она проста в использовании, поддерживает как общедоступные, так и частные репозитории, а также бесплатна для небольших проектов. У GitHub также есть сообщество , которое помогает всем пользователям GitHub поддерживать вопросы, проблемы и их общий образовательный путь. За прошедшие годы люди стали по-разному относиться к GitHub: одни рассматривают его в первую очередь для совместной работы, другие видят в нем учебный портал или приходят туда за вдохновением.

Итак, теперь, когда мы немного узнали о GitHub, давайте посмотрим, как вы можете изучать науку о данных с помощью репозиториев GitHub.

https://shly.link/5xzZ6
Создайте свой собственный мини-ChatGPT с помощью OpenAI и Gradio Зачем ждать в очереди, если вы можете создать своего собственного бота ChatGPT всего за 5 шагов с помощью Python. Для создания этого бота я использовал движок text-davinci-003.

https://shly.link/ghbNju

https://www.youtube.com/shorts/qRELzmT3biI
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Adrenaline, отладчик, исправляющий ошибки и объясняющий их с помощью GPT-3.

https://useadrenaline.com/playground
Может ли ChatGPT писать SQL лучше, чем Data Analyst?

Я попробовал ChatGPT , вариант языковой модели GPT-3, специально разработанный для создания человеческого текста в диалоговом контексте. И, конечно же, как и большинство из нас, я задавался вопросом: может ли ИИ выполнять мою работу? И может ли он сделать это лучше меня?
https://shly.link/hBPBc
Это пугающее зрелище для меня. Первая точка — это объем данных, на которых был обучен Chat GPT 3. Второе — это то, на чем обучается чат GPT 4. Они уже делают демо. Он может написать книгу из 60 000 слов из одной подсказки.
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи из Стэнфорда разработали модель искусственного интеллекта (ИИ) SUMMON, которая может генерировать многообъектные сцены из последовательности человеческого взаимодействия.

Краткое чтение: https://www.marktechpost.com/2023/01/09/researchers-at-stanford-have-developed-an-artificial-intelligence-ai-model-summon-that-can-generate-multi-object -сцены-из-последовательности-человеческого-взаимодействия/
Документ: https://arxiv.org/pdf/2301.01424.pdf
Проект: https://lijiaman.github.io/projects/summon/
Код: https: //github.com/onestarYX/summon
6 новых быстро развивающихся библиотек по науке о данных, которые вы должны изучить, чтобы повысить свои навыки в 2023 году

Наука о данных — это больше не только Pandas, NumPy и Scikit-learn
https://shly.link/deChC

(если пост не открывается полностью,войдите в режиме инкогнито )