Big data world
2.34K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
26 наборов данных для ваших проектов по науке о данных

Пусть эта статья станет для вас справочным материалом, чтобы вы могли попробовать набор данных для нового алгоритма, который вы изучаете и с которым хотите поэкспериментировать.

Однако , пожалуйста, не думайте, что это исчерпывающий список наборов данных для задач машинного обучения — ни я, ни кто-либо другой не может просмотреть каждый отдельный набор данных, доступный на каждом веб-сайте.

https://shly.link/11e1b
Бесплатный ускоренный курс по машинному обучению от Berkeley. Настоятельно рекомендуется для тех, кто хочет начать!
https://shly.link/3ks6Z
Все говорят о #ChatGPT и #GPT3 , но знаете ли вы, что существует бесплатная версия GPT-3 с открытым исходным кодом под названием OPT-175B? Нет входа в систему, кредитная карта не требуется!
https://opt.alpa.ai/
🔥3
Обучение с подкреплением (RL) — это вид машинного обучения, наиболее близкий к тому, как учатся люди и животные. Это также один из компонентов ChatGPT. В этом практическом бесплатном курсе я проведу вас от основ к продвинутым темам ↓

https://shly.link/ZrZjc

Весь код курса https://github.com/Paulescu/hands-on-rl
🔥3
«Вероятности» для машинного обучения . Из Гарварда. Бесплатно.

Изучите теорию вероятностей, необходимую для специалиста по обработке и анализу данных, на примере финансового кризиса 2007–2008 годов.
https://www.edx.org/course/data-science-probability
😱3
Глубокое обучение с PyTorch — Университет Амстердама (UvA) Фантастическая серия учебных пособий, охватывающих широкий спектр тем: основы PyTorch, основы нейронных сетей, архитектуры (CNN, преобразователи, GNN), генеративные сети

https://uvadlc-notebooks.readthedocs.io/en/latest/index.html

https://www.youtube.com/playlist?list=PLdlPlO1QhMiAkedeu0aJixfkknLRxk1nA
👍4
7 лучших инструментов кодирования на базе ИИ

ИИ теперь может делать так много, не нуждаясь в тоннах знаний в области программирования.

Эти модели чрезвычайно умны и могут анализировать огромные объемы данных, обучаться и адаптироваться и даже принимать решения. Безумно думать обо всех способах, которыми они могут улучшить технологии.

Мы вступаем в новую эру, когда люди и машины могут удивительным образом работать вместе.

https://shly.link/8DGPp
На Хабре вышла статья о разных способах развёртывания Apache Superset (Docker, ВМ, Kubernetes). Автор рассказал обо всех плюсах и минусах и поделился подробной инструкцией на примере облака VK Cloud.

Это очень актуально, учитывая вставшую перед компаниями задачу по полному перестраиванию системы бизнес-аналитики. В современных реалиях развитие BI-решений российских вендоров осуществляются максимально быстро и качественно. У них есть лицензионная поддержка, регулярные обновления и возможность влиять на roadmap.

Читать
Изучите науку о данных из этих репозиториев GitHub

Если вы хотите начать карьеру в области науки о данных, вам, вероятно, интересно, какой путь обучения выбрать. Вы, наверное, видели, как появляются учебные курсы по науке о данных, курсы по Udemy, степени и многое другое. Трудно выбрать один маршрут, когда их так много.

Что может быть лучше для обучения, чем репозитории GitHub? Для тех из вас, кто не знает, GitHub — это платформа для размещения кода для контроля версий и совместной работы. Кто использует GitHub? Вы увидите отдельных специалистов, компании, студентов университетов и учебных курсов, преподавателей и не только, использующих платформу для совместной работы и отслеживания кода.

Хотя GitHub — не единственная в своем роде платформа, она очень популярна по следующим причинам: она проста в использовании, поддерживает как общедоступные, так и частные репозитории, а также бесплатна для небольших проектов. У GitHub также есть сообщество , которое помогает всем пользователям GitHub поддерживать вопросы, проблемы и их общий образовательный путь. За прошедшие годы люди стали по-разному относиться к GitHub: одни рассматривают его в первую очередь для совместной работы, другие видят в нем учебный портал или приходят туда за вдохновением.

Итак, теперь, когда мы немного узнали о GitHub, давайте посмотрим, как вы можете изучать науку о данных с помощью репозиториев GitHub.

https://shly.link/5xzZ6
Создайте свой собственный мини-ChatGPT с помощью OpenAI и Gradio Зачем ждать в очереди, если вы можете создать своего собственного бота ChatGPT всего за 5 шагов с помощью Python. Для создания этого бота я использовал движок text-davinci-003.

https://shly.link/ghbNju

https://www.youtube.com/shorts/qRELzmT3biI
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Adrenaline, отладчик, исправляющий ошибки и объясняющий их с помощью GPT-3.

https://useadrenaline.com/playground
Может ли ChatGPT писать SQL лучше, чем Data Analyst?

Я попробовал ChatGPT , вариант языковой модели GPT-3, специально разработанный для создания человеческого текста в диалоговом контексте. И, конечно же, как и большинство из нас, я задавался вопросом: может ли ИИ выполнять мою работу? И может ли он сделать это лучше меня?
https://shly.link/hBPBc
Это пугающее зрелище для меня. Первая точка — это объем данных, на которых был обучен Chat GPT 3. Второе — это то, на чем обучается чат GPT 4. Они уже делают демо. Он может написать книгу из 60 000 слов из одной подсказки.
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи из Стэнфорда разработали модель искусственного интеллекта (ИИ) SUMMON, которая может генерировать многообъектные сцены из последовательности человеческого взаимодействия.

Краткое чтение: https://www.marktechpost.com/2023/01/09/researchers-at-stanford-have-developed-an-artificial-intelligence-ai-model-summon-that-can-generate-multi-object -сцены-из-последовательности-человеческого-взаимодействия/
Документ: https://arxiv.org/pdf/2301.01424.pdf
Проект: https://lijiaman.github.io/projects/summon/
Код: https: //github.com/onestarYX/summon
6 новых быстро развивающихся библиотек по науке о данных, которые вы должны изучить, чтобы повысить свои навыки в 2023 году

Наука о данных — это больше не только Pandas, NumPy и Scikit-learn
https://shly.link/deChC

(если пост не открывается полностью,войдите в режиме инкогнито )
This media is not supported in your browser
VIEW IN TELEGRAM
Ян ЛеКун в 1993 году демонстрация LeNet-1

Это была первая в мире сверточная нейронная сеть для распознавания рукописного ввода. 29 лет спустя — этот же подход лежит в основе большей части компьютерного зрения. Исторический момент для машинного обучения !
👏11🔥6
51 инструмент искусственного интеллекта, который вы должны использовать для жизни, программирования, создания контента и всего остального

ИИ буквально штурмом берет мир 🔥🔥🔥 У него безграничный потенциал, и он изменит нашу жизнь к лучшему. Эта технология будет быстро совершенствоваться, и сегодня вы можете использовать так много инструментов, которые повысят вашу производительность, помогут вам выполнить вашу работу, дадут вам советы по множеству различных тем и многое другое! Это инструменты, которые мы ВСЕ должны использовать СЕЙЧАС!

Вы можете использовать их во всех сферах жизни. Они могут генерировать контент для социальных сетей, помогать вам с жизненными проблемами, а при правильном использовании они даже могут помочь вам устроиться на работу! Например, можно использовать ChatGPT для проведения пробных интервью и получения обратной связи в режиме реального времени! Мы только царапаем поверхность, потому что благодаря ИИ возможно гораздо больше.

https://shly.link/devXj8X
👍1
Как я использовал ChatGPT для автоматизации этих 6 задач в моей роли Data Science

В этом посте я задам ChatGPT несколько вопросов по программированию, которые охватывают машинное обучение и разработку программного обеспечения.
Я попрошу его написать фрагменты кода и функции, которые я регулярно использую в своей работе, чтобы посмотреть, сможет ли он их автоматизировать.
https://shly.link/uZJwB

(если пост не открывается полностью,войдите в режиме инкогнито )
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем PivotTableJS,которыйпозволяет интерактивно анализировать данные в Jupyter 🚀

https://shly.link/ghM2PV
🔥4
12 команд Docker, которые должен знать каждый специалист по данным

Хотите добавить Docker в свой набор инструментов для обработки данных? Вот список основных команд Docker, которые помогут вам начать работу.

https://shly.link/sWKMK