Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
7 лучших инструментов кодирования на базе ИИ

ИИ теперь может делать так много, не нуждаясь в тоннах знаний в области программирования.

Эти модели чрезвычайно умны и могут анализировать огромные объемы данных, обучаться и адаптироваться и даже принимать решения. Безумно думать обо всех способах, которыми они могут улучшить технологии.

Мы вступаем в новую эру, когда люди и машины могут удивительным образом работать вместе.

https://shly.link/8DGPp
На Хабре вышла статья о разных способах развёртывания Apache Superset (Docker, ВМ, Kubernetes). Автор рассказал обо всех плюсах и минусах и поделился подробной инструкцией на примере облака VK Cloud.

Это очень актуально, учитывая вставшую перед компаниями задачу по полному перестраиванию системы бизнес-аналитики. В современных реалиях развитие BI-решений российских вендоров осуществляются максимально быстро и качественно. У них есть лицензионная поддержка, регулярные обновления и возможность влиять на roadmap.

Читать
Изучите науку о данных из этих репозиториев GitHub

Если вы хотите начать карьеру в области науки о данных, вам, вероятно, интересно, какой путь обучения выбрать. Вы, наверное, видели, как появляются учебные курсы по науке о данных, курсы по Udemy, степени и многое другое. Трудно выбрать один маршрут, когда их так много.

Что может быть лучше для обучения, чем репозитории GitHub? Для тех из вас, кто не знает, GitHub — это платформа для размещения кода для контроля версий и совместной работы. Кто использует GitHub? Вы увидите отдельных специалистов, компании, студентов университетов и учебных курсов, преподавателей и не только, использующих платформу для совместной работы и отслеживания кода.

Хотя GitHub — не единственная в своем роде платформа, она очень популярна по следующим причинам: она проста в использовании, поддерживает как общедоступные, так и частные репозитории, а также бесплатна для небольших проектов. У GitHub также есть сообщество , которое помогает всем пользователям GitHub поддерживать вопросы, проблемы и их общий образовательный путь. За прошедшие годы люди стали по-разному относиться к GitHub: одни рассматривают его в первую очередь для совместной работы, другие видят в нем учебный портал или приходят туда за вдохновением.

Итак, теперь, когда мы немного узнали о GitHub, давайте посмотрим, как вы можете изучать науку о данных с помощью репозиториев GitHub.

https://shly.link/5xzZ6
Создайте свой собственный мини-ChatGPT с помощью OpenAI и Gradio Зачем ждать в очереди, если вы можете создать своего собственного бота ChatGPT всего за 5 шагов с помощью Python. Для создания этого бота я использовал движок text-davinci-003.

https://shly.link/ghbNju

https://www.youtube.com/shorts/qRELzmT3biI
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Adrenaline, отладчик, исправляющий ошибки и объясняющий их с помощью GPT-3.

https://useadrenaline.com/playground
Может ли ChatGPT писать SQL лучше, чем Data Analyst?

Я попробовал ChatGPT , вариант языковой модели GPT-3, специально разработанный для создания человеческого текста в диалоговом контексте. И, конечно же, как и большинство из нас, я задавался вопросом: может ли ИИ выполнять мою работу? И может ли он сделать это лучше меня?
https://shly.link/hBPBc
Это пугающее зрелище для меня. Первая точка — это объем данных, на которых был обучен Chat GPT 3. Второе — это то, на чем обучается чат GPT 4. Они уже делают демо. Он может написать книгу из 60 000 слов из одной подсказки.
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи из Стэнфорда разработали модель искусственного интеллекта (ИИ) SUMMON, которая может генерировать многообъектные сцены из последовательности человеческого взаимодействия.

Краткое чтение: https://www.marktechpost.com/2023/01/09/researchers-at-stanford-have-developed-an-artificial-intelligence-ai-model-summon-that-can-generate-multi-object -сцены-из-последовательности-человеческого-взаимодействия/
Документ: https://arxiv.org/pdf/2301.01424.pdf
Проект: https://lijiaman.github.io/projects/summon/
Код: https: //github.com/onestarYX/summon
6 новых быстро развивающихся библиотек по науке о данных, которые вы должны изучить, чтобы повысить свои навыки в 2023 году

Наука о данных — это больше не только Pandas, NumPy и Scikit-learn
https://shly.link/deChC

(если пост не открывается полностью,войдите в режиме инкогнито )
This media is not supported in your browser
VIEW IN TELEGRAM
Ян ЛеКун в 1993 году демонстрация LeNet-1

Это была первая в мире сверточная нейронная сеть для распознавания рукописного ввода. 29 лет спустя — этот же подход лежит в основе большей части компьютерного зрения. Исторический момент для машинного обучения !
👏11🔥6
51 инструмент искусственного интеллекта, который вы должны использовать для жизни, программирования, создания контента и всего остального

ИИ буквально штурмом берет мир 🔥🔥🔥 У него безграничный потенциал, и он изменит нашу жизнь к лучшему. Эта технология будет быстро совершенствоваться, и сегодня вы можете использовать так много инструментов, которые повысят вашу производительность, помогут вам выполнить вашу работу, дадут вам советы по множеству различных тем и многое другое! Это инструменты, которые мы ВСЕ должны использовать СЕЙЧАС!

Вы можете использовать их во всех сферах жизни. Они могут генерировать контент для социальных сетей, помогать вам с жизненными проблемами, а при правильном использовании они даже могут помочь вам устроиться на работу! Например, можно использовать ChatGPT для проведения пробных интервью и получения обратной связи в режиме реального времени! Мы только царапаем поверхность, потому что благодаря ИИ возможно гораздо больше.

https://shly.link/devXj8X
👍1
Как я использовал ChatGPT для автоматизации этих 6 задач в моей роли Data Science

В этом посте я задам ChatGPT несколько вопросов по программированию, которые охватывают машинное обучение и разработку программного обеспечения.
Я попрошу его написать фрагменты кода и функции, которые я регулярно использую в своей работе, чтобы посмотреть, сможет ли он их автоматизировать.
https://shly.link/uZJwB

(если пост не открывается полностью,войдите в режиме инкогнито )
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем PivotTableJS,которыйпозволяет интерактивно анализировать данные в Jupyter 🚀

https://shly.link/ghM2PV
🔥4
12 команд Docker, которые должен знать каждый специалист по данным

Хотите добавить Docker в свой набор инструментов для обработки данных? Вот список основных команд Docker, которые помогут вам начать работу.

https://shly.link/sWKMK
ТОП-5 курсов по изучению SQL от лучших преподавателей БЕСПЛАТНО

1. В этом курсе вы начнете продвигаться от простых операторов SQL к реальной функциональной инженерии баз данных с использованием продвинутых концепций MySQL.
https://shly.link/qkmJG

2. Базы данных и SQL для науки о данных Большая часть мировых данных хранится в базах данных. SQL — это мощный язык, который используется для обмена данными с базами данных и извлечения данных из них. Изучите БД и SQL для науки о данных в этом курсе.
https://shly.link/uM9dz

3. Анализ больших данных с помощью SQL В этом курсе вы подробно изучите инструкцию SQL SELECT и ее основные предложения. Курс посвящен SQL-движкам больших данных Apache Hive и Apache Impala. но также применимо к традиционным СУБД.
https://shly.link/GPx5a

4. Продвинутый SQL для специалистов по данным Этот расширенный курс содержит инструкции по работе с базами данных SQL. Узнайте, как работать с реляционными базами данных, включая поиск, извлечение и подготовку данных.
https://shly.link/22fgz

5. Advanced SQL Now. Просто поднимите свои навыки SQL на новый уровень с помощью этого курса, чтобы выделиться на рынке труда
https://shly.link/d3hew
👍2🔥2
🔥Новая (1ч56м) видео-лекция: "Давайте построим GPT: с нуля

Мы создаем и обучаем Transformer в соответствии с документом «Внимание — это все, что вам нужно» в настройках языкового моделирования и заканчиваем ядром nanoGPT.

https://www.youtube.com/watch?v=kCc8FmEb1nY
Введение в глубокое обучение — Carnegie Mellon 2022 Intro to DL — один из уважаемых курсов CMU. Курс охватывает широкий круг тем, связанных с ГО, от основ, методов и алгоритмов нейронных сетей до последних достижений в этой области.

https://shly.link/ytisZH
Учебники по машинному обучению (в основном на Python3)

Коллекция из более чем 100 руководств по машинному обучению
https://shly.link/ghtzAn
Пожалуй, лучший курс линейной алгебры. Это бесплатно! Преподает легендарный профессор Массачусетского технологического института Гилберт Стрэнг. Создайте прочную математическую основу для машинного обучения

https://shly.link/ytoit8

Вот отличный курс по машинному обучению: Applied Machine Learning Cornell Tech ,
2020. 100% бесплатно. 80 видео.

https://shly.link/ytMzu9