Big Data AI
16.8K subscribers
813 photos
97 videos
19 files
820 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
⭐️ Flourish Studio — инструмент для создание интерактивных визуализаций данных без кодинга

Это отличный вариант, если вам нужно быстренько и красиво визуализировать собранные данных без необходимости программировать

С помощью инструмента вы сможете создавать динамичные и привлекательные графики, диаграммы, карты и другие визуальные элементы

У Flourish Studio есть широкий набор готовых шаблонов и анимаций, интуитивный визуальный редактор, возможность добавлять интерактивность и настраивать анимации

Стоимость: #бесплатно (но есть платные тарифы).

#данные #диаграммы

bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍74🔥3
🖥 Подробная Шпаргалка SQL на 2023 год

Руководство о всех SQL-запросах и примерах их использования.

Этот
пост постоянно обновляется и дополняется, сохраняйте пост себе и делитесь ссыслкой с друзьями.

Ставьте ❤️, если хотите больше подобного материала.

✔️ Шпаргалка

bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥3👍2
🚀 Podman Desktop

Графический интерфейс для создания, запуска и управления контейнерами Kubernetes.

Удобный интсрумент, который позволяет создавать, запускать, тестировать и публиковать микросервисы и приложения, разрабатываемые для систем контейнерной изоляции.

Github

bigdatai
6👍1👎1🔥1
Собрание бесплатных курсов по Python и машинному обучению.

1. Основы Python для анализа данных — программирование на Python.

2. Ускоренный курс по машинному обучению — видеолекции от исследователей Google.

3. Основы R — как обрабатывать, анализировать и визуализировать данные.

4. Введение в Data Science и аналитику — основы Data Science и Data Science Life Cycle.

5. Линейная регрессия — как применять R для осуществления линейной регрессии.

6. Визуализация — принципы визуализации данных и применение ggplot2.

7. Введение CS50 в программирование на Python, май 2023 г.

8. Python для всех: Getting Started with Python от Coursera, этот курс для начинающих знакомит с программированием на Python через пошаговые учебные пособия и практические упражнения. Курс ведет известный преподаватель доктор Чарльз Северанс.
👍83🔥3
🔎 Exposing the Troublemakers in Described Object Detection

Новый, размеченный набор данных для обнаружения объектов.

pip install ddd-dataset

from d_cube import D3
d3 = D3(IMG_ROOT, PKL_ANNO_PATH)
all_img_ids = d3.get_img_ids() # get the image ids in the dataset
all_img_info = d3.load_imgs(all_img_ids) # load images by passing a list of some image ids
img_path = all_img_info[0]["file_name"] # obtain one image path so you can load it and inference

🖥 Github: https://github.com/shikras/d-cube

🔗 Docs: https://github.com/shikras/d-cube/blob/main/doc.md

📕 Paper: https://arxiv.org/pdf/2307.12813.pdf

🔥 Dataset: https://paperswithcode.com/dataset/description-detection-dataset

bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥21
🆓 10 лучших бесплатных курсов Udacity для мл специалистов.

1. Machine Learning by Georgia Tech
Отличный курс по машинному обучению для начинающих.

2. Introduction to Machine Learning Course
Udacity научит вас основам и тому, как использовать машинное обучение для решения реальных задач.

3. Intro to Artificial Intelligence
Узнайте об интеллектуальных агентах, алгоритмах поиска и игровых программах. Вы словно окажетесь в научно-фантастическом фильме!

4. Artificial Intelligence for Robotics
Вы узнаете, как роботыпринимают решения, понимают, где они находятся и как передвигаются.

5. What is Programming?
Познакомит вас с популярными языками программирования, переменными, циклами и условиями.

6. Intro to HTML and CSS
Никакого опыта не требуется! Вы изучите основы веб-разработки и сможете создавать классные вещи в Интернете!

7. Introduction to Computer Vision
Компьютерное зрение подобно волшебству - оно позволяет компьютерам понимать изображения и видео. Узнайте об обработке изображений, распознавании объектов и многом другом!

8. Intro to Data Science
Наука о данных - это поиск скрытых закономерностей в данных. Исследуйте данные и принимайте разумные решения как эксперт в области данных!

9. SQL for Data Analysis
Анализ данных может быть интересным с помощью SQL. Станьте мастером данных с помощью этого важного навыка!

10. Data Wrangling with MongoDB
Узнайте, как организовать и преобразовать данные как профессионал с помощью MongoDB.

bigdatai
👍72🔥2
⚡️ ConvertCSV — крутой универсальный инструмент для работы с CSV

ConvertCSV отлично подойдёт для обработки и конвертации CSV-файлов, поддерживая также формат TSV и прочие популярные разделители

При этом обработка данных происходит непосредственно на вашем компьютере, что обеспечивает безопасность пользовательских данных

Также сервис поддерживает работу с Excel и предлагает инструменты для командной строки и настольные приложения

Стоимость: #бесплатно

#data #CSV #данные

bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Как маленькая нейроязыковая модель победила серверные подсказки

Автор, разработчик Яндекс Клавиатуры, поделился опытом создания модели и рассказал, какое качество можно получить из маленькой нейроязыковой модели и насколько она лучше n-граммной.

И вообще, почему выбрали CNN-эмбеддинг, а не Word Embedding или Byte Pair Encoding. Все тонкости в статье.

📌 Читать

bigdatai
👍5🔥31🥰1
🚀 Доступ к Spark-датасетам из разных приложений — Redis.

Apache Spark, универсальная платформа для крупномасштабной обработки данных, в сочетании с Redis способна обеспечить ускоренные расчеты в реальном времени для таких задач, как анализ временных рядов, прогнозы и рекомендации на основе машинного обучения и т. д.

Spark также способен извлекать датасеты в кэш-память кластера. Это невероятно полезно, когда приложению необходимо многократно запрашивать одни и те же данные. Если вы используете датасет, создание которого достаточно затратно, и который потом используется в вашем приложении не один раз, то этот датасет обязательно нужно кэшировать. Но если вы захотите получить доступ к этому датасету сразу из нескольких приложений, то вам придется поломать голову, как это сделать. Здесь на помощь приходит коннектор Spark-Redis.

Redis — это размещаемое в памяти хранилище структур данных с открытым исходным кодом (под лицензией BSD), используемое в качестве базы данных, кэша и брокера сообщений. Оно поддерживает множество разных структур данных, таких как строки, хэши, списки, сэты и так далее.

Redis Labs недавно опубликовала в общий доступ пакет “spark-redis”. Как следует из названия, это коннектор Redis для Apache Spark, который обеспечивает доступ для чтения и записи ко всем основным структурам данных Redis в виде RDD (Resilient Distributed Datasets, в терминологии Spark), что позволяет Spark использовать Redis в качестве одного из источников данных. Этот коннектор предоставляет Spark структуры данных Redis, тем самым обеспечивая значительный прирост производительности для всех типов расчетов. Он также позволяет нам организовать совместный доступ к DataSet/DataFrame/RDD Spark из сразу нескольких разных приложений.

Но прежде чем мы сможем использовать коннектор Spark-Redis, нам сперва нужно позаботиться о наличии нескольких ключевых элементов, а именно: Apache Spark, Scala, Jedis и Redis.

Чтобы без особой необходимости не растягивать этот пост, предположим, что о всем вышеперечисленном вы уже позаботились. Поэтому давайте сразу перейдем к делу — как запустить эту мощную комбинацию. Включите указанные ниже зависимости в свой проект вместе со Spark:

spark-redis
jedis

📌 Читать дальше

bigdatai
6👍1🔥1
⚡️Маст-хэв список для программистов, каналы с последними книжными новинками, библиотеками, разбором кода и актуальной информацией, связанной с вашим языком программирования.
Лучший способ получать свежие обновлении и следить за трендами в разработке.

Машинное обучение: t.iss.one/ai_machinelearning_big_data
Python: t.iss.one/pythonl
C#: t.iss.one/csharp_ci
C/C++/ t.iss.one/cpluspluc
Data Science: t.iss.one/data_analysis_ml
Devops: t.iss.one/devOPSitsec
Go: t.iss.one/Golang_google
Базы данных: t.iss.one/sqlhub
Rust: t.iss.one/rust_code
Javascript: t.iss.one/javascriptv
React: t.iss.one/react_tg
PHP: t.iss.one/phpshka
Android: t.iss.one/android_its
Мобильная разработка: t.iss.one/mobdevelop
Linux: t.iss.one/+A8jY79rcyKJlYWY6
Big Data: t.iss.one/bigdatai
Хакинг: t.iss.one/linuxkalii
Тестирование: https://t.iss.one/+F9jPLmMFqq1kNTMy
Java: t.iss.one/javatg

💼 Папка с вакансиями: t.iss.one/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.iss.one/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.iss.one/addlist/eEPya-HF6mkxMGIy

Папка машинное обучение: https://t.iss.one/addlist/_FjtIq8qMhU0NTYy

📕 Бесплатные Книги для программистов: https://t.iss.one/addlist/YZ0EI8Ya4OJjYzEy

🎞 YouTube канал: https://www.youtube.com/@uproger

😆ИТ-Мемы: t.iss.one/memes_prog

🇬🇧Английский: t.iss.one/english_forprogrammers
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41
📊Прогнозирование цен на акции с помощью моделирования методом Монте-Карло

Моделирование - мощный инструмент прогнозной аналитики в BI.

Методы имитационного моделирования используются для моделирования сложных сценариев и принятия обоснованных решений.
Имитационная модель многократно моделируется с разными входными данными и сценариями, что позволяет понять диапазон возможных результатов и связанные с ними вероятности.
Существует несколько методов имитационного моделирования, включая агентное моделирование, дискретно-событийное моделирование, моделирование по теории игр и моделирование методом Монте-Карло.
Мы используем моделирование методом Монте-Карло из-за его универсальности и способности решать сложные задачи с неопределенностью.

# Import required libraries
import math
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import yfinance as yf


#obtaining and printing data
#we have used the ticker 'AC.TO', which is Air Canada

data = yf.download('AC.TO','2020-01-01','2023-01-01')
data.head()


📌 Подробнее

bigdatai
9🔥4👍2😁1
📌 Подборка шпаргалок по matplotlib от лёгкого до высокого уровня

#cheatsheet #python
👍23🔥53
30802543.pdf
337.8 KB
Большая Шпаргалка по pandas, библиотеке на языке Python для обработки и анализа данных
🔥9👍1
🔥 Большой список сайтов с практическимим задачами для программистов.

Codeforces — платформа для алгоритмических соревнований. Проводит контесты и раунды с 5 задачами на 2 часа. Есть система рейтинга и два дивизиона. Задачи можно решать и проверять после соревнования. Также есть доступ к тренировкам с задачами с прошлых соревнований.

HackerRank - сайт будет больше интересен продвинутым программистам, которые уже многое умеют. На этом сайте собрано множество задач на самые разные разделы Computer Science: традиционная алгоритмика, ИИ, машинное обучение и т.д. Если вы решите много задач, то вами могут заинтересоваться работодатели, регуляторно мониторящие эту платформу.

Codewars — популярный cборник задач на разные темы, от алгоритмов до шаблонов проектирования.

LeetCode — известный сайт с задачами для подготовки к собеседованиям. Можно пообщаться и посмотреть решения других программистов.

Timus Online Judge — русскоязычная (хотя английский язык также поддерживается) платформа, на которой более тысячи задач удачно отсортированы по темам и по сложности.

TopCoder - популярная американская платформа. Она проводит алгоритмические контесты, а также соревнования по промышленному программированию и марафоны, где задачи требуют исследования и нет единого верного алгоритма. Участникам даются недели на решение таких задач.

informatics.mccme.ru - платформа с теоретическим материалом и задачами, удобно разделенными по категориям. Большая база задач с олимпиад школьников также доступна.

SPOJ - большой англоязычный сайт с 20000+ задачами на разные темы: DP, графы, структуры данных и др. Иногда проводят неинтересные контесты, если не из страны их проведения.

CodeChef — менее крупный аналог Codeforces и TopCoder, тоже с огромным архивом задач и регулярными контестами.

Project Euler - сборник 500 задач, проверяющих знание математических алгоритмов. Часто используется на собеседованиях, чтобы оценить алгоритмическую подготовку кандидата.

Kaggle - соревнования по анализу данных.

Golang tests - канал с тестами по Go

CodinGame - сайт для программистов и геймеров, предлагающий большую коллекцию видеоигр, оформленных в виде задач на программирование.

Al Zimmermann’s Programming Contests — платформа, на которой регулярно проводятся контесты с задачами на исследование и оптимизацию. Интересен тем, что писать программу необязательно — даются только тестовые данные. Ответы можно расчитывать вручную, или просто гадать их на кофейной гуще.

Programming Praxis — сайт, где можно найти много интересных задач.

CheckIO — сайт с задачами для программистов всех уровней, который вы проходите в виде игры.

Ruby Quiz — сайт с задачами для программистов на Ruby, но решения можно писать и на других языках.

Prolog Problems — Подборка задач для программистов, использующих Prolog.

Сборник задач от СppStudio - задачи на С++, но их можно и на других языках.

Operation Go — практика написания кода на Go в форме браузерной игры.

Empire of Code — сайт для программистов, где необходимо писать код, реализующий стратегию и тактику виртуальных бойцов.

https://t.iss.one/bigdatai
7👍6🔥2
Шпаргалка по Matplotlib

Matplotlib — библиотека на языке программирования Python для визуализации данных двумерной и трёхмерной графикой.
👍13🔥2
🖥 Полезные приемы с кодом для аналитиков данных на Python

1. Python itertools groupby удобный способ группировки - https://www.youtube.com/watch?v=Rt1gl4fM62k

2. Полезные приемы в Pandas - https://www.youtube.com/watch?v=Sd2S5rXe8sY&t=165s

3. Раскройте потенциал Python Numpy: руководство для начинающих в науке о данных - https://www.youtube.com/watch?v=XX2XremQ0fg&t=12s

4. Data science c Python.Ускоряем Pandas в 120 раз- https://www.youtube.com/watch?v=-dAdaEv23vk&t=4s

5. 26 практических приёмов и хитростей Python - https://www.youtube.com/watch?v=vAMyfvtxxdQ&t=5s

6. 5 декораторов Python для Data Science проектов - https://www.youtube.com/watch?v=rxq11WHAlqU

7. ChatGPT + Midjouney на практике - https://www.youtube.com/watch?v=2gUqbc3Ikmo&t=5s

8. Разбор вопросов с собеседований Python - https://www.youtube.com/watch?v=4L1e-A3AOL4&t=5s

9. 15 полезных лайфхаков с кодом Машинного обучения на Python - https://www.youtube.com/watch?v=loOtlwcdiBA&t=4s

10. Декораторы Python, которые выведут ваш код на новый уровень - https://www.youtube.com/watch?v=qxrGAogl4iM

11. 7 инструментов Python, который должен знать каждый специалист машинного обучения - https://www.youtube.com/watch?v=RGEftBi0C9Y

12. Как загружать данные в SQL в 20 раз быстрее на Python
- https://www.youtube.com/watch?v=eyeR1uWLnpM&t=2s

13. Data Science. Полезные советы по библиотеке Pandas - https://www.youtube.com/watch?v=neXc5Q-AWXY&t=3s

14. Data Science. Полезные советы по библиотеке Pandas - https://www.youtube.com/watch?v=neXc5Q-AWXY&t=3s

15. Дзен Python ООП: лучшие практики и шаблоны проектирования Python - https://www.youtube.com/watch?v=_MtX6QFJBRU

16. Python itertools. Хитрый способ избежать вложенных циклов - https://www.youtube.com/watch?v=TSvjYKIY01I&t=3s

17. Python. Генерация списка, словаря или множества в одну строку кода - https://www.youtube.com/watch?v=zS3HePvtxVc&t=10s

18. 8 крутых способов свести функции Python в одну строку - https://www.youtube.com/watch?v=jo3Q-rMggXk

19. Python itertools.compress. Удобный способ фильтрации данных - https://www.youtube.com/watch?v=8JGHID-_ApU&t=12s

20. Python Match/Case - https://www.youtube.com/watch?v=U_-NIKbKakM

21. Data Science. Советы по написанию эффективного кода на Python - https://www.youtube.com/watch?v=1Mcy-uatp_c&t=14s

22. Numpy векторизация вместо циклов в Python - https://www.youtube.com/watch?v=c7ypD2xet0E

🎞 Все видео по анализу данных


https://t.iss.one/bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥2