Анализ данных (Data analysis)
47K subscribers
2.71K photos
306 videos
1 file
2.32K links
Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml

РКН: clck.ru/3FmyAp
Download Telegram
💡 Pandas - одна из наиболее важных библиотек для анализа данных.

Однако при работе с большими массивами данных она становится очень медленной и не хватает памяти!

Представляем Modin - библиотеку python, которая в 10 раз быстрее Pandas
Modin хорошо работает на больших массивах данных, там где pandas становится медленной или не хватает памяти.

Посмотрите на приведенный ниже пример: Pandas (слева) и Modin (справа) выполняют одни и те же операции pandas на наборе данных размером 2 ГБ.

Единственное различие между двумя примерами заключается в операторе import (картинки 1 и 2).

Как это возможно?

Pandas является однопоточным, что означает, что он не может задействовать несколько ядер вашей машины, в то время как Modin использует все ядра.

На 3 картинке вы можете посмотреть скорость работы различных функций в Pandas и Modin

Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥135👎1
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю

Почитать:
Как разбить видеокарту и поделиться с коллегами? Динамический шеринг GPU в Kubernetes с помощью MIG, MPS и TimeSlicing
Обучение ИИ на синтетических данных: исследователи из MIT меняют правила игры
Как базы данных выполняют SQL-запросы?
Трюки и лайфхаки с Python кодом
Большие языковые модели (LLM) в задачах
DVC + Hydra: легко меняем и запускаем ML эксперименты
Распознавание русского жестового языка: распознаём до 3+ жестов в секунду на обычном ПК без видеокарты
Все, что нужно знать для разработки с использованием LLM
Генеративный ИИ — это просто «замыленный JPEG интернета», который убедительно косит под интеллект
ТОЛК: серия встреч про технологии будущего от red_mad_robot
Новые чипы от Microsoft, Git для аналитиков и эволюция Data Platform
Увядает ли ремесло программиста?
RAGLog: Log Anomaly Detection using Retrieval Augmented Generation
The Emergence of Autonomous Agents
Why OpenAI Assistants is a Big Win for LLM Evaluation
How to Use AI/ML Models for Your Projects
No Code Machine Learning for Business Decision-Making
Working through the fast.ai book in Rust - Part 5
Smart HR: Embracing Cloud and Machine Learning for Effective Talent Management
BakaLLM, part 12, 1 step backward, 4 steps forward: starting new experiment
Markov Decision Processes(MDP) basic concept
⚡️⚡️ 7 Machine Learning repos used by the TOP 1% of Python developers 🐉

Посмотреть:
🌐 Thomas Scialom, PhD - Large Language Models: Past, Present and Future ( 34:57)
🌐 Sarah Bird, PhD - Building and Using Generative AI Responsibly: Microsoft’s Journey ( 30:10)
🌐 ODSC Webinar | Enhanced Fine-tuning of Open Source Pre-trained LLMs for Q&A and Summarization Tasks ( 47:04)
🌐 Building an Optimized ML Pipeline: The builders behind Superbet’s profanity detection use case ( 25:23)

Хорошего дня!

@data_analysis_ml
🔥173👍2