Анализ данных (Data analysis)
46.2K subscribers
2.27K photos
263 videos
1 file
2.03K links
Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml

РКН: clck.ru/3FmyAp
Download Telegram
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю

Почитать:
Обслуживание моделей PyTorch с помощью TorchServe
Нейростроительное MVP или Почему иногда стоит возрождать проекты
Microsoft предлагает БЕСПЛАТНЫЕ онлайн курсы с сертификацией
7 шагов по контейнеризации Python-приложений
MySQL в Google Colab: Бесшовная интеграция
Как выбрать лучшую ИИ-систему?
Усы, лапы и QR-код – вот мои документы. Заменит ли цифровой паспорт бумажный и чем это обернется для компаний?
Как мы сделали свою ChatGPT Plus с голосовым вводом, чтением PDF, Youtube, и т.д
Использование технологий машинного обучения в аудите: примеры эффективного применения
20 проектов по аналитике данных для новичков в 2023 году
Кентавры и киборги: как консультанты BCG стали решать задачи на 25% быстрее с помощью ИИ
От логики и риторики до теории множеств и матанализа. Полезные материалы по Data Science и машинному обучению
Как мы в Just AI создавали и тестировали собственную LLM JustGPT — третью большую языковую модель в России
Conquer MS-101: Dumpsarena Offers Reliable Study Materials
How to Easily Try Out boto3 Interactively in AWS CloudShell
Kafka Ease: Simplifying Kafka Topic and ACL Management
A Python script to see my most watched YouTube videos
No One Expects the self._spanish_inquisition (Because it’s protected)
My Experience learning Python and SQL
Lovely Silk
My first contribution to other open source project
Data Science Essentials: Your Path to Effective Dataframe Joins with Pandas
Customizing RAG Pipelines to Summarize Latest Hacker News Posts with Haystack 2.0 Preview

Посмотреть:
🌐 Языки программирования, чей исходный код похож на что-то другое #программирование ( 00:42)
🌐 Python Matplotlib. Визуализация данных на PRO уровне. ( 24:43)
🌐 Устраиваемся на работу. Решаем тестовое задание на позицию Python Junior. ( 20:28)
🌐 Уроки Golang с нуля /#29 - Дженерики/обобщения ( 10:52)
🌐 Уроки Golang с нуля /#30 - Горутины ( 08:09)
🌐 Lightning Interview "Risk and Reward: Unraveling Machine Learning for High-Risk Applications" ( 52:37)
🌐 Framework and Lessons Learned from Building a Generative AI Application - Jason Tan ( 24:08)
🌐 Generative AI for Biomedical Insights: Solutions through OpenBIOML and BIO GP - Bidyut Sarkar ( 30:40)
🌐 Как защитить телеграм бота от атак и перегрузок.

Хорошего дня!

@data_analysis_ml
11🔥3👍1🥰1
🔥 Дайджест полезных материалов из мира Data Science за неделю

Почитать:
TechArena Ireland: как готовился хакатон
Визуализация распределений вероятностей в Python.
Построение пайплайна обработки данных в реальном времени с использованием Python
Исследования возможностей нейронных сетей глубокого обучения в распознавании маскируемого трафика
Как мы создавали self-service функционал проверки качества данных для ML-моделей
Становясь Пангеей: будущее современного стека для анализа данных
Как я пришёл в дата-анализ после долгих блужданий по онлайн-курсам, маршрут со всеми тупиками и ухабами
Как оценить объем работ по миграции хранилища данных на Arenadata DB / Greenplum: методика и пример
Data Science for Beginners: 2023 - 2024 Complete Roadmap
A Beginner's Guide to Data Analytics: Understanding the Fundamentals
The Start of My Year-long Journey into AI: From Novice to Engineer
Data Science for Beginners: 2023–2024 Complete Roadmap
Data Science for Beginners: 2023 - 2024 Complete Roadmap
Data Science Roadmap.
How can Ed-tech companies adopt AI, and what ways will it help in revenue generation and in work Operations?
Matplotlib Tutorial: Let’s Take Your Country Maps to Another Level
Data Analysis with SQL
Autoscout24 SQL Analysis

Посмотреть:
🌐 Large Language Models Are Not (Necessarily) Generative Ai - Karin Verspoor, PhD ( 29:59)
🌐 Django начало работы. ( 08:18)
🌐 Популярная задача с собеседования в Яндекс #python #задача #программирование #собеседование ( 01:00)
🌐 Новые функции в IOS 17 ( 00:29)
🌐 TokenFlow редактирование видео с помощью текстового описания ( 00:22)
🌐 Парсер телеграм каналов на Python. Гайд по написанию мощного бота. ( 11:58)
🌐 Задача из Собеседования в Яндекс с зарплатой 85000 рублей #python #собеседование #задача #yandex ( 00:59)
🌐 Асинхронный парсинг сайтов на Python ( 22:06)
🌐 Evolving Trends in Prompt Engineering for LLMs with Built-in Responsible AI Practices ( 33:21)
🌐 OpenAI’s ChatGPT Has Been Supercharged! ( 06:48)
🌐 Evolving Trends in Prompt Engineering for LLMs with Built-in Responsible AI Practices ( 33:21)
🌐 OpenAI’s ChatGPT Has Been Supercharged! ( 06:48)
🌐 New AI Listened To 20,000 Hours Of Music. What Did It Learn? ( 07:33)

Хорошего дня!

@data_analysis_ml
👍12🔥74💔1
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю

Почитать:
Есть ли жизнь после Nvidia?
Откройте свое будущее: Изучите 15 бесплатных курсов IBM прямо сейчас
Перевод трактата по демонологии при помощи GPT-4 и Claude
Откройте свое будущее: Изучите 15 бесплатных курсов IBM прямо сейчас
SAGE: коррекция орфографии с помощью языковых моделей
Python, Go или… готовим сырой видеопоток с полсотни камер
Как мы используем NLP в банке
Нейронные сети для планирования движения беспилотных автомобилей
Организация GPU-вычислений для машинного обучения в компании: проблемы и трудности
Детекция дефектов дорожного покрытия без размеченных данных: Хакатон, LiDAR, RANSAC, ICP и 44 бесcонных часов
Чат GPT-4V, который видит — что он умеет
Feature engineering и кластерный анализ клиентов на PySpark
Trabaje con sus datos en tiempo real usando Langchain
BakaLLM, part 3: it's testing time, it's testing time
Enabling Language Models to Implicitly Learn Self-Improvement
Introdução ao Aprendizado de Máquina Online
Why Python is a first choice for Data scientist
Mastering Machine Learning: Your Path to Excellence with UpSkill Certifications
Data Science for Beginners: 2023-2024 Edition
Data Science for beginners, complete roadmap.
Data Science Beginner's guide.
The Ultimate Guide to Getting a Data Scientist Job in 2023 (Even If You're a Beginner)

Посмотреть:
🌐 Разбор задачи с собеседования Data Science. Подготовка на практике ( 26:12)
🌐 Cобеседование #Python топовый банк Goldman Sachs Associate на 12000 $ #задача #программирование ( 01:00)
🌐 Interview: "Large Language Model Operations: The Next Frontier in MLOps" ( 59:18)
🌐 Exploring the Generative AI Landscape: From Basics to Hands-on Applications - Raghav Bali ( 32:54)

Хорошего дня!

@data_analysis_ml
👍17🔥54
🔥 Дайджест полезных материалов из мира Data Science за неделю

Почитать:
100 вопросов для подготовки к собесу Python
Большой тест GPT4, GPT3.5, YandexGPT, GigaChat, Saiga в RAG-задаче. Часть 1
— Полный отчет Github за 2023 о состоянии проектов.
9 вопросов для собеседования по SQL в Apple
Геометрия и навигация
Разметка данных в 2023 году: текущие тренды и требования будущего
fsspec и вообще зачем оно нам нужно
Как мы переезжали с PostgreSQL на Data Lake в AWS и какие грабли собрали по пути
Расчетная архитектура платформы для A/B-тестов Mail.Ru
Automate the boring stuff with Julia
Трёхканальный ИИ
Decoding a Data Model: Using SchemaSpy in Snowflake ❄️
Quickly create a personalized data dashboard for your boss.
What Is Data Analysis and How Can You Get Started?
Explorando as Funções Específicas da Biblioteca google-cloud-storage no Google Cloud Platform
Microsoft PHI-2 + Huggine Face + Langchain = Super Tiny Chatbot
How to rank Fungible Tokens in the TON blockchain by transactions
A good resource on Algorithms!
High-level overview of AWS Glue
What is the population of that region?
Streamlined Data Processing: A Guide to Cost-Effective ELT Implementation

Посмотреть:
🌐 Mixtral 8x7B - новый ИИ. Нейросети, которые ДОМИНИРУЮТ на другими моделями ( 08:04)
🌐 100 вопросов с собеседований Python. Полный разбор реальных вопросов. ( 34:27)
🌐 💡Задача #Python:Комбинация сумм II #python #программирование #код #yotube #youtube #пито ( 00:54)
🌐 💡Крутая задача #Python: #python #программирование #код #yotube #youtube #питон ( 00:49)
🌐 ODSC Webinar | Preparing for your First Enterprise Large Language Model (LLM) Application ( 48:16)
🌐 Adversarial Validation and Training in Stock Market Price Prediction ( 28:09)
🌐 NVIDIA’s New AI Is 20x Faster…But How? ( 08:16)
🌐 Here’s How ChatGPT is Changing The World! ( 08:33)

Хорошего дня!

@data_analysis_ml
👍14🔥53🥰3
🔥 Дайджест полезных материалов из мира Data Science за неделю

Почитать:
100 вопросов для подготовки к собесу Data Science
Сколько ядер CPU можно использовать параллельно в Python?
Вот так я изучаю ML
PLC Allen Bradley подключение с помощью Python
Ortools — библиотека для решения задачи VRP
4 миллиарда операторов if
Python без типов: таким он когда-то был
Вы точно хотите быть Data Scientist-ом?
Введение в SQL & СУБД на примере доступа к данным через Python
Plotting and Data Visualization with Matplotlib
Applications of Data Science
Semantic Search Over Satellite Images Using Qdrant
Introduction to Data Science
A Comprehensive Guide: How Deepchecks Evaluate the Large Language Model
Appreciating the "Learning Problem" - Why AI will never replace your job
Best JavaScript Chart Libraries 2024: Finding the Right Fit for Your JS Applications
NumPy Arrays: An Introduction
Hungarian GP 2022 Qualifying, and see what we can
I built Hippotable for in-browser data analysis
Десять самых ярких ИИ-работ от NVIDIA Research за 2023 год

Посмотреть:
🌐 100 вопросов с собеседований Data Science — часть 1 ( 36:48)
🌐 💡 Задача: Ряд клавиатуры #Python #yotube #код #алгоритмы #программирование #собеседование #кодинг ( 00:40)
🌐 💡задача #Python: Бинарный поиск #python #программирование #код #yotube #питон #собеседование ( 00:41)
🌐 💡 Задача: Ряд клавиатуры #Python #yotube #код #алгоритмы #программирование #собеседование #кодинг ( 01:00)
🌐 Evaluating Recommendation Algorithms at Delivery Hero - Manchit Madan ( 23:01)
🌐 ODSC Webinar | Open source Data Lake Management, Curation, Governance for New & Growing Companies ( 46:07)
🌐 Stable Diffusion AI: 100 Cats Per Second…For Free! ( 08:21)

Хорошего дня!

@data_analysis_ml
16👍12🔥2
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю

Почитать:
Направо пойдёшь — тестировщиком станешь, налево пойдёшь — ˂...˃: куда податься питонисту?
5 готовых скриптов Python, которые упростят вашу жизнь 2024
Список актуальных курсов на 2024 год
Семантический поиск и генерация текста на R. Часть 1
— Где бесплатно изучать Rust в 2024
Использование машинного обучения для борьбы с DDoS атаками
Маленькая история импортозамещения о разработке системы автоматического мониторинга моделей Alfa-MRM
Как мы победили в двух хакатонах Цифрового Прорыва. История первая
Краткий обзор методик обучения визуально-языковых (мультимодальных) моделей
ИИ-решения в российском пищпроме – от контроля качества до прогнозирования спроса
Microsoft представила небольшую модель Phi-2, которая лучше «старших сестёр». Что это за проект?
SALMONN — универсальная модель для всех типов аудиоданных
Нужен ли вам fine-tuning моделей и что это такое
Авторские права на производные от ИИ
Neural Style Transfer
How should AI answer more humanly ?
Dear MLE's..
Balancing Innovation and Privacy: Navigating LLM Augmentation with RAG and RA-DIT
Leaking sensitive data via membership inference attacks on machine learning models
Machine Learning
MLOps in practice: building and deploying a machine learning app
CoinSavvy: Revolutionizing Crypto Price Predictions
Training a neural network for fun and profit
New blog journey

Посмотреть:
🌐 Топ трюк оптимизации кода #Python !!! #код #программирование #yotubeshorts #питон #youtube ( 00:54)
🌐 Building Robust and Scalable Recommendation Engines for Online Food Delivery ( 25:25)
🌐 Lightning Interview "How to Ace the Data Science Job Interview in 2024" ( 46:23)

Хорошего дня!

@data_analysis_ml
👍13🔥42
🔥 Дайджест полезных материалов из мира Data Science за неделю

Почитать:
Machine Learning инженер: что/где/как изучать, чтобы въехать
Направо пойдёшь — тестировщиком станешь, налево пойдёшь — ˂...˃: куда податься питонисту?
Инженерные данные в 21 веке
10 лучших скриптов Python для автоматизации и повышения производительности 2024 года.
Spark не для чайников: где?
OpenRefine и другие альтернативные MS Excel инструменты нормализации справочников для Экспертов НСИ
Go — 100 вопросов/заданий с собеседований
Уродливая математика в машинном обучении или чему нам стоит поучиться у деривативов?
Best Web Scraping Libraries for Spring Boot
Best Web Scraping Libraries for R
How To Parse HTML With Regex
Automatically Generating Data Exploration Code in Python With Mito
Streamlit Authentication
CanvasXpress vs. Plotly: Which Data Visualization Library Is Better?
Working for a Data-Driven Startup Whose Value Surged 700% In Less Than One Year
Check Out GomorraSQL — A Library To Write Queries in Neapolitan
Achieving Loosely Coupling with a Math Expression Parser
Returning CSV Content From an API in Spring Boot

Посмотреть:
🌐 #Python трюк сопоставления #программирование #код #питон #yotube #собеседование #алгоритмы ( 00:59)
🌐 C# полный курс 2024. Урок 1: Загрузка VStudio ( 03:05)
🌐 Lightning Interview "How to Ace the Data Science Job Interview in 2024" ( 46:27)
🌐 Lightning Interview "Troubleshooting Large Language Models" ( 01:00:05)
🌐 ChatGPT: 4 Game-Changing Applications! ( 07:44)
🌐 NVIDIA Is Supercharging AI Research! ( 07:39)

Хорошего дня!

@data_analysis_ml
👍156🔥3
🖥 Aiopandas - легковесный патч для Pandas, который добавляет нативную async поддержку для самых популярных методов обработки данных: map, apply, applymap, aggregate и transform.

Позволяет без проблем передавать async функции в эти методы. Библиотека автоматически запустит их асинхронно, управляя количеством одновременно выполняемых задач с помощью параметра max_parallel.

Ключевые возможности:

Простая интеграция: Используйте как замену стандартным функциям Pandas, но теперь с полноценной поддержкой async функций.
Контролируемый параллелизм: Автоматическое асинхронное выполнение ваших корутин с возможностью ограничить максимальное число параллельных задач (max_parallel). Идеально для управления нагрузкой на внешние сервисы!
Гибкая обработка ошибок: Встроенные опции для управления ошибками во время выполнения: выбросить исключение (raise), проигнорировать (ignore) или записать в лог (log).
Индикация прогресса: Встроенная поддержка tqdm для наглядного отслеживания процесса выполнения долгих операций в реальном времени.

🖥 Github: https://github.com/telekinesis-inc/aiopandas

#python #pandas #asyncio #async #datascience #программирование #обработкаданных #асинхронность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1110🔥6