Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.24K photos
111 videos
64 files
4.65K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🔥 Hugging Face курс по практическому изучению агентов

На курсе обещают:

🔹 Теорию — разберут, что такое агенты, какие они бывают и как обучить LLM взаимодействовать с окружающей средой.

🔹 Практику — научат создавать агентов для реальных задач: от автоматизации SQL-запросов до генерации кода и анализа документов.

Запись открыта для всех — зарегистрироваться можно здесь.
👍51
Полный Roadmap по Machine Learning

Если хотите освоить Machine Learning, вот дорожная карта с основными этапами!
😢13👍11😁71🌚1
👍 Кодирование Хаффмана для сжатия данных без потерь

В эпоху быстрорастущих объемов данных эффективные методы сжатия стали необходимостью. Кодирование Хаффмана — это мощный алгоритм жадного сжатия без потерь, широко используемый в различных приложениях.

📌 Детальная статья с реализацией алгоритма
👍81
🔢 Основы квантизации весов

Квантизация весов — это процесс преобразования высокоточных весов нейросети (обычно 32-битных чисел с плавающей запятой) в низкоточные представления (чаще всего 8-битные целые числа).

Это позволяет значительно уменьшить размер модели и снизить потребление памяти, сохраняя при этом высокую производительность.
Главная сложность — сохранить точность модели, несмотря на снижение разрядности чисел.

Более подробно в статье: https://clc.to/-rZwSA
👍62👏2
Привет! Мы собираем данные о том, какие методы биохакинга действительно помогают разрабам улучшить качество жизни и повысить продуктивность.

Поделитесь своим опытом — это поможет другим сделать осознанный выбор в мире биохакинга.
4
🔍 4 метода тестирования ML-моделей в продакшене

Наглядная схема с основными стратегиями проверки ML-моделей в боевых условиях.

▪️ A/B тестирование — распределение запросов между старой и новой моделью.
▪️ Canary тестирование — постепенный запуск новой модели для небольшого числа пользователей.
▪️ Перемешанное тестирование — комбинирование предсказаний обеих моделей, например, в рекомендациях.
▪️ Shadow тестирование — тестирование модели без влияния на пользователей, с логированием результатов.
6👏2🤩2
👀 Альтернативный взгляд на нейросети: без матриц, но с высокой скоростью

Сегодня никого не удивить ещё одной нейросетью на Python, работающей через вычисления над матрицами.

А что, если реализовать нейросеть без матриц? И не на Python, а на Java.

Звучит необычно? Делимся подробностями: https://clc.to/WTJlfw
👍31