Проработав несколько лет в команде, задачей которой стояла квантизация моделей для умных колонок, автор решил поделиться знаниями и рассказать, зачем нужна квантизация, в какой момент лучше всего квантизовать модель, а также рассмотреть разные типы данных и современные методы квантизации.
Статья о том, как можно сэкономить ресурсы на устройствах, заставить модели работать быстрее, а значит, экономить деньги и улучшить пользовательский опыт.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤3🥰1
🔥 HPT 🔥 - новое семейство открытых мультимодальных LLM от Hypergain.
HPT (Hyper-Pretrained Transformer) демонстрирует мощные возможности в нескольких мультимодальных тестах.
▪Github: https://github.com/hyperGAI/HPT
▪HuggingFace: https://huggingface.co/HyperGAI/HPT
▪Project: https://hypergai.com/blog/introducing-hpt-a-family-of-leading-multimodal-llms
@data_analysis_ml
HPT (Hyper-Pretrained Transformer) демонстрирует мощные возможности в нескольких мультимодальных тестах.
▪Github: https://github.com/hyperGAI/HPT
▪HuggingFace: https://huggingface.co/HyperGAI/HPT
▪Project: https://hypergai.com/blog/introducing-hpt-a-family-of-leading-multimodal-llms
@data_analysis_ml
👍9🔥2❤1🥰1
Здесь супер доступно и понятно описываются основные темы Машинного обучения, уж теперь то станет понятно абсолютно всё
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤11🎉3🤨1
— Очистить и обработать данные. Например, для обработки массива информации о популярности разных товаров на R можно написать программу, которая сгруппирует данные о покупках по товарам, удалит дубли и подготовит таблицу для дальнейшей аналитики.
— Провести статистический тест. Посчитать среднюю продолжительность и увидеть, есть ли статистически значимая разница между несколькими показателями.
— Объединять данные из разных таблиц. Взять таблицы разных форматов, собрать из них данные и обрабатывать все как единый файл.
— Отрисовать интерактивный график. Распределить данные, отрегулировать параметры.
— Анализировать регрессионные модели. Выявить отношения между переменными — например, как доход магазина зависит от разных факторов.
— Провести другую математическую операцию. Объединить многомерные массивы, спрогнозировать величину, распознать текст. Для большинства задач есть готовые библиотеки, либо можно написать собственный код, используя широкий математический инструментарий.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤4🔥2🥰1🤨1
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20👍11🔥3
Torch Tune - это встроенная библиотека Pytorch, позволяющая легко создавать, настраивать и экспериментировать с LLMS.
git clone https://github.com/pytorch/torchtune.git
cd torchtune
pip install -e .
▪Github
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤3🥰3
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍4🥰1
Forwarded from Machinelearning
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33❤6🔥6🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 AnyV2V: новый фреймворк Plug-and-Play для любых задач редактирования видео.
- Сайт: https://tiger-ai-lab.github.io/AnyV2V/
- Код: https://github.com/TIGER-AI-Lab/AnyV2V
- arXiv: https://arxiv.org/abs/2403.14468
- Huggingface: https://huggingface.co/papers/2403.14468
@data_analysis_ml
- Сайт: https://tiger-ai-lab.github.io/AnyV2V/
- Код: https://github.com/TIGER-AI-Lab/AnyV2V
- arXiv: https://arxiv.org/abs/2403.14468
- Huggingface: https://huggingface.co/papers/2403.14468
@data_analysis_ml
👍11❤3🔥2🥰2
🛠 Dataverse
Простое, стандартизированное и удобное в использовании решение для обработки данных и управления ими, для специалистов по обработке данных, аналитиков и разработчиков в эпоху LLM.
Даже если вы мало что знаете о Spark, вы можете легко использовать его через dataverse.
▪с Dataverse вы получаете возможность
использовать множество функций предварительной обработки данных без необходимости установки различных библиотек.
▪позволяет генерировать данные для анализа и обучения больших языковых моделей (LM).
▪ вы можете с легкостью использовать Spark, независимо от вашего уровня знаний.
▪ инструмент упрощает совместную работу пользователей с различным уровнем владения Spark.
⚙️ Github
@data_analysis_ml
Простое, стандартизированное и удобное в использовании решение для обработки данных и управления ими, для специалистов по обработке данных, аналитиков и разработчиков в эпоху LLM.
Даже если вы мало что знаете о Spark, вы можете легко использовать его через dataverse.
▪с Dataverse вы получаете возможность
использовать множество функций предварительной обработки данных без необходимости установки различных библиотек.
▪позволяет генерировать данные для анализа и обучения больших языковых моделей (LM).
▪ вы можете с легкостью использовать Spark, независимо от вашего уровня знаний.
▪ инструмент упрощает совместную работу пользователей с различным уровнем владения Spark.
pip install dataverse
⚙️ Github
@data_analysis_ml
👍10❤4🥰1
Жизненный цикл модели в Data Science — это многоэтапный процесс, в течении которого исследователи, инженеры и разработчики обучают, разрабатывают и обслуживают модель машинного обучения.
Разработка модели принципиально отличается от традиционной разработки и требует своего собственного уникального способа разработки. Скажем, модель машинного обучения — это приложение искусственного интеллекта (ИИ), которое дает возможность автоматически учиться и совершенствоваться на основе собственного опыта без явного участия человека.
Основная цель модели заключается в том, чтобы компания смогла использовать преимущества алгоритмов искусственного интеллекта и машинного обучения для получения дополнительных конкурентных преимуществ.
Основные этапы:
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🥰4❤2⚡2
🕐Pendulum
Хотя встроенный пакет datetime достаточно хорош для простых случаев работы с датами, он не подходит для комплексных задач.
Pendulum предлагает более интуитивно понятный и удобный для пользователя API для работы с датами и временем, это делает его удобной заменой стандартного класса datetime.
▪ Github
@data_analysis_ml
Хотя встроенный пакет datetime достаточно хорош для простых случаев работы с датами, он не подходит для комплексных задач.
Pendulum предлагает более интуитивно понятный и удобный для пользователя API для работы с датами и временем, это делает его удобной заменой стандартного класса datetime.
▪ Github
@data_analysis_ml
❤17👍8🥰5
Держите полезную статью)
LDA — алгоритм классификации и понижения размерности, позволяющий производить разделение классов наилучшим образом. Основная идея LDA заключается в предположении о многомерном нормальном распределении признаков внутри классов и поиске их линейного преобразования, которое максимизирует межклассовую дисперсию и минимизирует внутриклассовую.
Некоторые мысли из статьи:
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🥰3❤2❤🔥1