В процессе используются библиотеки Pandas, Matplotlib, Numpy, Streamlit.
Параллельно затрагивается много важных аспектов, например, чтение данных из Excel, даже немного о работе с CSS.
Обсуждаются разные аспекты, связанные с анализом данных и Data Science.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤5🥰2
Проработав несколько лет в команде, задачей которой стояла квантизация моделей для умных колонок, автор решил поделиться знаниями и рассказать, зачем нужна квантизация, в какой момент лучше всего квантизовать модель, а также рассмотреть разные типы данных и современные методы квантизации.
Статья о том, как можно сэкономить ресурсы на устройствах, заставить модели работать быстрее, а значит, экономить деньги и улучшить пользовательский опыт.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤3🥰1
🔥 HPT 🔥 - новое семейство открытых мультимодальных LLM от Hypergain.
HPT (Hyper-Pretrained Transformer) демонстрирует мощные возможности в нескольких мультимодальных тестах.
▪Github: https://github.com/hyperGAI/HPT
▪HuggingFace: https://huggingface.co/HyperGAI/HPT
▪Project: https://hypergai.com/blog/introducing-hpt-a-family-of-leading-multimodal-llms
@data_analysis_ml
HPT (Hyper-Pretrained Transformer) демонстрирует мощные возможности в нескольких мультимодальных тестах.
▪Github: https://github.com/hyperGAI/HPT
▪HuggingFace: https://huggingface.co/HyperGAI/HPT
▪Project: https://hypergai.com/blog/introducing-hpt-a-family-of-leading-multimodal-llms
@data_analysis_ml
👍9🔥2❤1🥰1
Здесь супер доступно и понятно описываются основные темы Машинного обучения, уж теперь то станет понятно абсолютно всё
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤11🎉3🤨1
— Очистить и обработать данные. Например, для обработки массива информации о популярности разных товаров на R можно написать программу, которая сгруппирует данные о покупках по товарам, удалит дубли и подготовит таблицу для дальнейшей аналитики.
— Провести статистический тест. Посчитать среднюю продолжительность и увидеть, есть ли статистически значимая разница между несколькими показателями.
— Объединять данные из разных таблиц. Взять таблицы разных форматов, собрать из них данные и обрабатывать все как единый файл.
— Отрисовать интерактивный график. Распределить данные, отрегулировать параметры.
— Анализировать регрессионные модели. Выявить отношения между переменными — например, как доход магазина зависит от разных факторов.
— Провести другую математическую операцию. Объединить многомерные массивы, спрогнозировать величину, распознать текст. Для большинства задач есть готовые библиотеки, либо можно написать собственный код, используя широкий математический инструментарий.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤4🔥2🥰1🤨1
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20👍11🔥3
Torch Tune - это встроенная библиотека Pytorch, позволяющая легко создавать, настраивать и экспериментировать с LLMS.
git clone https://github.com/pytorch/torchtune.git
cd torchtune
pip install -e .
▪Github
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤3🥰3
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍4🥰1
Forwarded from Machinelearning
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33❤6🔥6🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 AnyV2V: новый фреймворк Plug-and-Play для любых задач редактирования видео.
- Сайт: https://tiger-ai-lab.github.io/AnyV2V/
- Код: https://github.com/TIGER-AI-Lab/AnyV2V
- arXiv: https://arxiv.org/abs/2403.14468
- Huggingface: https://huggingface.co/papers/2403.14468
@data_analysis_ml
- Сайт: https://tiger-ai-lab.github.io/AnyV2V/
- Код: https://github.com/TIGER-AI-Lab/AnyV2V
- arXiv: https://arxiv.org/abs/2403.14468
- Huggingface: https://huggingface.co/papers/2403.14468
@data_analysis_ml
👍11❤3🔥2🥰2
🛠 Dataverse
Простое, стандартизированное и удобное в использовании решение для обработки данных и управления ими, для специалистов по обработке данных, аналитиков и разработчиков в эпоху LLM.
Даже если вы мало что знаете о Spark, вы можете легко использовать его через dataverse.
▪с Dataverse вы получаете возможность
использовать множество функций предварительной обработки данных без необходимости установки различных библиотек.
▪позволяет генерировать данные для анализа и обучения больших языковых моделей (LM).
▪ вы можете с легкостью использовать Spark, независимо от вашего уровня знаний.
▪ инструмент упрощает совместную работу пользователей с различным уровнем владения Spark.
⚙️ Github
@data_analysis_ml
Простое, стандартизированное и удобное в использовании решение для обработки данных и управления ими, для специалистов по обработке данных, аналитиков и разработчиков в эпоху LLM.
Даже если вы мало что знаете о Spark, вы можете легко использовать его через dataverse.
▪с Dataverse вы получаете возможность
использовать множество функций предварительной обработки данных без необходимости установки различных библиотек.
▪позволяет генерировать данные для анализа и обучения больших языковых моделей (LM).
▪ вы можете с легкостью использовать Spark, независимо от вашего уровня знаний.
▪ инструмент упрощает совместную работу пользователей с различным уровнем владения Spark.
pip install dataverse
⚙️ Github
@data_analysis_ml
👍10❤4🥰1