⚡️ LLM Compressor
Neural Magic выпустили LLM Compressor: Новую библиотеку для сжатия LLM модели для более быстрого инференса с помощью vLLM.
▪Github
▪Blog
@data_analysis_ml
Neural Magic выпустили LLM Compressor: Новую библиотеку для сжатия LLM модели для более быстрого инференса с помощью vLLM.
pip install llmcompressor
▪Github
▪Blog
@data_analysis_ml
👍19❤4🔥4
✍ LongWriter с открытым исходным кодом: позволяет генерировать более 10 000 слов из Long Context Lms
Это один из самых мощных LLM с поддержкой long context, который я когда-либо использовал.
Я в восторге)
Самое главное - открытый исходный код.
▪ Github
@data_analysis_ml
Это один из самых мощных LLM с поддержкой long context, который я когда-либо использовал.
Я в восторге)
Самое главное - открытый исходный код.
▪ Github
@data_analysis_ml
👍11❤8🔥3
Forwarded from Искусственный интеллект. Высокие технологии
This media is not supported in your browser
VIEW IN TELEGRAM
🤗 Hugging Face выпустили пошаговый гайд по созданию и обучению своей личной робо-руки.
Компания Hugging Face опубликовала подробную инструкцию по созданию и обучению роботизированной руки.
В ней подробно рассказывается, где приобрести необходимые компоненты, как настроить нейронную сеть, а также приведены лекции, иллюстрирующие процесс сборки.
Крутой бесплатный курс - рекомендуем)
@vistehno
Компания Hugging Face опубликовала подробную инструкцию по созданию и обучению роботизированной руки.
В ней подробно рассказывается, где приобрести необходимые компоненты, как настроить нейронную сеть, а также приведены лекции, иллюстрирующие процесс сборки.
Крутой бесплатный курс - рекомендуем)
@vistehno
👍13❤7🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Flux Schnell в новом Diffusion Kit с MLX работает на 30% быстрее и использует меньше оперативной памяaти!
На моем ноутбуке M1 max объемом 32 ГБ я создаю высококачественные изображения меньше чем за минуту:
▪ Github
@data_analysis_ml
pip install -U diffusionkit
На моем ноутбуке M1 max объемом 32 ГБ я создаю высококачественные изображения меньше чем за минуту:
▪ Github
@data_analysis_ml
👍10❤8🔥4
Представлены модели:
Phi-3.5-mini-instruct: 3.82B параметров, 128K контекст, улучшено понимание кода, математические операции, на 5 пунктов подросло знание русского языка (по бенчмарку Multilangual MMLU):
Phi-3.5-vision-instruct: 4.15B параметров, 128К контекст, улучшено описание графиков и таблиц, суммаризация по нескольким изображениям и видео, классификация художественных стилей по изображению:
Phi-3.5-MoE-instruct: 16x3.8B параметров, 6.6B активных параметров при использовании 2 агентов, 128К контекст, актуальность датасета обучения - октябрь 2023:
@data_analysis_ml
#AI #Phi #LLM #ML #Microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤5🔥5
Как вы помните, AuraFlow — это крупнейшая открытая text-to-image модель.
AuraFlow v0.2 была обучена с использованием большего количества вычислительных ресурсов по сравнению с предыдущей версией, AuraFlow v0.1.
AuraFlow v0.2 показывает передовые результаты на GenEval;
на данный момент модель находится в бета-версии.
🤗 Hugging Face
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤7🔥2
💾 LLM Datasets
В нем есть множество высококачественных наборов данных и инструментов для тонкой настройки, очистки, генерации и исследования данных.
Я молча поддерживал его в течение последних месяцев. Особая благодарность geronimi73, Bytes-Explorer и eclipse за их поддержку.
▪Githib
@data_analysis_ml
В нем есть множество высококачественных наборов данных и инструментов для тонкой настройки, очистки, генерации и исследования данных.
Я молча поддерживал его в течение последних месяцев. Особая благодарность geronimi73, Bytes-Explorer и eclipse за их поддержку.
▪Githib
@data_analysis_ml
👍18❤9🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
🦧 Sapiens: новая SOTA ViTs для задач CV, связанных с обнаружением людей 🦧
Sapiens - семейство моделей для задач CV: оценки 2D-позы, сегментации частей тела, оценки глубины.
Модели поддерживают вывод данных в 1K hi-res. и очень легко адаптируются под конкретные задачи путем простого файнтюнига.
Модель предварительно обучена на более чем 300 миллионах изображений человека в естественных условиях. 💙
▪ HF: huggingface.co/papers/2408.12569
▪ Paper https://arxiv.org/pdf/2408.12569
@data_analysis_ml
Sapiens - семейство моделей для задач CV: оценки 2D-позы, сегментации частей тела, оценки глубины.
Модели поддерживают вывод данных в 1K hi-res. и очень легко адаптируются под конкретные задачи путем простого файнтюнига.
Модель предварительно обучена на более чем 300 миллионах изображений человека в естественных условиях. 💙
▪ HF: huggingface.co/papers/2408.12569
▪ Paper https://arxiv.org/pdf/2408.12569
@data_analysis_ml
❤14👍9🔥5
Разработчик и автор корпоративного code со-pilot Toqan и FinBERT pfgecnbk запустил публичный Leaderbord бенчмарка ProLLM, в котором языковые модели открытого и закрытого типа тестируются на выполнения различных задач в области программирования:
Помимо узкоспециализированных тестов, бенчмарк выполняет несколько общих тестов: Q&A Assistant, Summarization и LLM as a Judge.
На сегодняшний день возможность самостоятельного тестирования моделей этим бенчмарком не реализована, но разработчики открыты для диалога в вопросе корпоративного применения своей системы оценки, с ними можно связаться через форму на сайте.
Toqan ProLLM Leaderboard
@data_analysis_ml
#AI #LLM #ML #Benchmark
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤6🔥2🥱1🍌1
Здесь представлено буквально всё: от церковных колоколов до ChatGPT.
Залипнуть на этом интерактивном ресурсе в отличном качестве можно здесь: https://calculatingempires.net/
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19👍11🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
✨Проект: https://ys-imtech.github.io/projects/LayerPano3D/
✨Статья: https://arxiv.org/abs/2408.13252
✨Код: https://github.com/YS-IMTech/LayerPano3D
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤6🔥1🤯1
⚡️ Lazy Predict
Дата Саентисты обычно тратят много времени на тестирование множества моделей.
Lazy Predict позволяет быстро создавать прототипы и сравнивать несколько базовых моделей без написания большого количества кода или сложной настройки моделей.
▪Github
@data_analysis_ml
Дата Саентисты обычно тратят много времени на тестирование множества моделей.
Lazy Predict позволяет быстро создавать прототипы и сравнивать несколько базовых моделей без написания большого количества кода или сложной настройки моделей.
pip install lazypredict
▪Github
@data_analysis_ml
👍29❤11🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 Diffusion Models Are Real-Time Game Engines
Google представляет GameNGen, первый игровой движо в Stable Diffusion, который позволяет взаимодействовать со сложным окружением в реальном времени с высоким качеством.
GameNGen может интерактивно моделировать классическую игру DOOM со скоростью более 20 кадров в секунду на одном TPU.
Предсказание следующего кадра достигает PSNR 29,4,
На тестах дюди почти не отличают короткие ролики игры от роликов симуляции.
GameNGen обучается в два этапа: (1) RL-агент учится играть в игру, и тренировочные сессии записываются, и (2) диффузионная модель обучается выдавать следующий кадр, основываясь на последовательности прошлых кадров и действий.
▪ статья: https://arxiv.org/abs/2408.14837
▪ страница проекта: https://gamengen.github.io
Google представляет GameNGen, первый игровой движо в Stable Diffusion, который позволяет взаимодействовать со сложным окружением в реальном времени с высоким качеством.
GameNGen может интерактивно моделировать классическую игру DOOM со скоростью более 20 кадров в секунду на одном TPU.
Предсказание следующего кадра достигает PSNR 29,4,
На тестах дюди почти не отличают короткие ролики игры от роликов симуляции.
GameNGen обучается в два этапа: (1) RL-агент учится играть в игру, и тренировочные сессии записываются, и (2) диффузионная модель обучается выдавать следующий кадр, основываясь на последовательности прошлых кадров и действий.
▪ статья: https://arxiv.org/abs/2408.14837
▪ страница проекта: https://gamengen.github.io
❤13🔥7👍3🌚2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Diffusers 0.30 это 🔥
Модели видео: CogVideoX-5B и Latte. Также SparseCtrl и FreeNoise для расширения/ управления
Модели для генерации изображений: Flux, Aura Flow, Kolors, Lumina
Также стабильный звук
Наведение на нарушенное внимание
https://github.com/huggingface/diffusers/releases
@data_analysis_ml
Модели видео: CogVideoX-5B и Latte. Также SparseCtrl и FreeNoise для расширения/ управления
Модели для генерации изображений: Flux, Aura Flow, Kolors, Lumina
Также стабильный звук
Наведение на нарушенное внимание
https://github.com/huggingface/diffusers/releases
@data_analysis_ml
👍6❤4🔥1
Eagle - это семейство MLLM высокого разрешения, построенное на LLaVA. В обновленном до версии X5 наборе представлено 3 модели:
Архитектура Eagle-X5:
Обучение модели Eagle-X5 проходит в три этапа:
Eagle показывает высокие результаты в мультимодальных бенчмарках LLM, особенно в задачах, чувствительных к разрешению - OCR и понимание документов.
Установка и запуск с GradioUI:
# Clone repository
git clone https://github.com/NVlabs/EAGLE.git
cd Eagle
# Create venv and install requirements
conda create -n eagle python=3.10 -y
conda activate eagle
pip install --upgrade pip # enable PEP 660 support
pip install requirements
# Run Gradio
python gradio_demo.py --model-path ${MODEL_CKPT} --conv-mode vicuna_v1
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍6❤5⚡1