Machinelearning

💃 MagicDance: Realistic Human Dance
Video Generation with Motions & Facial Expressions Transfer

MagicDance - новый эффективный подход к созданию реалистичных видео с движением человека. Инструмент позволяет передавать движения и выражения лица без файнтюнинга, обеспечивая высокое качество генерации🕺.

▪page: https://boese0601.github.io/magicdance/
▪paper: https://arxiv.org/abs/2311.12052
▪code: https://github.com/Boese0601/MagicDance
▪jupyter: https://github.com/camenduru/MagicDance-jupyter

ai_machinelearning_big_data

🤣24👍14🔥5❤4

13.2K views14:19

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🧮 OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset

OpenMathInstruct-1 - это новый синтетический датасет от NVIDIA для настройки математических моделей, содержащий 1,8 млн пар "задача-решение".

> Используются обучающие датасеты GSM8K и MATH.
> Для создания ланных используется Mixtral 8x7B.
> Модель использует текстовые рассуждения + интерпретатор кода при генерации.
> Выпущены LLama, CodeLlama, Mistral, Mixtral fine-tunes.
> Лицензия Apache 2.0!

Блестящая работа команды Nvidia AI - 2024 год станет годом синтетических данных и еще более мощных моделей! 🔥

▪Dataset: https://huggingface.co/datasets/nvidia/OpenMathInstruct-1

▪Paper: https://huggingface.co/papers/2402.10176

ai_machinelearning_big_data

👍28🔥15❤10

18.2K viewsedited 08:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🦾 Learning to Learn Faster from Human Feedback with Language Model Predictive Control

Новый фреймворк от Google DeepMind для, управленияя роботомами, с помощью ествественного языка.

▪proj: https://robot-teaching.github.io
▪paper: https://arxiv.org/abs/2402.11450
▪code: https://colab.research.google.com/drive/1YcRN_kklw3cVVJNvgK_IEV6nDce9EJWK

ai_machinelearning_big_data

👍28🔥10❤6

13.5K views09:01

Machinelearning

🔝 ByteDance presents SDXL-Lightning: a lightning fast 1024px text-to-image generation model

SDXL-Lightning - это молниеносная генеративная модель преобразования текста в изображение. Она позволяет генерировать высококачественные изображения размером 1024px за несколько шагов.

▪HF: https://huggingface.co/ByteDance/SDXL-Lightning

ai_machinelearning_big_data

👍27❤10🔥7

14.1K views10:16

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

💫 Gemini великолепно анализирует входные данные и работает с ними.

Нейросети скормили видео с записью экрана по поиску квартиры на сайте Zillow. ИИ смог сгенерировать Selenium-код для автоматизации этой задачи и пошагово описал все, что делал.

Вот, что выдал Gemini, посмотрев видео по поиску квартиры:

"This code will open a Chrome browser, navigate to Zillow, enter "Cupertino, CA" in the search bar, click on the "For Rent" tab, set the price range to "Up to $3K", set the number of bedrooms to "2+", select the "Apartments/Condos/Co-ops" checkbox, click on the "Apply" button, wait for the results to load, print the results, and close the browser."

Посмотрите видео!

•Gemini
•Gemma opensource на основе Gemini.
•DeepMind Gemini 1.5 - An AI That Remembers!

ai_machinelearning_big_data

❤38👍19🔥14

16.8K viewsedited 11:05

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

SOTA🚀 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

🎉 Вышел YOLOv9 🎉

Новый SOTA для обнаружения объектов в реальном времени.

• Github
• Paper
• Hugging face

ai_machinelearning_big_data

👍56🔥13😁5❤4🍌1

16K views07:24

Machinelearning

1:45

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 NVIDIA AI Foundation Models

Вы можете тестировать модели с открытым исходным кодом, используя NVIDIAAI.

Взаимодействуйте с новейшими современными API моделей ИИ, оптимизированными на базе ускоренных вычислений NVIDIA, прямо из браузера.

Gemma 7B, Llama 2 70B, Kosmos-2, Mixtral 8x7B Instruct, Stable Diffusion XL и многое другое 🥳

https://catalog.ngc.nvidia.com/ai-foundation-models

ai_machinelearning_big_data

👍40🔥13❤6

18.9K views08:26

Machinelearning

🎓 Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot.

Multi-HMR - это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет 3D-реконструкцию нескольких людей в пространстве.

▪Github
▪Paper
▪Dataset

ai_machinelearning_big_data

🔥23👍12❤6🍌4

13.4K views15:03

Machinelearning

1:53

This media is not supported in your browser

VIEW IN TELEGRAM

🩳 👚 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on 👖

Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.

▪Github: https://github.com/levihsu/OOTDiffusion
▪Demo: https://ootd.ibot.cn
▪Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter

ai_machinelearning_big_data

🔥37👍25❤5🍌2

14.1K viewsedited 15:35

🔥 Новый бесплатный курс: Prompt Engineering with Llama 2 от Andrew YNg and и DeepLearning.AI

Llama 2 стала очень важной моделью для всего мира ИИ.

Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.

▪Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.

▪Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.

▪Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например Code Llama, помогающую писать, анализировать и улучшать код, и Llama Guard, которая проверяет промпты и ответы моделей на наличие вредоносного содержимого.

В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.

📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2

ai_machinelearning_big_data

👍30🔥8❤6🍌2😁1

12.3K viewsedited 09:02

Machinelearning