This media is not supported in your browser
VIEW IN TELEGRAM
💃 MagicDance: Realistic Human Dance
Video Generation with Motions & Facial Expressions Transfer
MagicDance - новый эффективный подход к созданию реалистичных видео с движением человека. Инструмент позволяет передавать движения и выражения лица без файнтюнинга, обеспечивая высокое качество генерации🕺.
▪page: https://boese0601.github.io/magicdance/
▪paper: https://arxiv.org/abs/2311.12052
▪code: https://github.com/Boese0601/MagicDance
▪jupyter: https://github.com/camenduru/MagicDance-jupyter
ai_machinelearning_big_data
Video Generation with Motions & Facial Expressions Transfer
MagicDance - новый эффективный подход к созданию реалистичных видео с движением человека. Инструмент позволяет передавать движения и выражения лица без файнтюнинга, обеспечивая высокое качество генерации🕺.
▪page: https://boese0601.github.io/magicdance/
▪paper: https://arxiv.org/abs/2311.12052
▪code: https://github.com/Boese0601/MagicDance
▪jupyter: https://github.com/camenduru/MagicDance-jupyter
ai_machinelearning_big_data
🤣24👍14🔥5❤4
This media is not supported in your browser
VIEW IN TELEGRAM
🧮 OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset
OpenMathInstruct-1 - это новый синтетический датасет от
> Используются обучающие датасеты
> Для создания ланных используется
> Модель использует текстовые рассуждения + интерпретатор кода при генерации.
> Выпущены
> Лицензия Apache 2.0!
Блестящая работа команды Nvidia AI - 2024 год станет годом синтетических данных и еще более мощных моделей! 🔥
▪Dataset: https://huggingface.co/datasets/nvidia/OpenMathInstruct-1
▪Paper: https://huggingface.co/papers/2402.10176
ai_machinelearning_big_data
OpenMathInstruct-1 - это новый синтетический датасет от
NVIDIA
для настройки математических моделей, содержащий 1,8 млн пар "задача-решение".> Используются обучающие датасеты
GSM8K
и MATH
.> Для создания ланных используется
Mixtral 8x7B.
> Модель использует текстовые рассуждения + интерпретатор кода при генерации.
> Выпущены
LLama, CodeLlama, Mistral, Mixtral fine-tunes
.> Лицензия Apache 2.0!
Блестящая работа команды Nvidia AI - 2024 год станет годом синтетических данных и еще более мощных моделей! 🔥
▪Dataset: https://huggingface.co/datasets/nvidia/OpenMathInstruct-1
▪Paper: https://huggingface.co/papers/2402.10176
ai_machinelearning_big_data
👍28🔥15❤10
This media is not supported in your browser
VIEW IN TELEGRAM
🦾 Learning to Learn Faster from Human Feedback with Language Model Predictive Control
Новый фреймворк от
▪proj: https://robot-teaching.github.io
▪paper: https://arxiv.org/abs/2402.11450
▪code: https://colab.research.google.com/drive/1YcRN_kklw3cVVJNvgK_IEV6nDce9EJWK
ai_machinelearning_big_data
Новый фреймворк от
Google DeepMind
для, управленияя роботомами, с помощью ествественного языка. ▪proj: https://robot-teaching.github.io
▪paper: https://arxiv.org/abs/2402.11450
▪code: https://colab.research.google.com/drive/1YcRN_kklw3cVVJNvgK_IEV6nDce9EJWK
ai_machinelearning_big_data
👍28🔥10❤6
🔝 ByteDance presents SDXL-Lightning: a lightning fast 1024px text-to-image generation model
SDXL-Lightning - это молниеносная генеративная модель преобразования текста в изображение. Она позволяет генерировать высококачественные изображения размером 1024px за несколько шагов.
▪HF: https://huggingface.co/ByteDance/SDXL-Lightning
ai_machinelearning_big_data
SDXL-Lightning - это молниеносная генеративная модель преобразования текста в изображение. Она позволяет генерировать высококачественные изображения размером 1024px за несколько шагов.
▪HF: https://huggingface.co/ByteDance/SDXL-Lightning
ai_machinelearning_big_data
👍27❤10🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
💫 Gemini великолепно анализирует входные данные и работает с ними.
Нейросети скормили видео с записью экрана по поиску квартиры на сайте Zillow. ИИ смог сгенерировать Selenium-код для автоматизации этой задачи и пошагово описал все, что делал.
Вот, что выдал Gemini, посмотрев видео по поиску квартиры:
"This code will open a Chrome browser, navigate to Zillow, enter "Cupertino, CA" in the search bar, click on the "For Rent" tab, set the price range to "Up to $3K", set the number of bedrooms to "2+", select the "Apartments/Condos/Co-ops" checkbox, click on the "Apply" button, wait for the results to load, print the results, and close the browser."
Посмотрите видео!
•Gemini
•Gemma opensource на основе Gemini.
•DeepMind Gemini 1.5 - An AI That Remembers!
ai_machinelearning_big_data
Нейросети скормили видео с записью экрана по поиску квартиры на сайте Zillow. ИИ смог сгенерировать Selenium-код для автоматизации этой задачи и пошагово описал все, что делал.
Вот, что выдал Gemini, посмотрев видео по поиску квартиры:
"This code will open a Chrome browser, navigate to Zillow, enter "Cupertino, CA" in the search bar, click on the "For Rent" tab, set the price range to "Up to $3K", set the number of bedrooms to "2+", select the "Apartments/Condos/Co-ops" checkbox, click on the "Apply" button, wait for the results to load, print the results, and close the browser."
Посмотрите видео!
•Gemini
•Gemma opensource на основе Gemini.
•DeepMind Gemini 1.5 - An AI That Remembers!
ai_machinelearning_big_data
❤38👍19🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SOTA🚀 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
🎉 Вышел YOLOv9 🎉
Новый SOTA для обнаружения объектов в реальном времени.
• Github
• Paper
• Hugging face
ai_machinelearning_big_data
🎉 Вышел YOLOv9 🎉
Новый SOTA для обнаружения объектов в реальном времени.
• Github
• Paper
• Hugging face
ai_machinelearning_big_data
👍56🔥13😁5❤4🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 NVIDIA AI Foundation Models
Вы можете тестировать модели с открытым исходным кодом, используя NVIDIAAI.
Взаимодействуйте с новейшими современными API моделей ИИ, оптимизированными на базе ускоренных вычислений NVIDIA, прямо из браузера.
https://catalog.ngc.nvidia.com/ai-foundation-models
ai_machinelearning_big_data
Вы можете тестировать модели с открытым исходным кодом, используя NVIDIAAI.
Взаимодействуйте с новейшими современными API моделей ИИ, оптимизированными на базе ускоренных вычислений NVIDIA, прямо из браузера.
Gemma 7B, Llama 2 70B, Kosmos-2, Mixtral 8x7B Instruct, Stable Diffusion X
L и многое другое 🥳 https://catalog.ngc.nvidia.com/ai-foundation-models
ai_machinelearning_big_data
👍40🔥13❤6
🎓 Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot.
Multi-HMR - это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет
▪Github
▪Paper
▪Dataset
ai_machinelearning_big_data
Multi-HMR - это простая, но эффективная модель , которая принимает на вход RGB-изображение и выполняет
3D-реконструкцию
нескольких людей в пространстве.▪Github
▪Paper
▪Dataset
ai_machinelearning_big_data
🔥23👍12❤6🍌4
This media is not supported in your browser
VIEW IN TELEGRAM
🩳 👚 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on 👖
Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.
▪Github: https://github.com/levihsu/OOTDiffusion
▪Demo: https://ootd.ibot.cn
▪Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter
ai_machinelearning_big_data
Мощная модель латентной диффузии для контролируемой виртуальныой примерочной.
▪Github: https://github.com/levihsu/OOTDiffusion
▪Demo: https://ootd.ibot.cn
▪Jupyter: https://github.com/camenduru/OOTDiffusion-jupyter
ai_machinelearning_big_data
🔥37👍25❤5🍌2
Media is too big
VIEW IN TELEGRAM
🔥 Новый бесплатный курс: Prompt Engineering with Llama 2 от Andrew YNg and и DeepLearning.AI
Llama 2 стала очень важной моделью для всего мира ИИ.
Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.
▪Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.
▪Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.
▪Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например
В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.
📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2
ai_machinelearning_big_data
Llama 2 стала очень важной моделью для всего мира ИИ.
Llama - это не одна модель, а целая коллекция моделей. В этом курсе вы узнаете: - Узнаете о различиях между разными видами Llama 2 и о том, когда следует использовать каждый из них.
▪Вы также узнаете, как работают теги промпты для Llama, - как они могут помочь вам в повседневных задачах.
▪Научитесь использовть продвинутые промпты, например, промпты в виде нескольких скриншотов для классификации или промпты в виде цепочки мыслей для решения логических задач.
▪Научитесь использовть специализированные модели из коллекции Llama для решения конкретных задач, например
Code Llama,
помогающую писать, анализировать и улучшать код, и Llama Guard
, которая проверяет промпты и ответы моделей на наличие вредоносного содержимого. В курсе также рассказывается о том, как запустить Llama 2 локально на собственном компьютере.
📌 https://deeplearning.ai/short-courses/prompt-engineering-with-llama-2
ai_machinelearning_big_data
👍30🔥8❤6🍌2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ 7 самых важных релизов недели из мира ИИ:
Это была важная неделя для мира ИИ: анонсы от
1. Исследователи Alibaba представили EMO - ИИ, который качетсвенно анимирует статическое изображение человека с синхронизацей движения губ и лица.
2. Компания Lightricks представила LTX Studio - студию для создания фильмов с помощью ИИ.
Новинка позволяет креативщикам автоматически генерировать сценарии, редактируемые раскадровки и короткие видеоклипы.
Создание видео с помощью искусственного интеллекта становится все более продвинутым с каждым днем.
3. Компания Ideogram выпустила новую версию своей модели преобразования текста в изображение.
В первую очередь, это невероятная детализация текста, сгенерированного искусственным интеллектом и новая функция
4. Apple незаметно анонсировала ИИ обновления для iOS.
Судя по тому, как продвигаются исследования в области ИИ, скоро мы увидим крупное обновление ИИ для Siri.
Возможно, это будет следующий "ChatGPT" от Apple.
5. Компания Klarna только что опубликовала блог, в котором говорится, что с помощью искусственного интеллекта они заменят 700 сотрудников службы поддержки клиентов.
Сумасшедшая статистика:
- За последний месяц чатбот обработал 2,3 млн разговоров.
- Среднее время решения проблемы сократилось на 9 минут
- 40 млн долларов дополнительной прибыли в 2024 году
6. Adobe выпустила Project Music GenAI Control.
Этот инструмент, названный "музыкальным фотошопом", позволяет легко генерировать и редактировать аудио с помощью искусственного интеллекта, позволяя авторам создавать собственные музыкальные треки с помощью текстовых промптов.
7. Компания Pika Labs представила новую функцию синхронизации губ в своем генераторе видео с искусственным интеллектом.
Новая технология позволяет создавать крайне реалистичноные анимации на базе ElevenLabs.
ai_machinelearning_big_data
Это была важная неделя для мира ИИ: анонсы от
Alibaba, Lightricks, Ideogram, Apple, Adobe, OpenAI
и многих других.1. Исследователи Alibaba представили EMO - ИИ, который качетсвенно анимирует статическое изображение человека с синхронизацей движения губ и лица.
2. Компания Lightricks представила LTX Studio - студию для создания фильмов с помощью ИИ.
Новинка позволяет креативщикам автоматически генерировать сценарии, редактируемые раскадровки и короткие видеоклипы.
Создание видео с помощью искусственного интеллекта становится все более продвинутым с каждым днем.
3. Компания Ideogram выпустила новую версию своей модели преобразования текста в изображение.
В первую очередь, это невероятная детализация текста, сгенерированного искусственным интеллектом и новая функция
Magic Prompt,
кооораяп
одскажет, как их написать и получить максимально качественный результат.4. Apple незаметно анонсировала ИИ обновления для iOS.
Судя по тому, как продвигаются исследования в области ИИ, скоро мы увидим крупное обновление ИИ для Siri.
Возможно, это будет следующий "ChatGPT" от Apple.
5. Компания Klarna только что опубликовала блог, в котором говорится, что с помощью искусственного интеллекта они заменят 700 сотрудников службы поддержки клиентов.
Сумасшедшая статистика:
- За последний месяц чатбот обработал 2,3 млн разговоров.
- Среднее время решения проблемы сократилось на 9 минут
- 40 млн долларов дополнительной прибыли в 2024 году
6. Adobe выпустила Project Music GenAI Control.
Этот инструмент, названный "музыкальным фотошопом", позволяет легко генерировать и редактировать аудио с помощью искусственного интеллекта, позволяя авторам создавать собственные музыкальные треки с помощью текстовых промптов.
7. Компания Pika Labs представила новую функцию синхронизации губ в своем генераторе видео с искусственным интеллектом.
Новая технология позволяет создавать крайне реалистичноные анимации на базе ElevenLabs.
ai_machinelearning_big_data
👍35❤9🔥3🥰1😱1🍌1
🎓 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement
Самосовершенствующийся диалоговый агент, который интегрируется в операционную систему для автоматизации повседневных задач.
OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС.
Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи.
Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями.
▪Github
▪Project
▪Статья
ai_machinelearning_big_data
Самосовершенствующийся диалоговый агент, который интегрируется в операционную систему для автоматизации повседневных задач.
OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС.
Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи.
Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями.
▪Github
▪Project
▪Статья
ai_machinelearning_big_data
👍30❤5🔥2
Media is too big
VIEW IN TELEGRAM
OpenCodeInterpreter — семейство моделей с открытым исходным кодом, предназначенных для генерации, выполнения и итеративного уточнения кода.
OpenCodeInterpreter, поддерживаемый Code-Feedback, набором данных, включающим 68 тыс. многошаговых взаимодействий, объединяет выполнение и обратную связь с человеком для уточнения кода.
Оценка OpenCodeInterpreter в таких тестах, как HumanEval, MBPP показывает его исключительную производительность с точностью 83,2 (76,4) в среднем (и в плюс версии), что близко к точности GPT-4 — 84,2 (76,2).
При этом точность может быть повышена до 91,6 (84,6).
🔗 Описание и сами модели OpenCodeInterpreter
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥5❤3🤔1🤣1