#ai #gen #avatar #video #photo #vasa #microsoft
Microsoft представила свою нейросеть модели VASA, которая анимирует по фото "говорящую голову" с приближенной к реалистичной мимике и движениям головы.
Можно считать её как ответ китайской Alibaba Group с их проектом EMO
Заявляется Real-time, то есть генерация в реальном времени. Нужна только фото персонажа, а далее по звуку голоса происходит "оживление" на видео. Размер 512x512 со скоростью 45 кадров в секунду в автономном режиме пакетной обработки и поддержка до 40 кадров в секунду в режиме онлайн-потоковой передачи с предшествующей задержкой всего 170 мс, оценка проводилась на настольном ПК с одним графическим процессором NVIDIA RTX 4090.
Генерацию можно контролировать, задавая эмоции, расстояние от камеры, направление взгляда и т.д.
Сейчас VASA в закрытом тестировании, позже выпустят для всех желающих.
---
Всё внимательнее нужно относиться к тому, что показывает "телик" и какие новости развешивают по соц.сетям... С учётом того, что искусственная генерация голоса уже вышла на достаточно высокий уровень достоверности — создание правдоподобных фейков становится всё проще.
📌 @tech_di
Microsoft представила свою нейросеть модели VASA, которая анимирует по фото "говорящую голову" с приближенной к реалистичной мимике и движениям головы.
Можно считать её как ответ китайской Alibaba Group с их проектом EMO
Заявляется Real-time, то есть генерация в реальном времени. Нужна только фото персонажа, а далее по звуку голоса происходит "оживление" на видео. Размер 512x512 со скоростью 45 кадров в секунду в автономном режиме пакетной обработки и поддержка до 40 кадров в секунду в режиме онлайн-потоковой передачи с предшествующей задержкой всего 170 мс, оценка проводилась на настольном ПК с одним графическим процессором NVIDIA RTX 4090.
Генерацию можно контролировать, задавая эмоции, расстояние от камеры, направление взгляда и т.д.
Сейчас VASA в закрытом тестировании, позже выпустят для всех желающих.
---
Всё внимательнее нужно относиться к тому, что показывает "телик" и какие новости развешивают по соц.сетям... С учётом того, что искусственная генерация голоса уже вышла на достаточно высокий уровень достоверности — создание правдоподобных фейков становится всё проще.
📌 @tech_di