ThinkSound — духовный наследник mmAudio — который способен генерировать звук к видео с высокой точностью.
▪ Поддерживает chain-of-thought промпты: позволяет по шагам объяснить, как должен звучать объект (например: «это металл, он падает на плитку, должно звучать звонкой эхо»)
▪ Учитывает контекст сцены, физику движения объектов, состав материалов и многое другое
▪ Работает с видео как reasoning-модель, а не просто визуально-аудиофильтр
В демках можно послушать звук шагов на песке, звон разбитого стекла, шум дождя — всё сгенерировано на лету, без записанных сэмплов.
Из минусов - сложно подобрать промпт, но когда получается, то модель выдает годноту.
@ai_machinelearning_big_data
#python #videotosound
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤85👍61🔥27👏9❤🔥2😁2😐2