Alibaba выпускает ClearerVoice-Studio: Open-Source фреймворк для обработки звука
Alibaba Speech Lab представили набор инструментов с открытым кодом для обработки речи.
Система интегрирует SOTA-модели для шумоподавления, разделения голосов и выделения целевого спикера.
В основе лежат технологии FRCRN и MossFormer.
Фреймворк включает компоненты для обработки, обучения и оценки качества речи с поддержкой до 48кГц.
Проект доступен на GitHub и в Hugging Face и идет в наборе с готовыми предобученными моделями.
Теперь даже домашний подкаст можно записывать в студийном качестве. Шах и мат, звукорежиссеры! 🎙
#Alibaba #ClearerVoice #MossFormer #Китай
-------
@tsingular
Alibaba Speech Lab представили набор инструментов с открытым кодом для обработки речи.
Система интегрирует SOTA-модели для шумоподавления, разделения голосов и выделения целевого спикера.
В основе лежат технологии FRCRN и MossFormer.
Фреймворк включает компоненты для обработки, обучения и оценки качества речи с поддержкой до 48кГц.
Проект доступен на GitHub и в Hugging Face и идет в наборе с готовыми предобученными моделями.
Теперь даже домашний подкаст можно записывать в студийном качестве. Шах и мат, звукорежиссеры! 🎙
#Alibaba #ClearerVoice #MossFormer #Китай
-------
@tsingular