Технозаметки Малышева

Alibaba выпускает ClearerVoice-Studio: Open-Source фреймворк для обработки звука

Alibaba Speech Lab представили набор инструментов с открытым кодом для обработки речи.
Система интегрирует SOTA-модели для шумоподавления, разделения голосов и выделения целевого спикера.
В основе лежат технологии FRCRN и MossFormer.

Фреймворк включает компоненты для обработки, обучения и оценки качества речи с поддержкой до 48кГц.

Проект доступен на GitHub и в Hugging Face и идет в наборе с готовыми предобученными моделями.

Теперь даже домашний подкаст можно записывать в студийном качестве. Шах и мат, звукорежиссеры! 🎙

#Alibaba #ClearerVoice #MossFormer #Китай
-------
@tsingular

749 viewsedited 08:16

About

Blog

Apps

Platform