Universal-1: прорыв в распознавании речи от AssemblyAI
Universal-1 обучена на 12,5 миллионах часов многоязычных аудиоданных и обеспечивает высокую точность на английском, испанском, французском и немецком.
Среди особенностей: Скорость! 1 час распознаёт за 21 секунду за счёт параллельной обработки порций запииси, 600М параметров, точные временные метки слов.
Использует Google Cloud TPUs и JAX framework для тренировок.
Модель почти не "галлюцинирует" и на 25,5% точнее Whisper Large-v3.
Улучшена идентификация говорящих и распознавание в многоязычной среде.
Доступ к модели открыт через API.
#AssemblyAI #Universal1 #SpeechRecognition
-------
@tsingular
Universal-1 обучена на 12,5 миллионах часов многоязычных аудиоданных и обеспечивает высокую точность на английском, испанском, французском и немецком.
Среди особенностей: Скорость! 1 час распознаёт за 21 секунду за счёт параллельной обработки порций запииси, 600М параметров, точные временные метки слов.
Использует Google Cloud TPUs и JAX framework для тренировок.
Модель почти не "галлюцинирует" и на 25,5% точнее Whisper Large-v3.
Улучшена идентификация говорящих и распознавание в многоязычной среде.
Доступ к модели открыт через API.
#AssemblyAI #Universal1 #SpeechRecognition
-------
@tsingular