Qwen3-TTS официально в релизе. Выложили в опенсорс всю линейку: VoiceDesign, CustomVoice и Base, чтобы принести реально качественный TTS в open-комьюнити.
* 5 моделей (0.6B и 1.8B)
* Свободный voice design и клонирование голоса
* Поддержка 10 языков
* SOTA 12Hz токенизатор для сильной компрессии
* Полная поддержка fine-tuning
* SOTA качество
Возможно, самый “взрывной” релиз в опенсорсном TTS на данный момент. Давайте, ломайте, тестите, собирайте что-то крутое. Уже доступно всё: веса, код и статья. Enjoy.
👉 @PythonPortal
* 5 моделей (0.6B и 1.8B)
* Свободный voice design и клонирование голоса
* Поддержка 10 языков
* SOTA 12Hz токенизатор для сильной компрессии
* Полная поддержка fine-tuning
* SOTA качество
Возможно, самый “взрывной” релиз в опенсорсном TTS на данный момент. Давайте, ломайте, тестите, собирайте что-то крутое. Уже доступно всё: веса, код и статья. Enjoy.
Github: https://github.com/QwenLM/Qwen3-TTS
Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts
ModelScope: https://modelscope.cn/collections/Qwen/Qwen3-TTS
Blog: https://qwen.ai/blog?id=qwen3tts-0115
Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
Hugging Face Demo: https://huggingface.co/spaces/Qwen/Qwen3-TTS
ModelScope Demo: https://modelscope.cn/studios/Qwen/Qwen3-TTS
API: https://alibabacloud.com/help/en/model-studio/qwen-tts-voice-design
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤3🔥2💊2