This media is not supported in your browser
VIEW IN TELEGRAM
🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبانهای کممنبع و محلی) را پشتیبانی میکند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.
✨ ویژگیها:
✳️پشتیبانی از زبانهای بسیار متنوع، از رایج تا کاملاً نادر
✳️امکان اضافه کردن زبانهای جدید با دادهی آموزشی بسیار کم (few-shot / zero-shot)
✳️طراحیشده برای دسترسپذیری و شمول جوامع مختلف زبانی
✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیتهاب
لینک گیتهاب 🔗
https://github.com/facebookresearch/omnilingual-asr
@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
بیش از ۱۶۰۰ زبان (حتی زبانهای کممنبع و محلی) را پشتیبانی میکند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.
✨ ویژگیها:
✳️پشتیبانی از زبانهای بسیار متنوع، از رایج تا کاملاً نادر
✳️امکان اضافه کردن زبانهای جدید با دادهی آموزشی بسیار کم (few-shot / zero-shot)
✳️طراحیشده برای دسترسپذیری و شمول جوامع مختلف زبانی
✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیتهاب
لینک گیتهاب 🔗
https://github.com/facebookresearch/omnilingual-asr
@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
GitHub
GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages
Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr
❤1🔥1👏1