VIRSUN

🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2

مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلی‌ثانیه به متن تبدیل کند — سرعتی تقریباً آنی!

🔹 ویژگی‌های کلیدی:

تشخیص و برچسب‌گذاری خودکار گویندگان مختلف 🗣️

پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍

قابلیت استریم زنده (Live Streaming) و اتصال از طریق API

مناسب برای رویدادها، سخنرانی‌ها و زیرنویس هم‌زمان ویدیوها

عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡

📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime

📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.

#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent

1.14K views11:45

VIRSUN

سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبان‌های کم‌منبع و محلی) را پشتیبانی می‌کند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.

✨ ویژگی‌ها:

✳️پشتیبانی از زبان‌های بسیار متنوع، از رایج تا کاملاً نادر

✳️امکان اضافه کردن زبان‌های جدید با داده‌ی آموزشی بسیار کم (few-shot / zero-shot)

✳️طراحی‌شده برای دسترس‌پذیری و شمول جوامع مختلف زبانی

✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیت‌هاب

لینک گیت‌هاب 🔗
https://github.com/facebookresearch/omnilingual-asr

@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText

GitHub

GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages

Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr

❤1🔥1👏1

378 views05:24

About

Blog

Apps

Platform