This media is not supported in your browser
VIEW IN TELEGRAM
🎥 StreamDiffusionV2 —
نسل جدید ویدیوهای تعاملی در زمان واقعی!
❌پروژهی StreamDiffusion به نسخهی دوم رسیده و حالا یک سیستم متنباز برای تولید ویدیوهای تعاملی بهصورت Real-Time است.
❌هدف تیم توسعهدهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابلقبول ✨
🚀 ویژگیهای کلیدی:
♻️کاهش قابلتوجه flickering و boiling artifacts در ویدیوهای دیفیوژنی
♻️پشتیبانی از GPUهای متنوع و ساختار مقیاسپذیر
♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات
♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرمهای محتوایی
🎮 در واقع، StreamDiffusionV2 را میتوان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو بهکمک AI که مستقیماً از جریان ورودی، خروجی زنده میسازد.
📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحهی پروژه:
🔗 streamdiffusionv2.github.io
@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
نسل جدید ویدیوهای تعاملی در زمان واقعی!
❌پروژهی StreamDiffusion به نسخهی دوم رسیده و حالا یک سیستم متنباز برای تولید ویدیوهای تعاملی بهصورت Real-Time است.
❌هدف تیم توسعهدهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابلقبول ✨
🚀 ویژگیهای کلیدی:
♻️کاهش قابلتوجه flickering و boiling artifacts در ویدیوهای دیفیوژنی
♻️پشتیبانی از GPUهای متنوع و ساختار مقیاسپذیر
♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات
♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرمهای محتوایی
🎮 در واقع، StreamDiffusionV2 را میتوان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو بهکمک AI که مستقیماً از جریان ورودی، خروجی زنده میسازد.
📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحهی پروژه:
🔗 streamdiffusionv2.github.io
@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent