VIRSUN

🎥 StreamDiffusionV2 —
نسل جدید ویدیوهای تعاملی در زمان واقعی!

❌پروژه‌ی StreamDiffusion به نسخه‌ی دوم رسیده و حالا یک سیستم متن‌باز برای تولید ویدیوهای تعاملی به‌صورت Real-Time است.
❌هدف تیم توسعه‌دهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابل‌قبول ✨

🚀 ویژگی‌های کلیدی:

♻️کاهش قابل‌توجه flickering و boiling artifacts در ویدیوهای دیفیوژنی

♻️پشتیبانی از GPUهای متنوع و ساختار مقیاس‌پذیر

♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات

♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرم‌های محتوایی

🎮 در واقع، StreamDiffusionV2 را می‌توان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو به‌کمک AI که مستقیماً از جریان ورودی، خروجی زنده می‌سازد.

📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحه‌ی پروژه:
🔗 streamdiffusionv2.github.io

@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels

254 viewsedited 07:26

VIRSUN

1:21

This media is not supported in your browser

VIEW IN TELEGRAM

🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2

مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلی‌ثانیه به متن تبدیل کند — سرعتی تقریباً آنی!

🔹 ویژگی‌های کلیدی:

تشخیص و برچسب‌گذاری خودکار گویندگان مختلف 🗣️

پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍

قابلیت استریم زنده (Live Streaming) و اتصال از طریق API

مناسب برای رویدادها، سخنرانی‌ها و زیرنویس هم‌زمان ویدیوها

عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡

📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime

📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.

#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent

164 views11:45

About

Blog

Apps

Platform