This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ورزش سنگین در Sora!
مدل ویدیوساز Sora وارد مرحلهی جدیدی شده — صحنههایی که فیزیک را تقریباً درست شبیهسازی میکنند... تا وقتی که یک هالتر وسط هوا میماند 😅
حرکات آهسته، نور واقعگرایانه و جزئیات بدن شگفتانگیز است، اما هنوز مغز حس میکند چیزی طبیعی نیست — مثل وزنهبرداری در دنیای خواب!
🧠 نکته جالب اینکه مدلهایی مثل Sora یا Veo واقعاً دارند فیزیک را یاد میگیرند:
وزن، شتاب، گشتاور و برخورد اجسام — بدون هیچ دادهی واقعی، فقط از روی تصویر.
نتیجه؟
🔹 ویدیوهایی خیرهکننده
🔹 اما هنوز با منطق فیزیکیِ کمی اشتباه!
📌 خلاصه:
همچنین AI هنوز قوانین نیوتن را کامل بلد نیست... ولی بهطرز خطرناکی دارد نزدیک میشود ⚙️
@rss_ai_ir
#Sora #هوش_مصنوعی #ویدیوژنراتور #AI #VideoGeneration #DeepLearning
مدل ویدیوساز Sora وارد مرحلهی جدیدی شده — صحنههایی که فیزیک را تقریباً درست شبیهسازی میکنند... تا وقتی که یک هالتر وسط هوا میماند 😅
حرکات آهسته، نور واقعگرایانه و جزئیات بدن شگفتانگیز است، اما هنوز مغز حس میکند چیزی طبیعی نیست — مثل وزنهبرداری در دنیای خواب!
🧠 نکته جالب اینکه مدلهایی مثل Sora یا Veo واقعاً دارند فیزیک را یاد میگیرند:
وزن، شتاب، گشتاور و برخورد اجسام — بدون هیچ دادهی واقعی، فقط از روی تصویر.
نتیجه؟
🔹 ویدیوهایی خیرهکننده
🔹 اما هنوز با منطق فیزیکیِ کمی اشتباه!
📌 خلاصه:
همچنین AI هنوز قوانین نیوتن را کامل بلد نیست... ولی بهطرز خطرناکی دارد نزدیک میشود ⚙️
@rss_ai_ir
#Sora #هوش_مصنوعی #ویدیوژنراتور #AI #VideoGeneration #DeepLearning
😁4👍2🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 StreamDiffusionV2 —
نسل جدید ویدیوهای تعاملی در زمان واقعی!
❌پروژهی StreamDiffusion به نسخهی دوم رسیده و حالا یک سیستم متنباز برای تولید ویدیوهای تعاملی بهصورت Real-Time است.
❌هدف تیم توسعهدهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابلقبول ✨
🚀 ویژگیهای کلیدی:
♻️کاهش قابلتوجه flickering و boiling artifacts در ویدیوهای دیفیوژنی
♻️پشتیبانی از GPUهای متنوع و ساختار مقیاسپذیر
♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات
♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرمهای محتوایی
🎮 در واقع، StreamDiffusionV2 را میتوان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو بهکمک AI که مستقیماً از جریان ورودی، خروجی زنده میسازد.
📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحهی پروژه:
🔗 streamdiffusionv2.github.io
@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
نسل جدید ویدیوهای تعاملی در زمان واقعی!
❌پروژهی StreamDiffusion به نسخهی دوم رسیده و حالا یک سیستم متنباز برای تولید ویدیوهای تعاملی بهصورت Real-Time است.
❌هدف تیم توسعهدهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابلقبول ✨
🚀 ویژگیهای کلیدی:
♻️کاهش قابلتوجه flickering و boiling artifacts در ویدیوهای دیفیوژنی
♻️پشتیبانی از GPUهای متنوع و ساختار مقیاسپذیر
♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات
♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرمهای محتوایی
🎮 در واقع، StreamDiffusionV2 را میتوان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو بهکمک AI که مستقیماً از جریان ورودی، خروجی زنده میسازد.
📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحهی پروژه:
🔗 streamdiffusionv2.github.io
@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
🎬 بهروزرسانی جدید Veo 3.1 از گوگل در راه است!
طبق اطلاعات فاششده در توییتر (۸ اکتبر ۲۰۲۵)، نسخهی جدید مدل تولید ویدیو Veo 3.1 از Google بهزودی منتشر میشود. این مدل در لیست انتظار Higgsfield AI و در کدهای داخلی Vertex AI مشاهده شده است.
✨ ویژگیهای احتمالی نسخه جدید:
✅بهبود در ثبات و هماهنگی شخصیتها در طول ویدیو
✅افزایش مدت زمان تولید ویدیو تا ۶۰ ثانیه
✅اضافه شدن سازندهی صحنهها (Scene Builder)
✅وجود پریستهای سینمایی (Cinematic Presets) برای خروجیهای حرفهایتر 🎥
✅جامعهی هوش مصنوعی این تغییرات را گامی جدی از سوی گوگل برای رقابت مستقیم با Sora از OpenAI میداند، هرچند گوگل هنوز بهصورت رسمی این خبر را تأیید نکرده است.
@rss_ai_ir
#Veo3 #Google #هوش_مصنوعی #تولید_ویدیو #AI #VideoGeneration
طبق اطلاعات فاششده در توییتر (۸ اکتبر ۲۰۲۵)، نسخهی جدید مدل تولید ویدیو Veo 3.1 از Google بهزودی منتشر میشود. این مدل در لیست انتظار Higgsfield AI و در کدهای داخلی Vertex AI مشاهده شده است.
✨ ویژگیهای احتمالی نسخه جدید:
✅بهبود در ثبات و هماهنگی شخصیتها در طول ویدیو
✅افزایش مدت زمان تولید ویدیو تا ۶۰ ثانیه
✅اضافه شدن سازندهی صحنهها (Scene Builder)
✅وجود پریستهای سینمایی (Cinematic Presets) برای خروجیهای حرفهایتر 🎥
✅جامعهی هوش مصنوعی این تغییرات را گامی جدی از سوی گوگل برای رقابت مستقیم با Sora از OpenAI میداند، هرچند گوگل هنوز بهصورت رسمی این خبر را تأیید نکرده است.
@rss_ai_ir
#Veo3 #Google #هوش_مصنوعی #تولید_ویدیو #AI #VideoGeneration
🎥 مدتی است که کاربران متوجه یک باگ جالب در مدلهای تولید ویدیو شدهاند:
وقتی از مدل بخواهید ویدیویی از یک انسان وارونه (سر به پایین) بسازد و سپس همان ویدیو را ۱۸۰ درجه بچرخانید، نتیجه کاملاً غیرمنطقی و خندهدار میشود! 😂
نسخه جدید Sora از OpenAI هم هنوز از این مشکل رنج میبرد — بهمحض چرخاندن تصویر، فیزیک بدن، لباس و حتی جاذبه کاملاً بههم میریزد.
👀 این مسئله نشان میدهد که حتی مدلهای پیشرفتهی ویدیو هنوز در درک پایداری فیزیکی و جهتگیری فضایی به درستی عمل نمیکنند.
📌 شاید روزی برسد که هوش مصنوعی واقعاً بداند “بالا” کجاست!
@rss_ai_ir
#هوش_مصنوعی #Sora #ویدیو #AI #VideoGeneration #OpenAI
وقتی از مدل بخواهید ویدیویی از یک انسان وارونه (سر به پایین) بسازد و سپس همان ویدیو را ۱۸۰ درجه بچرخانید، نتیجه کاملاً غیرمنطقی و خندهدار میشود! 😂
نسخه جدید Sora از OpenAI هم هنوز از این مشکل رنج میبرد — بهمحض چرخاندن تصویر، فیزیک بدن، لباس و حتی جاذبه کاملاً بههم میریزد.
👀 این مسئله نشان میدهد که حتی مدلهای پیشرفتهی ویدیو هنوز در درک پایداری فیزیکی و جهتگیری فضایی به درستی عمل نمیکنند.
📌 شاید روزی برسد که هوش مصنوعی واقعاً بداند “بالا” کجاست!
@rss_ai_ir
#هوش_مصنوعی #Sora #ویدیو #AI #VideoGeneration #OpenAI
😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Grok Imagine 0.9 Desktop
بالاخره منتشر شد!
در نسخهی جدید، ویژگی Lip-sync عمومی اضافه شده — اما با نتایج بامزهای 😄
مثلاً در ویدیوهای تست، کوسه و سنجاب هر دو همزمان دهان باز میکنند (هرکدام با استایل خودش!) 🦈🐿
📉 مشکل اینجاست که الگوریتم لبخوانی مدل، روی تمام دهانها و پوزههای موجود در تصویر اعمال میشود، و چون هنوز تفکیک موجودات انجام نمیدهد، حرکات لبها به شکل هماهنگ ولی عجیب اجرا میشود.
با این حال، Grok Imagine 0.9 گام مهمی است به سمت ویدیوهای چندشخصیتی و همزمان با صداهای مختلف 🎧
@rss_ai_ir
#Grok #xAI #LipSync #هوش_مصنوعی #AI #VideoGeneration
بالاخره منتشر شد!
در نسخهی جدید، ویژگی Lip-sync عمومی اضافه شده — اما با نتایج بامزهای 😄
مثلاً در ویدیوهای تست، کوسه و سنجاب هر دو همزمان دهان باز میکنند (هرکدام با استایل خودش!) 🦈🐿
📉 مشکل اینجاست که الگوریتم لبخوانی مدل، روی تمام دهانها و پوزههای موجود در تصویر اعمال میشود، و چون هنوز تفکیک موجودات انجام نمیدهد، حرکات لبها به شکل هماهنگ ولی عجیب اجرا میشود.
با این حال، Grok Imagine 0.9 گام مهمی است به سمت ویدیوهای چندشخصیتی و همزمان با صداهای مختلف 🎧
@rss_ai_ir
#Grok #xAI #LipSync #هوش_مصنوعی #AI #VideoGeneration
👍2
🔥 خبر داغ برای علاقهمندان هوش مصنوعی!
کاربرها گزارش دادهاند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.
🎬 نسخهی جدید Veo طبق شایعات:
♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالتهای سینمایی و پریستهای نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow
❌بهنظر میرسه گوگل داره جدیتر از همیشه وارد رقابت با Sora از OpenAI میشه.
@rss_ai_ir
#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
کاربرها گزارش دادهاند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.
🎬 نسخهی جدید Veo طبق شایعات:
♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالتهای سینمایی و پریستهای نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow
❌بهنظر میرسه گوگل داره جدیتر از همیشه وارد رقابت با Sora از OpenAI میشه.
@rss_ai_ir
#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مدل جدید ByteDance: Video-As-Prompt Wan2.1-14B 🎬
شرکت ByteDance از مدل جدید خود به نام Wan2.1-14B رونمایی کرده که برای وظیفهی نوآورانهی Video-as-Prompt طراحی شده است — یعنی میتوانید با دادن یک ویدیو (یا ترکیبی از تصویر و متن)، ویدیوی جدید و خلاقانهای بسازید.
✨ ویژگیها:
پشتیبانی از حالتهای:
🎞️ Video → Video
🖼️ Text/Image → Video
♻️دارای ۱۴ میلیارد پارامتر برای جزئیات بالا، حرکات روان و واقعگرایی چشمگیر.
♻️از ویدیوی ورودی برای حفظ سبک، ترکیببندی و ریتم حرکتی استفاده میکند.
⚠️ نکات مهم:
✳️برای اجرای آن به GPU قدرتمند و حافظه بالا نیاز است.
✳️کیفیت خروجی به میزان پیچیدگی درخواست و طول ویدیو بستگی دارد.
🟠 GitHub
🟠 Hugging Face
@rss_ai_ir
#AI #VideoGeneration #ByteDance #Wan2 #GenerativeAI #HuggingFace #Innovation
شرکت ByteDance از مدل جدید خود به نام Wan2.1-14B رونمایی کرده که برای وظیفهی نوآورانهی Video-as-Prompt طراحی شده است — یعنی میتوانید با دادن یک ویدیو (یا ترکیبی از تصویر و متن)، ویدیوی جدید و خلاقانهای بسازید.
✨ ویژگیها:
پشتیبانی از حالتهای:
🎞️ Video → Video
🖼️ Text/Image → Video
♻️دارای ۱۴ میلیارد پارامتر برای جزئیات بالا، حرکات روان و واقعگرایی چشمگیر.
♻️از ویدیوی ورودی برای حفظ سبک، ترکیببندی و ریتم حرکتی استفاده میکند.
⚠️ نکات مهم:
✳️برای اجرای آن به GPU قدرتمند و حافظه بالا نیاز است.
✳️کیفیت خروجی به میزان پیچیدگی درخواست و طول ویدیو بستگی دارد.
🟠 GitHub
🟠 Hugging Face
@rss_ai_ir
#AI #VideoGeneration #ByteDance #Wan2 #GenerativeAI #HuggingFace #Innovation
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 تولید ویدیو با ترکیب کاراکترها (Character Mixing Generation) 🦗
🚀 مؤسسه MBZUAI اولین سیستم تولید ویدیو را معرفی کرده که قادر است هویت، رفتار و سبک اصلی هر کاراکتر را حفظ کند، در حالی که تعاملات طبیعی و منطقی بین شخصیتهایی که هرگز با هم وجود نداشتهاند ایجاد میکند!
از کارتونهای کلاسیک 🎨 مثل We Bare Bears و Tom & Jerry
تا شخصیتهای واقعی 🎭 مثل Mr. Bean و Young Sheldon — همه در یک دنیای مشترک و هماهنگ.
💡 این فناوری گامی بزرگ در جهت تولید ویدیوهای چندکاراکتری واقعی و خلاقانه است، جایی که مرز بین انیمیشن و واقعیت محو میشود.
📚 منابع
👉 مقاله: https://lnkd.in/dhKMwukv
👉 پروژه: https://lnkd.in/dBkJs48h
👉 ریپوزیتوری: https://lnkd.in/dw_uzgAk
@rss_ai_ir
#هوش_مصنوعی #ویدیو #AI #MBZUAI #VideoGeneration #CharacterMixing
🚀 مؤسسه MBZUAI اولین سیستم تولید ویدیو را معرفی کرده که قادر است هویت، رفتار و سبک اصلی هر کاراکتر را حفظ کند، در حالی که تعاملات طبیعی و منطقی بین شخصیتهایی که هرگز با هم وجود نداشتهاند ایجاد میکند!
از کارتونهای کلاسیک 🎨 مثل We Bare Bears و Tom & Jerry
تا شخصیتهای واقعی 🎭 مثل Mr. Bean و Young Sheldon — همه در یک دنیای مشترک و هماهنگ.
💡 این فناوری گامی بزرگ در جهت تولید ویدیوهای چندکاراکتری واقعی و خلاقانه است، جایی که مرز بین انیمیشن و واقعیت محو میشود.
📚 منابع
👉 مقاله: https://lnkd.in/dhKMwukv
👉 پروژه: https://lnkd.in/dBkJs48h
👉 ریپوزیتوری: https://lnkd.in/dw_uzgAk
@rss_ai_ir
#هوش_مصنوعی #ویدیو #AI #MBZUAI #VideoGeneration #CharacterMixing
🔥2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Minimax
نسخهی جدید شبکهی عصبی تولید ویدیو خود را معرفی کرد: Hailuo 2.3
شرکت Minimax نسخهی تازهای از مدل تولید ویدیو با هوش مصنوعی به نام Hailuo 2.3 را منتشر کرده است.
این نسخه تمرکز ویژهای بر بهبود فیزیک حرکات و واقعگرایی در ویدیوها دارد — حرکات اکنون طبیعیتر، روانتر و از نظر دینامیکی دقیقتر هستند. ⚙️🎥
📊 مدل جدید Hailuo 2.3 گامی مهم در جهت ایجاد ویدیوهای فوتورئالیستی محسوب میشود و میتواند برای کاربردهایی مانند انیمیشنسازی، تولید محتوای تبلیغاتی، و شبیهسازیهای واقعگرایانه مورد استفاده قرار گیرد.
منبع:
https://hailuoai.video/create/image-to-video
@rss_ai_ir
#AI #VideoGeneration #Hailuo #Minimax #MachineLearning #NeuralNetworks
نسخهی جدید شبکهی عصبی تولید ویدیو خود را معرفی کرد: Hailuo 2.3
شرکت Minimax نسخهی تازهای از مدل تولید ویدیو با هوش مصنوعی به نام Hailuo 2.3 را منتشر کرده است.
این نسخه تمرکز ویژهای بر بهبود فیزیک حرکات و واقعگرایی در ویدیوها دارد — حرکات اکنون طبیعیتر، روانتر و از نظر دینامیکی دقیقتر هستند. ⚙️🎥
📊 مدل جدید Hailuo 2.3 گامی مهم در جهت ایجاد ویدیوهای فوتورئالیستی محسوب میشود و میتواند برای کاربردهایی مانند انیمیشنسازی، تولید محتوای تبلیغاتی، و شبیهسازیهای واقعگرایانه مورد استفاده قرار گیرد.
منبع:
https://hailuoai.video/create/image-to-video
@rss_ai_ir
#AI #VideoGeneration #Hailuo #Minimax #MachineLearning #NeuralNetworks
👍2🔥1😁1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
👢 Generative View Stitching (GVS):
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀
پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایتشده با دوربین را بهصورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم میکند — جایگزینی نوآورانه برای روشهای سنتی video length extrapolation. 🎥
✨ ویژگیهای کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیینشده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریمها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متنباز و قابل استفاده در پروژههای تحقیقاتی یا صنعتی
📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورسکد:
github.com/andrewsonga/generative_view_stitching
🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقعگرایانه با کنترل دقیق دوربین است — دنیای فیلمسازی و شبیهسازی ۳D را هوشمندتر از همیشه میسازد.
@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀
پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایتشده با دوربین را بهصورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم میکند — جایگزینی نوآورانه برای روشهای سنتی video length extrapolation. 🎥
✨ ویژگیهای کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیینشده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریمها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متنباز و قابل استفاده در پروژههای تحقیقاتی یا صنعتی
📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورسکد:
github.com/andrewsonga/generative_view_stitching
🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقعگرایانه با کنترل دقیق دوربین است — دنیای فیلمسازی و شبیهسازی ۳D را هوشمندتر از همیشه میسازد.
@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
❤2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ساخت ویدیو با LongCat-Video؛ غول ۱۳.۶ میلیارد پارامتری تولید ویدیو
مدل LongCat-Video یکی از قدرتمندترین سیستمهای تولید ویدیو است که میتواند متن را به ویدیو، تصویر را به ویدیو و حتی ادامهٔ ویدیو تولید کند — آن هم با کیفیت بالا و بدون افت در ویدیوهای طولانی.
🚀 ویژگیهای کلیدی:
✳️معماری یکپارچه برای تمام وظایف تولید ویدیو
✳️توانایی ساخت ویدیوهایی با مدت چند دقیقه
✳️تولید کارآمد با رزولوشن بالا
✳️کیفیت رقابتی در سطح مدلهای تجاری مطرح
📌 گیتهاب:
https://github.com/meituan-longcat/LongCat-Video
---
#LongCatVideo #AIvideo #VideoGeneration #DeepLearning
@rss_ai_ir
مدل LongCat-Video یکی از قدرتمندترین سیستمهای تولید ویدیو است که میتواند متن را به ویدیو، تصویر را به ویدیو و حتی ادامهٔ ویدیو تولید کند — آن هم با کیفیت بالا و بدون افت در ویدیوهای طولانی.
🚀 ویژگیهای کلیدی:
✳️معماری یکپارچه برای تمام وظایف تولید ویدیو
✳️توانایی ساخت ویدیوهایی با مدت چند دقیقه
✳️تولید کارآمد با رزولوشن بالا
✳️کیفیت رقابتی در سطح مدلهای تجاری مطرح
📌 گیتهاب:
https://github.com/meituan-longcat/LongCat-Video
---
#LongCatVideo #AIvideo #VideoGeneration #DeepLearning
@rss_ai_ir
❤1👏1