VIRSUN
12.1K subscribers
1.19K photos
703 videos
5 files
774 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ورزش سنگین در Sora!

مدل ویدیوساز Sora وارد مرحله‌ی جدیدی شده — صحنه‌هایی که فیزیک را تقریباً درست شبیه‌سازی می‌کنند... تا وقتی که یک هالتر وسط هوا می‌ماند 😅

حرکات آهسته، نور واقع‌گرایانه و جزئیات بدن شگفت‌انگیز است، اما هنوز مغز حس می‌کند چیزی طبیعی نیست — مثل وزنه‌برداری در دنیای خواب!

🧠 نکته جالب اینکه مدل‌هایی مثل Sora یا Veo واقعاً دارند فیزیک را یاد می‌گیرند:
وزن، شتاب، گشتاور و برخورد اجسام — بدون هیچ داده‌ی واقعی، فقط از روی تصویر.

نتیجه؟
🔹 ویدیوهایی خیره‌کننده
🔹 اما هنوز با منطق فیزیکیِ کمی اشتباه!

📌 خلاصه:
همچنین AI هنوز قوانین نیوتن را کامل بلد نیست... ولی به‌طرز خطرناکی دارد نزدیک می‌شود ⚙️

@rss_ai_ir
#Sora #هوش_مصنوعی #ویدیوژنراتور #AI #VideoGeneration #DeepLearning
😁4👍2🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 StreamDiffusionV2 —
نسل جدید ویدیوهای تعاملی در زمان واقعی!

پروژه‌ی StreamDiffusion به نسخه‌ی دوم رسیده و حالا یک سیستم متن‌باز برای تولید ویدیوهای تعاملی به‌صورت Real-Time است.
هدف تیم توسعه‌دهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابل‌قبول

🚀 ویژگی‌های کلیدی:

♻️کاهش قابل‌توجه flickering و boiling artifacts در ویدیوهای دیفیوژنی

♻️پشتیبانی از GPUهای متنوع و ساختار مقیاس‌پذیر

♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات

♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرم‌های محتوایی


🎮 در واقع، StreamDiffusionV2 را می‌توان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو به‌کمک AI که مستقیماً از جریان ورودی، خروجی زنده می‌سازد.

📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحه‌ی پروژه:
🔗 streamdiffusionv2.github.io

@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
🎬 به‌روزرسانی جدید Veo 3.1 از گوگل در راه است!

طبق اطلاعات فاش‌شده در توییتر (۸ اکتبر ۲۰۲۵)، نسخه‌ی جدید مدل تولید ویدیو Veo 3.1 از Google به‌زودی منتشر می‌شود. این مدل در لیست انتظار Higgsfield AI و در کدهای داخلی Vertex AI مشاهده شده است.

ویژگی‌های احتمالی نسخه جدید:

بهبود در ثبات و هماهنگی شخصیت‌ها در طول ویدیو

افزایش مدت زمان تولید ویدیو تا ۶۰ ثانیه

اضافه شدن سازنده‌ی صحنه‌ها (Scene Builder)

وجود پریست‌های سینمایی (Cinematic Presets) برای خروجی‌های حرفه‌ای‌تر 🎥


جامعه‌ی هوش مصنوعی این تغییرات را گامی جدی از سوی گوگل برای رقابت مستقیم با Sora از OpenAI می‌داند، هرچند گوگل هنوز به‌صورت رسمی این خبر را تأیید نکرده است.

@rss_ai_ir
#Veo3 #Google #هوش_مصنوعی #تولید_ویدیو #AI #VideoGeneration
🎥 مدتی است که کاربران متوجه یک باگ جالب در مدل‌های تولید ویدیو شده‌اند:

وقتی از مدل بخواهید ویدیویی از یک انسان وارونه (سر به پایین) بسازد و سپس همان ویدیو را ۱۸۰ درجه بچرخانید، نتیجه کاملاً غیرمنطقی و خنده‌دار می‌شود! 😂

نسخه جدید Sora از OpenAI هم هنوز از این مشکل رنج می‌برد — به‌محض چرخاندن تصویر، فیزیک بدن، لباس و حتی جاذبه کاملاً به‌هم می‌ریزد.

👀 این مسئله نشان می‌دهد که حتی مدل‌های پیشرفته‌ی ویدیو هنوز در درک پایداری فیزیکی و جهت‌گیری فضایی به درستی عمل نمی‌کنند.

📌 شاید روزی برسد که هوش مصنوعی واقعاً بداند “بالا” کجاست!

@rss_ai_ir
#هوش_مصنوعی #Sora #ویدیو #AI #VideoGeneration #OpenAI
😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Grok Imagine 0.9 Desktop
بالاخره منتشر شد!

در نسخه‌ی جدید، ویژگی Lip-sync عمومی اضافه شده — اما با نتایج بامزه‌ای 😄
مثلاً در ویدیوهای تست، کوسه و سنجاب هر دو هم‌زمان دهان باز می‌کنند (هرکدام با استایل خودش!) 🦈🐿

📉 مشکل اینجاست که الگوریتم لب‌خوانی مدل، روی تمام دهان‌ها و پوزه‌های موجود در تصویر اعمال می‌شود، و چون هنوز تفکیک موجودات انجام نمی‌دهد، حرکات لب‌ها به شکل هماهنگ ولی عجیب اجرا می‌شود.

با این حال، Grok Imagine 0.9 گام مهمی است به سمت ویدیوهای چندشخصیتی و هم‌زمان با صداهای مختلف 🎧

@rss_ai_ir
#Grok #xAI #LipSync #هوش_مصنوعی #AI #VideoGeneration
👍2
🔥 خبر داغ برای علاقه‌مندان هوش مصنوعی!

کاربرها گزارش داده‌اند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.

🎬 نسخه‌ی جدید Veo طبق شایعات:

♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالت‌های سینمایی و پری‌ست‌های نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow


به‌نظر می‌رسه گوگل داره جدی‌تر از همیشه وارد رقابت با Sora از OpenAI می‌شه.

@rss_ai_ir

#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مدل جدید ByteDance: Video-As-Prompt Wan2.1-14B 🎬

شرکت ByteDance از مدل جدید خود به نام Wan2.1-14B رونمایی کرده که برای وظیفه‌ی نوآورانه‌ی Video-as-Prompt طراحی شده است — یعنی می‌توانید با دادن یک ویدیو (یا ترکیبی از تصویر و متن)، ویدیوی جدید و خلاقانه‌ای بسازید.

ویژگی‌ها:

پشتیبانی از حالت‌های:
🎞️ Video → Video
🖼️ Text/Image → Video

♻️دارای ۱۴ میلیارد پارامتر برای جزئیات بالا، حرکات روان و واقع‌گرایی چشمگیر.

♻️از ویدیوی ورودی برای حفظ سبک، ترکیب‌بندی و ریتم حرکتی استفاده می‌کند.


⚠️ نکات مهم:

✳️برای اجرای آن به GPU قدرتمند و حافظه بالا نیاز است.
✳️کیفیت خروجی به میزان پیچیدگی درخواست و طول ویدیو بستگی دارد.


🟠 GitHub
🟠 Hugging Face

@rss_ai_ir

#AI #VideoGeneration #ByteDance #Wan2 #GenerativeAI #HuggingFace #Innovation
1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 تولید ویدیو با ترکیب کاراکترها (Character Mixing Generation) 🦗

🚀 مؤسسه MBZUAI اولین سیستم تولید ویدیو را معرفی کرده که قادر است هویت، رفتار و سبک اصلی هر کاراکتر را حفظ کند، در حالی که تعاملات طبیعی و منطقی بین شخصیت‌هایی که هرگز با هم وجود نداشته‌اند ایجاد می‌کند!

از کارتون‌های کلاسیک 🎨 مثل We Bare Bears و Tom & Jerry
تا شخصیت‌های واقعی 🎭 مثل Mr. Bean و Young Sheldon — همه در یک دنیای مشترک و هماهنگ.

💡 این فناوری گامی بزرگ در جهت تولید ویدیوهای چندکاراکتری واقعی و خلاقانه است، جایی که مرز بین انیمیشن و واقعیت محو می‌شود.

📚 منابع
👉 مقاله: https://lnkd.in/dhKMwukv
👉 پروژه: https://lnkd.in/dBkJs48h
👉 ریپوزیتوری: https://lnkd.in/dw_uzgAk

@rss_ai_ir
#هوش_مصنوعی #ویدیو #AI #MBZUAI #VideoGeneration #CharacterMixing
🔥21👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Minimax
نسخه‌ی جدید شبکه‌ی عصبی تولید ویدیو خود را معرفی کرد: Hailuo 2.3

شرکت Minimax نسخه‌ی تازه‌ای از مدل تولید ویدیو با هوش مصنوعی به نام Hailuo 2.3 را منتشر کرده است.
این نسخه تمرکز ویژه‌ای بر بهبود فیزیک حرکات و واقع‌گرایی در ویدیوها دارد — حرکات اکنون طبیعی‌تر، روان‌تر و از نظر دینامیکی دقیق‌تر هستند. ⚙️🎥

📊 مدل جدید Hailuo 2.3 گامی مهم در جهت ایجاد ویدیوهای فوتورئالیستی محسوب می‌شود و می‌تواند برای کاربردهایی مانند انیمیشن‌سازی، تولید محتوای تبلیغاتی، و شبیه‌سازی‌های واقع‌گرایانه مورد استفاده قرار گیرد.

منبع:
https://hailuoai.video/create/image-to-video

@rss_ai_ir
#AI #VideoGeneration #Hailuo #Minimax #MachineLearning #NeuralNetworks
👍2🔥1😁1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
👢 Generative View Stitching (GVS):
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀

پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایت‌شده با دوربین را به‌صورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم می‌کند — جایگزینی نوآورانه برای روش‌های سنتی video length extrapolation. 🎥

ویژگی‌های کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیین‌شده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریم‌ها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متن‌باز و قابل استفاده در پروژه‌های تحقیقاتی یا صنعتی

📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورس‌کد:
github.com/andrewsonga/generative_view_stitching

🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقع‌گرایانه با کنترل دقیق دوربین است — دنیای فیلم‌سازی و شبیه‌سازی ۳D را هوشمندتر از همیشه می‌سازد.

@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ساخت ویدیو با LongCat-Video؛ غول ۱۳.۶ میلیارد پارامتری تولید ویدیو

مدل LongCat-Video یکی از قدرتمندترین سیستم‌های تولید ویدیو است که می‌تواند متن را به ویدیو، تصویر را به ویدیو و حتی ادامهٔ ویدیو تولید کند — آن هم با کیفیت بالا و بدون افت در ویدیوهای طولانی.

🚀 ویژگی‌های کلیدی:

✳️معماری یکپارچه برای تمام وظایف تولید ویدیو

✳️توانایی ساخت ویدیوهایی با مدت چند دقیقه

✳️تولید کارآمد با رزولوشن بالا

✳️کیفیت رقابتی در سطح مدل‌های تجاری مطرح


📌 گیت‌هاب:
https://github.com/meituan-longcat/LongCat-Video


---

#LongCatVideo #AIvideo #VideoGeneration #DeepLearning
@rss_ai_ir
1👏1