VIRSUN
7.44K subscribers
792 photos
461 videos
3 files
507 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts

محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کرده‌اند که مشکل اصلی مدل‌ها را حل می‌کند:
وقتی ویدئو طولانی می‌شود، توجه مدل بیش از حد «پف می‌کند»؛ محاسبات سنگین‌تر می‌شود، جزئیات از بین می‌رود، کاراکترها فراموش می‌شوند و تصویر «سر می‌خورد».


---

🔑 ایده اصلی: Mixture of Contexts

♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم می‌شود.
♻️هر کوئری فقط بخش‌های مرتبط را انتخاب می‌کند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام می‌شود (مقایسه ویژگی بخش‌ها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریم‌های آینده را می‌بندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخش‌های انتخاب‌شده اعمال می‌شود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.



---

📊 نتایج

♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنه‌های طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.



---

🎥 جمع‌بندی

✳️در ویدئوهای کوتاه، کیفیت حفظ می‌شود.
✳️در ویدئوهای طولانی، صحنه‌ها روان‌تر و کاراکترها پایدارتر هستند.
✳️زمان تولید به‌طور محسوسی کاهش می‌یابد.


🔑 نکته مهم:
مدل خودش یاد می‌گیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا می‌کند.

🔖 لینک مقاله

#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
🎉26👍2523🥰23😁22🔥18👏16
🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥

هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایه‌ی Nano Banana و Veo 3 ساخته شده.

🔹 چیزی که این تیم رو خاص می‌کنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست می‌کنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربه‌ی کاربر کار می‌کنن.
🔹 از اون طرف، منتقدها می‌گن که از مدل‌های اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیع‌کننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلی‌شون، Speak 2.0، موفقیت خوبی داشت).

🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیک‌تاک‌مانند رو به ساده‌ترین حالت برسونه:

1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبک‌های صوتی (Audio styles)
6️⃣ افزودن پس‌زمینه مناسب

🎯 بدون نیاز به پرامپت‌های طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!

📌 لینک تست: Higgsfield UGC Factory

@rss_ai_ir

#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
13👍11🔥10👏10😁9🎉7🥰6
This media is not supported in your browser
VIEW IN TELEGRAM
🐙 ویدیوهای انسان‌محور با دقت بالا 🐙

محققان دانشگاه Tsinghua و شرکت ByteDance فریم‌ورک جدیدی به نام HuMo معرفی کردند؛ سیستمی یکپارچه برای تولید ویدیوهای انسان با کیفیت بالا که ویژگی‌های زیر رو داره:

🔹 تولید ویدیو از روی پرامپت متنی
🔹 حفظ یکپارچگی سوژه در فریم‌های مختلف
🔹 حرکت‌های هماهنگ‌شده با صدا (Audio-Driven Motion)
🔹 کنترل‌پذیری و جزئیات ظریف در خروجی

📌 فریم ورک HuMo می‌تونه از ورودی‌های چندحالته (متن، تصویر، صدا) ویدیوهای طبیعی و روان تولید کنه.
📌 سورس‌کد با لایسنس Apache 2.0 منتشر شده و به راحتی قابل استفاده و توسعه است.

🔗 لینک‌ها:

👉 Paper
👉 Project
👉 Repo

#HuMo #VideoGeneration #AI #DeepLearning #Tsinghua #ByteDance
12🔥11🥰10👏8👍5🎉5😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Lucy

تازه‌ترین محصول تیم Decart.ai معرفی شد: генератор ویدیویی Lucy که سرعت بالایی دارد و توجه زیادی جلب کرده است.

🔹 نسخه اصلی با ۱۴ میلیارد پارامتر عرضه شده (نسخه سبک‌تر ۵B هم وجود دارد).
🔹 سرعت: تولید یک ویدئو ۵ ثانیه‌ای در حدود ۱۲ ثانیه — ادعا ۶ ثانیه است، اما همین هم در مقایسه عالی محسوب می‌شود.
🔹 کیفیت خروجی: ۷۲۰p
🔹 طول ویدئو: فعلاً در Fal.ai فقط ۵ ثانیه (برخی منابع از ۱۰ ثانیه خبر داده‌اند).
🔹 هزینه: ۰.۰۸ دلار به ازای هر ثانیه تولید

💡 نکته مهم: این مدل اپن‌سورس نیست و فعلاً فقط روی Fal.ai در دسترس است.
اگر بخواهیم با Wan مقایسه کنیم، تفاوت سرعت قابل توجه است (۱۲ ثانیه در مقابل ۶۸ ثانیه)، اما در کیفیت هنوز جای بحث وجود دارد.

👾 جالب اینکه Decart.ai اخیراً Mirage (ژنراتور ریل‌تایم دنیاها) و Oasis 2.0 (ژنراتور دنیای Minecraft) را هم معرفی کرده بود — نشانه‌ای که احتمالاً مسیر آینده ترکیب «ژنراتورهای دنیا» و «ژنراتورهای ویدیو» خواهد بود (مشابه Veo و Genie از گوگل).

🔗 تست در Lucy Playground
🔗 معرفی رسمی: Decart.ai
@rss_ai_ir

---

#Lucy #AI #VideoGeneration #Decart #FalAI #GenerativeAI #cgevent
😁10👍5🔥53🎉3