This media is not supported in your browser
VIEW IN TELEGRAM
🎬مدل Grok Imagine حالا علاوه بر Image2Video، از Text2Video هم پشتیبانی میکند! 🤖✨
در نسخهی وب دسکتاپ، این ابزار حالا میتواند فقط با توصیف متنی از صفر یک ویدیو بسازد — بدون نیاز به تصویر ورودی.
اما بخش جالب ماجرا اینجاست 👇
کاربری یک تصویر کاملاً سیاه بدون هیچ پرامپتی وارد کرد و نوشت:
> «یک ویدیو بساز!»
نتیجه؟ 🎞
یک ویدیو ظاهر شد که شبیه تبلیغ جدید سامسونگ بود! 😅
و چون هیچ seed ثبت نشده، تکرار آن غیرممکن است — مثل یک الهام مرموز از تاریکی! 🌌
📍 لینک:
grok.com/imagine
📡 @rss_ai_ir
#هوش_مصنوعی #Grok #تبدیل_متن_به_ویدیو #AIvideo #تکنولوژی #GenerativeAI
در نسخهی وب دسکتاپ، این ابزار حالا میتواند فقط با توصیف متنی از صفر یک ویدیو بسازد — بدون نیاز به تصویر ورودی.
اما بخش جالب ماجرا اینجاست 👇
کاربری یک تصویر کاملاً سیاه بدون هیچ پرامپتی وارد کرد و نوشت:
> «یک ویدیو بساز!»
نتیجه؟ 🎞
یک ویدیو ظاهر شد که شبیه تبلیغ جدید سامسونگ بود! 😅
و چون هیچ seed ثبت نشده، تکرار آن غیرممکن است — مثل یک الهام مرموز از تاریکی! 🌌
📍 لینک:
grok.com/imagine
📡 @rss_ai_ir
#هوش_مصنوعی #Grok #تبدیل_متن_به_ویدیو #AIvideo #تکنولوژی #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Gamma.app —
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!
استارتاپ Gamma که بهعنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفقترین پلتفرمهای تولید محتوای بصری با هوش مصنوعی تبدیل شده است.
در نسخهی جدید Gamma 3.0، این ابزار نهتنها ارائههای (presentations) هوشمند میسازد، بلکه میتواند وبسایتها و طرحهای شبکههای اجتماعی را نیز بهصورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش میکشد.
📊 آمار چشمگیر:
💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار
👥 کاربران فعال: ۷۰ میلیون نفر
💎 ارزشگذاری شرکت: ۲.۱ میلیارد دلار
👨💻 تنها ۵۰ کارمند
⚡ روزانه بیش از ۱ میلیون گاما ساخته میشود!
🧠 آنها بهتازگی API رسمی را منتشر کردهاند و برای علاقهمندان، راهنمای پرامپتنویسی (Prompt Guide) را در لینک زیر قرار دادهاند:
👉 https://gamma.app/prompts
جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.
#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!
استارتاپ Gamma که بهعنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفقترین پلتفرمهای تولید محتوای بصری با هوش مصنوعی تبدیل شده است.
در نسخهی جدید Gamma 3.0، این ابزار نهتنها ارائههای (presentations) هوشمند میسازد، بلکه میتواند وبسایتها و طرحهای شبکههای اجتماعی را نیز بهصورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش میکشد.
📊 آمار چشمگیر:
💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار
👥 کاربران فعال: ۷۰ میلیون نفر
💎 ارزشگذاری شرکت: ۲.۱ میلیارد دلار
👨💻 تنها ۵۰ کارمند
⚡ روزانه بیش از ۱ میلیون گاما ساخته میشود!
🧠 آنها بهتازگی API رسمی را منتشر کردهاند و برای علاقهمندان، راهنمای پرامپتنویسی (Prompt Guide) را در لینک زیر قرار دادهاند:
👉 https://gamma.app/prompts
جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.
#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 مدل سهبعدیساز World Labs برای همه آزاد شد
استارتاپ World Labs که با همکاری فیفی لی تأسیس شده، دسترسی عمومی به مدل قدرتمند Marble را فعال کرد — مدلی که میتواند فقط از روی متن، عکس، ویدیو یا طرحهای سهبعدی موجود، یک دنیای کامل سهبعدی بسازد.
ویژگیهای کلیدی Marble:
🔸 ساخت محیطهای سهبعدی پایدار، قابل ویرایش و آماده استفاده
🔸 خروجی در قالب Mesh، Gaussian Splatting یا حتی ویدیو — مناسب برای بازیسازی، فیلمسازی و شبیهسازی
🔸 ورودی چندحالته: از یک عکس تکی تا ویدیوهای چندنمایی
🔸 ابزار داخلی «Chisel» برای طراحی سریع ساختار سهبعدی خام و سپس اعمال جزییات و سبک
🔸 مناسب برای تیمهای رباتیک، طراحان، گیمدِو و فیلمسازی
مدل Marble نشان میدهد که هوش مصنوعی مولد از متن و تصویر فراتر رفته و وارد درک فضایی واقعی شده است — یعنی ساخت جهانهای سهبعدی فقط با یک پرامپت.
---
https://marble.worldlabs.ai/
#هوش_مصنوعی #Marble #WorldLabs #سهبعدی #3D #GenerativeAI #SpatialAI #FeiFeiLi #AI #GaussianSplats #GameDev #VFX #Simulation
استارتاپ World Labs که با همکاری فیفی لی تأسیس شده، دسترسی عمومی به مدل قدرتمند Marble را فعال کرد — مدلی که میتواند فقط از روی متن، عکس، ویدیو یا طرحهای سهبعدی موجود، یک دنیای کامل سهبعدی بسازد.
ویژگیهای کلیدی Marble:
🔸 ساخت محیطهای سهبعدی پایدار، قابل ویرایش و آماده استفاده
🔸 خروجی در قالب Mesh، Gaussian Splatting یا حتی ویدیو — مناسب برای بازیسازی، فیلمسازی و شبیهسازی
🔸 ورودی چندحالته: از یک عکس تکی تا ویدیوهای چندنمایی
🔸 ابزار داخلی «Chisel» برای طراحی سریع ساختار سهبعدی خام و سپس اعمال جزییات و سبک
🔸 مناسب برای تیمهای رباتیک، طراحان، گیمدِو و فیلمسازی
مدل Marble نشان میدهد که هوش مصنوعی مولد از متن و تصویر فراتر رفته و وارد درک فضایی واقعی شده است — یعنی ساخت جهانهای سهبعدی فقط با یک پرامپت.
---
https://marble.worldlabs.ai/
#هوش_مصنوعی #Marble #WorldLabs #سهبعدی #3D #GenerativeAI #SpatialAI #FeiFeiLi #AI #GaussianSplats #GameDev #VFX #Simulation
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 مدل WorldGen؛ نسل بعدی ساخت جهانهای سهبعدی
متا رسماً وارد بازی «خدای 3D» شده است.
اگر Marble و Genie فقط «تصویر از یک دوربین» میدادند، WorldGen یک قدم جلوتر است:
یک تکه واقعی از جهان سهبعدی — حدود ۵۰×۵۰ متر فضای قابل پیمایش — که میتوانید مستقیماً داخل Unity یا Unreal بندازید و مثل یک محیط بازی واقعی استفاده کنید.
🔥 چرا WorldGen متفاوت است؟
چون این دیگر نه Gaussian Splats است و نه ویدئو.
🔹 مش واقعی (3D Mesh)
🔹 ساختار هندسی کامل
🔹 قابل استفاده در موتورهای بازیسازی
🔹 جهان قابل ناوبری (Navmesh-ready)
متا خودش میگوید WorldGen ترکیبی از 3 چیز است:
1. روشهای پروسیجرال
2. دیفیوژن برای تولید 2D
3. بازسازی کامل 3D بر اساس آبجکتها
نتیجه؟
جهانهایی پایدار، قابل راهرفتن، قابل رندر و مناسب برای:
🎮 بازیها
🤖 شبیهسازها
🌐 محیطهای اجتماعی و VR
---
🔧 Pipeline چهار مرحلهای WorldGen
(1) Planning – برنامهریزی
▫️ ساخت پروسیجرال بلوکها
▫️ استخراج Navmesh
▫️ تولید تصاویر مرجع
(2) Reconstruction – بازسازی
▫️ تبدیل تصویر به 3D
▫️ تولید صحنه براساس Navmesh
▫️ ساخت بافت اولیه
(3) Decomposition – تجزیهٔ صحنه
▫️ استخراج قطعات با AutoPartGen
▫️ پاکسازی و سازماندهی داده
(4) Refinement – پالایش نهایی
▫️ ارتقای کیفیت تصویر
▫️ اصلاح مش
▫️ تکسچرینگ نهایی
---
🚨 اما خبر بد؟
اینکهWorldGen فعلاً محصول نیست.
متا هنوز روی سرعت تولید و ساخت جهانهای بزرگتر کار میکند (فعلاً خیلی کند است).
اما خروجیهای اولیه شگفتانگیزند — ویدیوی دمو را اینجا ببینید:
🔗 https://www.uploadvr.com/meta-worldgen-ai-generates-3d-worlds/
بهظاهر، متا میخواهد Minecraft + Unreal + AI را یکجا ترکیب کند.
سال ۲۰۲۵ احتمالاً سال متولد شدن GenAI-Worlds خواهد بود.
@rss_ai_ir
#متاورس #WorldGen #MetaAI #3DGeneration #Unity #Unreal #AI #GameDev #GenerativeAI
متا رسماً وارد بازی «خدای 3D» شده است.
اگر Marble و Genie فقط «تصویر از یک دوربین» میدادند، WorldGen یک قدم جلوتر است:
یک تکه واقعی از جهان سهبعدی — حدود ۵۰×۵۰ متر فضای قابل پیمایش — که میتوانید مستقیماً داخل Unity یا Unreal بندازید و مثل یک محیط بازی واقعی استفاده کنید.
🔥 چرا WorldGen متفاوت است؟
چون این دیگر نه Gaussian Splats است و نه ویدئو.
🔹 مش واقعی (3D Mesh)
🔹 ساختار هندسی کامل
🔹 قابل استفاده در موتورهای بازیسازی
🔹 جهان قابل ناوبری (Navmesh-ready)
متا خودش میگوید WorldGen ترکیبی از 3 چیز است:
1. روشهای پروسیجرال
2. دیفیوژن برای تولید 2D
3. بازسازی کامل 3D بر اساس آبجکتها
نتیجه؟
جهانهایی پایدار، قابل راهرفتن، قابل رندر و مناسب برای:
🎮 بازیها
🤖 شبیهسازها
🌐 محیطهای اجتماعی و VR
---
🔧 Pipeline چهار مرحلهای WorldGen
(1) Planning – برنامهریزی
▫️ ساخت پروسیجرال بلوکها
▫️ استخراج Navmesh
▫️ تولید تصاویر مرجع
(2) Reconstruction – بازسازی
▫️ تبدیل تصویر به 3D
▫️ تولید صحنه براساس Navmesh
▫️ ساخت بافت اولیه
(3) Decomposition – تجزیهٔ صحنه
▫️ استخراج قطعات با AutoPartGen
▫️ پاکسازی و سازماندهی داده
(4) Refinement – پالایش نهایی
▫️ ارتقای کیفیت تصویر
▫️ اصلاح مش
▫️ تکسچرینگ نهایی
---
🚨 اما خبر بد؟
اینکهWorldGen فعلاً محصول نیست.
متا هنوز روی سرعت تولید و ساخت جهانهای بزرگتر کار میکند (فعلاً خیلی کند است).
اما خروجیهای اولیه شگفتانگیزند — ویدیوی دمو را اینجا ببینید:
🔗 https://www.uploadvr.com/meta-worldgen-ai-generates-3d-worlds/
بهظاهر، متا میخواهد Minecraft + Unreal + AI را یکجا ترکیب کند.
سال ۲۰۲۵ احتمالاً سال متولد شدن GenAI-Worlds خواهد بود.
@rss_ai_ir
#متاورس #WorldGen #MetaAI #3DGeneration #Unity #Unreal #AI #GameDev #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ مدل Flux 2 رسماً منتشر شد – ارتقای بزرگ در نسل تصویر
@rss_ai_ir
مدل Flux 2 با یک آپدیت سنگین برگشته و حالا دقیقتر، واقعگراتر و بسیار توانمندتر شده است.
✨ چه چیزهایی بهتر شده؟
♻️پشتیبانی همزمان از ۱۰ رفرنس
♻️درک بسیار بهتر از نور، متریالها و اپتیک
♻️رندر دقیقتر و طبیعیتر متن
♻️خروجی با کیفیت ۴K واقعی
♻️تصاویر نرمتر، واقعگراتر و بدون «براقی پلاستیکی»
♻️امکان ترکیب، ویرایش و ژنریشن چندمرحلهای
🖥️ اجرای محلی هم کاملاً ممکن است
وزنها باز هستند و با حدود ۶۵ گیگابایت میتوانید مدل را روی سیستم خود اجرا کنید.
🟠 دمو:
https://playground.bfl.ai/image/generate
🟠 وزنها:
https://huggingface.co/black-forest-labs
🟠 FLUX.2-dev در HF:
https://huggingface.co/black-forest-labs/FLUX.2-dev
---
#Flux2 #AI #ImageGeneration #AIGraphics #GenerativeAI #BlackForestLabs #DiffusionModels
@rss_ai_ir
مدل Flux 2 با یک آپدیت سنگین برگشته و حالا دقیقتر، واقعگراتر و بسیار توانمندتر شده است.
✨ چه چیزهایی بهتر شده؟
♻️پشتیبانی همزمان از ۱۰ رفرنس
♻️درک بسیار بهتر از نور، متریالها و اپتیک
♻️رندر دقیقتر و طبیعیتر متن
♻️خروجی با کیفیت ۴K واقعی
♻️تصاویر نرمتر، واقعگراتر و بدون «براقی پلاستیکی»
♻️امکان ترکیب، ویرایش و ژنریشن چندمرحلهای
🖥️ اجرای محلی هم کاملاً ممکن است
وزنها باز هستند و با حدود ۶۵ گیگابایت میتوانید مدل را روی سیستم خود اجرا کنید.
🟠 دمو:
https://playground.bfl.ai/image/generate
🟠 وزنها:
https://huggingface.co/black-forest-labs
🟠 FLUX.2-dev در HF:
https://huggingface.co/black-forest-labs/FLUX.2-dev
---
#Flux2 #AI #ImageGeneration #AIGraphics #GenerativeAI #BlackForestLabs #DiffusionModels
👏5👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir
🍓 مدل MotionV2V — ویرایش حرکت در ویدئو با دقت بیسابقه 🍓
گوگل سیستم MotionV2V را معرفی کرد؛ روشی نوین برای ویرایش حرکت در ویدئو که بهجای تغییر کل فریم، مستقیماً تفاوت حرکت بین ویدئوی اصلی و نسخه ویرایششده را کنترل میکند.
این مدل بر پایه دیفیوشن کار میکند و امکان میدهد که:
✨ حرکت یک فرد تغییر کند، بدون تغییر ظاهر
✨ سرعت، جهت، یا شدت حرکت اصلاح شود
✨ حرکت کاملاً جدید روی ویدئو اعمال شود
✨ ویدئوهای ادیتشده، طبیعی و منسجم باقی بمانند
نتیجه؟
ویدئوهایی با حرکتهای کاملاً کنترلشده، بدون artifacts و بدون پرشهای عجیب.
🔗 لینکها:
👉 Paper:
https://arxiv.org/pdf/2511.20640
👉 Project Page:
https://ryanndagreat.github.io/MotionV2V/
👉 GitHub (بهزودی):
https://github.com/RyannDaGreat/MotionV2V
#MotionEditing #VideoAI #DiffusionModels #GoogleAI #GenerativeAI #DeepLearning
🍓 مدل MotionV2V — ویرایش حرکت در ویدئو با دقت بیسابقه 🍓
گوگل سیستم MotionV2V را معرفی کرد؛ روشی نوین برای ویرایش حرکت در ویدئو که بهجای تغییر کل فریم، مستقیماً تفاوت حرکت بین ویدئوی اصلی و نسخه ویرایششده را کنترل میکند.
این مدل بر پایه دیفیوشن کار میکند و امکان میدهد که:
✨ حرکت یک فرد تغییر کند، بدون تغییر ظاهر
✨ سرعت، جهت، یا شدت حرکت اصلاح شود
✨ حرکت کاملاً جدید روی ویدئو اعمال شود
✨ ویدئوهای ادیتشده، طبیعی و منسجم باقی بمانند
نتیجه؟
ویدئوهایی با حرکتهای کاملاً کنترلشده، بدون artifacts و بدون پرشهای عجیب.
🔗 لینکها:
👉 Paper:
https://arxiv.org/pdf/2511.20640
👉 Project Page:
https://ryanndagreat.github.io/MotionV2V/
👉 GitHub (بهزودی):
https://github.com/RyannDaGreat/MotionV2V
#MotionEditing #VideoAI #DiffusionModels #GoogleAI #GenerativeAI #DeepLearning
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ STARFlow-V:
نسل تازه مدلهای ویدئو با Normalizing Flow
@rss_ai_ir 🎥⚡
مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایهی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده میشود، اما حالا نتایج فوقالعادهای نشان داده است.
🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیشبینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen
📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow
#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
نسل تازه مدلهای ویدئو با Normalizing Flow
@rss_ai_ir 🎥⚡
مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایهی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده میشود، اما حالا نتایج فوقالعادهای نشان داده است.
🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیشبینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen
📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow
#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
🥰1
Media is too big
VIEW IN TELEGRAM
🔥 استودیو Hunyuan 3D به نسخهٔ 1.1 آپدیت شد!
مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مشهای سهبعدی با کیفیت بسیار بالاتر تولید میکند.
✨ ویژگیهای مهم:
• مشهای Quad واقعی
و PolyGen 1.5 فقط مثل قبل مشهای مثلثی نمیسازد — حالا Quad Meshهای تمیز و حرفهای تولید میکند.
این یعنی تاپولوژی بهتر، وایرفریم مرتبتر و ادیت راحتتر.
🎮 کاربردهای عملی
مشهای Quad برای بازیسازها، انیماتورها، طراحان 3D و پروژههای VR ایدهآل هستند.
کیفیت و تمیزی لبهها، مدل را مستقیم قابل استفاده در تولید میکند.
⚙️ پشتیبانی از فرمتهای مختلف
هر دو نوع Quad و Tri تولید میشود — بنابراین برای هر نوع pipeline مناسب است.
🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio
#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مشهای سهبعدی با کیفیت بسیار بالاتر تولید میکند.
✨ ویژگیهای مهم:
• مشهای Quad واقعی
و PolyGen 1.5 فقط مثل قبل مشهای مثلثی نمیسازد — حالا Quad Meshهای تمیز و حرفهای تولید میکند.
این یعنی تاپولوژی بهتر، وایرفریم مرتبتر و ادیت راحتتر.
🎮 کاربردهای عملی
مشهای Quad برای بازیسازها، انیماتورها، طراحان 3D و پروژههای VR ایدهآل هستند.
کیفیت و تمیزی لبهها، مدل را مستقیم قابل استفاده در تولید میکند.
⚙️ پشتیبانی از فرمتهای مختلف
هر دو نوع Quad و Tri تولید میشود — بنابراین برای هر نوع pipeline مناسب است.
🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio
#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
🔥2❤1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🌵 Instance-Level Video Generation 🌵
👉 فریمورک InstanceV اولین فریمورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه میدهد هر شیء در ویدئو بهصورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شدهاند 💙
🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: بهزودی
#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👉 فریمورک InstanceV اولین فریمورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه میدهد هر شیء در ویدئو بهصورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شدهاند 💙
🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: بهزودی
#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 مدل Kling Omni (O1) رسماً منتشر شد و نتیجهها فوقالعادهاند!
این مدل مثل nano-banana pro است، اما برای ویدئو — هر ویدئو را میگیرد و به هر چیزی که بخواهی تبدیل میکند.
🎬 قابلیتهای کلیدی O1:
♻️حذف تمیز و دقیق اشیا
♻️تغییر کامل سبک و حالوهوای صحنه
♻️رندر دوبارهٔ کل ویدئو
♻️حفظ یکپارچگی چهره و شخصیت در هر زاویه و هر فریم
🚀 مزیت بزرگ:
دیگر لازم نیست تکتک فریمها را اصلاح کنی.
تنها با یک پرامپت، کل ویدئو تغییر میکند — سریعتر، ارزانتر و بدون اتلاف زمان و اعتبار.
🎨 تجربهٔ کاربری:
و O1 واقعاً حس یک همکار خلاق را میدهد:
✳️حذف اشیای ناخواسته
✳️تغییر سبک هنری
✳️بازآفرینی کامل ویدئو
✳️حفظ شخصیتها در تمامی زوایا
🌐 آزمایش رایگان:
اینکه OpenArt حالت بدون محدودیت فعال کرده — کاملاً مناسب برای تست و بازی با ایدهها.
🔗 https://app.klingai.com/global/omni/new
@rss_ai_ir
#Kling #KlingOmni #KlingO1 #AIvideo #AIGeneration #VideoEditing #GenerativeAI
این مدل مثل nano-banana pro است، اما برای ویدئو — هر ویدئو را میگیرد و به هر چیزی که بخواهی تبدیل میکند.
🎬 قابلیتهای کلیدی O1:
♻️حذف تمیز و دقیق اشیا
♻️تغییر کامل سبک و حالوهوای صحنه
♻️رندر دوبارهٔ کل ویدئو
♻️حفظ یکپارچگی چهره و شخصیت در هر زاویه و هر فریم
🚀 مزیت بزرگ:
دیگر لازم نیست تکتک فریمها را اصلاح کنی.
تنها با یک پرامپت، کل ویدئو تغییر میکند — سریعتر، ارزانتر و بدون اتلاف زمان و اعتبار.
🎨 تجربهٔ کاربری:
و O1 واقعاً حس یک همکار خلاق را میدهد:
✳️حذف اشیای ناخواسته
✳️تغییر سبک هنری
✳️بازآفرینی کامل ویدئو
✳️حفظ شخصیتها در تمامی زوایا
🌐 آزمایش رایگان:
اینکه OpenArt حالت بدون محدودیت فعال کرده — کاملاً مناسب برای تست و بازی با ایدهها.
🔗 https://app.klingai.com/global/omni/new
@rss_ai_ir
#Kling #KlingOmni #KlingO1 #AIvideo #AIGeneration #VideoEditing #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
✨ Vision Bridge Transformer at Scale —
خلاصه و معرفی
📌مدل Vision Bridge Transformer (ViBT) یک مدل بزرگمقیاس برای تولید شرطی (Conditional Generation) است.
این مدل برخلاف دیفیوژنها که فرآیند چندمرحلهای دارند، ورودی را بهصورت مستقیم به خروجی ترجمه میکند و به همین دلیل سریع، پایدار و مقیاسپذیر است.
🔍 ویژگیهای کلیدی:
♻️معماری جدید برای مدلسازی «trajectory» بین ورودی و خروجی
♻️مناسب برای ویرایش تصویر و ویدیو، تغییر سبک، بازسازی و تبدیلهای پیچیده
♻️مقیاسپذیر تا میلیاردها پارامتر
♻️کیفیت بالا در ویرایش صحنههای چندلایه و حفظ یکپارچگی بصری
📄 لینکها:
arXiv: https://arxiv.org/abs/2511.23199
PDF: https://arxiv.org/pdf/2511.23199
Project: https://yuanshi9815.github.io/ViBT_homepage/
GitHub: https://github.com/Yuanshi9815/ViBT
Demo Space: https://huggingface.co/spaces/Yuanshi/ViBT
==============================
@rss_ai_ir
#VisionTransformer #GenerativeAI #ComputerVision #DeepLearning #AI 🌟
خلاصه و معرفی
📌مدل Vision Bridge Transformer (ViBT) یک مدل بزرگمقیاس برای تولید شرطی (Conditional Generation) است.
این مدل برخلاف دیفیوژنها که فرآیند چندمرحلهای دارند، ورودی را بهصورت مستقیم به خروجی ترجمه میکند و به همین دلیل سریع، پایدار و مقیاسپذیر است.
🔍 ویژگیهای کلیدی:
♻️معماری جدید برای مدلسازی «trajectory» بین ورودی و خروجی
♻️مناسب برای ویرایش تصویر و ویدیو، تغییر سبک، بازسازی و تبدیلهای پیچیده
♻️مقیاسپذیر تا میلیاردها پارامتر
♻️کیفیت بالا در ویرایش صحنههای چندلایه و حفظ یکپارچگی بصری
📄 لینکها:
arXiv: https://arxiv.org/abs/2511.23199
PDF: https://arxiv.org/pdf/2511.23199
Project: https://yuanshi9815.github.io/ViBT_homepage/
GitHub: https://github.com/Yuanshi9815/ViBT
Demo Space: https://huggingface.co/spaces/Yuanshi/ViBT
==============================
@rss_ai_ir
#VisionTransformer #GenerativeAI #ComputerVision #DeepLearning #AI 🌟
🔥 دِ-آسیاسازی Z-Image رسید!
لِنا از Nextry.app یک لورای تازه برای Z-Image ساخته و بعد هم آن را با Z-Image Turbo مِرج کرده. این لورا روی چهرههای واقعگرایانهٔ اروپایی آموزش دیده و نتیجهاش این است که علاوهبر افزایش رئالیسم، مدل را از فرمهای کاملاً آسیایی دور میکند.
برای استفاده:
🔸 مقدار CFG را تا حدود 1 پایین بیاورید
🔸 از heupp یا euler استفاده کنید
🔸 همچنین Z-Image موقع آموزش CFG را کاهش میدهد، پس رفتارش طبیعی است
دانلود لورا 👇
https://civitai.com/models/2188147?modelVersionId=2463782
@rss_ai_ir
#AI #Zimage #LoRA #AIGeneration #Nextry #AImodels #GenerativeAI
لِنا از Nextry.app یک لورای تازه برای Z-Image ساخته و بعد هم آن را با Z-Image Turbo مِرج کرده. این لورا روی چهرههای واقعگرایانهٔ اروپایی آموزش دیده و نتیجهاش این است که علاوهبر افزایش رئالیسم، مدل را از فرمهای کاملاً آسیایی دور میکند.
برای استفاده:
🔸 مقدار CFG را تا حدود 1 پایین بیاورید
🔸 از heupp یا euler استفاده کنید
🔸 همچنین Z-Image موقع آموزش CFG را کاهش میدهد، پس رفتارش طبیعی است
دانلود لورا 👇
https://civitai.com/models/2188147?modelVersionId=2463782
@rss_ai_ir
#AI #Zimage #LoRA #AIGeneration #Nextry #AImodels #GenerativeAI
👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 معرفی یک مدل چندوجهی یکپارچه از META
یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.
در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار میگیرد و نتیجه آن یک فضای واحد است که اجازه میدهد مدلها بهصورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آنها عمل کنند — با کیفیت در حد مدلهای SOTA.
کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شدهاند و مسیر توسعه روشن است.
🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna
#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄
یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.
در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار میگیرد و نتیجه آن یک فضای واحد است که اجازه میدهد مدلها بهصورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آنها عمل کنند — با کیفیت در حد مدلهای SOTA.
کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شدهاند و مسیر توسعه روشن است.
🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna
#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄
This media is not supported in your browser
VIEW IN TELEGRAM
🐘 TTSC for 3D Generative 🐘
👉 روش SpaceControl، روش جدید SOTA و training-free برای کنترل فضایی کاملاً دقیق در تولید سهبعدی است. این مدل بدون نیاز به آموزش مجدد، فقط در test-time امکان اعمال کنترل صریح روی ساختار 3D را فراهم میکند. ریپازیتوری منتشر شد 💙
👉 Paper: https://lnkd.in/dEWh3vep
👉 Project: https://lnkd.in/dScftUmm
👉 Repo: TBA
#AI #3D #GenerativeAI #ComputerVision #DeepLearning #TTSC #SpaceControl
👉 روش SpaceControl، روش جدید SOTA و training-free برای کنترل فضایی کاملاً دقیق در تولید سهبعدی است. این مدل بدون نیاز به آموزش مجدد، فقط در test-time امکان اعمال کنترل صریح روی ساختار 3D را فراهم میکند. ریپازیتوری منتشر شد 💙
👉 Paper: https://lnkd.in/dEWh3vep
👉 Project: https://lnkd.in/dScftUmm
👉 Repo: TBA
#AI #3D #GenerativeAI #ComputerVision #DeepLearning #TTSC #SpaceControl
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎷 Layered PSD Diffusion 🎷
👉 معماری OmniPSD یک معماری جدید برای تولید فایلهای PSD لایهدار است؛ یعنی مدل نهتنها تصویر میسازد، بلکه آن را به لایههای جداگانه با آلفای شفاف (RGBA) تقسیم میکند — متن، عناصر پیشزمینه، پسزمینه… همه در لایههای تمیز و قابل ویرایش.
این یعنی خروجی مدل را میتوان مستقیم داخل Photoshop یا هر ویرایشگر PSD باز کرد و هر جزء را مستقل تغییر داد.
نسخهی آنلاین دمو هم فعال است 💙
👉 Paper: arxiv.org/pdf/2512.09247
👉 Project: showlab.github.io/OmniPSD/
👉 Demo: https://www.lovart.ai/it
#AI #Diffusion #PSD #GenerativeAI #Design #OmniPSD
👉 معماری OmniPSD یک معماری جدید برای تولید فایلهای PSD لایهدار است؛ یعنی مدل نهتنها تصویر میسازد، بلکه آن را به لایههای جداگانه با آلفای شفاف (RGBA) تقسیم میکند — متن، عناصر پیشزمینه، پسزمینه… همه در لایههای تمیز و قابل ویرایش.
این یعنی خروجی مدل را میتوان مستقیم داخل Photoshop یا هر ویرایشگر PSD باز کرد و هر جزء را مستقل تغییر داد.
نسخهی آنلاین دمو هم فعال است 💙
👉 Paper: arxiv.org/pdf/2512.09247
👉 Project: showlab.github.io/OmniPSD/
👉 Demo: https://www.lovart.ai/it
#AI #Diffusion #PSD #GenerativeAI #Design #OmniPSD
✨ دیزنی و OpenAI وارد یک همکاری بزرگ شدند 🎬🤖
💰 دیزنی بهتازگی اعلام کرده که با OpenAI یک قرارداد سهساله امضا کرده و به اولین شریک بزرگ لایسنس محتوایی Sora تبدیل شده است.
🧠 بر اساس این توافق، مدل Sora میتواند ویدیوهای کوتاه مبتنی بر پرامپت کاربران تولید کند که شامل بیش از ۲۰۰ کاراکتر از دنیای دیزنی، مارول، پیکسار و جنگ ستارگان هستند. این ویدیوها برای انتشار و اشتراکگذاری در شبکههای اجتماعی طراحی شدهاند.
🎥 این همکاری نشان میدهد که آینده تولید محتوا بهسمت ترکیب مستقیم هوش مصنوعی مولد + IPهای عظیم سرگرمی حرکت میکند؛ جایی که طرفداران نه فقط مصرفکننده، بلکه خالق روایتها میشوند.
🚀 دیزنی عملاً یک قدم جلوتر از بقیه است و Sora را به زمین بازی رسمی فرنچایزهایش تبدیل میکند.
@rss_ai_ir
#AI #OpenAI #Disney #Sora #GenerativeAI #Media #Entertainment
💰 دیزنی بهتازگی اعلام کرده که با OpenAI یک قرارداد سهساله امضا کرده و به اولین شریک بزرگ لایسنس محتوایی Sora تبدیل شده است.
🧠 بر اساس این توافق، مدل Sora میتواند ویدیوهای کوتاه مبتنی بر پرامپت کاربران تولید کند که شامل بیش از ۲۰۰ کاراکتر از دنیای دیزنی، مارول، پیکسار و جنگ ستارگان هستند. این ویدیوها برای انتشار و اشتراکگذاری در شبکههای اجتماعی طراحی شدهاند.
🎥 این همکاری نشان میدهد که آینده تولید محتوا بهسمت ترکیب مستقیم هوش مصنوعی مولد + IPهای عظیم سرگرمی حرکت میکند؛ جایی که طرفداران نه فقط مصرفکننده، بلکه خالق روایتها میشوند.
🚀 دیزنی عملاً یک قدم جلوتر از بقیه است و Sora را به زمین بازی رسمی فرنچایزهایش تبدیل میکند.
@rss_ai_ir
#AI #OpenAI #Disney #Sora #GenerativeAI #Media #Entertainment
👍7🎉7🥰6❤5👏4🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
✨ بهروزرسانی مهم از Runway ML؛ Demo Day تحقیقاتی که بیسروصدا برگزار شد 🎥🤖
مدتی است Runway ML آرام و بدون هیاهو جلو میرود، اما در Research Demo Day اخیرشان چند نکته مهم مطرح شد که ارزش توجه دارد 👇
🧠 Gen-4.5
در نسخههای آینده امکان ساخت و ویرایش صدا و همچنین ادیت ویدیو با طول دلخواه و حتی مونتاژ چندشاتی (multi-shot editing) فراهم میشود 🎬🔊
🌍 GWM-1 | General World Model
مدلی خودبازگشتی که فریمبهفریم آینده را پیشبینی میکند. کاربر میتواند وسط کار دخالت کند:
حرکت در فضا، کنترل ربات، یا تعامل با عاملها. خروجی فعلی: 720p و 24fps ⏱️
یک بازیگر جدی دیگر در میدان «مدلهای جهان».
🤖 GWM Robotics
شبیهساز قابلآموزش برای تولید داده مصنوعی و آموزش مقیاسپذیر رباتها، ساختهشده روی GWM-1.
🌐 GWM Worlds
مدل جهان برای شبیهسازی محیط بهصورت بلادرنگ و بینهایت.
از یک صحنه ثابت شروع میکند و جهانی قابل کاوش با هندسه، نورپردازی و فیزیک میسازد.
میتوانی انسان باشی، پهپاد، حیوان یا ربات — هر نقشی که بخواهی 🏙️🛸
🗣️ GWM Avatars
آواتارهای سخنگو شبیه Hedra و Live Avatars؛
نه فقط انسان، بلکه موجودات، شخصیتها و حیوانات، با ویدیوهای طولانی در 720p 🎭
⚠️ اسپویل مهم
هیچکدام از اینها هنوز آماده نیستند و زمانی برای عرضه اعلام نشده.
اینکه Runway از نظر ایده جلو بوده، اما از نظر سرعت آپدیتها کمی عقب افتاده است.
📺 ویدیو کامل:
https://www.youtube.com/watch?v=OnXu-6xecxM
🌐 وبسایت:
https://runwayml.com/
@rss_ai_ir
#AI #RunwayML #WorldModels #GenerativeAI #VideoGeneration #Robotics #Simulation
مدتی است Runway ML آرام و بدون هیاهو جلو میرود، اما در Research Demo Day اخیرشان چند نکته مهم مطرح شد که ارزش توجه دارد 👇
🧠 Gen-4.5
در نسخههای آینده امکان ساخت و ویرایش صدا و همچنین ادیت ویدیو با طول دلخواه و حتی مونتاژ چندشاتی (multi-shot editing) فراهم میشود 🎬🔊
🌍 GWM-1 | General World Model
مدلی خودبازگشتی که فریمبهفریم آینده را پیشبینی میکند. کاربر میتواند وسط کار دخالت کند:
حرکت در فضا، کنترل ربات، یا تعامل با عاملها. خروجی فعلی: 720p و 24fps ⏱️
یک بازیگر جدی دیگر در میدان «مدلهای جهان».
🤖 GWM Robotics
شبیهساز قابلآموزش برای تولید داده مصنوعی و آموزش مقیاسپذیر رباتها، ساختهشده روی GWM-1.
🌐 GWM Worlds
مدل جهان برای شبیهسازی محیط بهصورت بلادرنگ و بینهایت.
از یک صحنه ثابت شروع میکند و جهانی قابل کاوش با هندسه، نورپردازی و فیزیک میسازد.
میتوانی انسان باشی، پهپاد، حیوان یا ربات — هر نقشی که بخواهی 🏙️🛸
🗣️ GWM Avatars
آواتارهای سخنگو شبیه Hedra و Live Avatars؛
نه فقط انسان، بلکه موجودات، شخصیتها و حیوانات، با ویدیوهای طولانی در 720p 🎭
⚠️ اسپویل مهم
هیچکدام از اینها هنوز آماده نیستند و زمانی برای عرضه اعلام نشده.
اینکه Runway از نظر ایده جلو بوده، اما از نظر سرعت آپدیتها کمی عقب افتاده است.
📺 ویدیو کامل:
https://www.youtube.com/watch?v=OnXu-6xecxM
🌐 وبسایت:
https://runwayml.com/
@rss_ai_ir
#AI #RunwayML #WorldModels #GenerativeAI #VideoGeneration #Robotics #Simulation
🥰6👏6❤5👍4😁4🔥3🎉3
⚠️ اوپنایآی از دردسر حقوقی عبور کرد؛ دیزنی تمرکز را روی گوگل گذاشت 🧑⚖️🎬
پس از اعلام همکاری یکمیلیارددلاری دیزنی با OpenAI برای حضور شخصیتهای دیزنی در محصولات Sora، انتظار میرفت دعوای کپیرایت داغ شود؛ اما دیزنی مسیر دیگری را انتخاب کرد.
🔎 چه اتفاقی افتاده؟
دیزنی بهجای OpenAI، بهصورت رسمی گوگل را متهم کرده که با استفاده از مدلهای هوش مصنوعیاش تصاویر و ویدئوهای غیرمجاز مبتنی بر IPهای دیزنی را تولید و توزیع میکند.
📄 در نامهای به گوگل، دیزنی این شرکت را «دستگاه فروش مجازی» توصیف کرده که میتواند شخصیتهای دارای حقنشر را در مقیاس وسیع بازتولید کند. همچنین اشاره شده که بسیاری از خروجیهای ادعاً ناقض، با لوگوی Google Gemini منتشر شدهاند؛ موضوعی که بهگفته دیزنی، این تصور غلط را ایجاد میکند که استفاده از این شخصیتها مورد تأیید بوده است.
🗣️ واکنش گوگل:
گوگل به جزئیات اتهامات پاسخ نداده و تنها بر «روابط دیرینه و سودمند دوجانبه» با دیزنی تأکید کرده است.
📌 جمعبندی:
نبرد کپیرایت در عصر مولدها وارد فاز تازهای شده؛ همکاریهای رسمی یکسو، و فشارهای حقوقی بر تولیدکنندگان خروجیهای بدون مجوز سوی دیگر.
@rss_ai_ir
#AI #Copyright #OpenAI #Google #Disney #Sora #Gemini #GenerativeAI
پس از اعلام همکاری یکمیلیارددلاری دیزنی با OpenAI برای حضور شخصیتهای دیزنی در محصولات Sora، انتظار میرفت دعوای کپیرایت داغ شود؛ اما دیزنی مسیر دیگری را انتخاب کرد.
🔎 چه اتفاقی افتاده؟
دیزنی بهجای OpenAI، بهصورت رسمی گوگل را متهم کرده که با استفاده از مدلهای هوش مصنوعیاش تصاویر و ویدئوهای غیرمجاز مبتنی بر IPهای دیزنی را تولید و توزیع میکند.
📄 در نامهای به گوگل، دیزنی این شرکت را «دستگاه فروش مجازی» توصیف کرده که میتواند شخصیتهای دارای حقنشر را در مقیاس وسیع بازتولید کند. همچنین اشاره شده که بسیاری از خروجیهای ادعاً ناقض، با لوگوی Google Gemini منتشر شدهاند؛ موضوعی که بهگفته دیزنی، این تصور غلط را ایجاد میکند که استفاده از این شخصیتها مورد تأیید بوده است.
🗣️ واکنش گوگل:
گوگل به جزئیات اتهامات پاسخ نداده و تنها بر «روابط دیرینه و سودمند دوجانبه» با دیزنی تأکید کرده است.
📌 جمعبندی:
نبرد کپیرایت در عصر مولدها وارد فاز تازهای شده؛ همکاریهای رسمی یکسو، و فشارهای حقوقی بر تولیدکنندگان خروجیهای بدون مجوز سوی دیگر.
@rss_ai_ir
#AI #Copyright #OpenAI #Google #Disney #Sora #Gemini #GenerativeAI