VIRSUN
7.7K subscribers
1.37K photos
788 videos
5 files
872 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 از «ایرونوف» تا امروز — انقلاب جدید گوگل در بازاریابی هوش مصنوعی

گوگل دوباره همه را غافلگیر کرد 😎 با معرفی ابزار جدیدش به نام Pomelli — پلتفرمی که می‌تواند کل کمپین بازاریابی برند شما را به‌صورت خودکار طراحی کند!

💡 فقط کافی است لینک وب‌سایت شرکت خود را به Pomelli بدهید.
هوش مصنوعی گوگل تمام محتوای سایت را می‌خواند، تحلیل می‌کند و در خروجی:
یک بسته‌ی کامل از محتوای برندشده ارائه می‌دهد؛
با داستان، پیام و گرافیک هماهنگ، آماده برای استفاده در شبکه‌های اجتماعی و تبلیغات.

و اینجا نکته‌ی جالبی هست که کمتر کسی گفت:
شما می‌توانید خودتان با پرامپت کمپین را طراحی کنید یا اجازه دهید خود Pomelli ایده دهد.
خروجی‌ها هم قابل ویرایش هستند — چه در Photoshop، چه در NanoBanana 🎨

🔥 یعنی دقیقاً همان مسیر تاریخی که از «نیکولای ایرونوف» (ژنراتور لوگوی لبدیف) شروع شد،
حالا به مرحله‌ای رسیده که فقط با دادن لینک سایت، کل محتوای بازاریابی‌تان ساخته می‌شود.

به‌زودی دیگر لازم نیست هیچ کاری بکنید —
سایت را هوش مصنوعی می‌سازد، پرامپت را هوش مصنوعی می‌نویسد،
و کمپین بازاریابی‌تان را هم هوش مصنوعی اجرا می‌کند.

👁‍🗨 شما فقط می‌مانید برای خوردن و خوابیدن — بقیه را هوش مصنوعی انجام می‌دهد 😅

🔗 https://labs.google.com/pomelli/
(با VPN آمریکا)

@rss_ai_ir

#Google #Pomelli #AI #Marketing #GenerativeAI #Automation #DigitalMarketing #هوش_مصنوعی #گوگل #بازاریابی
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
👢 Generative View Stitching (GVS):
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀

پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایت‌شده با دوربین را به‌صورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم می‌کند — جایگزینی نوآورانه برای روش‌های سنتی video length extrapolation. 🎥

ویژگی‌های کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیین‌شده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریم‌ها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متن‌باز و قابل استفاده در پروژه‌های تحقیقاتی یا صنعتی

📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورس‌کد:
github.com/andrewsonga/generative_view_stitching

🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقع‌گرایانه با کنترل دقیق دوربین است — دنیای فیلم‌سازی و شبیه‌سازی ۳D را هوشمندتر از همیشه می‌سازد.

@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌐مدل OmniX — نسل جدید مدل‌های پانورامای سه‌بعدی از Kling 🎥🧠

اگر دنبال مدل‌های متن‌به‌پانوراما بودید، OmniX از تیم HKU MMLab یکی از جذاب‌ترین پروژه‌های اخیر است —
مدلی متن‌باز که نه‌تنها تصاویر پانورامای ۳۶۰ درجه تولید می‌کند، بلکه ویژگی‌های فیزیکی صحنه را هم به‌صورت خودکار استخراج می‌کند.


---

🧩 توانایی‌های کلیدی:

🟢 تولید هم‌زمان پانوراما و نقشه‌های فیزیکی:

Depth map (عمق)

Normal map (زاویه سطح)

Albedo (رنگ پایه)

Roughness (زِبری سطح)

Metallic (جلوه فلزی)


🟢 تبدیل پانوراما به صحنه‌ی سه‌بعدی آماده برای گرافیک (Graphics-Ready 3D Scene)
مدل می‌تواند پانورامای خروجی را به mesh واقعی تبدیل کند که قابل وارد کردن به نرم‌افزارهایی مانند Blender است.
هرچند خود تیم هشدار داده که این بخش هنوز در مرحله‌ی بتا است و گاهی ناپایدار عمل می‌کند.


---

⚙️ منابع پروژه:

📄 وب‌سایت رسمی:
yukun-huang.github.io/OmniX
💻 سورس‌کد:
github.com/HKU-MMLab/OmniX
🧠 وزن‌ها (Weights):
huggingface.co/KevinHuang/OmniX


---

🎯 مدل OmniX نشان می‌دهد آینده‌ی تولید محتوای سه‌بعدی از دیدگاه پانورامیک به‌سمت یکپارچگی کامل بین درک صحنه (perception) و تولید گرافیکی (generation) در حرکت است.

📡 @rss_ai_ir
#هوش_مصنوعی #OmniX #3D #Panorama #GenerativeAI #Blender #VisionAI #Kling #HKUMMLab
1
This media is not supported in your browser
VIEW IN TELEGRAM
🎄 تب کریسمس هوش مصنوعی با کوکاکولا برگشت! 🤖

شرکت Coca-Cola اعلام کرده که تبلیغ کریسمس امسالش دوباره به‌طور کامل با هوش مصنوعی تولید خواهد شد — از ایده تا فریم نهایی. 🧠🎬

وقتی شرکتی با ارزش میلیاردی مثل کوکاکولا به این سطح از اتکا به AI رسیده،
فقط تصور کنید چه فشاری روی دوش صنعت خلاقیت و تبلیغات انسانی قرار گرفته است.

🎥 دنیایی که روزی توسط کارگردان‌ها و آرت‌دایرکتورهای بزرگ شکل می‌گرفت،
حالا به‌سرعت به دستان مدل‌های مولد و الگوریتم‌های هوشمند سپرده می‌شود.

سؤال اینجاست —
در آینده‌ی نزدیک، آیا کمپین‌های تبلیغاتی بیشتر خلق خواهند شد یا تولید خواهند شد؟ 🧩

📡 @rss_ai_ir
#هوش_مصنوعی #تبلیغات #CocaCola #CreativeAI #AI #Marketing #GenerativeAI
👎3🔥2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬مدل Grok Imagine حالا علاوه بر Image2Video، از Text2Video هم پشتیبانی می‌کند! 🤖

در نسخه‌ی وب دسکتاپ، این ابزار حالا می‌تواند فقط با توصیف متنی از صفر یک ویدیو بسازد — بدون نیاز به تصویر ورودی.

اما بخش جالب ماجرا اینجاست 👇
کاربری یک تصویر کاملاً سیاه بدون هیچ پرامپتی وارد کرد و نوشت:

> «یک ویدیو بساز!»



نتیجه؟ 🎞
یک ویدیو ظاهر شد که شبیه تبلیغ جدید سامسونگ بود! 😅
و چون هیچ seed ثبت نشده، تکرار آن غیرممکن است — مثل یک الهام مرموز از تاریکی! 🌌

📍 لینک:
grok.com/imagine
📡 @rss_ai_ir
#هوش_مصنوعی #Grok #تبدیل_متن_به_ویدیو #AIvideo #تکنولوژی #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Gamma.app
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!

استارتاپ Gamma که به‌عنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفق‌ترین پلتفرم‌های تولید محتوای بصری با هوش مصنوعی تبدیل شده است.

در نسخه‌ی جدید Gamma 3.0، این ابزار نه‌تنها ارائه‌های (presentations) هوشمند می‌سازد، بلکه می‌تواند وب‌سایت‌ها و طرح‌های شبکه‌های اجتماعی را نیز به‌صورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش می‌کشد.

📊 آمار چشم‌گیر:

💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار

👥 کاربران فعال: ۷۰ میلیون نفر

💎 ارزش‌گذاری شرکت: ۲.۱ میلیارد دلار

👨‍💻 تنها ۵۰ کارمند

روزانه بیش از ۱ میلیون گاما ساخته می‌شود!


🧠 آن‌ها به‌تازگی API رسمی را منتشر کرده‌اند و برای علاقه‌مندان، راهنمای پرامپت‌نویسی (Prompt Guide) را در لینک زیر قرار داده‌اند:
👉 https://gamma.app/prompts

جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.

#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 مدل سه‌بعدی‌ساز World Labs برای همه آزاد شد

استارتاپ World Labs که با همکاری فی‌فی لی تأسیس شده، دسترسی عمومی به مدل قدرتمند Marble را فعال کرد — مدلی که می‌تواند فقط از روی متن، عکس، ویدیو یا طرح‌های سه‌بعدی موجود، یک دنیای کامل سه‌بعدی بسازد.

ویژگی‌های کلیدی Marble:
🔸 ساخت محیط‌های سه‌بعدی پایدار، قابل ویرایش و آماده استفاده
🔸 خروجی در قالب Mesh، Gaussian Splatting یا حتی ویدیو — مناسب برای بازی‌سازی، فیلم‌سازی و شبیه‌سازی
🔸 ورودی چندحالته: از یک عکس تکی تا ویدیوهای چندنمایی
🔸 ابزار داخلی «Chisel» برای طراحی سریع ساختار سه‌بعدی خام و سپس اعمال جزییات و سبک
🔸 مناسب برای تیم‌های رباتیک، طراحان، گیم‌دِو و فیلم‌سازی

مدل Marble نشان می‌دهد که هوش مصنوعی مولد از متن و تصویر فراتر رفته و وارد درک فضایی واقعی شده است — یعنی ساخت جهان‌های سه‌بعدی فقط با یک پرامپت.


---
https://marble.worldlabs.ai/

#هوش_مصنوعی #Marble #WorldLabs #سه‌بعدی #3D #GenerativeAI #SpatialAI #FeiFeiLi #AI #GaussianSplats #GameDev #VFX #Simulation
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 مدل WorldGen؛ نسل بعدی ساخت جهان‌های سه‌بعدی
متا رسماً وارد بازی «خدای 3D» شده است.

اگر Marble و Genie فقط «تصویر از یک دوربین» می‌دادند، WorldGen یک قدم جلوتر است:
یک تکه واقعی از جهان سه‌بعدی — حدود ۵۰×۵۰ متر فضای قابل پیمایش — که می‌توانید مستقیماً داخل Unity یا Unreal بندازید و مثل یک محیط بازی واقعی استفاده کنید.

🔥 چرا WorldGen متفاوت است؟
چون این دیگر نه Gaussian Splats است و نه ویدئو.
🔹 مش واقعی (3D Mesh)
🔹 ساختار هندسی کامل
🔹 قابل استفاده در موتورهای بازی‌سازی
🔹 جهان قابل ناوبری (Navmesh-ready)

متا خودش می‌گوید WorldGen ترکیبی از 3 چیز است:

1. روش‌های پروسیجرال
2. دیفیوژن برای تولید 2D
3. بازسازی کامل 3D بر اساس آبجکت‌ها



نتیجه؟
جهان‌هایی پایدار، قابل راه‌رفتن، قابل رندر و مناسب برای:
🎮 بازی‌ها
🤖 شبیه‌سازها
🌐 محیط‌های اجتماعی و VR


---

🔧 Pipeline چهار مرحله‌ای WorldGen

(1) Planning – برنامه‌ریزی
▫️ ساخت پروسیجرال بلوک‌ها
▫️ استخراج Navmesh
▫️ تولید تصاویر مرجع

(2) Reconstruction – بازسازی
▫️ تبدیل تصویر به 3D
▫️ تولید صحنه براساس Navmesh
▫️ ساخت بافت اولیه

(3) Decomposition – تجزیهٔ صحنه
▫️ استخراج قطعات با AutoPartGen
▫️ پاک‌سازی و سازمان‌دهی داده

(4) Refinement – پالایش نهایی
▫️ ارتقای کیفیت تصویر
▫️ اصلاح مش
▫️ تکسچرینگ نهایی


---

🚨 اما خبر بد؟

اینکهWorldGen فعلاً محصول نیست.
متا هنوز روی سرعت تولید و ساخت جهان‌های بزرگ‌تر کار می‌کند (فعلاً خیلی کند است).

اما خروجی‌های اولیه شگفت‌انگیزند — ویدیوی دمو را اینجا ببینید:
🔗 https://www.uploadvr.com/meta-worldgen-ai-generates-3d-worlds/

به‌ظاهر، متا می‌خواهد Minecraft + Unreal + AI را یک‌جا ترکیب کند.
سال ۲۰۲۵ احتمالاً سال متولد شدن GenAI-Worlds خواهد بود.

@rss_ai_ir
#متاورس #WorldGen #MetaAI #3DGeneration #Unity #Unreal #AI #GameDev #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ مدل Flux 2 رسماً منتشر شد – ارتقای بزرگ در نسل تصویر
@rss_ai_ir

مدل Flux 2 با یک آپدیت سنگین برگشته و حالا دقیق‌تر، واقع‌گراتر و بسیار توانمندتر شده است.

چه چیزهایی بهتر شده؟

♻️پشتیبانی همزمان از ۱۰ رفرنس

♻️درک بسیار بهتر از نور، متریال‌ها و اپتیک

♻️رندر دقیق‌تر و طبیعی‌تر متن

♻️خروجی با کیفیت ۴K واقعی

♻️تصاویر نرم‌تر، واقع‌گراتر و بدون «براقی پلاستیکی»

♻️امکان ترکیب، ویرایش و ژنریشن چندمرحله‌ای


🖥️ اجرای محلی هم کاملاً ممکن است
وزن‌ها باز هستند و با حدود ۶۵ گیگابایت می‌توانید مدل را روی سیستم خود اجرا کنید.

🟠 دمو:
https://playground.bfl.ai/image/generate

🟠 وزن‌ها:
https://huggingface.co/black-forest-labs

🟠 FLUX.2-dev در HF:
https://huggingface.co/black-forest-labs/FLUX.2-dev


---

#Flux2 #AI #ImageGeneration #AIGraphics #GenerativeAI #BlackForestLabs #DiffusionModels
👏5👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🍓 مدل MotionV2V — ویرایش حرکت در ویدئو با دقت بی‌سابقه 🍓

گوگل سیستم MotionV2V را معرفی کرد؛ روشی نوین برای ویرایش حرکت در ویدئو که به‌جای تغییر کل فریم، مستقیماً تفاوت حرکت بین ویدئوی اصلی و نسخه ویرایش‌شده را کنترل می‌کند.

این مدل بر پایه دیفیوشن کار می‌کند و امکان می‌دهد که:
حرکت یک فرد تغییر کند، بدون تغییر ظاهر
سرعت، جهت، یا شدت حرکت اصلاح شود
حرکت کاملاً جدید روی ویدئو اعمال شود
ویدئوهای ادیت‌شده، طبیعی و منسجم باقی بمانند

نتیجه؟
ویدئوهایی با حرکت‌های کاملاً کنترل‌شده، بدون artifacts و بدون پرش‌های عجیب.

🔗 لینک‌ها:

👉 Paper:
https://arxiv.org/pdf/2511.20640
👉 Project Page:
https://ryanndagreat.github.io/MotionV2V/
👉 GitHub (به‌زودی):
https://github.com/RyannDaGreat/MotionV2V

#MotionEditing #VideoAI #DiffusionModels #GoogleAI #GenerativeAI #DeepLearning
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
STARFlow-V:
نسل تازه مدل‌های ویدئو با Normalizing Flow
@rss_ai_ir 🎥

مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایه‌ی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده می‌شود، اما حالا نتایج فوق‌العاده‌ای نشان داده است.

🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیش‌بینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen

📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow

#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
🥰1
Media is too big
VIEW IN TELEGRAM
🔥 استودیو Hunyuan 3D به نسخهٔ 1.1 آپدیت شد!

مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مش‌های سه‌بعدی با کیفیت بسیار بالاتر تولید می‌کند.

ویژگی‌های مهم:

• مش‌های Quad واقعی
و PolyGen 1.5 فقط مثل قبل مش‌های مثلثی نمی‌سازد — حالا Quad Mesh‌های تمیز و حرفه‌ای تولید می‌کند.
این یعنی تاپولوژی بهتر، وایرفریم مرتب‌تر و ادیت راحت‌تر.

🎮 کاربردهای عملی
مش‌های Quad برای بازی‌سازها، انیماتورها، طراحان 3D و پروژه‌های VR ایده‌آل هستند.
کیفیت و تمیزی لبه‌ها، مدل را مستقیم قابل استفاده در تولید می‌کند.

⚙️ پشتیبانی از فرمت‌های مختلف
هر دو نوع Quad و Tri تولید می‌شود — بنابراین برای هر نوع pipeline مناسب است.

🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio


#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
🔥21🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🌵 Instance-Level Video Generation 🌵

👉 فریمورک InstanceV اولین فریم‌ورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه می‌دهد هر شیء در ویدئو به‌صورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شده‌اند 💙


🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: به‌زودی

#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 مدل Kling Omni (O1) رسماً منتشر شد و نتیجه‌ها فوق‌العاده‌اند!

این مدل مثل nano-banana pro است، اما برای ویدئو — هر ویدئو را می‌گیرد و به هر چیزی که بخواهی تبدیل می‌کند.

🎬 قابلیت‌های کلیدی O1:

♻️حذف تمیز و دقیق اشیا

♻️تغییر کامل سبک و حال‌وهوای صحنه

♻️رندر دوبارهٔ کل ویدئو

♻️حفظ یکپارچگی چهره و شخصیت در هر زاویه و هر فریم


🚀 مزیت بزرگ:
دیگر لازم نیست تک‌تک فریم‌ها را اصلاح کنی.
تنها با یک پرامپت، کل ویدئو تغییر می‌کند — سریع‌تر، ارزان‌تر و بدون اتلاف زمان و اعتبار.

🎨 تجربهٔ کاربری:
و O1 واقعاً حس یک همکار خلاق را می‌دهد:

✳️حذف اشیای ناخواسته

✳️تغییر سبک هنری

✳️بازآفرینی کامل ویدئو

✳️حفظ شخصیت‌ها در تمامی زوایا


🌐 آزمایش رایگان:
اینکه OpenArt حالت بدون محدودیت فعال کرده — کاملاً مناسب برای تست و بازی با ایده‌ها.
🔗 https://app.klingai.com/global/omni/new

@rss_ai_ir

#Kling #KlingOmni #KlingO1 #AIvideo #AIGeneration #VideoEditing #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
Vision Bridge Transformer at Scale —
خلاصه و معرفی

📌مدل Vision Bridge Transformer (ViBT) یک مدل بزرگ‌مقیاس برای تولید شرطی (Conditional Generation) است.
این مدل برخلاف دیفیوژن‌ها که فرآیند چندمرحله‌ای دارند، ورودی را به‌صورت مستقیم به خروجی ترجمه می‌کند و به همین دلیل سریع، پایدار و مقیاس‌پذیر است.

🔍 ویژگی‌های کلیدی:

♻️معماری جدید برای مدل‌سازی «trajectory» بین ورودی و خروجی

♻️مناسب برای ویرایش تصویر و ویدیو، تغییر سبک، بازسازی و تبدیل‌های پیچیده

♻️مقیاس‌پذیر تا میلیاردها پارامتر

♻️کیفیت بالا در ویرایش صحنه‌های چندلایه و حفظ یکپارچگی بصری


📄 لینک‌ها:

arXiv: https://arxiv.org/abs/2511.23199

PDF: https://arxiv.org/pdf/2511.23199

Project: https://yuanshi9815.github.io/ViBT_homepage/

GitHub: https://github.com/Yuanshi9815/ViBT

Demo Space: https://huggingface.co/spaces/Yuanshi/ViBT


==============================
@rss_ai_ir

#VisionTransformer #GenerativeAI #ComputerVision #DeepLearning #AI 🌟
🔥 دِ-آسیا‌سازی Z-Image رسید!

لِنا از Nextry.app یک لورای تازه برای Z-Image ساخته و بعد هم آن را با Z-Image Turbo مِرج کرده. این لورا روی چهره‌های واقع‌گرایانهٔ اروپایی آموزش دیده و نتیجه‌اش این است که علاوه‌بر افزایش رئالیسم، مدل را از فرم‌های کاملاً آسیایی دور می‌کند.

برای استفاده:
🔸 مقدار CFG را تا حدود 1 پایین بیاورید
🔸 از heupp یا euler استفاده کنید
🔸 همچنین Z-Image موقع آموزش CFG را کاهش می‌دهد، پس رفتارش طبیعی است

دانلود لورا 👇
https://civitai.com/models/2188147?modelVersionId=2463782

@rss_ai_ir

#AI #Zimage #LoRA #AIGeneration #Nextry #AImodels #GenerativeAI
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 معرفی یک مدل چندوجهی یکپارچه از META

یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.

در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار می‌گیرد و نتیجه آن یک فضای واحد است که اجازه می‌دهد مدل‌ها به‌صورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آن‌ها عمل کنند — با کیفیت در حد مدل‌های SOTA.

کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شده‌اند و مسیر توسعه روشن است.


🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna

#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄
This media is not supported in your browser
VIEW IN TELEGRAM
🐘 TTSC for 3D Generative 🐘

👉 روش SpaceControl، روش جدید SOTA و training-free برای کنترل فضایی کاملاً دقیق در تولید سه‌بعدی است. این مدل بدون نیاز به آموزش مجدد، فقط در test-time امکان اعمال کنترل صریح روی ساختار 3D را فراهم می‌کند. ریپازیتوری منتشر شد 💙

👉 Paper: https://lnkd.in/dEWh3vep
👉 Project: https://lnkd.in/dScftUmm
👉 Repo: TBA

#AI #3D #GenerativeAI #ComputerVision #DeepLearning #TTSC #SpaceControl
👍1