VIRSUN
7.15K subscribers
1.45K photos
819 videos
5 files
908 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
Media is too big
VIEW IN TELEGRAM
🔥 استودیو Hunyuan 3D به نسخهٔ 1.1 آپدیت شد!

مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مش‌های سه‌بعدی با کیفیت بسیار بالاتر تولید می‌کند.

ویژگی‌های مهم:

• مش‌های Quad واقعی
و PolyGen 1.5 فقط مثل قبل مش‌های مثلثی نمی‌سازد — حالا Quad Mesh‌های تمیز و حرفه‌ای تولید می‌کند.
این یعنی تاپولوژی بهتر، وایرفریم مرتب‌تر و ادیت راحت‌تر.

🎮 کاربردهای عملی
مش‌های Quad برای بازی‌سازها، انیماتورها، طراحان 3D و پروژه‌های VR ایده‌آل هستند.
کیفیت و تمیزی لبه‌ها، مدل را مستقیم قابل استفاده در تولید می‌کند.

⚙️ پشتیبانی از فرمت‌های مختلف
هر دو نوع Quad و Tri تولید می‌شود — بنابراین برای هر نوع pipeline مناسب است.

🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio


#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
🔥21🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🌵 Instance-Level Video Generation 🌵

👉 فریمورک InstanceV اولین فریم‌ورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه می‌دهد هر شیء در ویدئو به‌صورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شده‌اند 💙


🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: به‌زودی

#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 مدل Kling Omni (O1) رسماً منتشر شد و نتیجه‌ها فوق‌العاده‌اند!

این مدل مثل nano-banana pro است، اما برای ویدئو — هر ویدئو را می‌گیرد و به هر چیزی که بخواهی تبدیل می‌کند.

🎬 قابلیت‌های کلیدی O1:

♻️حذف تمیز و دقیق اشیا

♻️تغییر کامل سبک و حال‌وهوای صحنه

♻️رندر دوبارهٔ کل ویدئو

♻️حفظ یکپارچگی چهره و شخصیت در هر زاویه و هر فریم


🚀 مزیت بزرگ:
دیگر لازم نیست تک‌تک فریم‌ها را اصلاح کنی.
تنها با یک پرامپت، کل ویدئو تغییر می‌کند — سریع‌تر، ارزان‌تر و بدون اتلاف زمان و اعتبار.

🎨 تجربهٔ کاربری:
و O1 واقعاً حس یک همکار خلاق را می‌دهد:

✳️حذف اشیای ناخواسته

✳️تغییر سبک هنری

✳️بازآفرینی کامل ویدئو

✳️حفظ شخصیت‌ها در تمامی زوایا


🌐 آزمایش رایگان:
اینکه OpenArt حالت بدون محدودیت فعال کرده — کاملاً مناسب برای تست و بازی با ایده‌ها.
🔗 https://app.klingai.com/global/omni/new

@rss_ai_ir

#Kling #KlingOmni #KlingO1 #AIvideo #AIGeneration #VideoEditing #GenerativeAI
This media is not supported in your browser
VIEW IN TELEGRAM
Vision Bridge Transformer at Scale —
خلاصه و معرفی

📌مدل Vision Bridge Transformer (ViBT) یک مدل بزرگ‌مقیاس برای تولید شرطی (Conditional Generation) است.
این مدل برخلاف دیفیوژن‌ها که فرآیند چندمرحله‌ای دارند، ورودی را به‌صورت مستقیم به خروجی ترجمه می‌کند و به همین دلیل سریع، پایدار و مقیاس‌پذیر است.

🔍 ویژگی‌های کلیدی:

♻️معماری جدید برای مدل‌سازی «trajectory» بین ورودی و خروجی

♻️مناسب برای ویرایش تصویر و ویدیو، تغییر سبک، بازسازی و تبدیل‌های پیچیده

♻️مقیاس‌پذیر تا میلیاردها پارامتر

♻️کیفیت بالا در ویرایش صحنه‌های چندلایه و حفظ یکپارچگی بصری


📄 لینک‌ها:

arXiv: https://arxiv.org/abs/2511.23199

PDF: https://arxiv.org/pdf/2511.23199

Project: https://yuanshi9815.github.io/ViBT_homepage/

GitHub: https://github.com/Yuanshi9815/ViBT

Demo Space: https://huggingface.co/spaces/Yuanshi/ViBT


==============================
@rss_ai_ir

#VisionTransformer #GenerativeAI #ComputerVision #DeepLearning #AI 🌟
🔥 دِ-آسیا‌سازی Z-Image رسید!

لِنا از Nextry.app یک لورای تازه برای Z-Image ساخته و بعد هم آن را با Z-Image Turbo مِرج کرده. این لورا روی چهره‌های واقع‌گرایانهٔ اروپایی آموزش دیده و نتیجه‌اش این است که علاوه‌بر افزایش رئالیسم، مدل را از فرم‌های کاملاً آسیایی دور می‌کند.

برای استفاده:
🔸 مقدار CFG را تا حدود 1 پایین بیاورید
🔸 از heupp یا euler استفاده کنید
🔸 همچنین Z-Image موقع آموزش CFG را کاهش می‌دهد، پس رفتارش طبیعی است

دانلود لورا 👇
https://civitai.com/models/2188147?modelVersionId=2463782

@rss_ai_ir

#AI #Zimage #LoRA #AIGeneration #Nextry #AImodels #GenerativeAI
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 معرفی یک مدل چندوجهی یکپارچه از META

یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.

در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار می‌گیرد و نتیجه آن یک فضای واحد است که اجازه می‌دهد مدل‌ها به‌صورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آن‌ها عمل کنند — با کیفیت در حد مدل‌های SOTA.

کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شده‌اند و مسیر توسعه روشن است.


🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna

#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄
This media is not supported in your browser
VIEW IN TELEGRAM
🐘 TTSC for 3D Generative 🐘

👉 روش SpaceControl، روش جدید SOTA و training-free برای کنترل فضایی کاملاً دقیق در تولید سه‌بعدی است. این مدل بدون نیاز به آموزش مجدد، فقط در test-time امکان اعمال کنترل صریح روی ساختار 3D را فراهم می‌کند. ریپازیتوری منتشر شد 💙

👉 Paper: https://lnkd.in/dEWh3vep
👉 Project: https://lnkd.in/dScftUmm
👉 Repo: TBA

#AI #3D #GenerativeAI #ComputerVision #DeepLearning #TTSC #SpaceControl
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎷 Layered PSD Diffusion 🎷

👉 معماری OmniPSD یک معماری جدید برای تولید فایل‌های PSD لایه‌دار است؛ یعنی مدل نه‌تنها تصویر می‌سازد، بلکه آن را به لایه‌های جداگانه با آلفای شفاف (RGBA) تقسیم می‌کند — متن، عناصر پیش‌زمینه، پس‌زمینه… همه در لایه‌های تمیز و قابل ویرایش.

این یعنی خروجی مدل را می‌توان مستقیم داخل Photoshop یا هر ویرایشگر PSD باز کرد و هر جزء را مستقل تغییر داد.

نسخه‌ی آنلاین دمو هم فعال است 💙


👉 Paper: arxiv.org/pdf/2512.09247
👉 Project: showlab.github.io/OmniPSD/
👉 Demo: https://www.lovart.ai/it

#AI #Diffusion #PSD #GenerativeAI #Design #OmniPSD
دیزنی و OpenAI وارد یک همکاری بزرگ شدند 🎬🤖

💰 دیزنی به‌تازگی اعلام کرده که با OpenAI یک قرارداد سه‌ساله امضا کرده و به اولین شریک بزرگ لایسنس محتوایی Sora تبدیل شده است.

🧠 بر اساس این توافق، مدل Sora می‌تواند ویدیوهای کوتاه مبتنی بر پرامپت کاربران تولید کند که شامل بیش از ۲۰۰ کاراکتر از دنیای دیزنی، مارول، پیکسار و جنگ ستارگان هستند. این ویدیوها برای انتشار و اشتراک‌گذاری در شبکه‌های اجتماعی طراحی شده‌اند.

🎥 این همکاری نشان می‌دهد که آینده تولید محتوا به‌سمت ترکیب مستقیم هوش مصنوعی مولد + IPهای عظیم سرگرمی حرکت می‌کند؛ جایی که طرفداران نه فقط مصرف‌کننده، بلکه خالق روایت‌ها می‌شوند.

🚀 دیزنی عملاً یک قدم جلوتر از بقیه است و Sora را به زمین بازی رسمی فرنچایزهایش تبدیل می‌کند.

@rss_ai_ir

#AI #OpenAI #Disney #Sora #GenerativeAI #Media #Entertainment
👍7🎉7🥰65👏4🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
به‌روزرسانی مهم از Runway ML؛ Demo Day تحقیقاتی که بی‌سروصدا برگزار شد 🎥🤖

مدتی است Runway ML آرام و بدون هیاهو جلو می‌رود، اما در Research Demo Day اخیرشان چند نکته مهم مطرح شد که ارزش توجه دارد 👇

🧠 Gen-4.5
در نسخه‌های آینده امکان ساخت و ویرایش صدا و همچنین ادیت ویدیو با طول دلخواه و حتی مونتاژ چندشاتی (multi-shot editing) فراهم می‌شود 🎬🔊

🌍 GWM-1 | General World Model
مدلی خودبازگشتی که فریم‌به‌فریم آینده را پیش‌بینی می‌کند. کاربر می‌تواند وسط کار دخالت کند:
حرکت در فضا، کنترل ربات، یا تعامل با عامل‌ها. خروجی فعلی: 720p و 24fps ⏱️
یک بازیگر جدی دیگر در میدان «مدل‌های جهان».

🤖 GWM Robotics
شبیه‌ساز قابل‌آموزش برای تولید داده مصنوعی و آموزش مقیاس‌پذیر ربات‌ها، ساخته‌شده روی GWM-1.

🌐 GWM Worlds
مدل جهان برای شبیه‌سازی محیط به‌صورت بلادرنگ و بی‌نهایت.
از یک صحنه ثابت شروع می‌کند و جهانی قابل کاوش با هندسه، نورپردازی و فیزیک می‌سازد.
می‌توانی انسان باشی، پهپاد، حیوان یا ربات — هر نقشی که بخواهی 🏙️🛸

🗣️ GWM Avatars
آواتارهای سخنگو شبیه Hedra و Live Avatars؛
نه فقط انسان، بلکه موجودات، شخصیت‌ها و حیوانات، با ویدیوهای طولانی در 720p 🎭

⚠️ اسپویل مهم
هیچ‌کدام از این‌ها هنوز آماده نیستند و زمانی برای عرضه اعلام نشده.
اینکه Runway از نظر ایده جلو بوده، اما از نظر سرعت آپدیت‌ها کمی عقب افتاده است.

📺 ویدیو کامل:
https://www.youtube.com/watch?v=OnXu-6xecxM

🌐 وب‌سایت:
https://runwayml.com/

@rss_ai_ir

#AI #RunwayML #WorldModels #GenerativeAI #VideoGeneration #Robotics #Simulation
🥰6👏65👍4😁4🔥3🎉3
⚠️ اوپن‌ای‌آی از دردسر حقوقی عبور کرد؛ دیزنی تمرکز را روی گوگل گذاشت 🧑‍⚖️🎬

پس از اعلام همکاری یک‌میلیارددلاری دیزنی با OpenAI برای حضور شخصیت‌های دیزنی در محصولات Sora، انتظار می‌رفت دعوای کپی‌رایت داغ شود؛ اما دیزنی مسیر دیگری را انتخاب کرد.

🔎 چه اتفاقی افتاده؟
دیزنی به‌جای OpenAI، به‌صورت رسمی گوگل را متهم کرده که با استفاده از مدل‌های هوش مصنوعی‌اش تصاویر و ویدئوهای غیرمجاز مبتنی بر IPهای دیزنی را تولید و توزیع می‌کند.

📄 در نامه‌ای به گوگل، دیزنی این شرکت را «دستگاه فروش مجازی» توصیف کرده که می‌تواند شخصیت‌های دارای حق‌نشر را در مقیاس وسیع بازتولید کند. همچنین اشاره شده که بسیاری از خروجی‌های ادعاً ناقض، با لوگوی Google Gemini منتشر شده‌اند؛ موضوعی که به‌گفته دیزنی، این تصور غلط را ایجاد می‌کند که استفاده از این شخصیت‌ها مورد تأیید بوده است.

🗣️ واکنش گوگل:
گوگل به جزئیات اتهامات پاسخ نداده و تنها بر «روابط دیرینه و سودمند دوجانبه» با دیزنی تأکید کرده است.

📌 جمع‌بندی:
نبرد کپی‌رایت در عصر مولدها وارد فاز تازه‌ای شده؛ همکاری‌های رسمی یک‌سو، و فشارهای حقوقی بر تولیدکنندگان خروجی‌های بدون مجوز سوی دیگر.

@rss_ai_ir
#AI #Copyright #OpenAI #Google #Disney #Sora #Gemini #GenerativeAI