VIRSUN

🎥 مدل جدید ByteDance: Video-As-Prompt Wan2.1-14B 🎬

شرکت ByteDance از مدل جدید خود به نام Wan2.1-14B رونمایی کرده که برای وظیفه‌ی نوآورانه‌ی Video-as-Prompt طراحی شده است — یعنی می‌توانید با دادن یک ویدیو (یا ترکیبی از تصویر و متن)، ویدیوی جدید و خلاقانه‌ای بسازید.

✨ ویژگی‌ها:

پشتیبانی از حالت‌های:
🎞️ Video → Video
🖼️ Text/Image → Video

♻️دارای ۱۴ میلیارد پارامتر برای جزئیات بالا، حرکات روان و واقع‌گرایی چشمگیر.

♻️از ویدیوی ورودی برای حفظ سبک، ترکیب‌بندی و ریتم حرکتی استفاده می‌کند.

⚠️ نکات مهم:

✳️برای اجرای آن به GPU قدرتمند و حافظه بالا نیاز است.
✳️کیفیت خروجی به میزان پیچیدگی درخواست و طول ویدیو بستگی دارد.

🟠 GitHub
🟠 Hugging Face

@rss_ai_ir

#AI #VideoGeneration #ByteDance #Wan2 #GenerativeAI #HuggingFace #Innovation

❤1

258 views04:40

VIRSUN

1:20

This media is not supported in your browser

VIEW IN TELEGRAM

🌏 Hunyuan World 1.1 (WorldMirror) —
نسخه‌ی جدید مدل متن‌باز تولید جهان سه‌بعدی از Tencent Hunyuan

در حالی‌که نسخه‌ی قبلی Hunyuan World 1.0 برای ساخت جهان‌های سه‌بعدی از متن یا تصاویر تک‌زاویه‌ای طراحی شده بود و روی GPUهای معمولی اجرا می‌شد، نسخه‌ی جدید 1.1 حالا از ویدیوها و تصاویر چندزاویه‌ای پشتیبانی می‌کند.

🎯 ویژگی‌های کلیدی:

ورودی آزاد (Any Input): از ویدیو، تصویر، نقشه عمق و پارامترهای دوربین پشتیبانی می‌کند و ساختار سه‌بعدی دقیق و بدون اعوجاج می‌سازد.

خروجی آزاد (Any Output): تولید هم‌زمان چندین نمای سه‌بعدی — از جمله نقشه عمق، ابر نقاط (Point Cloud)، نرمال سطوح و Gaussian Splatting.

سرعت بالا: مدل از نوع Feed-Forward است و تمام ویژگی‌های سه‌بعدی را تنها در چند ثانیه و در یک GPU تولید می‌کند.

⚙️ این مدل به‌نوعی ادامه‌ی مسیر تکاملی مدل‌های تولید ویدیو است — با این تفاوت که حالا می‌تواند جهان‌های کامل را بازسازی کند.
در حالی‌که گوگل با مدل GENIE-3 پاسخ داده، OpenAI هنوز هیچ معادل مستقیمی برای این فناوری ندارد.

💻 منابع:
🔹 کد: github.com/Tencent-Hunyuan/HunyuanWorld-Mirror
🔹 پروژه: 3d-models.hunyuan.tencent.com/world/
🔹 دمو: Hugging Face Space
🔹 مقاله: Tech Report PDF

@rss_ai_ir
#AI #3D #GenerativeAI #Hunyuan #Tencent #OpenSource #هوش_مصنوعی #سه‌بعدی #مدل_تولیدی

👍2🔥1👏1

1.59K views15:50

VIRSUN

🎶 OpenAI
وارد دنیای موسیقی شد!

طبق گزارش منابع مختلف، OpenAI در حال توسعه‌ی یک مولد موسیقی (Music Generator) است — و ماجرا جدی‌تر از چیزی‌ست که به نظر می‌رسد.
گفته می‌شود این شرکت حتی با دانشجویان مدرسه‌ی موسیقی جولیارد (Juilliard School) در نیویورک همکاری می‌کند تا نت‌های موسیقایی را برای مدل‌هایش به‌صورت دقیق برچسب‌گذاری (annotate) کنند. 🎼

💡 هدف OpenAI
ایجاد ابزاری که کاربران بتوانند از طریق متن یا صدای خود موسیقی تولید کنند؛ مثلاً بنویسند:

> «به این وکال، یک گیتار الکتریک اضافه کن» 🎸
یا موسیقی متن مناسب برای یک ویدیو بسازند. 🎬

⚖️ اما چالش بزرگ — حقوق موسیقی (Copyright)
مجموعه OpenAI احتمالاً باید با شرکت‌های بزرگ ضبط موسیقی مانند Sony، Universal Music Group و Warner Bros. قرارداد ببندد تا از شکایت‌های احتمالی جلوگیری کند. (این شرکت‌ها هم‌اکنون از Suno و Udio به دلیل استفاده از آهنگ‌های دارای کپی‌رایت شکایت کرده‌اند).

👀 برخی تحلیلگران می‌گویند اگر OpenAI از داده‌های مجاز استفاده نکند، ممکن است سرنوشت مشابه مدل‌های Firefly از Adobe را پیدا کند — امن از نظر حقوقی، ولی بدون محبوبیت واقعی در بازار.

⛔️اما اگر این پروژه درست پیش برود، می‌تواند نقطه‌ی عطفی در دنیای تولید موسیقی با هوش مصنوعی باشد — از خلق قطعات جدید گرفته تا ساخت موسیقی‌های پویا برای فیلم و بازی.

@rss_ai_ir
#OpenAI #MusicAI #هوش_مصنوعی #موسیقی #AI #GenerativeAI #Suno #Udio #Juilliard #Firefly

❤1🔥1

1.46K views15:09

VIRSUN

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

🎨 نسخه‌ی جدید مدل تولید سه‌بعدی HiTem3D منتشر شد!

مدلی که قبلاً هم با کیفیت فوق‌العاده در تولید مش‌های سه‌بعدی شناخته می‌شد، حالا با نسخه‌ی جدید v1.5_1536 Pro بازگشته است — با جزئیاتی حتی دقیق‌تر و واقع‌گرایانه‌تر. 🤯

💎 ویژگی‌ها:

♻️کیفیت مش بسیار بالا برای مدل‌سازی دقیق اجسام
♻️مناسب برای کاربردهای طراحی صنعتی، بازی‌سازی و انیمیشن
♻️قابلیت تولید مدل‌های پیچیده با حفظ جزئیات ظریف بافت‌ها

🧩 امتحانش کنید:
https://www.hitem3d.ai/
(به‌نظر می‌رسد که هنوز اعتبار رایگان (Free Credits) هم ارائه می‌دهد 💰)

مدل HiTem3D واقعاً یکی از پیشرفته‌ترین ژنراتورهای سه‌بعدی فعلی است — مخصوصاً در ترکیب کیفیت هندسی بالا + سرعت پردازش مناسب. 🚀

@rss_ai_ir
#AI #3D #GenerativeAI #HiTem3D #هوش_مصنوعی #مدلسازی #انیمیشن #طراحی_صنعتی

🔥1

1.53K views15:13

VIRSUN

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

🧠 گوگل قابلیت جدیدی را در Gemini Canvas معرفی کرد — محیط کاری تعاملی درون Gemini حالا می‌تواند برایتان پرزنتیشن‌های کامل بسازد! 🚀

کافی است بنویسید:
💬 «ساخت یک پرزنتیشن درباره [موضوع]»
یا یک سند، جدول یا مقاله تحقیقاتی آپلود کنید —
مدل Gemini به‌صورت خودکار اسلایدهایی با متن، عناصر بصری و طراحی منسجم ایجاد می‌کند 🎨

📤 می‌توانید نتیجه را مستقیماً به Google Slides صادر کنید و هر بخش را ویرایش یا شخصی‌سازی کنید.

این قابلیت برای همه کاربران و کشورها در دسترس است،
اما کاربران Gemini 2.5 Pro از نسخه‌ی پیشرفته‌تر مدل بهره‌مند می‌شوند ⚡

و جالب‌تر اینکه این ویژگی فقط مخصوص پرزنتیشن نیست — Gemini Canvas به‌زودی به یک پلتفرم کامل برای تولید محتوای چندرسانه‌ای تبدیل می‌شود.

🔗 اطلاعات بیشتر

@rss_ai_ir
#Google #Gemini #AI #Presentation #Productivity #GenerativeAI #GeminiCanvas

👍3

1.45K views16:24

VIRSUN

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

🎬 مدل Firefly Video Editor و آموزش لور در سایت Adobe

ادوبی با پروژه‌ی Firefly قدم بزرگی به سمت دموکراتیزه‌ کردن تولید محتوای خلاقانه برداشته است.
اکنون وب‌سایت Firefly از مدل‌های مختلف مانند OpenAI، Google، Runway، Topaz و Flux پشتیبانی می‌کند تا کاربران بیشتری را جذب کند — و حالا یک گام جلوتر رفته است 👇

✨ قابلیت جدید:
کاربران می‌توانند مدل مخصوص به خودشان (Lora) را بسازند، فقط با کشیدن و رها کردن تصاویر، طراحی‌ها و طرح‌های دستی!
به این ترتیب هر کاربر می‌تواند مدل تصویری‌اش را بر اساس سبک هنری خودش آموزش دهد — بدون نیاز به هیچ دانش فنی.
یعنی تمرین لور مستقیماً روی سایت انجام می‌شود 🔥

🎥 همچنین Firefly Video Editor نیز به‌روزرسانی شده است:

♻️پشتیبانی از لایه‌ها و تایم‌لاین ویدیو
♻️ویرایش مستقیم داخل مرورگر
♻️فعلاً در حالت بتای بسته (Closed Beta) قرار دارد

📽 ویدیوی معرفی در بالای صفحه سایت Firefly قابل مشاهده است.

@rss_ai_ir

#Adobe #Firefly #AI #VideoEditing #GenerativeAI #Lora #هوش_مصنوعی #ادوبی #ویرایش_ویدیو

281 views17:15

VIRSUN

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

🎯 از «ایرونوف» تا امروز — انقلاب جدید گوگل در بازاریابی هوش مصنوعی

گوگل دوباره همه را غافلگیر کرد 😎 با معرفی ابزار جدیدش به نام Pomelli — پلتفرمی که می‌تواند کل کمپین بازاریابی برند شما را به‌صورت خودکار طراحی کند!

💡 فقط کافی است لینک وب‌سایت شرکت خود را به Pomelli بدهید.
هوش مصنوعی گوگل تمام محتوای سایت را می‌خواند، تحلیل می‌کند و در خروجی:
✅ یک بسته‌ی کامل از محتوای برندشده ارائه می‌دهد؛
✅ با داستان، پیام و گرافیک هماهنگ، آماده برای استفاده در شبکه‌های اجتماعی و تبلیغات.

و اینجا نکته‌ی جالبی هست که کمتر کسی گفت:
شما می‌توانید خودتان با پرامپت کمپین را طراحی کنید یا اجازه دهید خود Pomelli ایده دهد.
خروجی‌ها هم قابل ویرایش هستند — چه در Photoshop، چه در NanoBanana 🎨

🔥 یعنی دقیقاً همان مسیر تاریخی که از «نیکولای ایرونوف» (ژنراتور لوگوی لبدیف) شروع شد،
حالا به مرحله‌ای رسیده که فقط با دادن لینک سایت، کل محتوای بازاریابی‌تان ساخته می‌شود.

به‌زودی دیگر لازم نیست هیچ کاری بکنید —
سایت را هوش مصنوعی می‌سازد، پرامپت را هوش مصنوعی می‌نویسد،
و کمپین بازاریابی‌تان را هم هوش مصنوعی اجرا می‌کند.

👁‍🗨 شما فقط می‌مانید برای خوردن و خوابیدن — بقیه را هوش مصنوعی انجام می‌دهد 😅

🔗 https://labs.google.com/pomelli/
(با VPN آمریکا)

@rss_ai_ir

#Google #Pomelli #AI #Marketing #GenerativeAI #Automation #DigitalMarketing #هوش_مصنوعی #گوگل #بازاریابی

👍2🔥1👏1

307 viewsedited 17:24

VIRSUN

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

👢 Generative View Stitching (GVS):
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀

پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایت‌شده با دوربین را به‌صورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم می‌کند — جایگزینی نوآورانه برای روش‌های سنتی video length extrapolation. 🎥

✨ ویژگی‌های کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیین‌شده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریم‌ها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متن‌باز و قابل استفاده در پروژه‌های تحقیقاتی یا صنعتی

📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورس‌کد:
github.com/andrewsonga/generative_view_stitching

🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقع‌گرایانه با کنترل دقیق دوربین است — دنیای فیلم‌سازی و شبیه‌سازی ۳D را هوشمندتر از همیشه می‌سازد.

@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research

❤2🔥1👏1

1.53K views08:36

VIRSUN

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

🌐مدل OmniX — نسل جدید مدل‌های پانورامای سه‌بعدی از Kling 🎥🧠

اگر دنبال مدل‌های متن‌به‌پانوراما بودید، OmniX از تیم HKU MMLab یکی از جذاب‌ترین پروژه‌های اخیر است —
مدلی متن‌باز که نه‌تنها تصاویر پانورامای ۳۶۰ درجه تولید می‌کند، بلکه ویژگی‌های فیزیکی صحنه را هم به‌صورت خودکار استخراج می‌کند.

---

🧩 توانایی‌های کلیدی:

🟢 تولید هم‌زمان پانوراما و نقشه‌های فیزیکی:

Depth map (عمق)

Normal map (زاویه سطح)

Albedo (رنگ پایه)

Roughness (زِبری سطح)

Metallic (جلوه فلزی)

🟢 تبدیل پانوراما به صحنه‌ی سه‌بعدی آماده برای گرافیک (Graphics-Ready 3D Scene)
مدل می‌تواند پانورامای خروجی را به mesh واقعی تبدیل کند که قابل وارد کردن به نرم‌افزارهایی مانند Blender است.
هرچند خود تیم هشدار داده که این بخش هنوز در مرحله‌ی بتا است و گاهی ناپایدار عمل می‌کند.

---

⚙️ منابع پروژه:

📄 وب‌سایت رسمی:
yukun-huang.github.io/OmniX
💻 سورس‌کد:
github.com/HKU-MMLab/OmniX
🧠 وزن‌ها (Weights):
huggingface.co/KevinHuang/OmniX

---

🎯 مدل OmniX نشان می‌دهد آینده‌ی تولید محتوای سه‌بعدی از دیدگاه پانورامیک به‌سمت یکپارچگی کامل بین درک صحنه (perception) و تولید گرافیکی (generation) در حرکت است.

📡 @rss_ai_ir
#هوش_مصنوعی #OmniX #3D #Panorama #GenerativeAI #Blender #VisionAI #Kling #HKUMMLab

❤1

2.32K views12:41

VIRSUN

1:18

This media is not supported in your browser

VIEW IN TELEGRAM

🎄 تب کریسمس هوش مصنوعی با کوکاکولا برگشت! 🤖✨

شرکت Coca-Cola اعلام کرده که تبلیغ کریسمس امسالش دوباره به‌طور کامل با هوش مصنوعی تولید خواهد شد — از ایده تا فریم نهایی. 🧠🎬

وقتی شرکتی با ارزش میلیاردی مثل کوکاکولا به این سطح از اتکا به AI رسیده،
فقط تصور کنید چه فشاری روی دوش صنعت خلاقیت و تبلیغات انسانی قرار گرفته است.

🎥 دنیایی که روزی توسط کارگردان‌ها و آرت‌دایرکتورهای بزرگ شکل می‌گرفت،
حالا به‌سرعت به دستان مدل‌های مولد و الگوریتم‌های هوشمند سپرده می‌شود.

سؤال اینجاست —
در آینده‌ی نزدیک، آیا کمپین‌های تبلیغاتی بیشتر خلق خواهند شد یا تولید خواهند شد؟ 🧩

📡 @rss_ai_ir
#هوش_مصنوعی #تبلیغات #CocaCola #CreativeAI #AI #Marketing #GenerativeAI

👎3🔥2🥰1

1.21K views05:27

About

Blog

Apps

Platform