This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مدل جدید ByteDance: Video-As-Prompt Wan2.1-14B 🎬
شرکت ByteDance از مدل جدید خود به نام Wan2.1-14B رونمایی کرده که برای وظیفهی نوآورانهی Video-as-Prompt طراحی شده است — یعنی میتوانید با دادن یک ویدیو (یا ترکیبی از تصویر و متن)، ویدیوی جدید و خلاقانهای بسازید.
✨ ویژگیها:
پشتیبانی از حالتهای:
🎞️ Video → Video
🖼️ Text/Image → Video
♻️دارای ۱۴ میلیارد پارامتر برای جزئیات بالا، حرکات روان و واقعگرایی چشمگیر.
♻️از ویدیوی ورودی برای حفظ سبک، ترکیببندی و ریتم حرکتی استفاده میکند.
⚠️ نکات مهم:
✳️برای اجرای آن به GPU قدرتمند و حافظه بالا نیاز است.
✳️کیفیت خروجی به میزان پیچیدگی درخواست و طول ویدیو بستگی دارد.
🟠 GitHub
🟠 Hugging Face
@rss_ai_ir
#AI #VideoGeneration #ByteDance #Wan2 #GenerativeAI #HuggingFace #Innovation
شرکت ByteDance از مدل جدید خود به نام Wan2.1-14B رونمایی کرده که برای وظیفهی نوآورانهی Video-as-Prompt طراحی شده است — یعنی میتوانید با دادن یک ویدیو (یا ترکیبی از تصویر و متن)، ویدیوی جدید و خلاقانهای بسازید.
✨ ویژگیها:
پشتیبانی از حالتهای:
🎞️ Video → Video
🖼️ Text/Image → Video
♻️دارای ۱۴ میلیارد پارامتر برای جزئیات بالا، حرکات روان و واقعگرایی چشمگیر.
♻️از ویدیوی ورودی برای حفظ سبک، ترکیببندی و ریتم حرکتی استفاده میکند.
⚠️ نکات مهم:
✳️برای اجرای آن به GPU قدرتمند و حافظه بالا نیاز است.
✳️کیفیت خروجی به میزان پیچیدگی درخواست و طول ویدیو بستگی دارد.
🟠 GitHub
🟠 Hugging Face
@rss_ai_ir
#AI #VideoGeneration #ByteDance #Wan2 #GenerativeAI #HuggingFace #Innovation
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🌏 Hunyuan World 1.1 (WorldMirror) —
نسخهی جدید مدل متنباز تولید جهان سهبعدی از Tencent Hunyuan
در حالیکه نسخهی قبلی Hunyuan World 1.0 برای ساخت جهانهای سهبعدی از متن یا تصاویر تکزاویهای طراحی شده بود و روی GPUهای معمولی اجرا میشد، نسخهی جدید 1.1 حالا از ویدیوها و تصاویر چندزاویهای پشتیبانی میکند.
🎯 ویژگیهای کلیدی:
ورودی آزاد (Any Input): از ویدیو، تصویر، نقشه عمق و پارامترهای دوربین پشتیبانی میکند و ساختار سهبعدی دقیق و بدون اعوجاج میسازد.
خروجی آزاد (Any Output): تولید همزمان چندین نمای سهبعدی — از جمله نقشه عمق، ابر نقاط (Point Cloud)، نرمال سطوح و Gaussian Splatting.
سرعت بالا: مدل از نوع Feed-Forward است و تمام ویژگیهای سهبعدی را تنها در چند ثانیه و در یک GPU تولید میکند.
⚙️ این مدل بهنوعی ادامهی مسیر تکاملی مدلهای تولید ویدیو است — با این تفاوت که حالا میتواند جهانهای کامل را بازسازی کند.
در حالیکه گوگل با مدل GENIE-3 پاسخ داده، OpenAI هنوز هیچ معادل مستقیمی برای این فناوری ندارد.
💻 منابع:
🔹 کد: github.com/Tencent-Hunyuan/HunyuanWorld-Mirror
🔹 پروژه: 3d-models.hunyuan.tencent.com/world/
🔹 دمو: Hugging Face Space
🔹 مقاله: Tech Report PDF
@rss_ai_ir
#AI #3D #GenerativeAI #Hunyuan #Tencent #OpenSource #هوش_مصنوعی #سهبعدی #مدل_تولیدی
نسخهی جدید مدل متنباز تولید جهان سهبعدی از Tencent Hunyuan
در حالیکه نسخهی قبلی Hunyuan World 1.0 برای ساخت جهانهای سهبعدی از متن یا تصاویر تکزاویهای طراحی شده بود و روی GPUهای معمولی اجرا میشد، نسخهی جدید 1.1 حالا از ویدیوها و تصاویر چندزاویهای پشتیبانی میکند.
🎯 ویژگیهای کلیدی:
ورودی آزاد (Any Input): از ویدیو، تصویر، نقشه عمق و پارامترهای دوربین پشتیبانی میکند و ساختار سهبعدی دقیق و بدون اعوجاج میسازد.
خروجی آزاد (Any Output): تولید همزمان چندین نمای سهبعدی — از جمله نقشه عمق، ابر نقاط (Point Cloud)، نرمال سطوح و Gaussian Splatting.
سرعت بالا: مدل از نوع Feed-Forward است و تمام ویژگیهای سهبعدی را تنها در چند ثانیه و در یک GPU تولید میکند.
⚙️ این مدل بهنوعی ادامهی مسیر تکاملی مدلهای تولید ویدیو است — با این تفاوت که حالا میتواند جهانهای کامل را بازسازی کند.
در حالیکه گوگل با مدل GENIE-3 پاسخ داده، OpenAI هنوز هیچ معادل مستقیمی برای این فناوری ندارد.
💻 منابع:
🔹 کد: github.com/Tencent-Hunyuan/HunyuanWorld-Mirror
🔹 پروژه: 3d-models.hunyuan.tencent.com/world/
🔹 دمو: Hugging Face Space
🔹 مقاله: Tech Report PDF
@rss_ai_ir
#AI #3D #GenerativeAI #Hunyuan #Tencent #OpenSource #هوش_مصنوعی #سهبعدی #مدل_تولیدی
👍2🔥1👏1
🎶 OpenAI
وارد دنیای موسیقی شد!
طبق گزارش منابع مختلف، OpenAI در حال توسعهی یک مولد موسیقی (Music Generator) است — و ماجرا جدیتر از چیزیست که به نظر میرسد.
گفته میشود این شرکت حتی با دانشجویان مدرسهی موسیقی جولیارد (Juilliard School) در نیویورک همکاری میکند تا نتهای موسیقایی را برای مدلهایش بهصورت دقیق برچسبگذاری (annotate) کنند. 🎼
💡 هدف OpenAI
ایجاد ابزاری که کاربران بتوانند از طریق متن یا صدای خود موسیقی تولید کنند؛ مثلاً بنویسند:
> «به این وکال، یک گیتار الکتریک اضافه کن» 🎸
یا موسیقی متن مناسب برای یک ویدیو بسازند. 🎬
⚖️ اما چالش بزرگ — حقوق موسیقی (Copyright)
مجموعه OpenAI احتمالاً باید با شرکتهای بزرگ ضبط موسیقی مانند Sony، Universal Music Group و Warner Bros. قرارداد ببندد تا از شکایتهای احتمالی جلوگیری کند. (این شرکتها هماکنون از Suno و Udio به دلیل استفاده از آهنگهای دارای کپیرایت شکایت کردهاند).
👀 برخی تحلیلگران میگویند اگر OpenAI از دادههای مجاز استفاده نکند، ممکن است سرنوشت مشابه مدلهای Firefly از Adobe را پیدا کند — امن از نظر حقوقی، ولی بدون محبوبیت واقعی در بازار.
⛔️اما اگر این پروژه درست پیش برود، میتواند نقطهی عطفی در دنیای تولید موسیقی با هوش مصنوعی باشد — از خلق قطعات جدید گرفته تا ساخت موسیقیهای پویا برای فیلم و بازی.
@rss_ai_ir
#OpenAI #MusicAI #هوش_مصنوعی #موسیقی #AI #GenerativeAI #Suno #Udio #Juilliard #Firefly
وارد دنیای موسیقی شد!
طبق گزارش منابع مختلف، OpenAI در حال توسعهی یک مولد موسیقی (Music Generator) است — و ماجرا جدیتر از چیزیست که به نظر میرسد.
گفته میشود این شرکت حتی با دانشجویان مدرسهی موسیقی جولیارد (Juilliard School) در نیویورک همکاری میکند تا نتهای موسیقایی را برای مدلهایش بهصورت دقیق برچسبگذاری (annotate) کنند. 🎼
💡 هدف OpenAI
ایجاد ابزاری که کاربران بتوانند از طریق متن یا صدای خود موسیقی تولید کنند؛ مثلاً بنویسند:
> «به این وکال، یک گیتار الکتریک اضافه کن» 🎸
یا موسیقی متن مناسب برای یک ویدیو بسازند. 🎬
⚖️ اما چالش بزرگ — حقوق موسیقی (Copyright)
مجموعه OpenAI احتمالاً باید با شرکتهای بزرگ ضبط موسیقی مانند Sony، Universal Music Group و Warner Bros. قرارداد ببندد تا از شکایتهای احتمالی جلوگیری کند. (این شرکتها هماکنون از Suno و Udio به دلیل استفاده از آهنگهای دارای کپیرایت شکایت کردهاند).
👀 برخی تحلیلگران میگویند اگر OpenAI از دادههای مجاز استفاده نکند، ممکن است سرنوشت مشابه مدلهای Firefly از Adobe را پیدا کند — امن از نظر حقوقی، ولی بدون محبوبیت واقعی در بازار.
⛔️اما اگر این پروژه درست پیش برود، میتواند نقطهی عطفی در دنیای تولید موسیقی با هوش مصنوعی باشد — از خلق قطعات جدید گرفته تا ساخت موسیقیهای پویا برای فیلم و بازی.
@rss_ai_ir
#OpenAI #MusicAI #هوش_مصنوعی #موسیقی #AI #GenerativeAI #Suno #Udio #Juilliard #Firefly
❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 نسخهی جدید مدل تولید سهبعدی HiTem3D منتشر شد!
مدلی که قبلاً هم با کیفیت فوقالعاده در تولید مشهای سهبعدی شناخته میشد، حالا با نسخهی جدید v1.5_1536 Pro بازگشته است — با جزئیاتی حتی دقیقتر و واقعگرایانهتر. 🤯
💎 ویژگیها:
♻️کیفیت مش بسیار بالا برای مدلسازی دقیق اجسام
♻️مناسب برای کاربردهای طراحی صنعتی، بازیسازی و انیمیشن
♻️قابلیت تولید مدلهای پیچیده با حفظ جزئیات ظریف بافتها
🧩 امتحانش کنید:
https://www.hitem3d.ai/
(بهنظر میرسد که هنوز اعتبار رایگان (Free Credits) هم ارائه میدهد 💰)
مدل HiTem3D واقعاً یکی از پیشرفتهترین ژنراتورهای سهبعدی فعلی است — مخصوصاً در ترکیب کیفیت هندسی بالا + سرعت پردازش مناسب. 🚀
@rss_ai_ir
#AI #3D #GenerativeAI #HiTem3D #هوش_مصنوعی #مدلسازی #انیمیشن #طراحی_صنعتی
مدلی که قبلاً هم با کیفیت فوقالعاده در تولید مشهای سهبعدی شناخته میشد، حالا با نسخهی جدید v1.5_1536 Pro بازگشته است — با جزئیاتی حتی دقیقتر و واقعگرایانهتر. 🤯
💎 ویژگیها:
♻️کیفیت مش بسیار بالا برای مدلسازی دقیق اجسام
♻️مناسب برای کاربردهای طراحی صنعتی، بازیسازی و انیمیشن
♻️قابلیت تولید مدلهای پیچیده با حفظ جزئیات ظریف بافتها
🧩 امتحانش کنید:
https://www.hitem3d.ai/
(بهنظر میرسد که هنوز اعتبار رایگان (Free Credits) هم ارائه میدهد 💰)
مدل HiTem3D واقعاً یکی از پیشرفتهترین ژنراتورهای سهبعدی فعلی است — مخصوصاً در ترکیب کیفیت هندسی بالا + سرعت پردازش مناسب. 🚀
@rss_ai_ir
#AI #3D #GenerativeAI #HiTem3D #هوش_مصنوعی #مدلسازی #انیمیشن #طراحی_صنعتی
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 گوگل قابلیت جدیدی را در Gemini Canvas معرفی کرد — محیط کاری تعاملی درون Gemini حالا میتواند برایتان پرزنتیشنهای کامل بسازد! 🚀
کافی است بنویسید:
💬 «ساخت یک پرزنتیشن درباره [موضوع]»
یا یک سند، جدول یا مقاله تحقیقاتی آپلود کنید —
مدل Gemini بهصورت خودکار اسلایدهایی با متن، عناصر بصری و طراحی منسجم ایجاد میکند 🎨
📤 میتوانید نتیجه را مستقیماً به Google Slides صادر کنید و هر بخش را ویرایش یا شخصیسازی کنید.
این قابلیت برای همه کاربران و کشورها در دسترس است،
اما کاربران Gemini 2.5 Pro از نسخهی پیشرفتهتر مدل بهرهمند میشوند ⚡
و جالبتر اینکه این ویژگی فقط مخصوص پرزنتیشن نیست — Gemini Canvas بهزودی به یک پلتفرم کامل برای تولید محتوای چندرسانهای تبدیل میشود.
🔗 اطلاعات بیشتر
@rss_ai_ir
#Google #Gemini #AI #Presentation #Productivity #GenerativeAI #GeminiCanvas
کافی است بنویسید:
💬 «ساخت یک پرزنتیشن درباره [موضوع]»
یا یک سند، جدول یا مقاله تحقیقاتی آپلود کنید —
مدل Gemini بهصورت خودکار اسلایدهایی با متن، عناصر بصری و طراحی منسجم ایجاد میکند 🎨
📤 میتوانید نتیجه را مستقیماً به Google Slides صادر کنید و هر بخش را ویرایش یا شخصیسازی کنید.
این قابلیت برای همه کاربران و کشورها در دسترس است،
اما کاربران Gemini 2.5 Pro از نسخهی پیشرفتهتر مدل بهرهمند میشوند ⚡
و جالبتر اینکه این ویژگی فقط مخصوص پرزنتیشن نیست — Gemini Canvas بهزودی به یک پلتفرم کامل برای تولید محتوای چندرسانهای تبدیل میشود.
🔗 اطلاعات بیشتر
@rss_ai_ir
#Google #Gemini #AI #Presentation #Productivity #GenerativeAI #GeminiCanvas
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 مدل Firefly Video Editor و آموزش لور در سایت Adobe
ادوبی با پروژهی Firefly قدم بزرگی به سمت دموکراتیزه کردن تولید محتوای خلاقانه برداشته است.
اکنون وبسایت Firefly از مدلهای مختلف مانند OpenAI، Google، Runway، Topaz و Flux پشتیبانی میکند تا کاربران بیشتری را جذب کند — و حالا یک گام جلوتر رفته است 👇
✨ قابلیت جدید:
کاربران میتوانند مدل مخصوص به خودشان (Lora) را بسازند، فقط با کشیدن و رها کردن تصاویر، طراحیها و طرحهای دستی!
به این ترتیب هر کاربر میتواند مدل تصویریاش را بر اساس سبک هنری خودش آموزش دهد — بدون نیاز به هیچ دانش فنی.
یعنی تمرین لور مستقیماً روی سایت انجام میشود 🔥
🎥 همچنین Firefly Video Editor نیز بهروزرسانی شده است:
♻️پشتیبانی از لایهها و تایملاین ویدیو
♻️ویرایش مستقیم داخل مرورگر
♻️فعلاً در حالت بتای بسته (Closed Beta) قرار دارد
📽 ویدیوی معرفی در بالای صفحه سایت Firefly قابل مشاهده است.
@rss_ai_ir
#Adobe #Firefly #AI #VideoEditing #GenerativeAI #Lora #هوش_مصنوعی #ادوبی #ویرایش_ویدیو
ادوبی با پروژهی Firefly قدم بزرگی به سمت دموکراتیزه کردن تولید محتوای خلاقانه برداشته است.
اکنون وبسایت Firefly از مدلهای مختلف مانند OpenAI، Google، Runway، Topaz و Flux پشتیبانی میکند تا کاربران بیشتری را جذب کند — و حالا یک گام جلوتر رفته است 👇
✨ قابلیت جدید:
کاربران میتوانند مدل مخصوص به خودشان (Lora) را بسازند، فقط با کشیدن و رها کردن تصاویر، طراحیها و طرحهای دستی!
به این ترتیب هر کاربر میتواند مدل تصویریاش را بر اساس سبک هنری خودش آموزش دهد — بدون نیاز به هیچ دانش فنی.
یعنی تمرین لور مستقیماً روی سایت انجام میشود 🔥
🎥 همچنین Firefly Video Editor نیز بهروزرسانی شده است:
♻️پشتیبانی از لایهها و تایملاین ویدیو
♻️ویرایش مستقیم داخل مرورگر
♻️فعلاً در حالت بتای بسته (Closed Beta) قرار دارد
📽 ویدیوی معرفی در بالای صفحه سایت Firefly قابل مشاهده است.
@rss_ai_ir
#Adobe #Firefly #AI #VideoEditing #GenerativeAI #Lora #هوش_مصنوعی #ادوبی #ویرایش_ویدیو
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 از «ایرونوف» تا امروز — انقلاب جدید گوگل در بازاریابی هوش مصنوعی
گوگل دوباره همه را غافلگیر کرد 😎 با معرفی ابزار جدیدش به نام Pomelli — پلتفرمی که میتواند کل کمپین بازاریابی برند شما را بهصورت خودکار طراحی کند!
💡 فقط کافی است لینک وبسایت شرکت خود را به Pomelli بدهید.
هوش مصنوعی گوگل تمام محتوای سایت را میخواند، تحلیل میکند و در خروجی:
✅ یک بستهی کامل از محتوای برندشده ارائه میدهد؛
✅ با داستان، پیام و گرافیک هماهنگ، آماده برای استفاده در شبکههای اجتماعی و تبلیغات.
و اینجا نکتهی جالبی هست که کمتر کسی گفت:
شما میتوانید خودتان با پرامپت کمپین را طراحی کنید یا اجازه دهید خود Pomelli ایده دهد.
خروجیها هم قابل ویرایش هستند — چه در Photoshop، چه در NanoBanana 🎨
🔥 یعنی دقیقاً همان مسیر تاریخی که از «نیکولای ایرونوف» (ژنراتور لوگوی لبدیف) شروع شد،
حالا به مرحلهای رسیده که فقط با دادن لینک سایت، کل محتوای بازاریابیتان ساخته میشود.
بهزودی دیگر لازم نیست هیچ کاری بکنید —
سایت را هوش مصنوعی میسازد، پرامپت را هوش مصنوعی مینویسد،
و کمپین بازاریابیتان را هم هوش مصنوعی اجرا میکند.
👁🗨 شما فقط میمانید برای خوردن و خوابیدن — بقیه را هوش مصنوعی انجام میدهد 😅
🔗 https://labs.google.com/pomelli/
(با VPN آمریکا)
@rss_ai_ir
#Google #Pomelli #AI #Marketing #GenerativeAI #Automation #DigitalMarketing #هوش_مصنوعی #گوگل #بازاریابی
گوگل دوباره همه را غافلگیر کرد 😎 با معرفی ابزار جدیدش به نام Pomelli — پلتفرمی که میتواند کل کمپین بازاریابی برند شما را بهصورت خودکار طراحی کند!
💡 فقط کافی است لینک وبسایت شرکت خود را به Pomelli بدهید.
هوش مصنوعی گوگل تمام محتوای سایت را میخواند، تحلیل میکند و در خروجی:
✅ یک بستهی کامل از محتوای برندشده ارائه میدهد؛
✅ با داستان، پیام و گرافیک هماهنگ، آماده برای استفاده در شبکههای اجتماعی و تبلیغات.
و اینجا نکتهی جالبی هست که کمتر کسی گفت:
شما میتوانید خودتان با پرامپت کمپین را طراحی کنید یا اجازه دهید خود Pomelli ایده دهد.
خروجیها هم قابل ویرایش هستند — چه در Photoshop، چه در NanoBanana 🎨
🔥 یعنی دقیقاً همان مسیر تاریخی که از «نیکولای ایرونوف» (ژنراتور لوگوی لبدیف) شروع شد،
حالا به مرحلهای رسیده که فقط با دادن لینک سایت، کل محتوای بازاریابیتان ساخته میشود.
بهزودی دیگر لازم نیست هیچ کاری بکنید —
سایت را هوش مصنوعی میسازد، پرامپت را هوش مصنوعی مینویسد،
و کمپین بازاریابیتان را هم هوش مصنوعی اجرا میکند.
👁🗨 شما فقط میمانید برای خوردن و خوابیدن — بقیه را هوش مصنوعی انجام میدهد 😅
🔗 https://labs.google.com/pomelli/
(با VPN آمریکا)
@rss_ai_ir
#Google #Pomelli #AI #Marketing #GenerativeAI #Automation #DigitalMarketing #هوش_مصنوعی #گوگل #بازاریابی
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
👢 Generative View Stitching (GVS):
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀
پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایتشده با دوربین را بهصورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم میکند — جایگزینی نوآورانه برای روشهای سنتی video length extrapolation. 🎥
✨ ویژگیهای کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیینشده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریمها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متنباز و قابل استفاده در پروژههای تحقیقاتی یا صنعتی
📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورسکد:
github.com/andrewsonga/generative_view_stitching
🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقعگرایانه با کنترل دقیق دوربین است — دنیای فیلمسازی و شبیهسازی ۳D را هوشمندتر از همیشه میسازد.
@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀
پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایتشده با دوربین را بهصورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم میکند — جایگزینی نوآورانه برای روشهای سنتی video length extrapolation. 🎥
✨ ویژگیهای کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیینشده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریمها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متنباز و قابل استفاده در پروژههای تحقیقاتی یا صنعتی
📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورسکد:
github.com/andrewsonga/generative_view_stitching
🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقعگرایانه با کنترل دقیق دوربین است — دنیای فیلمسازی و شبیهسازی ۳D را هوشمندتر از همیشه میسازد.
@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
❤2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌐مدل OmniX — نسل جدید مدلهای پانورامای سهبعدی از Kling 🎥🧠
اگر دنبال مدلهای متنبهپانوراما بودید، OmniX از تیم HKU MMLab یکی از جذابترین پروژههای اخیر است —
مدلی متنباز که نهتنها تصاویر پانورامای ۳۶۰ درجه تولید میکند، بلکه ویژگیهای فیزیکی صحنه را هم بهصورت خودکار استخراج میکند.
---
🧩 تواناییهای کلیدی:
🟢 تولید همزمان پانوراما و نقشههای فیزیکی:
Depth map (عمق)
Normal map (زاویه سطح)
Albedo (رنگ پایه)
Roughness (زِبری سطح)
Metallic (جلوه فلزی)
🟢 تبدیل پانوراما به صحنهی سهبعدی آماده برای گرافیک (Graphics-Ready 3D Scene)
مدل میتواند پانورامای خروجی را به mesh واقعی تبدیل کند که قابل وارد کردن به نرمافزارهایی مانند Blender است.
هرچند خود تیم هشدار داده که این بخش هنوز در مرحلهی بتا است و گاهی ناپایدار عمل میکند.
---
⚙️ منابع پروژه:
📄 وبسایت رسمی:
yukun-huang.github.io/OmniX
💻 سورسکد:
github.com/HKU-MMLab/OmniX
🧠 وزنها (Weights):
huggingface.co/KevinHuang/OmniX
---
🎯 مدل OmniX نشان میدهد آیندهی تولید محتوای سهبعدی از دیدگاه پانورامیک بهسمت یکپارچگی کامل بین درک صحنه (perception) و تولید گرافیکی (generation) در حرکت است.
📡 @rss_ai_ir
#هوش_مصنوعی #OmniX #3D #Panorama #GenerativeAI #Blender #VisionAI #Kling #HKUMMLab
اگر دنبال مدلهای متنبهپانوراما بودید، OmniX از تیم HKU MMLab یکی از جذابترین پروژههای اخیر است —
مدلی متنباز که نهتنها تصاویر پانورامای ۳۶۰ درجه تولید میکند، بلکه ویژگیهای فیزیکی صحنه را هم بهصورت خودکار استخراج میکند.
---
🧩 تواناییهای کلیدی:
🟢 تولید همزمان پانوراما و نقشههای فیزیکی:
Depth map (عمق)
Normal map (زاویه سطح)
Albedo (رنگ پایه)
Roughness (زِبری سطح)
Metallic (جلوه فلزی)
🟢 تبدیل پانوراما به صحنهی سهبعدی آماده برای گرافیک (Graphics-Ready 3D Scene)
مدل میتواند پانورامای خروجی را به mesh واقعی تبدیل کند که قابل وارد کردن به نرمافزارهایی مانند Blender است.
هرچند خود تیم هشدار داده که این بخش هنوز در مرحلهی بتا است و گاهی ناپایدار عمل میکند.
---
⚙️ منابع پروژه:
📄 وبسایت رسمی:
yukun-huang.github.io/OmniX
💻 سورسکد:
github.com/HKU-MMLab/OmniX
🧠 وزنها (Weights):
huggingface.co/KevinHuang/OmniX
---
🎯 مدل OmniX نشان میدهد آیندهی تولید محتوای سهبعدی از دیدگاه پانورامیک بهسمت یکپارچگی کامل بین درک صحنه (perception) و تولید گرافیکی (generation) در حرکت است.
📡 @rss_ai_ir
#هوش_مصنوعی #OmniX #3D #Panorama #GenerativeAI #Blender #VisionAI #Kling #HKUMMLab
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🎄 تب کریسمس هوش مصنوعی با کوکاکولا برگشت! 🤖✨
شرکت Coca-Cola اعلام کرده که تبلیغ کریسمس امسالش دوباره بهطور کامل با هوش مصنوعی تولید خواهد شد — از ایده تا فریم نهایی. 🧠🎬
وقتی شرکتی با ارزش میلیاردی مثل کوکاکولا به این سطح از اتکا به AI رسیده،
فقط تصور کنید چه فشاری روی دوش صنعت خلاقیت و تبلیغات انسانی قرار گرفته است.
🎥 دنیایی که روزی توسط کارگردانها و آرتدایرکتورهای بزرگ شکل میگرفت،
حالا بهسرعت به دستان مدلهای مولد و الگوریتمهای هوشمند سپرده میشود.
سؤال اینجاست —
در آیندهی نزدیک، آیا کمپینهای تبلیغاتی بیشتر خلق خواهند شد یا تولید خواهند شد؟ 🧩
📡 @rss_ai_ir
#هوش_مصنوعی #تبلیغات #CocaCola #CreativeAI #AI #Marketing #GenerativeAI
شرکت Coca-Cola اعلام کرده که تبلیغ کریسمس امسالش دوباره بهطور کامل با هوش مصنوعی تولید خواهد شد — از ایده تا فریم نهایی. 🧠🎬
وقتی شرکتی با ارزش میلیاردی مثل کوکاکولا به این سطح از اتکا به AI رسیده،
فقط تصور کنید چه فشاری روی دوش صنعت خلاقیت و تبلیغات انسانی قرار گرفته است.
🎥 دنیایی که روزی توسط کارگردانها و آرتدایرکتورهای بزرگ شکل میگرفت،
حالا بهسرعت به دستان مدلهای مولد و الگوریتمهای هوشمند سپرده میشود.
سؤال اینجاست —
در آیندهی نزدیک، آیا کمپینهای تبلیغاتی بیشتر خلق خواهند شد یا تولید خواهند شد؟ 🧩
📡 @rss_ai_ir
#هوش_مصنوعی #تبلیغات #CocaCola #CreativeAI #AI #Marketing #GenerativeAI
👎3🔥2🥰1