VIRSUN

⚡️ چرا مدل‌های زبانی مدرن (LLM) نمی‌توانند نقش «شرور» را درست بازی کنند؟

گزارش جدید Tencent نشان می‌دهد که مدل‌هایی که روی امنیت و اخلاق آموزش دیده‌اند، در ایفای نقش‌های منفی مثل شرور، فریب‌کار یا خودخواه تقریباً شکست می‌خورند.
دلیل ساده است: آموزش‌های ایمنی آن‌ها را مجبور می‌کند همیشه صادق، مفید و اخلاقی باشند — و این دقیقاً برعکس ویژگی‌های یک ضدقهرمان است.

🧩 پژوهشگران تستی به نام Moral RolePlay ساخته‌اند:
۸۰۰ کاراکتر با چهار سطح اخلاقی، و مدل باید در یک سناریوی خاص واکنشی متناسب با شخصیت نشان دهد.

📊 نتایج جالب بودند:

♻️هرچه شخصیت «تاریک‌تر» می‌شود، کیفیت بازی مدل به‌شدت افت می‌کند.

♻️در گذار از "خیر با نیت مبهم" به "خودخواه"، عملکرد به‌طور ناگهانی سقوط می‌کند.

♻️مدل‌ها به‌جای برنامه‌ریزی فریبکارانه، معمولاً دچار "انفجار عصبی" می‌شوند و فضای نقش را می‌شکنند.

♻️توانایی خوب در چت معمولی هیچ ربطی به بازی نقش شرور ندارد.

♻️تنظیمات ایمنی قوی‌تر، اوضاع را حتی بدتر می‌کنند.

🎭 نتیجه: متدهای فعلی ایمنی با حوزه‌هایی مثل بازی، فیلم‌نامه‌نویسی و داستان‌پردازی واقعی در تضاد هستند، چون این حوزه‌ها نیاز به رفتارهای غیراخلاقی اما واقعی دارند.

📄 منبع: arxiv.org/abs/2511.04962
#هوش_مصنوعی #LLM #Tencent #AIethics #RolePlay #Neural

❤1👍1

1.99K viewsedited 15:32

VIRSUN

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

🐼مدل Pixel-Dense Embedding در مدل FlowFeat 🐼

محققان دانشگاه مونیخ (TUM Vision) مدل جدیدی به نام FlowFeat معرفی کرده‌اند — یک نمایش ویژگی چندوظیفه‌ای و با وضوح بالا که قادر است توزیع حرکات ممکن در تصویر را به‌صورت بردارهای فشرده (Embedding) نمایش دهد.

🧠 ایده‌ی کلیدی:
به‌جای نمایش تنها یک حرکت برای هر پیکسل، FlowFeat چندین حرکت محتمل (motion profiles) را مدل می‌کند. این کار باعث افزایش دقت در وظایفی مانند Optical Flow، تخمین عمق، و درک صحنه‌های پویا می‌شود.

💡 ویژگی‌ها:

♻️دقت بالا در پیش‌بینی حرکات ظریف در ویدیو
♻️مناسب برای چندین وظیفه (multi-task representation)
♻️نیاز محاسباتی پایین با حفظ جزئیات
♻️مبتنی بر معماری DINOv3 Backbone

📄 مقاله:
arxiv.org/pdf/2511.07696
💻 پروژه:
tum-vision.github.io/flowfeat
📦 کد منبع:
github.com/tum-vision/flowfeat

#FlowFeat #ComputerVision #MotionEstimation #DeepLearning #Neural #AI

1.11K views11:24

VIRSUN

1:46

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 شرکت Unitree از پلتفرم جدید خود برای کنترل از راه دور ربات‌ها با کپی کامل حرکات انسان رونمایی کرد.

این سیستم به کاربر اجازه می‌دهد حرکات خود را در زمان واقعی به ربات منتقل کند، در حالی که داده‌های حسگرهای ربات هم‌زمان جمع‌آوری می‌شوند.

به این ترتیب، ربات می‌تواند حرکات انسانی را با دقت بالا تقلید کند — گامی مهم در جهت همگرایی انسان و ماشین در محیط‌های صنعتی و خدماتی.

—————————
✔️ @rss_ai_ir
#ربات #Unitree #هوش_مصنوعی #رباتیک #کنترل_از_راه_دور #RobotControl #AI #Robotics

🔥2

1.07K views11:27

VIRSUN

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Gamma.app —
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!

استارتاپ Gamma که به‌عنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفق‌ترین پلتفرم‌های تولید محتوای بصری با هوش مصنوعی تبدیل شده است.

در نسخه‌ی جدید Gamma 3.0، این ابزار نه‌تنها ارائه‌های (presentations) هوشمند می‌سازد، بلکه می‌تواند وب‌سایت‌ها و طرح‌های شبکه‌های اجتماعی را نیز به‌صورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش می‌کشد.

📊 آمار چشم‌گیر:

💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار

👥 کاربران فعال: ۷۰ میلیون نفر

💎 ارزش‌گذاری شرکت: ۲.۱ میلیارد دلار

👨‍💻 تنها ۵۰ کارمند

⚡ روزانه بیش از ۱ میلیون گاما ساخته می‌شود!

🧠 آن‌ها به‌تازگی API رسمی را منتشر کرده‌اند و برای علاقه‌مندان، راهنمای پرامپت‌نویسی (Prompt Guide) را در لینک زیر قرار داده‌اند:
👉 https://gamma.app/prompts

جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.

#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent

👍2

1.07K views11:41

VIRSUN

1:21

This media is not supported in your browser

VIEW IN TELEGRAM

🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2

مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلی‌ثانیه به متن تبدیل کند — سرعتی تقریباً آنی!

🔹 ویژگی‌های کلیدی:

تشخیص و برچسب‌گذاری خودکار گویندگان مختلف 🗣️

پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍

قابلیت استریم زنده (Live Streaming) و اتصال از طریق API

مناسب برای رویدادها، سخنرانی‌ها و زیرنویس هم‌زمان ویدیوها

عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡

📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime

📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.

#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent

1.07K views11:45

VIRSUN

🧠 بایدو مدل جدید ERNIE-4.5-VL-28B-A3B-Thinking را منتشر کرد

مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال می‌کند، اما عملکردی در حد مدل‌های تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحله‌ای نیاز دارند.

📊 قابلیت‌های کلیدی:

🧩 استدلال بصری: تحلیل دیاگرام‌ها، روابط علّی و منطق چندمرحله‌ای

📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید

🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا

🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوت‌ها

🧠 فراخوانی ابزارها: مثل Image Search برای جست‌وجوی تصویری

🎞 درک ویدیو: دنبال‌کردن وقایع و تغییرات در طول زمان

🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking

#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent

1.89K views11:46

VIRSUN

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

🚚 در حالی‌که همه سرگرم «رونمایی ربات‌تاکسی» از Tesla هستند، در چین پارک‌های کامل خودروهای خودران برای تحویل کالا در حال راه‌اندازی‌اند!

در چین، شرکت‌ها در حال پیاده‌سازی اتحادیه‌ای از ناوگان‌های خودران هستند که بدون راننده، محموله‌ها را در مقیاس وسیع بین مراکز توزیع و نقاط مصرف جابه‌جا می‌کنند.

📌 نکات مهم این روند:

✅ تمرکز بر تحویل بسته و لوجستیک نه سواری مسافر — یعنی ورود به بازاری متفاوت و احتمالاً با موانع مقرراتی کمتر

🏞 ایجاد «پارک‌های خودران» یا مناطق آزاد برای تست و بهره‌برداری تجاری

🌐 چین با سرعت بیشتری به سمت استقرار عملیاتی خودروهای خودران حرکت می‌کند، در حالی‌که تمرکز عمومی بر خودروی سواری است

🔍 نتیجه؟
ربات‌تاکسی‌ها شگفت‌انگیز هستند، اما خودروهای تحویل خودران شاید اولین دستاورد بزرگ در مقیاس واقعی باشند — و چین در این مسیر جلوتر از بسیاری از رقباست.

#خودرو_خودران #تکنولوژی #چین #لجستیک #AUTONOMOUS #AI #رسانه_هوش_مصنوعی

1.95K views11:48

VIRSUN

🧠 HierarchicalTopK —
رویکردی تازه برای تفسیرپذیری شبکه‌های عصبی

در کنفرانس EMNLP 2025 روشی با نام HierarchicalTopK معرفی شد — رویکردی که امکان آموزش شبکه‌های عصبی را در چندین سطح پراکندگی (sparsity) به‌صورت هم‌زمان فراهم می‌کند، بدون آنکه تفسیرپذیری یا کیفیت مدل از بین برود.

🔹 مسئله اصلی:
در روش‌های سنتی، سطح پراکندگی باید پیش از آموزش تعیین شود و تغییر آن بعداً ممکن نیست.
پراکندگی کم → مدل دقیق ولی غیرتفسیرپذیر.
پراکندگی زیاد → تفسیرپذیر ولی با افت عملکرد.

🔹 نوآوری HierarchicalTopK:
به‌جای آموزش چند مدل جداگانه برای هر سطح، این روش یک فضای واحد می‌سازد که تمام سطوح پراکندگی را در خود جای می‌دهد.
در نتیجه:

♻️می‌توان به‌صورت پویا بین سطوح پراکندگی جابه‌جا شد؛

♻️ارتباط معنایی بین سطوح حفظ می‌شود؛

♻️مدل حتی در سطوح بالا تفسیرپذیری خود را حفظ می‌کند.

🔹 مزیت‌های کلیدی:
✅ فقط یک مدل لازم است، نه ده‌ها مدل جداگانه
✅ کاهش هزینه محاسباتی و زمان آموزش
✅ مناسب برای حسابرسی و تحلیل رفتار مدل‌ها
✅ گامی مهم به‌سوی هوش مصنوعی تفسیرپذیر در صنعت

📦 مدل و کد در Hugging Face:
🔗 https://huggingface.co/t-tech/flex-sae

#AI #ML #EMNLP2025 #ExplainableAI #SparseModeling #Interpretability #هوش_مصنوعی #یادگیری_ماشینی

1.92K viewsedited 11:48

VIRSUN

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 دموی زنده‌ی کونگ‌فو با ربات Unitree G1 — واقعاً چشمگیر!

ربات انسان‌نمای Unitree G1 در جدیدترین نمایش خود، مهارت‌های فیزیکی و هماهنگی بدنی در سطح بسیار بالایی را نشان داد — از حرکات رزمی گرفته تا تعادل دقیق و واکنش سریع در محیط واقعی.

این نسخه از G1 به‌لطف موتور کنترل حرکتی بهبود‌یافته و الگوریتم‌های یادگیری تقویتی جدید می‌تواند حرکات دینامیکی مانند لگد، چرخش و دفاع را با تعادل کامل انجام دهد.

📍 با چنین دقت و پایداری، G1 نه‌تنها یک ربات نمایشی نیست، بلکه گامی جدی به‌سمت روبات‌های انسان‌نمای کاربردی در محیط‌های واقعی محسوب می‌شود.

📹 ویدیو دموی زنده را ببینید:
#Unitree #Humanoid #Robot #AI #Robotics #هوش_مصنوعی #رباتیک #ربات_انسان‌نما #تکنولوژی

❤3

2.02K views11:51

VIRSUN

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

📚 پروژه‌ای متن‌باز برای در دسترس‌کردن ۱۰۰ میلیون مقاله علمی با کمک خلاصه‌های ساختاریافته تولیدشده توسط LLM

هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آن‌هاست — جایی که هوش مصنوعی به پژوهشگران در جهت‌یابی در اقیانوس دانش کمک می‌کند.

🧠 شامل:

۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی

دو مدل LLM بهینه‌سازی‌شده برای تحلیل مفهومی و استخراج ساختار علمی

بصری‌ساز سه‌بعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهش‌ها

🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدل‌ها: huggingface.co/inference-net
🌐 بصری‌ساز: aella.inference.net

#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI

💯1

1.17K views09:28

VIRSUN

⭐ مدل VibeThinker-1.5B؛ مدل کوچک اما رکوردشکن در استدلال

این مدل ۱.۵ میلیارد پارامتری با وجود اندازه‌ی بسیار کوچک، در آزمون‌های استدلالی به نتایج SOTA رسیده است.

🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترین‌هاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر می‌گذارد. در برنامه‌نویسی رقابتی هم بالاتر از مدل‌های هم‌حجم ظاهر شده است.

⚡ بهره‌وری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچک‌تر از مدل‌هایی مثل Kimi K2 و DeepSeek R1.

💰 هزینه:
کل هزینهٔ پس‌تمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزان‌تر از DeepSeek R1 یا MiniMax-M1.

این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریم‌ورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.

📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221

#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir

1.1K views09:28

VIRSUN

⚡️مدل ChatGPT-5.1 منتشر شد

همچنین OpenAI نسخه‌ی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخ‌گویی است.

🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی می‌تواند در مسائل پیچیده به‌صورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمون‌های AIME 2025 و چالش‌های Codeforces.
همچنین در دنبال‌کردن دستورها بهتر شده و لحن پیش‌فرض آن گرم‌تر و انسانی‌تر است.

🟢 GPT-5.1 Thinking
این نسخه هم به‌روزرسانی شده:
• پاسخ‌دهی به پرسش‌های ساده سریع‌تر
• خروجی‌ها روشن‌تر و کم‌اصطلاح‌تر شده‌اند

✨ سبک‌های جدید نوشتاری نیز اضافه شده‌اند:
مدل «Professional»، «Frank» و «Unusual» برای شخصی‌سازی دقیق‌تر پاسخ‌ها.

🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال می‌شود. نسخه‌های قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.

#news #ai #ml @rss_ai_ir

1.12K views09:34

VIRSUN

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 مجموعه Freepik قابلیت Camera Angle را به فضای نودی Spaces اضافه کرد

در Freepik Spaces حالا می‌توانید زاویهٔ دوربین را به‌صورت سه‌بعدی کنترل کنید:

🟦 تصویر خود را آپلود می‌کنید
🟧 آن را به نود Camera Angle وصل می‌کنید
🟩 تصویر روی یکی از وجه‌های یک مکعب مجازی قرار می‌گیرد
🟪 تنها با چرخاندن مکعب، خروجی از هر زاویه تولید می‌شود

می‌توانید چند نود مختلف وصل کنید تا هر کدام یک زاویهٔ مستقل نمایش دهند.

🧠 در پشت صحنه از Qwen Image Edit استفاده شده.
💳 هر生成 حدود ۵۰ کریدر هزینه دارد.

🌐 سایت

#neural #ai #image_editing
@rss_ai_ir

🔥2

1.14K viewsedited 09:37

VIRSUN

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

🟩 Foundational Humanoid —
مدل SONIC از انویدیا 🟩

انویدیا از SONIC رونمایی کرد؛ یک مدل بنیادی (Foundational Model) برای کنترل بسیار دقیق ربات‌های انسان‌نما با حرکات طبیعی و شبیه انسان — از دویدن و پریدن تا خزیدن و تعاملات پیچیده.

🧠 ویژگی‌های کلیدی SONIC:

♻️کنترل تله‌اُپریشن با دقت بالا

♻️حرکات طبیعی و هماهنگ شبیه انسان

♻️تعاملات پیچیده سه‌بعدی

♻️کاربرد در ربات‌های نسل جدید و سیستم‌های فیزیک‌محور

کد پروژه منتشر شده است 💙

🔗 لینک‌ها:
Paper:
https://arxiv.org/pdf/2511.07820

Project:
https://nvlabs.github.io/SONIC

#AI #Robotics #Humanoid #NVIDIA #SONIC @rss_ai_ir

❤1👍1

234 views06:46

VIRSUN

⚡️ بایدو ERNIE 5.0 را منتشر کرد — هیولای ۲.۴ تریلیون پارامتری

غول تکنولوژی چین Baidu نسخهٔ جدید مدل پرچم‌دار خود ERNIE 5.0 را با ۲.۴ تریلیون پارامتر رونمایی کرد.

🟢 ویژگی‌های کلیدی ERNIE 5.0:

✳️اُمـنی‌مودال: پشتیبانی از متن، تصویر، صدا و ویدئو در ورودی و خروجی

✳️فهم بهترِ دستورها (Instruction Following)

✳️بهبود چشمگیر در نوشتار خلاقانه

✳️عملکرد قوی در منطق، reasoning، حافظه و اقناع (persuasion)

✳️مناسب برای کارهای پیچیده و چندمرحله‌ای

⛔️فعلاً جزئیات کامل منتشر نشده و فقط چند نمودار مبهم از بنچمارک‌ها ارائه شده، اما مدل قابل تست در چت‌بات بایدو است.
https://ernie.baidu.com/

#AI #ML #Baidu #ERNIE5 @rss_ai_ir

🔥1

226 views06:49

VIRSUN

🎛 نودها ۴۰ ساله شدند!

این روزها همهٔ سرویس‌ها «رابط نودی» را مثل یک قابلیت تازه معرفی می‌کنند — اما واقعیت این است که نودهای گرافیکی حدود ۴ دهه عمر دارند.

🔹 داستان از کجا شروع شد؟
قبل از Houdini، نرم‌افزاری به نام Prisms وجود داشت که برای بزرگ‌ترین استودیوی CG آن زمان، یعنی Omnibus نوشته شد.
اما در سال ۱۹۸۷، Omnibus ورشکست شد و Kim Davidson و Greg Hermanovic حقوق Prisms را خریدند و شرکت SideFX را ساختند.

🔹 سپس چه شد؟
مدتی Houdini و Prisms هم‌زمان فروخته می‌شدند.
در دل Prisms، ماژولی وجود داشت به نام:
✨ ICE – Interactive Compositing Environment
و همین ICE اولین نسل جدی رابط‌های نودی بود.

امروز Krea ، Runway ، ComfyUI و صدها ابزار دیگر فقط ادامهٔ همان مسیر ۴۰ ساله‌اند — نه یک «فکر جدید» بلکه تکامل یک ایدهٔ قدیمی و قدرتمند.

📚 اگر تاریخ Houdini برایتان جذاب است، این مقاله را بخوانید:
fxguide.com/fxfeatured/side-effects-software-25-years-on/

#NodeBased #Houdini #CG #VFX #HistoryOfTech @rss_ai_ir

217 views06:50

VIRSUN

🧠 یان لوکُن دوباره برگشت: معرفی LeJEPA — نسل جدید یادگیری خودنظارتی

در مدل‌های قبلی خانوادهٔ JEPA همیشه نیاز به ترفندهای پیچیده بود تا مدل دچار collapsing نشود:
مثل stop-gradient،‌ معماری teacher–student یا هدهای پیش‌بینی‌کننده.

اما مدل جدید LeJEPA همهٔ این هک‌ها را حذف کرده و فقط یک Regularizer جدید اضافه کرده:
✨ SIGReg — Sketched Isotropic Gaussian Regularization

🔍 مدل SIGReg چه می‌کند؟
بردارهای ویژگی را وادار می‌کند که به‌طور یکنواخت در تمام جهت‌ها پخش شوند؛ یعنی یک ابر ایزوتروپیک بسازند.
این ساختار هندسی باعث می‌شود مدل کمترین خطا را در وظایف آینده داشته باشد — نه بر اساس حدس، بلکه بر اساس تحلیل ریاضی.

📌 چرا مهم است؟

✳️آموزش بسیار پایدارتر و ساده‌تر می‌شود

✳️به راحتی مقیاس‌پذیر است (تست روی مدل ۱.۸ میلیارد پارامتری)

✳️نیازی به teacher-student نیست

✳️کیفیت مدل بدون برچسب‌گذاری قابل تخمین است — چون loss به‌خوبی با دقت نهایی همبستگی دارد

✳️مناسب‌ترین هندسه برای نمایش ویژگی‌ها را ایجاد می‌کند

📈 نتیجه:
دقت 79٪ در ارزیابی linear probe روی ImageNet-1K با حداقل تنظیمات.

این کار یک گام مهم به سمت self-supervised learning قابل‌اعتماد، پایدار و مقیاس‌پذیر است.

📄 مقاله:
arxiv.org/abs/2511.08544

#AI #ML #SelfSupervised #LeJEPA #YannLeCun @rss_ai_ir

215 views06:58

VIRSUN

1:08

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 ماربل (Marble) از نگاه یک بتاتستر واقعی — بازسازی یک خانه فقط با ۱۳ عکس ۳۶۰ درجه!

گوشا مولودتسوف، که در بتاتست Marble شرکت کرده بود، یک کار فوق‌العاده کرده:
او با استفاده از Gaussian Splatting + AI + Marble خانه‌ای را که همسرش دوران کودکی‌اش را در آن گذرانده بود به‌طور کامل بازسازی سه‌بعدی کرده است — و فقط با ۱۳ عکس ۳۶۰ درجه!

این ویدئو که مثل پرواز FPV به نظر می‌رسد، کاملاً مجازی است — هیچ درون یا دوربینی وجود ندارد. همه‌چیز یک جهان سه‌بعدی بازسازی‌شده با هوش‌مصنوعی است.

وقتی همسرش اولین تست را دید، اشکش درآمد…
حالا کل خانواده (که هر کدام در کشوری هستند) می‌توانند دوباره داخل آن خانه قدم بزنند — در متاورس.

🔗 نسخهٔ قابل بازدید فضای بازسازی‌شده:
https://arrival.space/51431471_7414

---

🛠 مراحل کار — به زبان ساده

1) ساخت Gaussian Splat با Marble (World Labs)

همچنین Marble اخیراً پشتیبانی از عکس‌های ۳۶۰ درجه را اضافه کرده.
گوشا تمام ۱۳ عکس را در کمتر از یک ساعت وارد سیستم کرد.

مدل Marble با ترکیبی از:

تخمین عمق از عکس ۳۶۰

بازسازی مبتنی بر AI

آموزش روی میلیون‌ها اسپلت
فضایی کامل و قابل حرکت تولید می‌کند.

---

2) ویرایش و یکپارچه‌سازی با SuperSplat

با SuperSplat از PlayCanvas:

اتاق‌ها و فضاها یکپارچه شدند

سوراخ‌ها بسته شدند

اندازه واقعی فضاها تنظیم شد (چون AI مقیاس واقعی را نمی‌داند)

آسمان و بیرون خانه بازسازی شد

برای نمای بیرونی چند عکس جدید گرفته شد تا Marble حدس اشتباه نزند

📦 حجم نهایی:
حدود 22 میلیون اسپلت — 1.3GB فایل.

---

3) ساخت جهان متاورسی با Arrival.Space

همچنین GS بهترین فرمت برای متاورس است.
در Arrival:

♻️فایل SOG (نسخه فشرده GS) بارگذاری شد

♻️با یک ترفند، ابتدا PLY بارگذاری شد تا کُلیدر (قاب برخورد) تولید شود

♻️سپس نسخه اصلی SOG با کُلیدر اصلاح‌شده جایگزین شد

---

🎁 خروجی‌های فعلی Marble

همچنین Marble در حال حاضر این‌ها را تحویل می‌دهد:

1. فایل PLY + نسخه فشرده SPZ
2. مش کم‌کیفیت برای Collider
3. مش با کیفیت بالا
4. یک پانورامای ۳۶۰ از فضای بازسازی‌شده

---

🎬 ویدئو را حتماً با کیفیت بالا ببینید:
https://www.youtube.com/watch?v=R70bydPsb4s

---

🔥 این همان جایی است که فناوری واقعاً به زندگی انسان‌ها معنا و احساس اضافه می‌کند.
بازسازی خاطره، بازگشت به گذشته، و زنده‌کردن فضاهایی که دیگر وجود ندارند…

#AI #3D #Marble #GaussianSplatting @rss_ai_ir

❤2🔥1👏1

208 views07:04

About

Blog

Apps

Platform