VIRSUN
7.44K subscribers
792 photos
461 videos
3 files
507 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
⚡️ Kyvo —
مدل چندمنظوره‌ی جدید از Caltech

ترنسفورمر Kyvo یک ترنسفورمر مولتی‌مدال هست که می‌تونه همزمان با متن، تصویر و صحنه‌های سه‌بعدی کار کنه. این مدل همه‌چیز رو توکن به توکن همگام‌سازی می‌کنه و همین باعث می‌شه دریچه‌های تازه‌ای برای هوش مصنوعی باز بشه.

🔍 توانایی‌ها:

نمایش صحنه‌های سه‌بعدی به‌صورت لیستی از اشیاء (شکل، اندازه، نوع، موقعیت و حالت).

ادغام متن، تصویر و 3D در یک نمایش مشترک.

رندر تصویر از روی صحنه یا بازسازی 3D از روی عکس.

پاسخ به پرسش‌های مربوط به صحنه یا تغییر آن طبق دستور.

استفاده از کدگذاری ویژه برای بازسازی دقیق‌تر فرم اشیاء.


🧪 آزمایش‌ها روی:

✳️دیتاست‌های CLEVR, ObjaWorld, Objectron, ARKitScenes
✳️وظایف: رندرینگ، شناسایی اشیاء، دستورهای متنی برای صحنه، پرسش و پاسخ.


⛔️ چرا جالب است؟

یکپارچگی: یک مدل برای چندین وظیفه و فرمت داده.
انعطاف: هم در تولید، هم در درک محتوا قوی عمل می‌کنه.
گامی مهم به‌سوی درک سه‌بعدی جهان توسط هوش مصنوعی.


🔗 منابع:
📄 مقاله در arXiv
🌐 پروژه
💻 GitHub

@rss_ai_ir

#هوش_مصنوعی #مدل_چندوجهی #3D #Caltech #Kyvo
🔥14👏12😁1110🥰9👍8🎉8