⚡️ Omni-Embed-Nemotron —
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو
انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانهای یکپارچه برای تبدیل انواع دادهها به نمایش برداری مشترک (Unified Embedding).
🎯 ویژگیهای کلیدی:
پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو
مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)
طول زمینه تا ۳۲٬۷۶۸ توکن
اندازهی بردار نهائی (Embedding) برابر ۲۰۴۸
بهینهشده برای GPU و پشتیبانی از FlashAttention 2
🚀 کاربردها:
♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)
♻️بهبود پروژههای RAG (Retrieval-Augmented Generation)
♻️توسعه سیستمهای درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان دادههای متنی و دیداری را از میان برمیدارد.
🌐 مدل متنباز:
huggingface.co/nvidia/omni-embed-nemotron-3b
#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو
انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانهای یکپارچه برای تبدیل انواع دادهها به نمایش برداری مشترک (Unified Embedding).
🎯 ویژگیهای کلیدی:
پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو
مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)
طول زمینه تا ۳۲٬۷۶۸ توکن
اندازهی بردار نهائی (Embedding) برابر ۲۰۴۸
بهینهشده برای GPU و پشتیبانی از FlashAttention 2
🚀 کاربردها:
♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)
♻️بهبود پروژههای RAG (Retrieval-Augmented Generation)
♻️توسعه سیستمهای درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان دادههای متنی و دیداری را از میان برمیدارد.
🌐 مدل متنباز:
huggingface.co/nvidia/omni-embed-nemotron-3b
#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند