This media is not supported in your browser
VIEW IN TELEGRAM
🍏 اپل دو مدل متنباز جدید معرفی کرد: FastVLM و MobileCLIP2
🔹 این مدلها تا ۸۵ برابر سریعتر و ۳.۴ برابر کوچکتر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:
♻️OCR (تشخیص متن از تصویر)
♻️Image Captioning (تولید توضیحات برای تصاویر)
♻️Visual Question Answering (پاسخ به سوالات تصویری)
♻️Image Understanding (درک محتوای تصویر)
⚡️ اپل با این حرکت جدیتر از همیشه وارد رقابت مدلهای سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.
لینک
@rss_ai_ir
#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
🔹 این مدلها تا ۸۵ برابر سریعتر و ۳.۴ برابر کوچکتر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:
♻️OCR (تشخیص متن از تصویر)
♻️Image Captioning (تولید توضیحات برای تصاویر)
♻️Visual Question Answering (پاسخ به سوالات تصویری)
♻️Image Understanding (درک محتوای تصویر)
⚡️ اپل با این حرکت جدیتر از همیشه وارد رقابت مدلهای سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.
لینک
@rss_ai_ir
#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
👍2🔥2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
🧪 معرفی EfficientSAM3 – نسل تازه مدلهای سبک و قدرتمند در سگمنتیشن
دانشگاه بریستول خانوادهی EfficientSAM3 را معرفی کرده است؛ مجموعهای از مدلهای سبک و پرسرعت که با روش نوآورانهی Progressive Hierarchical Distillation (PHD) آموزش دیدهاند.
در این روش، تواناییهای مدل بزرگ SAM3 به مدلهای کوچکتر منتقل میشود؛ نتیجهی آن:
🔹 دقت بالا
🔹 سرعت بیشتر
🔹 مناسب برای دستگاههای کمقدرت و کاربردهای صنعتی
کد پروژه همزمان با انتشار رسمی SAM3 در راه است.
🔗 Paper: arxiv.org/pdf/2511.15833
🔗 Project: simonzeng7108.github.io/efficientsam3/
🔗 Repo: github.com/SimonZeng7108/efficientsam3
@rss_ai_ir
---
#هوش_مصنوعی #سگمنتیشن #ComputerVision
#EfficientSAM3 #SAM3 #دیپ_لرنینگ
#AI #ML #VisionModels #PHD
#مدل_سبک #مدل_کارا #پردازش_تصویر
دانشگاه بریستول خانوادهی EfficientSAM3 را معرفی کرده است؛ مجموعهای از مدلهای سبک و پرسرعت که با روش نوآورانهی Progressive Hierarchical Distillation (PHD) آموزش دیدهاند.
در این روش، تواناییهای مدل بزرگ SAM3 به مدلهای کوچکتر منتقل میشود؛ نتیجهی آن:
🔹 دقت بالا
🔹 سرعت بیشتر
🔹 مناسب برای دستگاههای کمقدرت و کاربردهای صنعتی
کد پروژه همزمان با انتشار رسمی SAM3 در راه است.
🔗 Paper: arxiv.org/pdf/2511.15833
🔗 Project: simonzeng7108.github.io/efficientsam3/
🔗 Repo: github.com/SimonZeng7108/efficientsam3
@rss_ai_ir
---
#هوش_مصنوعی #سگمنتیشن #ComputerVision
#EfficientSAM3 #SAM3 #دیپ_لرنینگ
#AI #ML #VisionModels #PHD
#مدل_سبک #مدل_کارا #پردازش_تصویر
🙏2❤1🕊1
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 معرفی یک مدل چندوجهی یکپارچه از META
یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.
در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار میگیرد و نتیجه آن یک فضای واحد است که اجازه میدهد مدلها بهصورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آنها عمل کنند — با کیفیت در حد مدلهای SOTA.
کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شدهاند و مسیر توسعه روشن است.
🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna
#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄
یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.
در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار میگیرد و نتیجه آن یک فضای واحد است که اجازه میدهد مدلها بهصورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آنها عمل کنند — با کیفیت در حد مدلهای SOTA.
کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شدهاند و مسیر توسعه روشن است.
🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna
#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄