VIRSUN
7.2K subscribers
1.45K photos
819 videos
5 files
908 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🍏 اپل دو مدل متن‌باز جدید معرفی کرد: FastVLM و MobileCLIP2

🔹 این مدل‌ها تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:

♻️OCR (تشخیص متن از تصویر)

♻️Image Captioning (تولید توضیحات برای تصاویر)

♻️Visual Question Answering (پاسخ به سوالات تصویری)

♻️Image Understanding (درک محتوای تصویر)


⚡️ اپل با این حرکت جدی‌تر از همیشه وارد رقابت مدل‌های سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.

لینک
@rss_ai_ir

#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
👍2🔥2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
🧪 معرفی EfficientSAM3 – نسل تازه مدل‌های سبک و قدرتمند در سگمنتیشن

دانشگاه بریستول خانواده‌ی EfficientSAM3 را معرفی کرده است؛ مجموعه‌ای از مدل‌های سبک و پرسرعت که با روش نوآورانه‌ی Progressive Hierarchical Distillation (PHD) آموزش دیده‌اند.
در این روش، توانایی‌های مدل بزرگ SAM3 به مدل‌های کوچک‌تر منتقل می‌شود؛ نتیجه‌ی آن:
🔹 دقت بالا
🔹 سرعت بیشتر
🔹 مناسب برای دستگاه‌های کم‌قدرت و کاربردهای صنعتی

کد پروژه هم‌زمان با انتشار رسمی SAM3 در راه است.


🔗 Paper: arxiv.org/pdf/2511.15833
🔗 Project: simonzeng7108.github.io/efficientsam3/
🔗 Repo: github.com/SimonZeng7108/efficientsam3

@rss_ai_ir
---

#هوش_مصنوعی #سگمنتیشن #ComputerVision
#EfficientSAM3 #SAM3 #دیپ_لرنینگ
#AI #ML #VisionModels #PHD
#مدل_سبک #مدل_کارا #پردازش_تصویر
🙏21🕊1
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 معرفی یک مدل چندوجهی یکپارچه از META

یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.

در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار می‌گیرد و نتیجه آن یک فضای واحد است که اجازه می‌دهد مدل‌ها به‌صورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آن‌ها عمل کنند — با کیفیت در حد مدل‌های SOTA.

کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شده‌اند و مسیر توسعه روشن است.


🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna

#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄