📄 PaddleOCR-VL (0.9B) —
مدل فشرده Vision-Language نسل جدید از Baidu AI
تیم تحقیقاتی Baidu AI نسخهی جدیدی از مدلهای چندوجهی خود را معرفی کرده است:
🔹 PaddleOCR-VL (0.9B) —
مدلی بسیار سبک که با وجود اندازه کوچک، به دقت SOTA در وظایف بینایی-زبانی دست یافته است:
♻️شناسایی و تشخیص متنها
♻️جدولها و دادههای ساختاریافته
♻️فرمولهای ریاضی
♻️نمودارها و گرافه
ا
💡 درون :
NaViT —
انکودر تصویری پویا (Dynamic Vision Encoder)
ERNIE —
نسخه سبکشدهی مدل زبانی بایدو برای درک متن
⚡️ پشتیبانی از ۱۰۹ زبان مختلف، با تمرکز بر کارایی بالا در دستگاههای لبهای (edge).
🟠 GitHub:
github.com/PaddlePaddle/PaddleOCR
🟠 HuggingFace:
PaddleOCR-VL
🟠 اسناد رسمی:
paddleocr.ai/latest/en/index.html
@rss_ai_ir
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
مدل فشرده Vision-Language نسل جدید از Baidu AI
تیم تحقیقاتی Baidu AI نسخهی جدیدی از مدلهای چندوجهی خود را معرفی کرده است:
🔹 PaddleOCR-VL (0.9B) —
مدلی بسیار سبک که با وجود اندازه کوچک، به دقت SOTA در وظایف بینایی-زبانی دست یافته است:
♻️شناسایی و تشخیص متنها
♻️جدولها و دادههای ساختاریافته
♻️فرمولهای ریاضی
♻️نمودارها و گرافه
ا
💡 درون :
NaViT —
انکودر تصویری پویا (Dynamic Vision Encoder)
ERNIE —
نسخه سبکشدهی مدل زبانی بایدو برای درک متن
⚡️ پشتیبانی از ۱۰۹ زبان مختلف، با تمرکز بر کارایی بالا در دستگاههای لبهای (edge).
🟠 GitHub:
github.com/PaddlePaddle/PaddleOCR
🟠 HuggingFace:
PaddleOCR-VL
🟠 اسناد رسمی:
paddleocr.ai/latest/en/index.html
@rss_ai_ir
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR