⚡️ مدل HunyuanOCR؛ کوچک، سریع و شکستدهندهٔ بنچمارکها
تنسنت نسخهٔ متنباز مدل HunyuanOCR را منتشر کرده؛ مدلی فقط با ۱ میلیارد پارامتر که عملکرد آن در سطح مدلهای چندین برابر بزرگتر است. این سیستم بهصورت End-to-End کار میکند و تقریباً همهٔ نیازهای OCR مدرن را پوشش میدهد.
✨ برتری در بنچمارکها
امتیاز 860 در OCRBench بین تمام مدلهای کوچکتر از 3B
امتیاز 94.1 در OmniDocBench؛ بهترین عملکرد در پردازش اسناد پیچیده
🧠 قابلیتها
مدل برای طیف گستردهای از سناریوهای OCR بهینه شده است:
✳️متن محیطی: تابلو، ویترین، بنر، خیابان
✳️دستخط و فونتهای هنری
✳️اسناد پیچیده: جدول، فرمول، HTML، LaTeX
✳️زیرنویس ویدیو
✳️ترجمهٔ مستقیم متن روی تصویر به ۱۴ زبان
این یک سامانهٔ چندمرحلهای نیست؛ فقط یک درخواست و یک پاس انفِرِنس.
🔗 لینکها
• وب:
https://hunyuan.tencent.com/vision/zh?tabIndex=0
• نسخه موبایل:
https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
• GitHub:
https://github.com/Tencent-Hunyuan/HunyuanOCR
• HuggingFace:
https://huggingface.co/tencent/HunyuanOCR
• گزارش فنی:
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf
@rss_ai_ir
#OCR #مدل_متنباز #هوش_مصنوعی #بینایی_ماشینی #Tencent #HunyuanOCR #AI #DeepLearning #Multimodal
تنسنت نسخهٔ متنباز مدل HunyuanOCR را منتشر کرده؛ مدلی فقط با ۱ میلیارد پارامتر که عملکرد آن در سطح مدلهای چندین برابر بزرگتر است. این سیستم بهصورت End-to-End کار میکند و تقریباً همهٔ نیازهای OCR مدرن را پوشش میدهد.
✨ برتری در بنچمارکها
امتیاز 860 در OCRBench بین تمام مدلهای کوچکتر از 3B
امتیاز 94.1 در OmniDocBench؛ بهترین عملکرد در پردازش اسناد پیچیده
🧠 قابلیتها
مدل برای طیف گستردهای از سناریوهای OCR بهینه شده است:
✳️متن محیطی: تابلو، ویترین، بنر، خیابان
✳️دستخط و فونتهای هنری
✳️اسناد پیچیده: جدول، فرمول، HTML، LaTeX
✳️زیرنویس ویدیو
✳️ترجمهٔ مستقیم متن روی تصویر به ۱۴ زبان
این یک سامانهٔ چندمرحلهای نیست؛ فقط یک درخواست و یک پاس انفِرِنس.
🔗 لینکها
• وب:
https://hunyuan.tencent.com/vision/zh?tabIndex=0
• نسخه موبایل:
https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
• GitHub:
https://github.com/Tencent-Hunyuan/HunyuanOCR
• HuggingFace:
https://huggingface.co/tencent/HunyuanOCR
• گزارش فنی:
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf
@rss_ai_ir
#OCR #مدل_متنباز #هوش_مصنوعی #بینایی_ماشینی #Tencent #HunyuanOCR #AI #DeepLearning #Multimodal
🔥1