این پست از Peter W. J. Staar، یکی از اعضای ارشد تحقیقاتی در IBM Research Zurich، درباره معرفی مدل جدیدی به نام Granite-Docling برای پردازش اسناد است.
👉 @ai_python ✍️
مدل Granite-Docling یک مدل چندحالته تصویری-زبانی (Visual Language Model) است که برای تبدیل اسناد به شکل دقیق و مقرونبهصرفه طراحی شده. این مدل ادامهدهندهی پروژهی قبلی به نام SmolDocling است و هدف آن فراهم کردن ابزارهای قدرتمند برای پردازش اسناد برای همه است.
👉 @ai_python ✍️
تعداد پارامترها، فقط ۲۵۸ میلیون، که آن را بسیار سبک و سریع میکند.
ویژگی های اصلی :
تشخیص بهتر معادلات ریاضی، جداول، OCR، بلوکهای کد و معادلات درونخطی
حالتهای استنتاج منعطف (تمام صفحه یا ناحیهای)
رمزگشایی پایدارتر (جلوگیری از حلقههای بینهایت)
پاسخ به سوالات درباره ساختار و ترتیب عناصر سند
پشتیبانی آزمایشی از زبانهای ژاپنی، عربی و چینی
👉 @ai_python ✍️
🔗 لینکهای مرتبط:
توضیحات کامل در بلاگ
دموی مدل در Hugging Face
مخزن Docling در GitHub
مدل Granite-Docling یک مدل چندحالته تصویری-زبانی (Visual Language Model) است که برای تبدیل اسناد به شکل دقیق و مقرونبهصرفه طراحی شده. این مدل ادامهدهندهی پروژهی قبلی به نام SmolDocling است و هدف آن فراهم کردن ابزارهای قدرتمند برای پردازش اسناد برای همه است.
تعداد پارامترها، فقط ۲۵۸ میلیون، که آن را بسیار سبک و سریع میکند.
ویژگی های اصلی :
تشخیص بهتر معادلات ریاضی، جداول، OCR، بلوکهای کد و معادلات درونخطی
حالتهای استنتاج منعطف (تمام صفحه یا ناحیهای)
رمزگشایی پایدارتر (جلوگیری از حلقههای بینهایت)
پاسخ به سوالات درباره ساختار و ترتیب عناصر سند
پشتیبانی آزمایشی از زبانهای ژاپنی، عربی و چینی
توضیحات کامل در بلاگ
دموی مدل در Hugging Face
مخزن Docling در GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
13
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from DLeX: AI Python (NaviD DariYa)
پلی لیست رایگان دوره احتمالات (گرایش علوم کامپیوتر) از استفورد در یوتیوب :
@ai_python
https://www.youtube.com/playlist?list=PLoROMvodv4rOpr_A7B9SriE_iZmkanvUg
@ai_python
https://www.youtube.com/playlist?list=PLoROMvodv4rOpr_A7B9SriE_iZmkanvUg
YouTube
Stanford CS109 Introduction to Probability for Computer Scientists I 2022 I Chris Piech
The class starts by providing a fundamental grounding in combinatorics, and then quickly moves into the basics of probability theory. We will then cover many...
https://wardenprotocol.org/
Please open Telegram to view this post
VIEW IN TELEGRAM
wardenprotocol.org
Warden Protocol
Warden brings AI to web3, enabling any application, protocol or smart contract to integrate safe AI.
3
از اون جایی که چند وقتی هست به شدت مشاهده می شه آگهی های استخدام متخصص مایکروسافت آژور مسلط به ArgoCD در اروپا زیاد شده و از اون جایی که به خاطر Azure Machine Learning و Azure AI Foundry خیلی از کمپانی ها در اروپا مایل هستن که از به دلیل برخی سیاست ها از Azure بهره بگیرن، کمی دنبال این موضوع گشتم که ببینم منابع خوب رایگان برای شروع ArgoCD چی داریم؟ که به این کانال برخوردم که ویدیوهاش با اینکه قدیمی بودن خیلی خوب بودن. برای همین با شما هم به اشتراک می ذارم :
راستی دوستانی که از کانال @MigrationEasy این پست رو می بینن، اگر مایل بودن کانال @ai_python رو هم فالو کنن.🍷
👉 @ai_python ✍️
https://youtu.be/MeU5_k9ssrs?si=fjeXx8A0wlyh4dW_
راستی دوستانی که از کانال @MigrationEasy این پست رو می بینن، اگر مایل بودن کانال @ai_python رو هم فالو کنن.
https://youtu.be/MeU5_k9ssrs?si=fjeXx8A0wlyh4dW_
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
ArgoCD Tutorial for Beginners | GitOps CD for Kubernetes
Full ArgoCD Tutorial | Learn about the GitOps CD tool for Kubernetes
► Learn how to build production-grade GitOps pipeline with ArgoCD in our DevSecOps Bootcamp: https://bit.ly/4dLvm7F
The ArgoCD chapter includes building a pipeline of dynamically updating…
► Learn how to build production-grade GitOps pipeline with ArgoCD in our DevSecOps Bootcamp: https://bit.ly/4dLvm7F
The ArgoCD chapter includes building a pipeline of dynamically updating…
میخواهی دنیای دادهها رو کشف کنی؟
🚀 ثبت نام دوره داده کاوی با پایتون شروع شد!
از امروز با قدرت پایتون، الگوهای مخفی در دادهها رو شناسایی کن و به اطلاعات ارزشمند تبدیلشون کن! 📊💻
➖➖➖➖➖➖➖➖➖➖➖➖
اطلاعات دوره کلیک کنید👇
https://B2n.ir/jk2189
➖➖➖➖➖➖➖➖➖➖➖➖
☎️مشاوره وثبت نام
02167641999
📲تلگرام و واتساپ
09222477250
➖➖➖➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص
🚀 ثبت نام دوره داده کاوی با پایتون شروع شد!
از امروز با قدرت پایتون، الگوهای مخفی در دادهها رو شناسایی کن و به اطلاعات ارزشمند تبدیلشون کن! 📊💻
➖➖➖➖➖➖➖➖➖➖➖➖
اطلاعات دوره کلیک کنید👇
https://B2n.ir/jk2189
➖➖➖➖➖➖➖➖➖➖➖➖
☎️مشاوره وثبت نام
02167641999
📲تلگرام و واتساپ
09222477250
➖➖➖➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص
مقایسه کوتاه Google A2A با MCP :
👉 @ai_python ✍️
https://youtube.com/shorts/Dxn1ku9nkRc?si=QOI1fBFdAmdS0ZrK
https://youtube.com/shorts/Dxn1ku9nkRc?si=QOI1fBFdAmdS0ZrK
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
A2A vs MCP for AI Agents: Which One to Choose? (60 Sec Guide)|A2A vs MCP: The AI Agent Showdown
این مقاله محدودیتهای بنیادی مدلهای بازیابی مبتنی بر وکتور امبدینگ را بررسی میکند، بهویژه زمانی که این مدلها با وظایف پیچیدهتر، مانند استدلال یا پیروی از دستورالعملها، روبرو میشوند.
نویسندگان نشان میدهند که تعداد زیرمجموعههای اسناد که یک وکتور امبدینگ میتواند با توجه به ابعاد Embedding بازگرداند، محدود است.
برای اثبات این موضوع، آنها یک مجموعه داده واقعگرایانه و در عین حال ساده به نام LIMIT ایجاد میکنند که مدلهای پیشرفته فعلی نیز در آن شکست میخورند، و تأکید میکنند که این محدودیتهای نظری حتی در تنظیمات عملی نیز وجود دارند.
نتیجهگیری این است که جامعه تحقیقاتی باید به این محدودیتها توجه داشته باشد و روشهای بازیابی جایگزین، مانند مدلهای چند برداری، را برای وظایف پیچیدهتر توسعه دهد.
لینک ویدیو فارسی توضیحات این مقاله : https://youtu.be/rNEl_tBJ5aE?si=Wg5LUPloe6s3noz2
لینک مقاله در آرشیو :
https://arxiv.org/pdf/2508.21038
Please open Telegram to view this post
VIEW IN TELEGRAM
15