📚 بزرگترین دیتاست آموزش مدلهای عامل (Agent LLM) منتشر شد — شامل ۱.۲۷ میلیون مسیر یادگیری و بیش از ۳۶ میلیارد توکن! 🤖📈
تا امروز، آموزش گستردهی supervised fine-tuning برای مدلهای عامل نادر بود — نه به خاطر کمبود داده، بلکه به دلیل پراکندگی و تفاوت فرمتها.
برای حل این مشکل، پژوهشگران Agent Data Protocol (ADP) را معرفی کردهاند — یک استاندارد یکپارچه برای دادههای عاملها که اطلاعات را از منابع مختلف ترکیب میکند:
🧩 کد، مرورگر، API، و ابزارها.
در این پروژه، ۱۳ دیتاست در قالب ADP ترکیب شدهاند و حالا با چندین فریمورک عامل سازگارند.
نتیجه؟ به طور میانگین ۲۰٪ بهبود عملکرد بدون نیاز به تنظیم اختصاصی برای هر دامنه — و رسیدن به سطح SOTA.
این گام راه را برای استاندارد واحد آموزش عاملها و ایجاد پایپلاینهای مقیاسپذیر باز میکند.
📄 مقاله: arxiv.org/abs/2510.24702
🌐 پروژه: agentdataprotocol.com
📡 @rss_ai_ir
#AgentLLM #هوش_مصنوعی #AI #LLM #DataProtocol #MachineLearning #Agents
تا امروز، آموزش گستردهی supervised fine-tuning برای مدلهای عامل نادر بود — نه به خاطر کمبود داده، بلکه به دلیل پراکندگی و تفاوت فرمتها.
برای حل این مشکل، پژوهشگران Agent Data Protocol (ADP) را معرفی کردهاند — یک استاندارد یکپارچه برای دادههای عاملها که اطلاعات را از منابع مختلف ترکیب میکند:
🧩 کد، مرورگر، API، و ابزارها.
در این پروژه، ۱۳ دیتاست در قالب ADP ترکیب شدهاند و حالا با چندین فریمورک عامل سازگارند.
نتیجه؟ به طور میانگین ۲۰٪ بهبود عملکرد بدون نیاز به تنظیم اختصاصی برای هر دامنه — و رسیدن به سطح SOTA.
این گام راه را برای استاندارد واحد آموزش عاملها و ایجاد پایپلاینهای مقیاسپذیر باز میکند.
📄 مقاله: arxiv.org/abs/2510.24702
🌐 پروژه: agentdataprotocol.com
📡 @rss_ai_ir
#AgentLLM #هوش_مصنوعی #AI #LLM #DataProtocol #MachineLearning #Agents
arXiv.org
Agent Data Protocol: Unifying Datasets for Diverse, Effective...
Public research results on large-scale supervised finetuning of AI agents remain relatively rare, since the collection of agent training data presents unique challenges. In this work, we argue...
❤1