🧠 مجموعه Anthropic نسل جدید ایجنتهای هوش مصنوعی را با اجرای کُد از طریق MCP متحول کرد
مجموعه Anthropic آپدیت بسیار مهمی منتشر کرده که شیوهٔ کار ایجنتهای هوش مصنوعی را تغییر میدهد:
اجرای مستقیم کُد از طریق پروتکل MCP (Model Context Protocol) — تغییری که میتواند معماری ایجنتها را وارد یک مرحلهٔ جدید کند.
🔸 در روشهای قدیمی، ایجنتها مجبور بودند برای هر اقدام، چندین فراخوانی ابزار (Tool Call) انجام دهند؛ این کار هم هزینهٔ محاسباتی را بالا میبرد و هم سریع فضای کانتکست را پر میکرد.
🔸 اما در رویکرد جدید، ایجنت مستقیماً کُد مینویسد و اجرا میکند و همان کد از طریق MCP ابزارها را فراخوانی میکند — نتیجه؟
کاهش ۹۸.۷٪ در مصرف توکن!
🔸 گاید رسمی Anthropic شامل نمونهکد، مراحل پیادهسازی و روشهای اتصال به فریمورکهای موجود است.
🔸 خروجی نهایی: ایجنتهایی سریعتر، ارزانتر و بسیار خودمختارتر که میتوانند زنجیرهای از وظایف پیچیده را با کمترین سربار انجام دهند.
این تغییر فقط یک بهینهسازی نیست؛
یک پارادایم جدید برای ساخت ایجنتهای مقیاسپذیر و خودکفا است.
https://www.anthropic.com/engineering/code-execution-with-mcp
---
#هوش_مصنوعی #Anthropic #MCP #AIagents #Claude #ایجنت #کدنویسی #مدل_زبان #خودمختاری #MachineLearning #AIRevolution
مجموعه Anthropic آپدیت بسیار مهمی منتشر کرده که شیوهٔ کار ایجنتهای هوش مصنوعی را تغییر میدهد:
اجرای مستقیم کُد از طریق پروتکل MCP (Model Context Protocol) — تغییری که میتواند معماری ایجنتها را وارد یک مرحلهٔ جدید کند.
🔸 در روشهای قدیمی، ایجنتها مجبور بودند برای هر اقدام، چندین فراخوانی ابزار (Tool Call) انجام دهند؛ این کار هم هزینهٔ محاسباتی را بالا میبرد و هم سریع فضای کانتکست را پر میکرد.
🔸 اما در رویکرد جدید، ایجنت مستقیماً کُد مینویسد و اجرا میکند و همان کد از طریق MCP ابزارها را فراخوانی میکند — نتیجه؟
کاهش ۹۸.۷٪ در مصرف توکن!
🔸 گاید رسمی Anthropic شامل نمونهکد، مراحل پیادهسازی و روشهای اتصال به فریمورکهای موجود است.
🔸 خروجی نهایی: ایجنتهایی سریعتر، ارزانتر و بسیار خودمختارتر که میتوانند زنجیرهای از وظایف پیچیده را با کمترین سربار انجام دهند.
این تغییر فقط یک بهینهسازی نیست؛
یک پارادایم جدید برای ساخت ایجنتهای مقیاسپذیر و خودکفا است.
https://www.anthropic.com/engineering/code-execution-with-mcp
---
#هوش_مصنوعی #Anthropic #MCP #AIagents #Claude #ایجنت #کدنویسی #مدل_زبان #خودمختاری #MachineLearning #AIRevolution
🤖 VITRA —
مدل VLA مقیاسپذیر مایکروسافت برای یادگیری مهارتهای انسان از ویدیوهای واقعی
مایکروسافت پروژهٔ جدیدی به نام VITRA معرفی کرده که هدف آن انتقال مستقیم مهارتهای انسان به رباتهاست — فقط با استفاده از ویدیوهای واقعی، بدون سناریو و کاملاً ایگو-سنتریک (از دید انسان).
این یعنی ربات مهارتها را از مشاهدهٔ رفتار طبیعی انسانها یاد میگیرد، نه با دیتاستهای ساختگی یا دموهای دقیق آزمایشگاهی.
🔍 مدل VITRA دقیقاً چه میکند؟
ویدیوهای معمولی از دست انسان را به دیتاست کامل VLA تبدیل میکند
مدل Vision-Language-Action را برای حرکت دست انسان آموزش میدهد
همان مدل را روی دادههای ربات فاینتیون میکند تا روی ربات واقعی کار کند
🧩 چطور دیتاست عظیم ساخته میشود؟
♻️بازسازی کامل حرکت ۳بعدی دست انسان
♻️تعیین دقیق پوز دوربین و هماهنگی فضا
♻️تبدیل حرکت پیوسته به اکشنهای اتمی
♻️اضافه کردن توضیح متنی به هر بخش، مثل:
«چرخ را بگیر»، «دستگیره را بچرخان»، «شیء را بردار»
🧠 معماری مدل
مدل VLM بکاند برای درک بصری
دیفیوژن پالیسی برای تولید اکشن
توصیف اکشن با ۱۵ زاویهٔ مفصل + پوز و اورینتیشن دست (استاندارد MANO)
— مستقیماً قابل استفاده روی رباتهای انساننما
📈 نتایج کلیدی
پیشبینی zero-shot رفتار دست در محیطهای جدید
مقیاسپذیری قوی — کیفیت با افزایش داده رشد میکند
عملکرد بهتر نسبت به SOTA مثل EgoDex
کنترل واقعی ربات با موفقیت بالا در کارهای دستکاری (manipulation)
📅 زمان انتشار عمومی
مایکروسافت قول داده کد، داده و مدلها را تا ۳۰ نوامبر ۲۰۲۵ منتشر کند.
🔗 پروژه:
https://microsoft.github.io/VITRA/
🔗 مقاله:
https://arxiv.org/abs/2510.21571
#AI #Robotics #VLA #Microsoft #VITRA #MachineLearning
#ComputerVision #RobotLearning #ImitationLearning
#EgocentricVideo #Manipulation #DeepLearning
#HumanToRobot #EmbodiedAI #AutonomousSystems
مدل VLA مقیاسپذیر مایکروسافت برای یادگیری مهارتهای انسان از ویدیوهای واقعی
مایکروسافت پروژهٔ جدیدی به نام VITRA معرفی کرده که هدف آن انتقال مستقیم مهارتهای انسان به رباتهاست — فقط با استفاده از ویدیوهای واقعی، بدون سناریو و کاملاً ایگو-سنتریک (از دید انسان).
این یعنی ربات مهارتها را از مشاهدهٔ رفتار طبیعی انسانها یاد میگیرد، نه با دیتاستهای ساختگی یا دموهای دقیق آزمایشگاهی.
🔍 مدل VITRA دقیقاً چه میکند؟
ویدیوهای معمولی از دست انسان را به دیتاست کامل VLA تبدیل میکند
مدل Vision-Language-Action را برای حرکت دست انسان آموزش میدهد
همان مدل را روی دادههای ربات فاینتیون میکند تا روی ربات واقعی کار کند
🧩 چطور دیتاست عظیم ساخته میشود؟
♻️بازسازی کامل حرکت ۳بعدی دست انسان
♻️تعیین دقیق پوز دوربین و هماهنگی فضا
♻️تبدیل حرکت پیوسته به اکشنهای اتمی
♻️اضافه کردن توضیح متنی به هر بخش، مثل:
«چرخ را بگیر»، «دستگیره را بچرخان»، «شیء را بردار»
🧠 معماری مدل
مدل VLM بکاند برای درک بصری
دیفیوژن پالیسی برای تولید اکشن
توصیف اکشن با ۱۵ زاویهٔ مفصل + پوز و اورینتیشن دست (استاندارد MANO)
— مستقیماً قابل استفاده روی رباتهای انساننما
📈 نتایج کلیدی
پیشبینی zero-shot رفتار دست در محیطهای جدید
مقیاسپذیری قوی — کیفیت با افزایش داده رشد میکند
عملکرد بهتر نسبت به SOTA مثل EgoDex
کنترل واقعی ربات با موفقیت بالا در کارهای دستکاری (manipulation)
📅 زمان انتشار عمومی
مایکروسافت قول داده کد، داده و مدلها را تا ۳۰ نوامبر ۲۰۲۵ منتشر کند.
🔗 پروژه:
https://microsoft.github.io/VITRA/
🔗 مقاله:
https://arxiv.org/abs/2510.21571
#AI #Robotics #VLA #Microsoft #VITRA #MachineLearning
#ComputerVision #RobotLearning #ImitationLearning
#EgocentricVideo #Manipulation #DeepLearning
#HumanToRobot #EmbodiedAI #AutonomousSystems
👍14❤13🎉11😁10🔥9🥰8👏7
🚀 یک موتور قدرتمند برای مدلهای چندمودالی (Multimodal Models)
اگر با مدلهای ترکیبی متن–تصویر–ویدیو کار میکنید، LMMs-Engine یکی از بهترین فریمورکهای جدید است.
این موتور فوقسبک و بسیار انعطافپذیر، مخصوص آموزش و توسعهی مدلهای چندمودالی طراحی شده و حتی در مقیاسهای بزرگ هم کارایی بسیار بالایی دارد.
💡 ویژگیهای برجسته:
🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدلهای ترکیبی
⚙️ بهینهسازی برای آموزش توزیعشده با مصرف حافظه بسیار کم
🧩 شامل دهها نمونه آماده اجرا برای شروع سریع با مدلهای مختلف
⚡ مناسب برای پژوهشگران، توسعهدهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند
📌 گیتهاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine
---
#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
اگر با مدلهای ترکیبی متن–تصویر–ویدیو کار میکنید، LMMs-Engine یکی از بهترین فریمورکهای جدید است.
این موتور فوقسبک و بسیار انعطافپذیر، مخصوص آموزش و توسعهی مدلهای چندمودالی طراحی شده و حتی در مقیاسهای بزرگ هم کارایی بسیار بالایی دارد.
💡 ویژگیهای برجسته:
🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدلهای ترکیبی
⚙️ بهینهسازی برای آموزش توزیعشده با مصرف حافظه بسیار کم
🧩 شامل دهها نمونه آماده اجرا برای شروع سریع با مدلهای مختلف
⚡ مناسب برای پژوهشگران، توسعهدهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند
📌 گیتهاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine
---
#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
😁19🔥17❤12🥰12🎉12👍10👏10🙏1
🍨کتابخانه Gelato — کتابخانهای تازه برای مدیریت و بهینهسازی گرافهای محاسباتی در ML
پروژهی Gelato از mlfoundations یک کتابخانهی مینیمال و بسیار کاربردی است که کمک میکند:
✳️گراف محاسباتی هر مدل ML را شفاف ببینیم
✳️وابستگیها و مسیرها را تحلیل کنیم
✳️گراف را بهصورت مستقیم اصلاح یا بهینهسازی کنیم
✳️معماریهای جدید را آزمایش کنیم و گلوگاههای محاسباتی را پیدا کنیم
اگر با مدلهای پیچیده، معماریهای سفارشی، یا تحقیق روی طراحی شبکهها کار میکنید، Gelato ابزار فوقالعادهای برای مهندسی و تحلیل ساختار مدل است.
🔗 Blog:
https://github.com/mlfoundations/Gelato
🔗 🍨 Gelato-30B-A3B (Model):
https://huggingface.co/mlfoundations/Gelato-30B-A3B
🔗 🖱️ Click-100k (Data):
https://huggingface.co/datasets/mlfoundations/Click-100k
---
#MachineLearning #Gelato #MLGraphs #AIGeneration
@rss_ai_ir
پروژهی Gelato از mlfoundations یک کتابخانهی مینیمال و بسیار کاربردی است که کمک میکند:
✳️گراف محاسباتی هر مدل ML را شفاف ببینیم
✳️وابستگیها و مسیرها را تحلیل کنیم
✳️گراف را بهصورت مستقیم اصلاح یا بهینهسازی کنیم
✳️معماریهای جدید را آزمایش کنیم و گلوگاههای محاسباتی را پیدا کنیم
اگر با مدلهای پیچیده، معماریهای سفارشی، یا تحقیق روی طراحی شبکهها کار میکنید، Gelato ابزار فوقالعادهای برای مهندسی و تحلیل ساختار مدل است.
🔗 Blog:
https://github.com/mlfoundations/Gelato
🔗 🍨 Gelato-30B-A3B (Model):
https://huggingface.co/mlfoundations/Gelato-30B-A3B
🔗 🖱️ Click-100k (Data):
https://huggingface.co/datasets/mlfoundations/Click-100k
---
#MachineLearning #Gelato #MLGraphs #AIGeneration
@rss_ai_ir
👍2🔥1👏1