VIRSUN

🤖 ربات دو‌دستی جدید از VLAI Robotics با قیمت مقرون‌به‌صرفه معرفی شد!

شرکت VLAI Robotics رباتی دو‌دستی مبتنی بر پلتفرم OpenArm معرفی کرده که قیمت پایه‌ی آن از حدود ۵۵۰۰ دلار شروع می‌شود. 🇨🇳

🔹 این سیستم دارای ۱۶ درجه آزادی (DoF) است و قادر است حرکات انسان را با دقت بالا تقلید کند — ایده‌آل برای آموزش از طریق یادگیری تقلیدی (Imitation Learning).
🔹 تولید آن به‌صورت بومی انجام می‌شود و از الگوریتم‌های VLA (Vision-Language-Action) برای درک محیط و تعامل هوشمندانه بهره می‌برد.

این گام مهمی است به‌سوی دموکراتیزه‌کردن ربات‌های انسان‌نما و در دسترس‌کردن فناوری‌های پیشرفته برای آموزش و پژوهش. ⚙️

@rss_ai_ir
#رباتیک #هوش_مصنوعی #VLA #OpenArm #ImitationLearning #Automation #AI #Robotics

🔥2👍1😁1

1.42K views18:48

VIRSUN

🤖 VITRA —
مدل VLA مقیاس‌پذیر مایکروسافت برای یادگیری مهارت‌های انسان از ویدیوهای واقعی

مایکروسافت پروژهٔ جدیدی به نام VITRA معرفی کرده که هدف آن انتقال مستقیم مهارت‌های انسان به ربات‌هاست — فقط با استفاده از ویدیوهای واقعی، بدون سناریو و کاملاً ایگو-سنتریک (از دید انسان).
این یعنی ربات مهارت‌ها را از مشاهدهٔ رفتار طبیعی انسان‌ها یاد می‌گیرد، نه با دیتاست‌های ساختگی یا دموهای دقیق آزمایشگاهی.

🔍 مدل VITRA دقیقاً چه می‌کند؟

ویدیوهای معمولی از دست انسان را به دیتاست کامل VLA تبدیل می‌کند

مدل Vision-Language-Action را برای حرکت دست انسان آموزش می‌دهد

همان مدل را روی داده‌های ربات فاین‌تیون می‌کند تا روی ربات واقعی کار کند

🧩 چطور دیتاست عظیم ساخته می‌شود؟

♻️بازسازی کامل حرکت ۳بعدی دست انسان

♻️تعیین دقیق پوز دوربین و هماهنگی فضا

♻️تبدیل حرکت پیوسته به اکشن‌های اتمی

♻️اضافه کردن توضیح متنی به هر بخش، مثل:
«چرخ را بگیر»، «دستگیره را بچرخان»، «شیء را بردار»

🧠 معماری مدل

مدل VLM بک‌اند برای درک بصری

دیفیوژن پالیسی برای تولید اکشن

توصیف اکشن با ۱۵ زاویهٔ مفصل + پوز و اورینتیشن دست (استاندارد MANO)
— مستقیماً قابل استفاده روی ربات‌های انسان‌نما

📈 نتایج کلیدی

پیش‌بینی zero-shot رفتار دست در محیط‌های جدید

مقیاس‌پذیری قوی — کیفیت با افزایش داده رشد می‌کند

عملکرد بهتر نسبت به SOTA مثل EgoDex

کنترل واقعی ربات با موفقیت بالا در کارهای دستکاری (manipulation)

📅 زمان انتشار عمومی

مایکروسافت قول داده کد، داده و مدل‌ها را تا ۳۰ نوامبر ۲۰۲۵ منتشر کند.

🔗 پروژه:
https://microsoft.github.io/VITRA/
🔗 مقاله:
https://arxiv.org/abs/2510.21571

#AI #Robotics #VLA #Microsoft #VITRA #MachineLearning
#ComputerVision #RobotLearning #ImitationLearning
#EgocentricVideo #Manipulation #DeepLearning
#HumanToRobot #EmbodiedAI #AutonomousSystems

👍14❤13🎉11😁10🔥9🥰8👏7

1.24K views14:15

About

Blog

Apps

Platform