Robotic Knowledge
382 subscribers
242 photos
62 videos
2 files
172 links
دانش و برنامه‌نویسی برای رباتیک
Download Telegram
#هوش_مصنوعی #راه_رفتن_چهار_پا
یادگیری تقویتی با مولد ترجکتوری تحولی

راه رفتن یک ربات چهار پا را تجسم کنید. در حالت عادی برای هر سناریو محیطی (مسیر مستقیم یا شیب دار بدون پله یا شیب دار با پله و مسیر باریک و ...) یک کنترل‌کننده مخصوص باید طراحی گردد تا ربات امکان حرکت داشته باشد. در واقع حداقل واحد مولد ترجکتوری کنترل‌کننده باید بر اساس سناریو تغییر کند. این مساله زیاد ساده نیست و دشواری‌های خاص دارد.

الگوریتم‌های یادگیری تقویتی (Reinforcement Learning) نیز در حالت عادی امکان یادگیری کامل راه رفتن موثر (منظور واحد تولید مسیر مطلوب کنترل‌کننده است که در محیط تولید مسیر را یاد بگیرد) را ندارند یا با دشواری‌های زیادی سر و کار دارند! دلیل عدم یادگیری موثر RL دینامیک غیرخطی ربات چهار پا و بحث reward sparsity در RL است. اجازه بدهید کمی در خصوص این بحث صحبت کنیم.

در مسائل RL دنیای واقعی چالشی بر سر راه عامل یا agent ظاهر می‌شود که یادگیری را مشکل می‌کند. این چالش که به نام sparse extrinsic reward یا پاداش خارجی کم تراکم (واقعا معادل بهتری به ذهن بنده نرسید🙂) معروف است، با این ويژگی قابل مشخص شدن است که در یک فعالیت مشخص، تنها تعداد کمی نقطه در فضای حالت سیستم دینامیکی وجود دارد که در آنها سیگنال فیدبک به agent داده می‌شود. برای مثال اگر فعالیت agent رسیدن به یک موقعیت مطلوب باشد و تنها هنگامی که به اندازه کافی به هدف نزدیک باشد به او سیگنال پاداش داده می‌شود. برای حل این چالش روش‌های مختلفی ارائه شده است که در این مقاله می‌توانید مطالعه کنید و ما از بحث خود دور نمی‌شویم!

در ادامه بحث مشکلات RL های رایج برای تولید مسیر یک ربات چهار پا، می‌توان مثال راه رفتن تعادلی بر روی یک بیم را زد که یک فعالیت بسیار مشکل است! محققان یک روش جدید مبتنی بر RL برای تولید ترجکتوری ارائه کرده‌اند. در روش‌های قبلی تولید ترجکتوری توسط یک واحد بدون تغییر انجام می‌شد اما در روش جدید مولد شکل خروجی تولید شده را بر اساس سناریو بهینه می‌کند. این اتفاق منجر به تنوع حرکات پیشین برای یادگیری policy یا سیاست می‌شود. سیاست با RL به شکلی آموزش می‌بیند که خروجی (ترجکتوری تولید شده) منطبق بر راه رفتن در سناریوهای متفاوت شود. به طور متناوب مولد ترجکتوری و شبکه سیاست بهینه می‌شوند تا آموزش پایدار گردد و داده‌های اکتشافی اشتراک گذاشته شده منجر به بهبود کارایی نمونه شود.

در نشان دادن کارایی این روش، کنترل‌کننده یک ربات 12 درجه آزادی چهار پا طی شبیه‌سازی راه رفتن در سناریوهای محیطی مختلف را یاد گرفته است که در این فیلم خروجی کار آنها قابل دیدن است. همچنین اجرای این روش یادگیری مولد مسیر بر روی ربات واقعی انجام شده است که می‌توانید فیلم آن را ببینید. این یک پروژه open source است که در github در این لینک می‌توانید به آن دسترسی داشته باشید و بر روی ربات چهار پای خود اجرا کنید. البته اگر ربات چهار پا داشته باشید!

—————
@roboticknowledge
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: انیمیشن یادگیری راه رفتن (تولید مسیر) توسط الگوریتم تحولی مبتنی بر RL در ربات چهار پا در سناریوهای گوناگون
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: پیاده‌سازی الگوریتم یادگیری راه رفتن در ربات چهار پا در الگوریتم تحولی مبتنی بر RL
#اتوماسیون #خدمات_رباتیک
خدمات شستن ظروف توسط خط اتوماتیک رباتیک شرکت dishcraft

شرکت dishcraft ارائه دهنده خط تمام اتوماتیک برای شست و شوی ظروف است که با هدف بهبود کارایی شست و شو در حجم بالا و کاهش تولید زباله سیستم رباتیک خود را توسعه داده است. طبق فیلم خط ظرفشویی این شرکت از چند مکانیزم و حداقل یک بازوی رباتیک استفاده می‌کند. dishcrafe در فرآیندی‌های تشخیصی و بازرسی ظروف از هوش مصنوعی هم استفاده می‌کند. در این تصویر سیکل کاری این شرکت را مشاهده می‌کنید. طبق این سیکل، این شرکت به دنبال انجام شستن ظروف و تحویل آنها است و نه فروش خط خود (حداقل در حال حاضر). طبق داده‎‌های این شرکت، تولید زباله مشتریان 60٪ کاهش یافته است. در حال حاضر خدمات این شرکت به San Francisco Bay محدود هست. در ایران خودمان چنین خدمات نوینی در آينده حتما پتانسیل اقتصادی خوبی خواهد داشت!
—————
@roboticknowledge
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: کارکرد خط اتوماتیک شست و شوی ظروف dishcraft
تصویر: سیکل کاری dishcraft و جایگاه مشتریان در اکوسیستم این شرکت.
تصویر: از اولین ربات‌های کار با بمب. دیتای دریافتی از ربات به اپراتور و یا دستورهای اپراتور به ربات از طریق سیم به پلتفرم ارسال می‌شد. طبیعی است. آن زمان ارتباط بی‌سیم به شکل الان وجود نداشت!
—————
@roboticknowledge
#سنسور #مکانیزم_تشخیص
سنسور نیرو/تغییر شکل بر اساس تغییر شکل مکانیزم‌های انعطاف پذیر

پژوهشگران MIT موفق به اضافه کردن قابلیت حس کردن به ماده یک جسم شده‌اند که در تکنولوژی‌های رباتیک بسیار کاربردی است. دیگر می‌توان به چیزی به غیر از Load Cell هم برای اندازه‌گیری نیرو فکر کرد!

آنها روش جدیدی توسعه داده‌اند که در آن با چاپ سه بعدی مکانیزم‌های تشخیصی امکان سنجش میزان نیروی وارده به یک جسم حاصل می‌شود. مکانیزم مورد بحث تک جنس و با سرعت بالایی قابل ساخت است (البته واقعا اینطور نیست! آخر مطلب متوجه خواهید شد). از این کار می‌توان ورودی‌های تعاملی یک سیستم را طراحی کرد. برای مثال می‌توان یک جوی استیک یا کلید ورودی یک سیستم را متناسب با نیاز ساخت.

در این طرح الکترودها با فرامواد (موادی ساخته شده از شبکه تکراری از سلول‌ها) یکپارچه می‌شوند. ایده این است که تغییر شکل مکانیزم (در اثر اعمال نیروی خارجی) منجر به کشش یا فشردگی سلول‌های انعطاف پذیر داخلی می‌شود. هر سلول دارای دو دیواره رسانا (همان الکترود) و دو دیواره غیر رسانا است. با تغییر شکل کلی مکانیزم، طول دیواره‌های رسانا هم تغییر می‌کند و با استفاده از اندازه‌گیری اثر خازنی دو صفحه رسانا روبروی هم در هر سلول (و البته کل مکانیزم) می‌توان مقدار نیروی وارد شده به مکانیزم و جهت آن را اندازه‌گیری کرد. البته در این صورت اندازه‌گیری شتاب و دوران هم ممکن می‌شود.

برای نشان دادن (اثبات کردن) کارکرد این مکانیزم، محققان یک جوی استیک فراماده ساخته‌اند که چهار سلول با ساختار مورد بحث در چهار جهت در آن قرار داده‌اند. در این فیلم تمام تست‌های آن را می‌توانید مشاهده کنید.

تیم پژوهشگر اقدام به توسعه یک نرم‌افزار ویرایش سه بعدی به نام MetaSence کرده‌اند که در آن جا نمایی سلول‌های برشی رسانا بصورت خودکار و البته بهینه انجام می‌شود (خود کاربر هم می‌تواند دستی این کار را انجام دهد). این ابزار قابلیت شبیه‌سازی برای طراحی مکانیزم تغییر شکل و محاسبات مربوط به آن را دارد. سلول‌هایی که بیشترین تغییر شکل را دارند، تنها بصورت خازنی ایجاد می‌شوند و سلول‌های دیگر معمولی خواهند بود.

ساخت چنین سنسوری آنقدر هم ساده نیست که تیم توسعه دهنده می‌گوید. همزمان دو نازل (یکی برای تزریق ماده غیر رسانا و یکی برای تزریق ماده رسانا در دو دیواره از چهار دیواره سلول‌های اصلی مکانیزم) باید کار کنند که با توجه به تفاوت‌های خواصی مادی در دو نازل قلق‌های خاص خود را می‌طلبد.

اگرچه فعلا در حد تحقیق هست چنین سنسوری، اما می‌تواند در آینده گزینه تجاری خوبی برای حسگرهای ربات‌ها باشد. خصوصا در نرم‌رباتیک که کلا استفاده از سنسور سخت مثل Load Cell برای سنجش نیرو مشکل است.

—————
@roboticknowledge
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: چند تست در طراحی‌های ساختاری مختلف از مکانیزم مخصوص اندازه‌گیری نیرو/تغییر شکل مبتنی بر رفتار خازنی توسط محققان MIT.
#ربات_های_الهام_گرفته_شده_از_طبیعت
مطالعه جریان‌های گردابی اقیانوسی توسط ربات پنگوئن مانند!

برای مطالعه جریان‌های گردابی ناشناخته در اقیانوس‌ها اقدام به توسعه یک ربات زیرآبی خودمختار (Autonomous Underwater Vehicle) شده است که هندسه آن از بدن پنگوئن الهام گرفته شده است. این ربات طی همکاری اقیانوس شناسان با یک شرکت bionic به نام EvoLogics ایجاد شده است.

جریان‌های اقیانوسی برخی اوقات حلقه‌های کوچک موقت ایجاد می‌کننند که به گردابه یا ocean eddies معروف هستند. این گردابه‌ها در اکوسیستم دریایی با جابجایی حرارت، مواد مرتبط با تغذیه جانداران و گازهای‌های بین آب‌های سطحی و عمقی ایفای نقش مهمی انجام می‌کنند. حداقل دانشمندان این چنین فکر می‌کنند در حال حاضر!

مشکل و چالش اساسی مطالعه این جریان گردابی در عرض کم آنها و ناپدید شدن آنها تنها بعد از چند ساعت از تشکیل شدن آنهاست. اگر هم محققان خیلی خوش شانس باشند و در زمان مناسب در مکان مناسب جریان گردابی برسند، آنها راه مناسبی برای جمع آوری داده از این جریان ناشناخته ندارند. اقیانوس شناسان از روش‌هایی مثل بستن تجهیزات داده‌برداری به قایق با طناب و کشیدن آن به مکان مناسب استفاده می‌کنند که البته خیلی راحت امکان از دست رفتن چند هزار دلار تجهیزات در اثر برخورد به موانع طبیعی و مصنوعی و ... وجود دارد! پس به فکر توسعه یک ربات برای انجام اندازه‌گیری‌ها از دل جریان گردابی افتادند.

این AUV پنگوئنی Quadroin نام دارد. این نام ترکیب quadro به سبب وجود چهار پیشران در دم ربات و penguin که هندسه ربات از آن الهام گرفته شده است، می‌باشد. خطوط جریان اطراف هندسه پنگوئن از نظر مشخصات بهینه می‌باشد که در نیروی مقاوم درگ و کاهش آن تقش مهمی دارد:

“Penguins provide a shape with optimal streamlining characteristics,” EvoLogics co-founder Rudolf Bannasch said.

ربات پنگوئنی Quadroin سنسورهای دما، شوری،‌ سطح اکسیژن و ... برای مطالعه جریان گردابی اقیانوسی دارد. سرعت بیشینه آن برابر 18.52 کیلومتر بر ساعت و عمق حرکت آن تا 152.4 متر است. قیمت این ربات در حدود 95000$ است! به نظر به دنبال دسته کردن این ربات‌ها برای داده برداری دقیق نیز هستند. اگر الکترونیک ربات دچار مشکل شود، بصورت خودکار شناور می‌شود و چیزی از دست نمی‌رود؛ طراحی این ربات منجر به این اتفاق می‌شود.

دوام کاری ربات بین 6-8 ساعت است. اگر بحث بهینه بودن هندسه ربات از نظر خطوط جریان در میان نبود، قطعا این مداوت کاری پایین‌تر بود.

—————
@roboticknowledge
تصویر: Quadroin در دستان یک اقیانوس شناس - تصویر از گاردین.
#هوش_مصنوعی
یادگیری مسائل مختلف توسط یک ربات: تحکیم وزن الاستیک در آموزش شبکه عصبی
قسمت اول

ما روزانه با چندین الگوریتم هوش مصنوعی سر و کار داریم. برای مثال می‌توان به سیستم‌های پیشنهاد محتوا در وب اپ‌ها یا سرویس زیرنویس هوشمند یوتوب اشاره کرد؛ اگرچه تعداد مثال‌ها خیلی بیشتر است!
یکی از مسائلی که در کاربرد هوش مصنوعی در رباتیک بصورت چالش است، یادگیری چندین کار متفاوت توسط ربات است. برای مثال یک شبکه عصبی را در نظر بگیرید که برای تشخیص سگ/گربه آموزش دیده است. این شبکه اگر قرار باشد که تشخیص خودرو/اتبوس را یاد بگیرد، در صورت عدم استفاده از استراتژی یادگیری چندگانه قطعا کارایی خود را در فرآیند تشخیصی اول از دست می‌دهد.
به عنوان یک استراتژی یادگیری چندگانه محققان DeepMind روش elastic weight consolidation یا تحکیم وزن الاستیک را پیشنهاد داده‌اند. در این روش وزن‌های مهم شبکه عصبی در مساله یادگیری اول دستخوش تغییر خیلی کم در مساله یادگیری دوم می‌شوند. به عبارتی امکان تغییر خیلی کم دارند و در یادگیری مسائل جدید تنها اتصالات بدون استفاده امکان استفاده برای آموزش دارند.
این روش به عنوان یک پایه در توسعه روش‌های جدید مطرح شده است زیرا مشکلات فراوانی دارد که مهم‌ترین آن غیر مقیاس پذیر بودن هوش مصنوعی سیستم است و تنها مسائل محدودی را می‌توان یاد گرفت.

—————
@roboticknowledge
تصویر: روش تحکیم وزن الاستیک یک شبکه عصبی برای یادگیری چند مساله. در مساله دوم اتصالات بنفش مهم هستند که توسط مساله اول استفاده شده‌اند و scalable نبودن روش مورد بحث را می‌توان درک کرد.
Robotic Knowledge
تصویر: روش تحکیم وزن الاستیک یک شبکه عصبی برای یادگیری چند مساله. در مساله دوم اتصالات بنفش مهم هستند که توسط مساله اول استفاده شده‌اند و scalable نبودن روش مورد بحث را می‌توان درک کرد.
توضیح: اتصالات نارنجی در یادگیری مساله اول با اهمیت هستند و در مسائل بعدی نمی‌توانند استفاده گردند. در مساله دوم اتصالات آبی رنگ باید لحاظ شوند؛ دو اتصال نیز به رنگ بنفش هستند به این معنی که باید آبی می‌شدند اما توسط مساله اول مورد استفاده قرار گرفته‌اند و دیگر به آن‌ها دسترسی وجود ندارد که همین مساله قابلیت‌های شبکه عصبی در پاسخ مساله دوم را کاهش می‌دهد. در همین تصویر مشکل مقیاس پذیری با چشم دیده می‌شود؛ تنها چند مساله محدود می‌توان یاد گرفت.
—————
@roboticknowledge
تصویر: پوستر چالش SubT که امسال توسط DARPA برگزار شد.
تصویر: ورودی محیط مسابقه SubT (چپ) و قسمتی از یک شبیه‌ساز تونل طبیعی در آن (راست).
تصویر: طرح مفهومی تیم CERBERUS که برنده نهایی چالش SubT شد. ربات پرنده در ابتدا بصورت محدود مسیرهای ممکن را بررسی می‌کند و بهترین سناریو برای Planning را برای پیشنهاد به ربات چهارپا طراحی می‌کند.