#هوش_مصنوعی #راه_رفتن_چهار_پا
یادگیری تقویتی با مولد ترجکتوری تحولی
راه رفتن یک ربات چهار پا را تجسم کنید. در حالت عادی برای هر سناریو محیطی (مسیر مستقیم یا شیب دار بدون پله یا شیب دار با پله و مسیر باریک و ...) یک کنترلکننده مخصوص باید طراحی گردد تا ربات امکان حرکت داشته باشد. در واقع حداقل واحد مولد ترجکتوری کنترلکننده باید بر اساس سناریو تغییر کند. این مساله زیاد ساده نیست و دشواریهای خاص دارد.
الگوریتمهای یادگیری تقویتی (Reinforcement Learning) نیز در حالت عادی امکان یادگیری کامل راه رفتن موثر (منظور واحد تولید مسیر مطلوب کنترلکننده است که در محیط تولید مسیر را یاد بگیرد) را ندارند یا با دشواریهای زیادی سر و کار دارند! دلیل عدم یادگیری موثر RL دینامیک غیرخطی ربات چهار پا و بحث reward sparsity در RL است. اجازه بدهید کمی در خصوص این بحث صحبت کنیم.
در مسائل RL دنیای واقعی چالشی بر سر راه عامل یا agent ظاهر میشود که یادگیری را مشکل میکند. این چالش که به نام sparse extrinsic reward یا پاداش خارجی کم تراکم (واقعا معادل بهتری به ذهن بنده نرسید🙂) معروف است، با این ويژگی قابل مشخص شدن است که در یک فعالیت مشخص، تنها تعداد کمی نقطه در فضای حالت سیستم دینامیکی وجود دارد که در آنها سیگنال فیدبک به agent داده میشود. برای مثال اگر فعالیت agent رسیدن به یک موقعیت مطلوب باشد و تنها هنگامی که به اندازه کافی به هدف نزدیک باشد به او سیگنال پاداش داده میشود. برای حل این چالش روشهای مختلفی ارائه شده است که در این مقاله میتوانید مطالعه کنید و ما از بحث خود دور نمیشویم!
در ادامه بحث مشکلات RL های رایج برای تولید مسیر یک ربات چهار پا، میتوان مثال راه رفتن تعادلی بر روی یک بیم را زد که یک فعالیت بسیار مشکل است! محققان یک روش جدید مبتنی بر RL برای تولید ترجکتوری ارائه کردهاند. در روشهای قبلی تولید ترجکتوری توسط یک واحد بدون تغییر انجام میشد اما در روش جدید مولد شکل خروجی تولید شده را بر اساس سناریو بهینه میکند. این اتفاق منجر به تنوع حرکات پیشین برای یادگیری policy یا سیاست میشود. سیاست با RL به شکلی آموزش میبیند که خروجی (ترجکتوری تولید شده) منطبق بر راه رفتن در سناریوهای متفاوت شود. به طور متناوب مولد ترجکتوری و شبکه سیاست بهینه میشوند تا آموزش پایدار گردد و دادههای اکتشافی اشتراک گذاشته شده منجر به بهبود کارایی نمونه شود.
در نشان دادن کارایی این روش، کنترلکننده یک ربات 12 درجه آزادی چهار پا طی شبیهسازی راه رفتن در سناریوهای محیطی مختلف را یاد گرفته است که در این فیلم خروجی کار آنها قابل دیدن است. همچنین اجرای این روش یادگیری مولد مسیر بر روی ربات واقعی انجام شده است که میتوانید فیلم آن را ببینید. این یک پروژه open source است که در github در این لینک میتوانید به آن دسترسی داشته باشید و بر روی ربات چهار پای خود اجرا کنید. البته اگر ربات چهار پا داشته باشید!
—————
@roboticknowledge
یادگیری تقویتی با مولد ترجکتوری تحولی
راه رفتن یک ربات چهار پا را تجسم کنید. در حالت عادی برای هر سناریو محیطی (مسیر مستقیم یا شیب دار بدون پله یا شیب دار با پله و مسیر باریک و ...) یک کنترلکننده مخصوص باید طراحی گردد تا ربات امکان حرکت داشته باشد. در واقع حداقل واحد مولد ترجکتوری کنترلکننده باید بر اساس سناریو تغییر کند. این مساله زیاد ساده نیست و دشواریهای خاص دارد.
الگوریتمهای یادگیری تقویتی (Reinforcement Learning) نیز در حالت عادی امکان یادگیری کامل راه رفتن موثر (منظور واحد تولید مسیر مطلوب کنترلکننده است که در محیط تولید مسیر را یاد بگیرد) را ندارند یا با دشواریهای زیادی سر و کار دارند! دلیل عدم یادگیری موثر RL دینامیک غیرخطی ربات چهار پا و بحث reward sparsity در RL است. اجازه بدهید کمی در خصوص این بحث صحبت کنیم.
در مسائل RL دنیای واقعی چالشی بر سر راه عامل یا agent ظاهر میشود که یادگیری را مشکل میکند. این چالش که به نام sparse extrinsic reward یا پاداش خارجی کم تراکم (واقعا معادل بهتری به ذهن بنده نرسید🙂) معروف است، با این ويژگی قابل مشخص شدن است که در یک فعالیت مشخص، تنها تعداد کمی نقطه در فضای حالت سیستم دینامیکی وجود دارد که در آنها سیگنال فیدبک به agent داده میشود. برای مثال اگر فعالیت agent رسیدن به یک موقعیت مطلوب باشد و تنها هنگامی که به اندازه کافی به هدف نزدیک باشد به او سیگنال پاداش داده میشود. برای حل این چالش روشهای مختلفی ارائه شده است که در این مقاله میتوانید مطالعه کنید و ما از بحث خود دور نمیشویم!
در ادامه بحث مشکلات RL های رایج برای تولید مسیر یک ربات چهار پا، میتوان مثال راه رفتن تعادلی بر روی یک بیم را زد که یک فعالیت بسیار مشکل است! محققان یک روش جدید مبتنی بر RL برای تولید ترجکتوری ارائه کردهاند. در روشهای قبلی تولید ترجکتوری توسط یک واحد بدون تغییر انجام میشد اما در روش جدید مولد شکل خروجی تولید شده را بر اساس سناریو بهینه میکند. این اتفاق منجر به تنوع حرکات پیشین برای یادگیری policy یا سیاست میشود. سیاست با RL به شکلی آموزش میبیند که خروجی (ترجکتوری تولید شده) منطبق بر راه رفتن در سناریوهای متفاوت شود. به طور متناوب مولد ترجکتوری و شبکه سیاست بهینه میشوند تا آموزش پایدار گردد و دادههای اکتشافی اشتراک گذاشته شده منجر به بهبود کارایی نمونه شود.
در نشان دادن کارایی این روش، کنترلکننده یک ربات 12 درجه آزادی چهار پا طی شبیهسازی راه رفتن در سناریوهای محیطی مختلف را یاد گرفته است که در این فیلم خروجی کار آنها قابل دیدن است. همچنین اجرای این روش یادگیری مولد مسیر بر روی ربات واقعی انجام شده است که میتوانید فیلم آن را ببینید. این یک پروژه open source است که در github در این لینک میتوانید به آن دسترسی داشته باشید و بر روی ربات چهار پای خود اجرا کنید. البته اگر ربات چهار پا داشته باشید!
—————
@roboticknowledge
Medium
Reinforcement Learning: Dealing with Sparse Reward Environments
Reinforcement Learning (RL) is a method of machine learning in which an agent learns a strategy through interactions with its environment…
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: انیمیشن یادگیری راه رفتن (تولید مسیر) توسط الگوریتم تحولی مبتنی بر RL در ربات چهار پا در سناریوهای گوناگون
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: پیادهسازی الگوریتم یادگیری راه رفتن در ربات چهار پا در الگوریتم تحولی مبتنی بر RL
#اتوماسیون #خدمات_رباتیک
خدمات شستن ظروف توسط خط اتوماتیک رباتیک شرکت dishcraft
شرکت dishcraft ارائه دهنده خط تمام اتوماتیک برای شست و شوی ظروف است که با هدف بهبود کارایی شست و شو در حجم بالا و کاهش تولید زباله سیستم رباتیک خود را توسعه داده است. طبق فیلم خط ظرفشویی این شرکت از چند مکانیزم و حداقل یک بازوی رباتیک استفاده میکند. dishcrafe در فرآیندیهای تشخیصی و بازرسی ظروف از هوش مصنوعی هم استفاده میکند. در این تصویر سیکل کاری این شرکت را مشاهده میکنید. طبق این سیکل، این شرکت به دنبال انجام شستن ظروف و تحویل آنها است و نه فروش خط خود (حداقل در حال حاضر). طبق دادههای این شرکت، تولید زباله مشتریان 60٪ کاهش یافته است. در حال حاضر خدمات این شرکت به San Francisco Bay محدود هست. در ایران خودمان چنین خدمات نوینی در آينده حتما پتانسیل اقتصادی خوبی خواهد داشت!
—————
@roboticknowledge
خدمات شستن ظروف توسط خط اتوماتیک رباتیک شرکت dishcraft
شرکت dishcraft ارائه دهنده خط تمام اتوماتیک برای شست و شوی ظروف است که با هدف بهبود کارایی شست و شو در حجم بالا و کاهش تولید زباله سیستم رباتیک خود را توسعه داده است. طبق فیلم خط ظرفشویی این شرکت از چند مکانیزم و حداقل یک بازوی رباتیک استفاده میکند. dishcrafe در فرآیندیهای تشخیصی و بازرسی ظروف از هوش مصنوعی هم استفاده میکند. در این تصویر سیکل کاری این شرکت را مشاهده میکنید. طبق این سیکل، این شرکت به دنبال انجام شستن ظروف و تحویل آنها است و نه فروش خط خود (حداقل در حال حاضر). طبق دادههای این شرکت، تولید زباله مشتریان 60٪ کاهش یافته است. در حال حاضر خدمات این شرکت به San Francisco Bay محدود هست. در ایران خودمان چنین خدمات نوینی در آينده حتما پتانسیل اقتصادی خوبی خواهد داشت!
—————
@roboticknowledge
Dishcraft
Automated Corporate Dishwashing Services | Dishcraft Robotics
Dishcraft's Corporate Dishwashing Service simplifies your dining operations. Dishcraft delivers sanitized wares daily, eliminating strain on your staff.
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: کارکرد خط اتوماتیک شست و شوی ظروف dishcraft
تصویر: از اولین رباتهای کار با بمب. دیتای دریافتی از ربات به اپراتور و یا دستورهای اپراتور به ربات از طریق سیم به پلتفرم ارسال میشد. طبیعی است. آن زمان ارتباط بیسیم به شکل الان وجود نداشت!
—————
@roboticknowledge
—————
@roboticknowledge
#سنسور #مکانیزم_تشخیص
سنسور نیرو/تغییر شکل بر اساس تغییر شکل مکانیزمهای انعطاف پذیر
پژوهشگران MIT موفق به اضافه کردن قابلیت حس کردن به ماده یک جسم شدهاند که در تکنولوژیهای رباتیک بسیار کاربردی است. دیگر میتوان به چیزی به غیر از Load Cell هم برای اندازهگیری نیرو فکر کرد!
آنها روش جدیدی توسعه دادهاند که در آن با چاپ سه بعدی مکانیزمهای تشخیصی امکان سنجش میزان نیروی وارده به یک جسم حاصل میشود. مکانیزم مورد بحث تک جنس و با سرعت بالایی قابل ساخت است (البته واقعا اینطور نیست! آخر مطلب متوجه خواهید شد). از این کار میتوان ورودیهای تعاملی یک سیستم را طراحی کرد. برای مثال میتوان یک جوی استیک یا کلید ورودی یک سیستم را متناسب با نیاز ساخت.
در این طرح الکترودها با فرامواد (موادی ساخته شده از شبکه تکراری از سلولها) یکپارچه میشوند. ایده این است که تغییر شکل مکانیزم (در اثر اعمال نیروی خارجی) منجر به کشش یا فشردگی سلولهای انعطاف پذیر داخلی میشود. هر سلول دارای دو دیواره رسانا (همان الکترود) و دو دیواره غیر رسانا است. با تغییر شکل کلی مکانیزم، طول دیوارههای رسانا هم تغییر میکند و با استفاده از اندازهگیری اثر خازنی دو صفحه رسانا روبروی هم در هر سلول (و البته کل مکانیزم) میتوان مقدار نیروی وارد شده به مکانیزم و جهت آن را اندازهگیری کرد. البته در این صورت اندازهگیری شتاب و دوران هم ممکن میشود.
برای نشان دادن (اثبات کردن) کارکرد این مکانیزم، محققان یک جوی استیک فراماده ساختهاند که چهار سلول با ساختار مورد بحث در چهار جهت در آن قرار دادهاند. در این فیلم تمام تستهای آن را میتوانید مشاهده کنید.
تیم پژوهشگر اقدام به توسعه یک نرمافزار ویرایش سه بعدی به نام MetaSence کردهاند که در آن جا نمایی سلولهای برشی رسانا بصورت خودکار و البته بهینه انجام میشود (خود کاربر هم میتواند دستی این کار را انجام دهد). این ابزار قابلیت شبیهسازی برای طراحی مکانیزم تغییر شکل و محاسبات مربوط به آن را دارد. سلولهایی که بیشترین تغییر شکل را دارند، تنها بصورت خازنی ایجاد میشوند و سلولهای دیگر معمولی خواهند بود.
ساخت چنین سنسوری آنقدر هم ساده نیست که تیم توسعه دهنده میگوید. همزمان دو نازل (یکی برای تزریق ماده غیر رسانا و یکی برای تزریق ماده رسانا در دو دیواره از چهار دیواره سلولهای اصلی مکانیزم) باید کار کنند که با توجه به تفاوتهای خواصی مادی در دو نازل قلقهای خاص خود را میطلبد.
اگرچه فعلا در حد تحقیق هست چنین سنسوری، اما میتواند در آینده گزینه تجاری خوبی برای حسگرهای رباتها باشد. خصوصا در نرمرباتیک که کلا استفاده از سنسور سخت مثل Load Cell برای سنجش نیرو مشکل است.
—————
@roboticknowledge
سنسور نیرو/تغییر شکل بر اساس تغییر شکل مکانیزمهای انعطاف پذیر
پژوهشگران MIT موفق به اضافه کردن قابلیت حس کردن به ماده یک جسم شدهاند که در تکنولوژیهای رباتیک بسیار کاربردی است. دیگر میتوان به چیزی به غیر از Load Cell هم برای اندازهگیری نیرو فکر کرد!
آنها روش جدیدی توسعه دادهاند که در آن با چاپ سه بعدی مکانیزمهای تشخیصی امکان سنجش میزان نیروی وارده به یک جسم حاصل میشود. مکانیزم مورد بحث تک جنس و با سرعت بالایی قابل ساخت است (البته واقعا اینطور نیست! آخر مطلب متوجه خواهید شد). از این کار میتوان ورودیهای تعاملی یک سیستم را طراحی کرد. برای مثال میتوان یک جوی استیک یا کلید ورودی یک سیستم را متناسب با نیاز ساخت.
در این طرح الکترودها با فرامواد (موادی ساخته شده از شبکه تکراری از سلولها) یکپارچه میشوند. ایده این است که تغییر شکل مکانیزم (در اثر اعمال نیروی خارجی) منجر به کشش یا فشردگی سلولهای انعطاف پذیر داخلی میشود. هر سلول دارای دو دیواره رسانا (همان الکترود) و دو دیواره غیر رسانا است. با تغییر شکل کلی مکانیزم، طول دیوارههای رسانا هم تغییر میکند و با استفاده از اندازهگیری اثر خازنی دو صفحه رسانا روبروی هم در هر سلول (و البته کل مکانیزم) میتوان مقدار نیروی وارد شده به مکانیزم و جهت آن را اندازهگیری کرد. البته در این صورت اندازهگیری شتاب و دوران هم ممکن میشود.
برای نشان دادن (اثبات کردن) کارکرد این مکانیزم، محققان یک جوی استیک فراماده ساختهاند که چهار سلول با ساختار مورد بحث در چهار جهت در آن قرار دادهاند. در این فیلم تمام تستهای آن را میتوانید مشاهده کنید.
تیم پژوهشگر اقدام به توسعه یک نرمافزار ویرایش سه بعدی به نام MetaSence کردهاند که در آن جا نمایی سلولهای برشی رسانا بصورت خودکار و البته بهینه انجام میشود (خود کاربر هم میتواند دستی این کار را انجام دهد). این ابزار قابلیت شبیهسازی برای طراحی مکانیزم تغییر شکل و محاسبات مربوط به آن را دارد. سلولهایی که بیشترین تغییر شکل را دارند، تنها بصورت خازنی ایجاد میشوند و سلولهای دیگر معمولی خواهند بود.
ساخت چنین سنسوری آنقدر هم ساده نیست که تیم توسعه دهنده میگوید. همزمان دو نازل (یکی برای تزریق ماده غیر رسانا و یکی برای تزریق ماده رسانا در دو دیواره از چهار دیواره سلولهای اصلی مکانیزم) باید کار کنند که با توجه به تفاوتهای خواصی مادی در دو نازل قلقهای خاص خود را میطلبد.
اگرچه فعلا در حد تحقیق هست چنین سنسوری، اما میتواند در آینده گزینه تجاری خوبی برای حسگرهای رباتها باشد. خصوصا در نرمرباتیک که کلا استفاده از سنسور سخت مثل Load Cell برای سنجش نیرو مشکل است.
—————
@roboticknowledge
Telegram
Robotic Knowledge
فیلم: چند تست در طراحیهای ساختاری مختلف از مکانیزم مخصوص اندازهگیری نیرو/تغییر شکل محققان MIT.
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: چند تست در طراحیهای ساختاری مختلف از مکانیزم مخصوص اندازهگیری نیرو/تغییر شکل مبتنی بر رفتار خازنی توسط محققان MIT.
#ربات_های_الهام_گرفته_شده_از_طبیعت
مطالعه جریانهای گردابی اقیانوسی توسط ربات پنگوئن مانند!
برای مطالعه جریانهای گردابی ناشناخته در اقیانوسها اقدام به توسعه یک ربات زیرآبی خودمختار (Autonomous Underwater Vehicle) شده است که هندسه آن از بدن پنگوئن الهام گرفته شده است. این ربات طی همکاری اقیانوس شناسان با یک شرکت bionic به نام EvoLogics ایجاد شده است.
جریانهای اقیانوسی برخی اوقات حلقههای کوچک موقت ایجاد میکننند که به گردابه یا ocean eddies معروف هستند. این گردابهها در اکوسیستم دریایی با جابجایی حرارت، مواد مرتبط با تغذیه جانداران و گازهایهای بین آبهای سطحی و عمقی ایفای نقش مهمی انجام میکنند. حداقل دانشمندان این چنین فکر میکنند در حال حاضر!
مشکل و چالش اساسی مطالعه این جریان گردابی در عرض کم آنها و ناپدید شدن آنها تنها بعد از چند ساعت از تشکیل شدن آنهاست. اگر هم محققان خیلی خوش شانس باشند و در زمان مناسب در مکان مناسب جریان گردابی برسند، آنها راه مناسبی برای جمع آوری داده از این جریان ناشناخته ندارند. اقیانوس شناسان از روشهایی مثل بستن تجهیزات دادهبرداری به قایق با طناب و کشیدن آن به مکان مناسب استفاده میکنند که البته خیلی راحت امکان از دست رفتن چند هزار دلار تجهیزات در اثر برخورد به موانع طبیعی و مصنوعی و ... وجود دارد! پس به فکر توسعه یک ربات برای انجام اندازهگیریها از دل جریان گردابی افتادند.
این AUV پنگوئنی Quadroin نام دارد. این نام ترکیب quadro به سبب وجود چهار پیشران در دم ربات و penguin که هندسه ربات از آن الهام گرفته شده است، میباشد. خطوط جریان اطراف هندسه پنگوئن از نظر مشخصات بهینه میباشد که در نیروی مقاوم درگ و کاهش آن تقش مهمی دارد:
“Penguins provide a shape with optimal streamlining characteristics,” EvoLogics co-founder Rudolf Bannasch said.
ربات پنگوئنی Quadroin سنسورهای دما، شوری، سطح اکسیژن و ... برای مطالعه جریان گردابی اقیانوسی دارد. سرعت بیشینه آن برابر 18.52 کیلومتر بر ساعت و عمق حرکت آن تا 152.4 متر است. قیمت این ربات در حدود 95000$ است! به نظر به دنبال دسته کردن این رباتها برای داده برداری دقیق نیز هستند. اگر الکترونیک ربات دچار مشکل شود، بصورت خودکار شناور میشود و چیزی از دست نمیرود؛ طراحی این ربات منجر به این اتفاق میشود.
دوام کاری ربات بین 6-8 ساعت است. اگر بحث بهینه بودن هندسه ربات از نظر خطوط جریان در میان نبود، قطعا این مداوت کاری پایینتر بود.
—————
@roboticknowledge
مطالعه جریانهای گردابی اقیانوسی توسط ربات پنگوئن مانند!
برای مطالعه جریانهای گردابی ناشناخته در اقیانوسها اقدام به توسعه یک ربات زیرآبی خودمختار (Autonomous Underwater Vehicle) شده است که هندسه آن از بدن پنگوئن الهام گرفته شده است. این ربات طی همکاری اقیانوس شناسان با یک شرکت bionic به نام EvoLogics ایجاد شده است.
جریانهای اقیانوسی برخی اوقات حلقههای کوچک موقت ایجاد میکننند که به گردابه یا ocean eddies معروف هستند. این گردابهها در اکوسیستم دریایی با جابجایی حرارت، مواد مرتبط با تغذیه جانداران و گازهایهای بین آبهای سطحی و عمقی ایفای نقش مهمی انجام میکنند. حداقل دانشمندان این چنین فکر میکنند در حال حاضر!
مشکل و چالش اساسی مطالعه این جریان گردابی در عرض کم آنها و ناپدید شدن آنها تنها بعد از چند ساعت از تشکیل شدن آنهاست. اگر هم محققان خیلی خوش شانس باشند و در زمان مناسب در مکان مناسب جریان گردابی برسند، آنها راه مناسبی برای جمع آوری داده از این جریان ناشناخته ندارند. اقیانوس شناسان از روشهایی مثل بستن تجهیزات دادهبرداری به قایق با طناب و کشیدن آن به مکان مناسب استفاده میکنند که البته خیلی راحت امکان از دست رفتن چند هزار دلار تجهیزات در اثر برخورد به موانع طبیعی و مصنوعی و ... وجود دارد! پس به فکر توسعه یک ربات برای انجام اندازهگیریها از دل جریان گردابی افتادند.
این AUV پنگوئنی Quadroin نام دارد. این نام ترکیب quadro به سبب وجود چهار پیشران در دم ربات و penguin که هندسه ربات از آن الهام گرفته شده است، میباشد. خطوط جریان اطراف هندسه پنگوئن از نظر مشخصات بهینه میباشد که در نیروی مقاوم درگ و کاهش آن تقش مهمی دارد:
“Penguins provide a shape with optimal streamlining characteristics,” EvoLogics co-founder Rudolf Bannasch said.
ربات پنگوئنی Quadroin سنسورهای دما، شوری، سطح اکسیژن و ... برای مطالعه جریان گردابی اقیانوسی دارد. سرعت بیشینه آن برابر 18.52 کیلومتر بر ساعت و عمق حرکت آن تا 152.4 متر است. قیمت این ربات در حدود 95000$ است! به نظر به دنبال دسته کردن این رباتها برای داده برداری دقیق نیز هستند. اگر الکترونیک ربات دچار مشکل شود، بصورت خودکار شناور میشود و چیزی از دست نمیرود؛ طراحی این ربات منجر به این اتفاق میشود.
دوام کاری ربات بین 6-8 ساعت است. اگر بحث بهینه بودن هندسه ربات از نظر خطوط جریان در میان نبود، قطعا این مداوت کاری پایینتر بود.
—————
@roboticknowledge
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم: ربات Quadroin.
#هوش_مصنوعی
یادگیری مسائل مختلف توسط یک ربات: تحکیم وزن الاستیک در آموزش شبکه عصبی
قسمت اول
ما روزانه با چندین الگوریتم هوش مصنوعی سر و کار داریم. برای مثال میتوان به سیستمهای پیشنهاد محتوا در وب اپها یا سرویس زیرنویس هوشمند یوتوب اشاره کرد؛ اگرچه تعداد مثالها خیلی بیشتر است!
یکی از مسائلی که در کاربرد هوش مصنوعی در رباتیک بصورت چالش است، یادگیری چندین کار متفاوت توسط ربات است. برای مثال یک شبکه عصبی را در نظر بگیرید که برای تشخیص سگ/گربه آموزش دیده است. این شبکه اگر قرار باشد که تشخیص خودرو/اتبوس را یاد بگیرد، در صورت عدم استفاده از استراتژی یادگیری چندگانه قطعا کارایی خود را در فرآیند تشخیصی اول از دست میدهد.
به عنوان یک استراتژی یادگیری چندگانه محققان DeepMind روش elastic weight consolidation یا تحکیم وزن الاستیک را پیشنهاد دادهاند. در این روش وزنهای مهم شبکه عصبی در مساله یادگیری اول دستخوش تغییر خیلی کم در مساله یادگیری دوم میشوند. به عبارتی امکان تغییر خیلی کم دارند و در یادگیری مسائل جدید تنها اتصالات بدون استفاده امکان استفاده برای آموزش دارند.
این روش به عنوان یک پایه در توسعه روشهای جدید مطرح شده است زیرا مشکلات فراوانی دارد که مهمترین آن غیر مقیاس پذیر بودن هوش مصنوعی سیستم است و تنها مسائل محدودی را میتوان یاد گرفت.
—————
@roboticknowledge
یادگیری مسائل مختلف توسط یک ربات: تحکیم وزن الاستیک در آموزش شبکه عصبی
قسمت اول
ما روزانه با چندین الگوریتم هوش مصنوعی سر و کار داریم. برای مثال میتوان به سیستمهای پیشنهاد محتوا در وب اپها یا سرویس زیرنویس هوشمند یوتوب اشاره کرد؛ اگرچه تعداد مثالها خیلی بیشتر است!
یکی از مسائلی که در کاربرد هوش مصنوعی در رباتیک بصورت چالش است، یادگیری چندین کار متفاوت توسط ربات است. برای مثال یک شبکه عصبی را در نظر بگیرید که برای تشخیص سگ/گربه آموزش دیده است. این شبکه اگر قرار باشد که تشخیص خودرو/اتبوس را یاد بگیرد، در صورت عدم استفاده از استراتژی یادگیری چندگانه قطعا کارایی خود را در فرآیند تشخیصی اول از دست میدهد.
به عنوان یک استراتژی یادگیری چندگانه محققان DeepMind روش elastic weight consolidation یا تحکیم وزن الاستیک را پیشنهاد دادهاند. در این روش وزنهای مهم شبکه عصبی در مساله یادگیری اول دستخوش تغییر خیلی کم در مساله یادگیری دوم میشوند. به عبارتی امکان تغییر خیلی کم دارند و در یادگیری مسائل جدید تنها اتصالات بدون استفاده امکان استفاده برای آموزش دارند.
این روش به عنوان یک پایه در توسعه روشهای جدید مطرح شده است زیرا مشکلات فراوانی دارد که مهمترین آن غیر مقیاس پذیر بودن هوش مصنوعی سیستم است و تنها مسائل محدودی را میتوان یاد گرفت.
—————
@roboticknowledge
Robotic Knowledge
تصویر: روش تحکیم وزن الاستیک یک شبکه عصبی برای یادگیری چند مساله. در مساله دوم اتصالات بنفش مهم هستند که توسط مساله اول استفاده شدهاند و scalable نبودن روش مورد بحث را میتوان درک کرد.
توضیح: اتصالات نارنجی در یادگیری مساله اول با اهمیت هستند و در مسائل بعدی نمیتوانند استفاده گردند. در مساله دوم اتصالات آبی رنگ باید لحاظ شوند؛ دو اتصال نیز به رنگ بنفش هستند به این معنی که باید آبی میشدند اما توسط مساله اول مورد استفاده قرار گرفتهاند و دیگر به آنها دسترسی وجود ندارد که همین مساله قابلیتهای شبکه عصبی در پاسخ مساله دوم را کاهش میدهد. در همین تصویر مشکل مقیاس پذیری با چشم دیده میشود؛ تنها چند مساله محدود میتوان یاد گرفت.
—————
@roboticknowledge
—————
@roboticknowledge
تصویر: ورودی محیط مسابقه SubT (چپ) و قسمتی از یک شبیهساز تونل طبیعی در آن (راست).
تصویر: طرح مفهومی تیم CERBERUS که برنده نهایی چالش SubT شد. ربات پرنده در ابتدا بصورت محدود مسیرهای ممکن را بررسی میکند و بهترین سناریو برای Planning را برای پیشنهاد به ربات چهارپا طراحی میکند.