فیلم/ یادگیری راه رفتن در ۲۰ دقیقه توسط سگ رباتیک

پژوهشگران آمریکایی در بررسی جدیدی نشان داده اند که یک سگ رباتیک با کمک نوعی الگوریتم یادگیری ماشینی میتواند راه رفتن را طی ۲۰ دقیقه یاد بگیرد.

به گزارش ایسنا به نقل از نیو ساینتیست، به لطف الگوریتم یادگیری ماشینی، یک سگ رباتیک میتواند راه رفتن در زمین های ناآشنایی مانند چمن و مسیرهای پیاده روی (walking) را یاد بگیرد.

بیشتر ربات های خودکار باید به دقت توسط انسان ها برنامه ریزی شوند یا در شرایط شبيه سازي شده، به طور گسترده آزمایش شوند تا بتوانند کارهای دنیای واقعی از جمله راه رفتن روی یک تپه سنگی یا یک شیب لغزنده را انجام دهند و هنگامی که با محیط های ناآشنا روبرو میشوند، به کشمکش با آن ها می پردازند.

"سرگی لوین" (Sergey Levine)، پژوهشگر "دانشگاه کالیفرنیا، برکلی" (UC Berkeley) و همکارانش نشان داده اند که ربات با استفاده از نوعی یادگیری ماشینی به نام یادگیری تقویتی عمیق میتواند نحوه راه رفتن را طی حدود ۲۰ دقیقه در چندین محیط مختلف مانند چمن زار و مسیر پیاده روی یاد بگیرد.

لوین گفت: این ربات از الگوریتمی به نام" یادگیری Q" ‪( Q- learning)‬ استفاده می کند که به ارائه یک مدل از زمین موردنظر نیازی ندارد. این الگوریتم های یادگیری ماشینی معمولا در شبيه سازي استفاده می شوند. ما نیازی به درک چگونگی عملکرد فیزیک یک محیط نداریم زیرا فقط ربات را در یک محیط قرار می دهیم و آنرا روشن می کنیم.

ربات به ازای هر عملی که انجام می دهد، بسته به میزان موفقیت آن براساس اهداف از پیش تعریف شده، پاداش مشخصی را دریافت می کند. ربات، این روند را بطور مداوم تکرار می کند تا زمانی که راه رفتن را یاد بگیرد.

"ایلیا کوستریکوف" (Ilya Kostrikov)، از پژوهشگران این پروژه گفت: این کار از یک جهت، بسیار شبیه به نحوه یادگیری انسانها است. انسان ها با برخی از محیط ها تعامل دارند، بعضی از مزایا را دریافت می کنند و اساسا فقط به تجربه گذشته خود فکر می کنند و سعی دارند بفهمند که شرایط را چگونه میتوان بهبود بخشید.

اگرچه ربات میتواند راه رفتن روی هر سطح جدیدی را که با آن روبرو می شود، یاد بگیرد اما لوین گفت که اگر ربات قرار باشد که مهارت های دیگری را بیاموزد، گروه باید سیستم پاداش را تنظیم کنند.

"کریس واتکینز" (Chris Watkins)، پژوهشگر "دانشگاه لندن" (UoL) گفت: روش یادگیری تقویتی عمیق در دنیای واقعی، کار سختی است زیرا متغیرها و داده های مختلفی باید بطور همزمان در تعامل باشند.

او ادامه داد: من فکر می کنم که این کار بسیار تأثیرگذاری است؛ اگرچه کمی متعجبم که میتوان از روشی به سادگی یادگیری Q برای یادگیری مهارت هایی مانند راه رفتن روی سطوح مختلف با تجربه کم و به سرعت استفاده کرد.

۵۰%

روباتیک (رباتیک)

سگ رباتیک

پیاده روی