به گزارش باشگاه خبرنگاران به نقل از popsci، گوگل در تازه ترین اقدامات خود در حال آموزش بازي پینگ پنگ به ربات ها برای تعامل بیشتر است.
گوگل ریسرچ به تازگی از دو پروژه جدید خود با یک ربات تنیس روی میز رونمایی کرد. تیم رباتیک در گوگل به یک بازوی رباتی آموزش داد که بیش از ۳۰۰ شوت رالی با افراد دیگر بازي کند و سرویس ها را با دقت «انسان های آماتور» بازگرداند.
گرچه این ممکن است با توجه به اینکه برخی افراد در تنیس روی میز چقدر بد هستند، چندان چشمگیر بنظر نرسد، میتوان از همین تکنیک ها برای آموزش ربات ها برای انجام سایر «وظایف پویا و با شتاب بالا» استفاده کرد که به تعامل نزدیک انسان و ربات نیاز دارند.
تنیس روی میز یک کار جالب برای یادگیری ربات ها به دلیل دو ویژگی مکمل است: این کار به حرکات سریع و دقیق در یک بازی ساختاریافته نیاز دارد که در یک محیط ثابت و قابل پیش بینی رخ می دهد. الگوریتم یادگیری که ربات برای تصمیم گیری به آن تکیه می کند، باید سخت کار کند تا به نتیجه برسد، بازی تنیس روی میز فعالیتی دو طرفه است: ربات می تواند با یک ربات دیگر (یا شبیه سازی ) بازي کند یا با یک انسان واقعی برای آموزش. همه این ها آن را به مجموعه ای عالی برای بررسی تعامل انسان و ربات و تکنیک های یادگیری تقویتی تبدیل می کند.
مهندسان گوگل (Google) دو پروژه مجزا را با استفاده از یک ربات طراحی کردند. Iterative- Sim۲Real که اواخر امسال در CoRL ارائه خواهد شد و GoalsEye که هفته آینده در IROS ارائه خواهد شد. Iterative- Sim۲Real برنامه ای است که به ربات آموزش می دهد تا در مسابقات ۳۰۰ تیری با انسانها بازی کند، در حالی که GoalsEye به آن اجازه می دهد تا سرویس ها را به نقطه هدف خاصی روی میز با دقتی شبیه به انسان آماتور بازگرداند.
Iterative- Sim۲Real تلاشی برای غلبه بر «مشکل مرغ و تخم مرغ» آموزش ماشین ها برای تقلید از رفتارهای انسانی است. تیم تحقیقاتی توضیح می دهد اگر برای شروع یک خط مشی خوب برای ربات (مجموعه ای از قوانین برای ربات) نداشته باشید، نمی توانید داده های با کیفیت بالا در مورد نحوه تعامل مردم با آن جمع آوری کنید. ولی بدون یک مدل رفتار انسانی برای شروع، نمی توانید در وهله اول سیاست ربات را ارائه کنید. یک راه حل جایگزین آموزش انحصاری ربات ها در دنیای واقعی است.
با این حال، این فرآیند اغلب آهسته، هزینه بر است و چالش های مرتبط با ایمنی را بهمراه دارد که با مشارکت مردم تشدید می شود؛ به عبارت دیگر، زمان زيادي طول میکشد و مردم میتوانند توسط بازو های رباتی که خفاش های تنیس روی میز را به اطراف می چرخانند، آسیب ببینند.
Iterative- Sim۲Real با استفاده از یک مدل بسیار ساده از رفتار انسان به عنوان نقطه شروع و سپس آموزش ربات هم با شبيه سازي و هم با یک انسان در دنیای واقعی، این مشکل را رفع کند. بعد از هر تکرار، هم مدل رفتار انسان و هم خط مشی ربات اصلاح می شوند. با استفاده از پنج سوژه انسانی، ربات آموزش دیده با Iterative- Sim۲Real از یک رویکرد جایگزین به نام sim- to- real plus- tuning بهتر عمل کرد. این رالی به میزان قابل توجهی کمتر بود که با کمتر از پنج شلیک به پایان رسید که میانگین طول رالی آن ۹ درصد بیشتر بود.
از سوی دیگر، GoalsEye تصمیم گرفت تا با مجموعه ای از مشکلات تمرینی مقابله کرده و به ربات آموزش دهد که توپ را به یک مکان دلخواه مانند گوشه سمت چپ پشتی یا دقیقا بالای تور در سمت راست برگرداند. یادگیری تقلید جایی که یک ربات یک استراتژی بازی برگرفته از داده های عملکرد انسان را توسعه می دهد؛ در تنظیمات با سرعت بالا به سختی انجام می شود.
متغیر های زيادي وجود دارد که بر نحوه برخورد انسان با توپ پینگ پنگ تاثیر می گذارد که ردیابی همه چیز لازم برای یادگیری یک ربات را عملا غیرممکن می کند. یادگیری تقویتی معمولا برای این موقعیت ها خوب است، ولی می تواند آهسته و ناکارآمد باشد، به ویژه در شروع، به عبارت دیگر، برای ایجاد یک استراتژی بازی نسبتا محدود به تکرارهای زیادی نیاز است.
GoalsEye تلاش می کند با استفاده از مجموعه داده های کوچک، با ساختار ضعیف و غیرهدفمند اولیه که به ربات امکان می دهد اصول اولیه آنچه را که هنگام برخورد با توپ پینگ پنگ اتفاق می افتد، بیاموزد و سپس به او اجازه تمرین خود را بدهد، بر هر دو مجموعه مشکلات غلبه کند. به آن بیاموزد که توپ را دقیقا به نقاط خاصی بزند. ربات پس از آموزش در ۲۴۸۰ نمایش اولیه، تنها در ۹ درصد مواقع توانست توپ را به فاصله ۳۰ سانتی متری برگرداند، اما پس از خودتمرینی برای ۱۳۵۰۰ شات، در ۴۳ درصد مواقع دقیق بود.
در حالی که آموزش بازی به ربات ها ممکن است بی اهمیت بنظر برسد، تیم تحقیقاتی معتقد است حل این نوع مشکلات تمرینی با تنیس روی میز کاربرد های بالقوه ای در دنیای واقعی دارد. Iterative- Sim۲Real به ربات ها اجازه می دهد از تعامل با انسان ها بیاموزند، در حالی که GoalsEye نشان می دهد که چگونه ربات ها می توانند از داده های بدون ساختار یاد بگیرند و در یک «محیط دقیق و پویا» تمرین کنند. بدترین سناریو این است که اگر اهداف بزرگ گوگل محقق نشود، حداقل می توانند یک مربی ربات تنیس روی میز بسازند.
- 12
- 6