هدف RT- 2 کاهش شکاف بین واقعیت و تخیل است با اطمینان از اینکه ربات ها به طور کامل بتوانند دنیای اطراف خود را درک کنند.
چت بات های هوش مصنوعی که از مدل های زبان بزرگ (LLM) تشکیل شده اند، مانند ChatGPT و Bard در چند وقت گذشته مورد توجه بسیار زیادی قرار گرفته اند و حوزه رباتیک نیز سال هاست که بطور فعال در حال بررسی بوده است. حالا گوگل با یک مدل هوش مصنوعی جدید از پیشرفت دیگری در این حوزه خبر داده است.
گوگل از مدل هوش مصنوعی جدیدی با نام Robotics Transformer 2 (RT- 2) رونمایی کرده که هدف بسیار خاصی دارد:برقراری ارتباط با یک ربات. مدل غول فناوری برای رسیدن به هدف خود از تکنیک های جدیدی استفاده می کند که توسط یک عمل بصری- زبان (VLA) منحصر به فرد طراحی شده که گوگل مدعی شده در نوع خود اولین است.
هدف RT- 2 کاهش شکاف بین واقعیت و تخیل است با اطمینان از اینکه ربات ها به طور کامل بتوانند دنیای اطراف خود را درک کنند. در اصل، عملکرد این مدل بسیار شبیه به LLM است و از یک مدل مبتنی بر ترانسفورماتور استفاده می کند تا بتواند اطلاعات متنی و بصری موجود در وب جهان را درک کند و سپس آن ها را به فعالیت های رباتیک تبدیل کنند، حتی در مواردی که آموزش داده نشده است.
قابلیت های هوش مصنوعی RT- 2
گوگل (Google) درباره موارد استفاده از قابلیت RT- 2 به چند مورد اشاره کرده است.
به عنوان مثال، اگر از یک ربات مجهز به RT- 2 بخواهید زباله ها را در سطل زباله بیندازد، به راحتی میتواند بفهمد زباله چیست، چگونه آنرا از سایر اشیاء تشخیص دهد و چگونه آن را در سطل بیندازد، بدون اینکه در مورد هر یک از این فعالیت ها آموزش دیده باشد.
آزمایش های غول فناوری همچنین نتایج نسبتاً چشمگیری بهمراه داشته است.
به گفته گوگل، RT- 2 در بیش از ۶۰۰۰ تست خود ثابت کرد که در کارهای مربوط به «دیدن» به اندازه نمونه قبلی خود توانا است. جالب تر این که در فعالیت های دیگر، مدل جدید امتیاز ۶۲ را کسب کرده است که در مقایسه با RT- 1 با امتیاز ۳۲، تقریباً دو برابر شاهد بهبود عملکرد بوده است.
- 9
- 3