به گزارش انتخاب به نقل از یورونیوز، چت بات یا ربات مکالمه جی پی تی محصول شرکت «اوپن ای آی» می تواند به هر سوالی پاسخ دهد، برای حل مسائل پیچیده دوره مدرسه و حتی دوره دانشگاه راه حل ارائه کند و تنها ظرف چند ثانیه در هر موضوعی مقاله بنویسد.
از زمان انتشار عمومی این ابزار در ۲۰ نوامبر ۲۰۲۲، چت جی پی تی۱۰۰ میلیون کاربر فعال ماهیانه را ثبت کرده است و جستجو برای کلمات مرتبط با آن در گوگل به شدت افزایش یافته است.
علیرغم این محبوبیت اما شاید تعداد قابل توجهی از مردم نتوانند به شما بگویند که جی پی تی در «چت جی پی تی» چه چیزی را نشان می دهد. این کلمه در واقع مخفف «ترانسفورمر تولیدگر از پیش آموزش دیده» (Generative Pre- trained Transformer) است.
برای توضیح این عبارت ابتدا باید دانست که چت جی پی تی در اصل یک برنامه کامپیوتری مبتنی بر هوش مصنوعی (Artificial Intelligence) است که مکالمات متنی تولید می کند. در واقع هر سوالی از آن بپرسید، چت جی پی تی بسیار طبیعی و همچون یک انسان برایتان یک متن آماده می کند و تحویل می دهد.
از نظر فنی تر اما اگر بخواهیم بگوییم، این ابزار مبتنی بر یک« مدل زبان» است. به این معنی که از مقادیر باورنکردنی از داده های متنی (نظیر کتاب ها، مقالات خبری و صفحات وب) تغذیه می کند و از آنها نحوه جمله سازی را می آموزد. وقتی یاد گرفت، آن وقت می تواند همان اطلاعات را دسته بندی کرده و به شما برگرداند (اگر سوال مرتبط بپرسید).
حالا می توانیم به همان اصطلاح اولیه برگردیم و برای دریافت مفهمومش حتی می توانیم از خود چت چی پی تی هم سوال بپرسیم. در اصل «ترانسفورمر تولیدگر از پیش آموزش دیده» اصطلاحی است که ویژگی های کلیدی معماری مدل زبان را توصیف می کند و اگر آنرا بشکنیم می توانیم بهتر مفهومش را درک کنیم:
۱. تولیدگر:در مبحث پردازش زبان طبیعی، تولیدگر به این معنی است که مدل قادر به تولید متن جدیدی است که شبیه به زبان انسان باشد. این متن جدید می تواند شامل جمله ها، پاراگراف ها و یا عبارت های طولانیتر منسجم و مناسب باشد.
۲. از پیش آموزش دیده: این عبارت به مرحله اولیه آموزش دهی مدل زبانی اشاره دارد. در طول این پروسه، مدل زبانی با استفاده از مجموعه بزرگی از متون اینترنتی یا منابع دیگری که در اختیار دارد یاد می گیرد کلمه بعدی در یک جمله را بر اساس کلمات قبلی پیش بینی کند.
این فرآیند مدل را قادر می سازد تصویرسازی درستی از الگوهای آماری و روابط موجود بین داده ها داشته باشد.
۳. ترانسفورمر: این کلمه اشاره به نوع خاصی از معماری یادگیری عمیق دارد. این معماری با استفاده از سازوکارهایی که از آن برخوردار است مدل را قادر می سازد تا به هنگام تولید خروجی، اهمیت کلمات مختلف در ورودی را بسنجد و در نظر بگیرد.
ترانسفورمرها به علت توانایی شان در مدیریت داده و و قابلیت موازی سازی شان در پردازش زبان طبیعی محبوب شده اند.
در حال حاضر چت جی پی تی و شرکت سازنده اش اوپن ای آی شناخته شده ترین نام های حوزه «ترانسفورمر از پیش آموزش دیده» هستند، با این حال شرکت های متعددی وجود دارند که وارد گردونه رقابت با آن شده اند.
انتظار میرود در سال های آینده شرکت هاي تخصصی بیشتری در این زمینه فعال شوند، چرا که به اعتقاد بسياري این حوزه فناوری آینده را تشکیل می دهد.
- 18
- 2