«گوگل» با تمرکزی فراتر از حد تصور بر هوش مصنوعی در کنفرانس Google I/O امسال، ظاهر شد تا عقبماندگیاش از این حوزه جنجالی را جبران کند. در چند ماه گذشته، گوگل روزهای پرتلاطمی را در حوزه هوش مصنوعی تجربه کرد و به نظر میرسید رقابت را به «مایکروسافت» و جنجال تبلیغاتیاش بر سر «چتجیپیتی» باخته است.
شرکتی که در ایجاد شبکه عصبی ترنسفورمر که مدلهای زبانی بزرگ نظیر GPT بر پایه آن توسعه یافتهاند، نقش کلیدی داشت، حالا چنان از کارزار چتباتها و دیگر ابزار هوش مصنوعی مولد عقب مانده بود که حتی عرضه «بارد» هم نتوانست آن اعتباری را که «مایکروسافت» بهراحتی با ChatGPT و بینگ چت به دست آورده بود، به گوگل بازگرداند.
از ماجرای خطای علمی و سرقت ادبی «بارد» تا استعفای «جفری هینتون»، پدرخوانده هوش مصنوعی، از گوگل پس از ۱۰ سال و هشدارش درباره خطرات این تکنولوژی، گوگل واقعا به تولدی دوباره در حوزهای که بیشتر از هر شرکت دیگر در آن سرمایهگذاری کرده بود (نزدیک۴ میلیارد دلار)، نیاز داشت و چه فرصتی بهتر از کنفرانسGoogle I/O؟ کنفرانسی با چنان تمرکزی بر هوش مصنوعی که حتی محصولات سختافزاری آن ازجمله گوشیها و تبلت پیکسل هم از قابلیتهای این تکنولوژی بیبهره نماندند.
شاید بهتر بود امسال نام Google I/O به Google AI تغییر مییافت. حقیقت این است که نمیتوان در برابر هیجان و پتانسیل وسوسهانگیز هوش مصنوعی مقاومت کرد و وقتی گوگل وعده میدهد تا این تکنولوژی را «برای همه بهدردبخورتر و مفیدتر کند»، دلمان میخواهد حرفش را باور کنیم. اما آیا دنیا برای رویارویی با مدلهای زبانی که با سرعتی برقآسا در حال پیشرفت هستند و هر لحظه باهوشتر از قبل میشوند، آماده است؟
معرفی مدل زبانی «PaLM 2»
مدل زبانی «۲ PaLM» گل سرسبد رویداد متمرکز بر هوش مصنوعی Google I/O بود؛ مدلی که از قدرت استدلال و منطقش از قبل بیشتر شده، بر اساس دادههای چندزبانه متشکل از بیش از ۱۰۰ زبان آموزش دیده و قرار است خانوادهای از محصولات با قابلیتهای مختلف را دربرگیرد. این سیستم در نسخههای مختلف برای کاربران و سازمانها عرضه خواهد شد و از نظر حجم دادهای که براساس آن آموزش دیده، بهترتیب از کوچکترین به بزرگترین، چهار نسخه به نامهای Gecko، Otter، Bison و Unicorn را شامل میشود.
برای مثال، یکی از نسخههای«۲ PaLM » به نام« ۲ Med-PaLM» صرفا براساس دادههای پزشکی آموزش دیده و بهگفته گوگل، میتواند به سوالات مشابه آنچه در آزمون دریافت مجوز پزشکی ایالات متحده (USMLE) دیده میشود، در حد «متخصص» پاسخ دهد. نسخه دیگر«۲ PaLM » موسوم به« ۲ Sec-PaLM» نیز براساس دادههای امنیت سایبری آموزش دیده و میتواند «رفتار اسکریپتهای مخرب را توضیح دهد و به کاربران در شناسایی کدهای حاوی بدافزار کمک کند.»
سبکترین نسخه«۲ PaLM» یعنی Gecko آنقدر کوچک است که میتواند روی گوشیهای هوشمند اجرا شود و در هر ثانیه ۲۰ توکن، معادل حدودا ۱۶، ۱۷ کلمه را پردازش کند. این مدل اگرچه قابلیتهای محدودتری از نسخههای بزرگتر ارائه میدهد، چون به صورت محلی اجرا میشود، دغدغههای حریم شخصی کمتری به همراه دارد.
«گوگل» چتبات هوش مصنوعی را به موتور جستوجو آورد
«گوگل» با وجود آنکه هماکنون در حال توسعه چتبات «بارد» است، بهاندازه رقبا، به چتباتها علاقه چندانی ندارد و به تبدیل صفحه نتایج جستوجویش به چیزی شبیه به ChatGPT نیز تمایلی نشان نمیدهد، در عوض میخواهد AI را در دل نتایج جستوجو جای دهد؛ به این صورت که بالای نتایج سنتی، قسمت جدیدی به نمایش درمیآید که پاسخ AI به سوال کاربر را بهصورت خلاصه در دل خود دارد. سمت راست توضیحات AI سه لینک قرار خواهد گرفت که پاسخ تولیدشده را «تایید میکنند». گوگل پاسخ تولیدشده بهدست هوش مصنوعی در موتور جستوجویش را AI snapshot مینامد؛ تمام پاسخها بهکمک مدلهای بزرگ زبانی گوگل و با استفاده از منابع موجود در اینترنت تولید میشوند.
صفحه نتایج گوگل نیز ظاهر جدیدی بهخود گرفته؛ طرحی رنگارنگ و با محوریت هوش مصنوعی. در صفحه نتایج جدید به ویژه در نسخه موبایل، AI snapshot تقریبا کل صفحه اول را اشغال میکند. موتور جستوجوی گوگل اکنون از چند مدل بزرگ زبانی پیشرفته گوگل از جمله مدل چندمنظوره و جدید «PaLM2» و «Multitask Unified Model» قدرت میگیرد. در حال حاضر برای دسترسی به پاسخهای AI، باید در برنامهای موسوم به Search Generative Experience عضویت داشته باشید. صف انتظار برای دسترسی به هوش مصنوعی مولد در Google Search در اپلیکیشن Google و صفحه Google.com روی مرورگر کروم آغاز میشود و نخستین کاربران آزمایشی طی هفتههای آتی پذیرش خواهند شد.
ویرایش حرفهای تصاویر با هوش مصنوعی
همچنین ابزار هوش مصنوعی Magic Editor که برای Google Photos معرفی شده، بهکمک هوش مصنوعی مولد که نمونهای از آن را در مولد تصویر Dall-E و Midjourney دیدهایم، ویرایش حرفهای تصاویر را در حد فتوشاپ برای کاربر انجام میدهد. از دمویی که گوگل از تواناییهای Magic Editor به نمایش گذاشت میتوان گفت که این ابزار قابلیتهای متعددی ازجمله جابهجایی سوژه به نقطهای بهتر در تصویر، تغییر اندازه سوژه، تغییر رنگ و میزان ابرها در آسمان یا پاک کردن موارد زاید از تصاویر را ارائه میدهد.
گوگل اعلام کردMagic Editor اواخر سال میلادی جاری برای برخی از گوشیهای پیکسل عرضه خواهد شد تا از فیدبک کاربران برای بهبود این ابزار استفاده کند.
انتشار عمومی «بارد» برای بیشاز ۱۸۰ کشور همراه با پشتیبانی از زبان فارسی یکی از مهمترین دلایلی که باعث شکست «بارد» از «بینگ چت» و «چتجیپیتی» میشد، محدودیت استفاده از آن و نبود پشتیبانی از زبان فارسی بود. گوگل در کنفرانس ۲۰۲۳ I/O اعلام کرد که کاربران بیش از ۱۸۰ کشور برای دسترسی به این چتبات دیگر نیازی به ثبتنام و قرارگرفتن در لیست انتظار ندارند.
این چتبات تاکنون تنها برای کاربران ایالات متحده و بریتانیا در دسترس قرار داشت. گوگل میگوید «بارد» افزونبر انگلیسی، اکنون از زبانهای کرهای و ژاپنی نیز پشتیبانی میکند و در آینده پشتیبانی از ۴۰ زبان برتر دنیا که خوشبختانه فارسی را نیز شامل میشود به آن اضافه میشود. تغییر مدل زبانی بارد به «۲ PaLM» تواناییهای این چتبات هوش مصنوعی را در زمینه استدلال، ریاضیات و مهارتهای کدنویسی افزایش داده است.
هماکنون ۲۰ زبان برنامهنویسی پراستفاده توسط پایگاه داده این چتبات پشتیبانی میشود و کاربران میتوانند برای اعمالی چون کدنویسی، دیباگ یا صادر کردن کد به پلتفرمهای مختلفی چون Google Colab از «بارد» کمک بگیرند.
- 19
- 4