به گزارش جهانصنعت؛ مدل هوش مصنوعی پزشکی گوگل، به عنوان یکی از پیشروهای جدید در عرصه بهداشت و درمان، قابلیتهایی برتر برای تشخیص بیماریها و پیشنهاد درمان مناسب را دارا است.
تحلیل دقیق دادهها، الگوریتمهای پیشرفته و استفاده از یادگیری عمیق، این مدل را قادر میکند که در برخی موارد، نتایج بهتری نسبت به پزشکان ارائه کند. مدل هوش مصنوعی پزشکی گوگل موسوم به «Med-Gemini» یک هوش مصنوعی متخصص در پزشکی است که ادعا میشود در برخی کارها حتی از پزشکان انسانی نیز عملکرد بهتری دارد.
گروه«گوگل ریسرچ» و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل به نام «دیپمایند»، مدل هوش مصنوعی «مد-جمینای» که خانوادهای از مدلهای پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح دادهاند. این مدل، یک پیشرفت بزرگ در تشخیص بالینی با پتانسیل عظیم در دنیای واقعی است.
پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده معاینه و درمان میکنند. آنها برای ارائه مراقبت موثر باید با پرونده پزشکی هر بیمار آشنا باشند و با جدیدترین روشها و درمانها بهروز باشند.
سپس موضوع بسیار مهم رابطه میان پزشک و بیمار وجود دارد که بر پایه همدلی، اعتماد و ارتباط بنا میشود و برای اینکه یک هوش مصنوعی به تقلید از یک پزشک در دنیای واقعی نزدیک شود، باید بتواند همه این کارها را انجام دهد. هوش مصنوعی و پزشکی این روزها متقارن شدهاند. طی ماههای اخیر اخبار و گزارشهای زیادی درباره مدلهای هوش مصنوعی گزارش شده است که به پزشکان کمتجربه در شناسایی پیشسازهای سرطان، تشخیص اوتیسم دوران کودکی از روی تصاویر چشمها و پیشبینی آنی اینکه آیا جراح تمام بافتهای سرطانی را در طول جراحی سرطان سینه برداشته است یا خیر، کمک میکند.
اکنون گفته میشود که Med-Gemini چیز دیگری است و از همه مدلهای پیشین سر است. مدلهای جمینای گوگل نسل جدیدی از مدلهای هوش مصنوعی چندوجهی هستند، به این معنی که میتوانند اطلاعات را از حالتهای مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کنند. این مدلها در زبان و مکالمه، درک اطلاعات متنوعی که روی آنها آموزش دیدهاند و آنچه «استدلال با زمینه طولانی» یا استدلال از مقادیر زیادی داده مانند ساعتها ویدئو یا دهها ساعت صوت نامیده میشود، مهارت دارند. هوش مصنوعی Med-Gemini تمام مزایای مدلهای پایه جمینای را دارد، اما آنها را به خوبی تنظیم و متعادل کرده است. محققان این ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در مقاله گنجاندند.
قابلیتهای خودآموزی و جستوجوی وب
رسیدن به یک تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان، دانش پزشکی خود را با مجموعهای از اطلاعات مرتبط دیگر مانند علائم بیمار، تاریخچه پزشکی، جراحی و اجتماعی، نتایج آزمایشگاهی و نتایج سایر آزمایشات تحقیقاتی و واکنش بیمار به درمانهای قبلی گردآوری کنند تا درمانهای موجود بهروزرسانی شوند و درمانهای جدیدی معرفی میشوند. همه این موارد بر استدلال بالینی پزشک تاثیر میگذارد. به همین دلیل است که گوگل با Med-Gemini دسترسی به جستوجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفتهتر فراهم کرده است. این هوش مصنوعی مانند بسیاری از مدلهای زبان بزرگ(LLM) متمرکز بر پزشکی با MedQA که حاوی سوالات چندگزینهای نماینده سوالات آزمون مجوز پزشکی ایالات متحده(USMLE) است، آموزش دیده که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شده است. با این حال، گوگل همچنین دو مجموعه داده جدید را برای مدل خود توسعه داده است. اولی MedQA-R (استدلال) است که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام «زنجیره افکار» گسترش میدهد. دومی MedQA-RS
(استدلال و جستوجو) است که دستورالعملهایی را برای استفاده از نتایج جستوجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه میدهد.
بدینترتیب اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته میشود تا یک جستوجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.هوش مصنوعی Med-Gemini روی ۱۴معیار پزشکی آزمایش شد و عملکرد جدیدی روی ۱۰معیار اجرا کرد که از مدل «GPT-4» ساخته شرکت «اوپنایآی» پیشی گرفت. این مدل در معیار MedQA با استفاده از استراتژی جستوجوی هدایتشده به دقت ۱/۹۱ درصدی دست یافت و از مدل زبان بزرگ مبتنی بر پزشکی پیشین گوگل ۲ تا ۵/۴درصد بهتر عمل کرد. هوش مصنوعی Med-Gemini در ۷معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند حاوی تصاویر موارد چالشبرانگیز بالینی که از یک لیست ۱۰تایی تشخیص داده میشود، به طور متوسط از ۵/۴۴درصد بهتر از «GPT-4» عمل کرد. محققان میگویند در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال ما محدود کردن نتایج جستوجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستوجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستوجو و کیفیت استنادها را در نظر نگرفتهایم. علاوه بر این، باید دید که آیا میتوان به مدلهای زبان بزرگ به کوچکتر نیز با استفاده از جستوجوی وب را آموزش داد؟ ما این اکتشافات را به کارهای آینده واگذار میکنیم.
بازیابی اطلاعات خاص از پروندههای الکترونیکی پزشکی طولانی
پرونده الکترونیک سلامت (EHR) ممکن است بلندبالا باشد اما پزشکان باید از محتوای آنها آگاه باشند. آنها گاهی پیچیده هستند، چراکه معمولا حاوی شباهتهای متنی، املای غلط، کلمات اختصاری و مترادفها هستند که میتوانند هوش مصنوعی را به چالش بکشند بنابراین محققان برای آزمایش توانایی Med-Gemini در درک و استدلال از اطلاعات پزشکی بلندبالا و طولانی از یک پایگاه داده بزرگ و در دسترس عموم که به مثابه پیدا کردن سوزن در انبار کاه است، استفاده کردند. این پایگاه حاوی دادههای بیماران بستری در بخشهای مراقبتهای ویژه است. هدف این بود که مدل بتواند یک وضعیت، علامت یا درمان پزشکی کماستفاده و ظریف را در مجموعه بزرگی از یادداشتهای بالینی بازیابی کند. ۲۰۰نمونه انتخاب شد و هر نمونه شامل مجموعهای از پروندههای این پایگاه از ۴۴ بیمار بستری شده در بخش مراقبتهای ویژه با سابقه پزشکی طولانی بود.
هوش مصنوعی Med-Gemini دومرحله برای یافتن سوزن در انبار کاه پیش رو داشت؛ اول اینکه مجبور بود همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی میکرد. دوم اینکه باید ارتباط همه موارد را با هم ارزیابی و آنها را دستهبندی میکرد و نتیجه میگرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه میکرد. درنهایت این هوش مصنوعی عملکرد خوبی داشت. محققان میگویند شاید برجستهترین جنبه Med-Gemini، قابلیتهای پردازش سوابق طولانی باشد، زیرا آنها مرزهای عملکردی جدیدی را باز میکنند و امکانات کاربردی جدیدی را که قبلا غیرممکن بود برای سیستمهای هوش مصنوعی پزشکی فراهم میکنند. این وظیفه یافتن «سوزن در انبار کاه» منعکسکننده یک چالش در دنیای واقعی است که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیتهای پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از دادههای بیماران نشان میدهد.
گفتوگو با «Med-Gemini»
در یک آزمایش در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی که خارش دارد، پرسید. این مدل پس از درخواست تصویر، سوالات مناسب بعدی را پرسید و آن ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد. همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه یک بیمار را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که بتوان آن را در اختیار بیمار قرار داد. محققان میگویند قابلیتهای مکالمه چندوجهی Med-Gemini امیدوارکننده است و چنین قابلیتهایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستمهای هوش مصنوعی را فراهم میکنند. با این حال، محققان دریافتند که کار بیشتری لازم است. آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی، از جمله کمک به پزشکان و بیماران است، البته خطرات قابل توجهی نیز به دنبال دارد. در حالی که پتانسیل تحقیقات آینده در این حوزه را برجسته میکنیم، ما تواناییهای مکالمه بالینی را در این کار، همانطور که قبلا توسط دیگران در تحقیقات اختصاصی در زمینه هوش مصنوعی تشخیصی محاورهای بررسی شده بود، به طور دقیق مورد بررسی قرار ندادهایم.
چشماندازهای آینده
محققان اذعان میکنند که کارهای بیشتری برای انجام دادن وجود دارد اما قابلیتهای اولیه مدل Med-Gemini امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی مسوول، از جمله حفظ حریم خصوصی و انصاف را در سراسر فرآیند توسعه مدل بگنجانند. محققان افزودند ملاحظات حریم خصوصی به طور ویژه باید در سیاستها و مقررات مراقبتهای بهداشتی موجود که از اطلاعات بیمار محافظت میکنند، ریشه داشته باشد. انصاف و عدالت حوزه دیگری است که ممکن است نیاز به توجه داشته باشد زیرا این خطر وجود دارد که سیستمهای هوش مصنوعی در مراقبتهای بهداشتی ممکن است ناخواسته سوگیریها و نابرابریهای تاریخی را منعکس یا تقویت کنند و به طور بالقوه منجر به عملکرد مدل متفاوت و نتایج مضر برای گروههایی شود اما درنهایت، مدل Med-Gemini به عنوان یک ابزار خوب در نظر گرفته میشود.
پژوهشگران میگویند مدلهای زبان بزرگ چندوجهی در حال آغاز دوره جدیدی از امکانات برای سلامت و پزشکی هستند. قابلیتهای نشان داده شده توسط جمینای و Med-Gemini نشاندهنده جهش قابلتوجهی در عمق و وسعت فرصتها برای تسریع اکتشافات زیستپزشکی و کمک به ارائه مراقبتهای بهداشتی و تجارب است. با این حال، بسیار مهم است که پیشرفت در قابلیتهای مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستمها همراه باشد. با اولویتبندی هر دوجنبه میتوانیم با مسوولیتپذیری هوش مصنوعی، آیندهای را متصور شویم که در آن قابلیتهای سیستمهای هوش مصنوعی شتابدهندههای معنادار و ایمن در پیشرفت علمی و مراقبت در پزشکی باشند.
- 15
- 1