رونمایی از هوش مصنوعی جدید مجهز به فناوری «ذهن‌خوانی»

یک هوش مصنوعی جدید مجهز به فناوری «ذهن خوانی» میتواند افکار افراد را مستقیماً از امواج مغزی آنها و بدون نیاز به استفاده از هیچ گونه ایمپلنت مغزی ترجمه کند.

به گزارش ایسنا به نقل از اس ای، نخستین سیستم هوش مصنوعی غیرتهاجمی در جهان می تواند افکار را به متن تبدیل کند، در حالیکه فقط از کاربران می خواهد یک کلاه سر کنند و نیازی به کاشت تراشه مغزی وجود ندارد.

پژوهشگران استرالیایی که این فناوری به نام دی ویو (DeWave) را توسعه داده اند، این فرآیند را با استفاده از داده های بیش از ۱۰ نفر آزمایش کردند.

شرکت کنندگان در حالیکه کلاهی به سر داشتند و در سکوت مطالعه می کردند، امواج مغزی شان از طریق نوار مغزی (EEG) ضبط و افکارشان رمزگشایی و به متن تبدیل می شد.

پژوهشگران استرالیایی می گویند، DeWave با اصلاحات بیشتر می تواند به بیماران سکته مغزی (stroke) و مبتلا به فلج کمک کند تا با دیگران ارتباط برقرار کنند و هدایت ماشین هایی مانند بازوهای بیونیک یا ربات ها را برای مردم آسان تر کند.

چین تِنگ لین دانشمند علوم کامپیوتر از دانشگاه فناوری سیدنی (UTS) می گوید: این تحقیق نشان دهنده تلاشی پیشگامانه در ترجمه امواج خام EEG به طور مستقیم به متن است که یک پیشرفت قابل توجه در این زمینه را نشان می دهد.

این فناوری در آزمایش های انجام شده توسط لین و همکارانش به بیش از ۴۰ درصد دقت دست یافت یک حکایت از بهبود سه درصدی نسبت به استاندارد قبلی برای ترجمه فکر از ضبط های EEG دارد.

هدف پژوهشگران بهبود دقت به حدود ۹۰ درصد است که با روش های مرسوم ترجمه زبان یا نرم‌افزار تشخیص گفتار برابری می کند.

سایر روش های ترجمه سیگنال های مغزی به زبان، نیاز به جراحی های تهاجمی برای کاشت الکترودها در مغز یا استفاده از دستگاه های بزرگ و گرانقیمت مانند MRI دارند که آنها را برای استفاده روزانه غیر عملی می سازد و اغلب نیاز به استفاده از ردیابی چشم برای تبدیل سیگنال های مغزی به کلمات دارند.

وقتی چشم یک فرد از یک کلمه به کلمه دیگر میرود، منطقی است که فرض کنیم مغز او بین پردازش هر کلمه استراحت کوتاهی می کند. بنابراین ترجمه موج مغزی خام به کلمات، بدون ردیابی چشم فرد دشوار است.

امواج مغزی افراد مختلف، همگی گسست بین کلمات را کاملاً یکسان نشان نمی دهند و همین امر، آموزش هوش مصنوعی برای ترجمه افکار افراد را چالش برانگیز می کند.

پس از آموزش گسترده DeWave، رمزگذار آن امواج مغزی را به یک کد تبدیل می کند که می تواند بر اساس میزان نزدیکی آن به ورودی ها و کلمات خاص مطابقت داده شود.

لین توضیح می دهد: این فناوری اولین در نوع خود است که تکنیک های رمزگذاری گسسته را در فرآیند ترجمه مغز به متن معرفی می کند و رویکردی نوآورانه برای رمزگشایی عصبی ارائه می دهد.

وی افزود: ادغام این سیستم با مدل های زبانی بزرگ، مرزهای جدیدی را در علوم اعصاب و هوش مصنوعی (Artificial Intelligence) باز می کند.

لین و تیمش از مدل های زبان آموزش دیده استفاده کردند که شامل ترکیبی از سیستمی به نام BERT با GPT بود و آن را بر روی مجموعه داده های موجود افرادی که ردیابی چشم و فعالیت مغزشان هنگام خواندن متن ثبت شده بود، آزمایش کردند.

این کار به سیستم کمک کرد تا الگوهای امواج مغزی را با کلمات مطابقت دهد، سپس DeWave با یک مدل زبان بزرگ منبع باز که اساساً از کلمات، جمله می سازد، بیشتر آموزش دید.

ترجمه افعال قسمتی بود که DeWave بهترین عملکرد را در آن داشت. از سوی دیگر، اسم ها بیشتر به عنوان جفت کلماتی ترجمه شدند که به جای ترجمه های دقیق، تقریبا یک مفهوم دارند.

ییکوان دوان دانشمند علوم کامپیوتر از UTS و از اعضای این تیم تحقیقاتی می گوید: ما فکر می کنیم این به این دلیل است که وقتی مغز این کلمات را پردازش می کند، کلمات دارای مشابهت معنایی ممکن است الگوهای امواج مغزی مشابهی تولید کنند.

وی افزود:مدل ما با وجود چالش ها، نتایج معنی داری به دست می دهد، کلمات کلیدی را تراز می کند و ساختار جمله ای مشابه را تشکیل می دهد.

این پژوهش نسبتاً بزرگ آزمایش شده به این واقعیت اشاره می کند که توزیع امواج EEG افراد بسیار متفاوت است و همچنین نشان می دهد که این تحقیق قابل اعتمادتر از فناوری های قبلی است که فقط بر روی نمونه های بسیار کوچک آزمایش شده اند.

کارهای بیشتری باید انجام شود و زمانی که سیگنال های EEG به جای الکترودهای کاشته شده در مغز، از طریق یک کلاه دریافت می شوند، سیگنال نسبتاً نویزدار است.

پژوهشگران این مطالعه می گویند: ترجمه افکار به صورت مستقیم از مغز، یک تلاش ارزشمند و در عین حال چالش برانگیز است که مستلزم تلاش های مداوم و قابل توجه است و با توجه به پیشرفت سریع مدل های زبان بزرگ، روش های رمزگذاری مشابهی که میان فعالیت مغز با زبان طبیعی پل می زنند، شایسته توجه بیشتر هستند.

این پژوهش در کنفرانس NeurIPS ۲۰۲۳ ارائه شد و مقاله پیش چاپ آن در ArXiv موجود است.

۵۰%