باسازی گفتار از روی فعالیت مغز توسط محققان

محققان، گفتار را از روی فعالیت مغز بازسازی کردند.

تولید گفتار یک فرآیند عصبی پیچیده است که باعث شده محققان در توضیح آن عاجز بمانند. جدا کردن شبکه پیچیده نواحی عصبی که حرکت ماهیچه ای دقیق در دهان، فک و زبان را کنترل می کند با مناطقی که بازخورد شنیداری صدای خود فرد را پردازش می کنند، یک مشکل پیچیده است و باید برای نسل بعدی پروتزهای تولید گفتار بر آن غلبه کرد.

به گزارش ایسنا به نقل از اسپیس، اکنون، گروهی از محققان دانشگاه نیویورک اکتشافات اساسی انجام داده اند که به باز کردن این گره کمک می کند و از آن برای ساخت فناوری بازسازی صدا استفاده کردند که صدای بیمارانی را که توانایی صحبت کردن خود را از دست داده اند، به آنها بازگردانند.

این گروه به سرپرستی آدین فلینکر (Adeen Flinker)، دانشیار مهندسی بیومدیکال در دانشگاه تاندون نیویورک و دانشیار عصب شناسی در دانشکده پزشکی گروسمن نیویورک، و یائو وانگ (Yao Wang)، پروفسور مهندسی زیست پزشکی و مهندسی برق و رایانه در دانشگاه تاندون نیویورک برای بازسازی گفتار از سوابق مغز از شبکه های عصبی پیچیده استفاده کردند و سپس از آن بازسازی برای تجزیه و تحلیل فرآیندهایی که گفتار انسان را هدایت می کند، بهره بردند.

تولید گفتار در انسان یک رفتار پیچیده است که شامل کنترل فرمان های حرکتی و همچنین پردازش بازخورد گفتار می شود. این فرآیندها نیازمند درگیری چندین شبکه مغزی پشت سر هم است. با این حال، تفکیک درجه و زمان به کار گیری قشر مغز برای کنترل حرکتی در مقابل پردازش حسی تولید شده توسط تولید گفتار دشوار بوده است.

در یک مقاله جدید، محققان با موفقیت فرآیندهای پیچیده بازخورد و پیش خورد را در طول تولید گفتار از هم متمایز کردند. این تیم با استفاده از یک یادگیری عمیق خلاقانه بر روی سوابق جراحی مغز و اعصاب انسان، از یک سنتزکننده گفتار متمایز مبتنی بر قانون برای رمزگشایی پارامترهای گفتار از سیگنال های قشر مغز استفاده کردند.

محققان توانستند بطور دقیق سهم بازخورد و پیش خورد (feedforward) در تولید گفتار را تجزیه و تحلیل کنند.

محققان از این دیدگاه جدید برای توسعه پروتزهایی استفاده کرده اند که میتوانند فعالیت مغز را بخوانند و مستقیما آن را به گفتار رمزگشایی کنند. در حالیکه بسياري از محققان در حال کار بر روی توسعه چنین دستگاه هایی هستند، نمونه اولیه دانشگاه نیویورک یک تفاوت اساسی دارد و آن این است که می تواند صدای بیمار را تنها با استفاده از مجموعه داده های کوچکی از سوابق مغزی، به میزان قابل توجهی بازسازی کند.

نتیجه امکان دارد این باشد که بیماران پس از از دست دادن صدایشان نه تنها موفق به بازگرداندن یک صدا شوند بلکه صدای خود را پس بگیرند. این به لطف یک شبکه عصبی عمیق است که فضای شنیداری نهفته را در نظر می گیرد و میتوان آنرا تنها بر روی چند نمونه از صدای خود فرد، مانند ویدیوی که در آن صحبت کرده است، آموزش داد.

به منظور جمع آوری داده ها ، محققان به گروهی از بیماران مبتلا به صرع مقاوم به درمان مراجعه کردند که در حال حاضر با دارو قابل درمان نیستند. این بیماران شبکه ای از الکترودهای نوار مغزی را برای یک دوره یک هفته ای روی مغزشان کاشت کردند تا شرایط آنها را بررسی کند. آنها درک مهمی در مورد فعالیت مغز در طول عمل تولید گفتار در اختیار محققان قرار دادند.

محققان یافته های جدید خود را در مقاله ای در PNAS منتشر کردند.

۵۰%