به گزارش ایسنا، نتایج یک مطالعه جدید این را نشان میدهد که نسل جدید سمعک ها میتوانند صحبت های اشخاص را چه بسا در زمانی که شخص مقابل از ماسک استفاده می کند، لب خوانی کنند.
یک گروه بین المللی از مهندسان و دانشمندان محاسباتی دانشگاه گلاسگو این فن آوری تازه را که برای نخستین بار حسگر فرکانس رادیویی را با هوش مصنوعی همراه با فن آوری سنتی سمعک برای شناسایی حرکات لب به یکدیگر مرتبط می کند، توسعه دادند. این فن آوری میتواند به مقابله با" اثر مهمانی شبانه" کمک کند برای اینکه اثر مهمانی شبانه یک نقص رایج سمعک های سنتی است که در آن برای کاربر دشوار است در در میان صداهای بسیار بر روی یک صدای خاص تمرکز کند.
اثر مهمانی شبانه( Cocktail party effect) پدیده ای در روان شناسی و شنوایی شناسی است و به این معنی است که فرد میتواند توجه شنوایی خود را به یک محرک خاص معطوف و دیگر محرک ها را فیلتر کند، همان طور که فرد در یک مهمانی شلوغ میتواند با شخص دیگر گفتگو کند و به بقیه صداهای مزاحم توجهی نکند.
سمعک های هوشمند جدید تقویت کننده های صوتی عادی را با دستگاه دوم ترکیب می کنند تا داده های اضافی را برای عملکرد بهتر جمع آوری کنند، برخلاف مطالعات قبلی که در آن محققان از دوربین ها برای لب خوانی استفاده می کردند و این امر نه تنها مشکلاتی در زمینه حریم خصوصی ایجاد میکرد بلکه در صورت استفاده افراد از ماسک عمل نمی کرد.
در مقاله جدیدی که در مجله" Nature Communications" منتشر شده است، پژوهشگران دانشگاه گلاسکو چگونگی استفاده از این فن آوری حسگر پیشرفته برای لب خوانی را شرح دادند.
آموزش سمعک هوشمند برای درک گفتار
این فن آوری نوین تنها با جمع آوری داده های فرکانس رادیویی و بدون هیچگونه فیلم ویدئویی، حریم خصوصی افراد را حفظ می کند. برای توسعه این سیستم، محققان از داوطلبان زن و مرد خواستند که ابتدا در حالیکه ماسک ندارند و سپس در حالیکه ماسک جراحی دارند، پنج صدای مصوت( A، E، I، O و U) را تکرار کنند. همان طور که داوطلبان صداهای صدادار را تکرار می کردند، یک حسگر رادار اختصاصی و یک فرستنده وای فای با استفاده از سیگنال های فرکانس رادیویی صورت آنها را اسکن می کردند. محققان همچنین صورت اشخاص را در حالیکه لب هایشان ثابت مانده بود اسکن کردند.
بعد از آن پژوهشگران از ۳۶۰۰ نمونه داده جمع آوری شده در طول اسکن ها برای آموزش الگوریتم های یادگیری ماشینی و یادگیری عمیق استفاده کردند تا به آنها آموزش دهند چگونه حرکات مشخصه لب و دهان مرتبط با هر صدای مصوت را تشخیص دهند. از آنجایی که سیگنال های فرکانس رادیویی میتوانند به راحتی از ماسک داوطلبان عبور کنند، الگوریتم ها همچنین میتوانند نحوه شکل گیری واکه های کاربران دارای ماسک را نیز لب خوانی کنند. در آواشناسی، واکه یا مُصَوَّت( حرف صدادار) صدایی در زبان گفتاری است که ویژگی آن به وسیله وضعیت باز مجرای صوتی شناخته می شود که در آن هیچ فشار هوایی در بالای حنجره ایجاد نمی گردد.
این سیستم ثابت کرد که قادر به خواندن صحیح لب های داوطلبان در بیشتر مواقع است. الگوریتم های یادگیری همچنین داده های وای فای را تا ۹۵ درصد برای لب های اشخاص بدون ماسک و ۸۰ درصد برای لب های افراد ماسک دار به درستی تفسیر کردند. در همین حال، این سیستم در ۹۱ درصد از افراد بدون ماسک و ۸۳ درصد از افراد با ماسک داده های رادار را به درستی تفسیر می کرد.
دکتر" قمر عباسی"( Qammer Abbasi) از دانشکده مهندسی جیمز وات دانشگاه گلاسکو بیان کرد:حدود پنج درصد از جمعیت جهان( حدود ۴۳۰ میلیون نفر) به نوعی اختلال شنوایی دارند. سمعک برای بسیاری از افراد کم شنوا فواید شگفت انگیزی به همراه داشته است. نسل جدید از این فن آوری که طیف گسترده ای از داده ها را برای تقویت صدا جمع آوری می کند، میتواند گام بزرگ دیگری در بهبود کیفیت زندگی افراد کم شنوا باشد. با این مطالعات، ما نشان دادیم که سیگنال های فرکانس رادیویی میتوانند برای خواندن دقیق صداهای صدادار روی لب های افراد، حتی هنگامی که دهانشان با ماسک پوشیده است، استفاده شود.
- 16
- 1