دوشنبه ۰۱ مرداد ۱۴۰۳
کد مقاله: ۹۷۰۲۰۰۰۹۷

بکارگیری هوش مصنوعی در خواندن متون دست نوشته قدیمی

هوش مصنوعی,دست نوشته قدیمی,خواندن متون دست نوشته

در ایتالیا ۱۲۰ دانش آموز دبیرستانی به حل مشکلی با قدمتی تاریخی کمک کردند: اینکه چگونه پژوهشگران به کتابخانه‌های مخفی واتیکان دسترسی پیدا کنند.

 

مجموعه‌ی عظیمی از اسناد در واتیکان وجود دارد که جزئیات فعالیت‌های واتیکان از قرن هشت به بعد را نشان می‌دهد. قفسه‌های کتابخانه‌های مخفی واتیکان دارای طولی حدود ۸۵ کیلومتر است و حاوی ۳۵۰۰۰ جلد کاتالوگ است. اما اسنادی که پژوهشگران اسکن و آپلود کرده‌اند کمتر از یک اینچ ضخامت دارد. در این جا از اسناد رونویسی شده قابل جستجو توسط کامپیوتر خبری نیست. علت آن است که به‌نظر می‌رسد واتیکان تمایلی به اشتراک گذاری این اطلاعات نداشته است. البته آن‌ها توانایی انجام چنین کاری را هم ندارند؛ حتی نرم افزار OCR (نرم افزار تشخیص نوری حروف) نیز نمی‌تواند به‌سادگی از پس نامنظمی‌های موجود در متون دست نویس برآید. بنابراین اگر پژوهشگران بخواهند این اسناد را ببینند، چاره‌ای ندارند جز اینکه شخصا کتابخانه‌ها را بازدید کنند (با فرض این که واتیکان اجازه دسترسی آن‌ها به این متون را صادر کند).

 

هوش مصنوعی,دست نوشته قدیمی,خواندن متون دست نوشته

در حال حاضر گروهی از پژوهشگران دانشگاه روما تری در ایتالیا پروژه‌ای برای حل این مشکل دارند و از هوش مصنوعی برای رونویسی از این اسناد استفاده می‌کنند. مطالعه‌ی آن‌ها در ژورنال ERCIM News منتشر شده است.

 

مشکل این است که عملکرد کامیپوتر در خواندن دست‌نوشته‌ی انسان چندان خوب نیست. بنابراین نخستین مرحله در پروژه این بود که دانش آموزان خوانده دست‌نوشته را به کامپیوتر آموزش دهند (Training). دانش‌آموزان با استفاده از یک برنامه‌ی کامپیوتری آنلاین تهیه‌شده توسط پژوهشگران، باید به این پرسش پاسخ می‌دادند که آیا یک حرف دست‌نوشته که از دو صفحه‌ی نمونه‌برداری‌شده از اسناد واتیکان، با حالت‌های مختلف یک حرف که توسط خط‌شناسان (افرادی که خطوط قدیمی را مطالعه می‌کنند) تایید شده است، هم خوانی دارد یا نه.

 

هوش مصنوعی,دست نوشته قدیمی,خواندن متون دست نوشته نمونه‌ای از متون استفاده شده توسط پژوهشگران

برای نمونه، یک دانش آموز با دیدن یک سری از M های نوشته شده با دست که توسط کارشناسان تایید شده بود، باید بررسی می‌کرد چه چیزی در متون شبیه این حرف M است. اگر آن حرف شبیه M بود به آن رای مثبت داده می‌شد و در غیر این صورت رای منفی. اگر به‌اندازه‌ی کافی رای مثبت جمع می‌شد، آن حرف دست‌نوشته یک برچسب می‌خورد: مثلا تایید می‌شد که حرف M است. کار این ۱۲۰ دانش آموز برای آموزش داده‌ها، فقط چند ساعت زمان برد.

 

اما هوش مصنوعی نیاز با آموزش بیشتری هم داشت. پژوهشگران در مرحله‌ی بعد برای آموزش هوش مصنوعی به‌منظور شناسایی حروف دست نوشته از روشی به‌نام jigsaw segmentation استفاده کردند. آنها به جای نگریستن به دست‌نوشته به‌عنوان یک سری از کلمات، یا حتی ترکیبی از حروف، به‌دنبال خطوط اضافی مربوط به دست‌نوشته‌ها بودند؛ مثلا کشیدگی انتهای حروف که توسط نویسنده‌ی دست‌نوشته انجام شده است. روش کار به این صورت بود که مثلا دست‌نوشته‌ی M شبیه یک حرف نبود، بلکه شبیه سه خط کنار هم بود. بر اساس آنچه از بخش آموزش توسط داده‌های دانش‌آموزان به دست آمده بود، این علامات می‌توانست حرف M یا نشانه‌ی III باشد (عدد سه). پژوهشگران برای کمک به هوش مصنوعی در خواندن این علامت‌ها، آن را با یک مجموعه‌ی ۱/۵ میلیون کلمه‌ای از زبان لاتین تغذیه کردند؛ زبانی که این متن‌ها بر اساس آن نوشته شده بود. در ادامه با کمک این اطلاعات، می‌توانستند تعیین کنند که قرار گرفتن سه خط در کنار هم در جایی از متن، احتمالا نشان‌دهنده‌ی یک M است و نه III. دلیل چنین برداشتی هم این است که وجود نماد III در میان حروف یک کلمه‌ی لاتین دور از ذهن می‌نماید.

 

زمانی که پژوهشگران هوش مصنوعی را با چهار صفحه از نسخه‌های واتیکانی مورد آزمایش قرار دادند، ۶۵ درصد از کلمات به درستی رونویسی شد. پژوهشگران بر این باورند که رونوشت‌های ایجادشده به‌اندازه‌ای دقیق هستند که می‌توانند پایه‌ای قابل اطمینان برای خط‌شناسان مهیا کنند تا آنها بتوانند فرآیند رونوشت‌برداری خود را سریع‌تر پیش ببرند. دانشمندان در پی بهبود بخشیدن به این سیستم هستند. این موضوع به‌ویژه زمانی اهمیت خود را بیشتر نشان می‌دهد که واتیکان تنها اجازه‌ی در اختیار داشتن سه سند در روز را برای افراد محفوظ داشته است. بنابراین پژوهشگران از این راه می‌توانند بررسی کنند که کدام اسناد بیشتر به‌کارشان می‌آید و تصمیم به بررسی همان موارد بگیرند.

 

اگر از همه‌ی موارد دسترس رونوشت‌برداری شود، شاید پژوهشگران کل دنیا نهایتا بتوانند کل این مجموعه را با کلمات کلیدی مورد جستجو قرار دهند و اسناد حاوی آن واژه‌های کلیدی را شناسایی و سپس اجازه‌ی مشاهده آن سند را دریافت کنند؛ یا اینکه حتی شاید بتوانند اطلاعاتی درمورد این اسناد به‌دست آورند؛ بدون اینکه نیاز باشد که به واتیکان سفر کنند.

 

 

  • 13
  • 2
۵۰%
همه چیز درباره
نظر شما چیست؟
انتشار یافته: ۰
در انتظار بررسی:۰
غیر قابل انتشار: ۰
جدیدترین
قدیمی ترین
مشاهده کامنت های بیشتر
بزرگمهر بختگان زندگینامه بزرگمهر بختگان حکیم بزرگ ساسانی

تاریخ تولد: ۱۸ دی ماه د ۵۱۱ سال پیش از میلاد

محل تولد: خروسان

لقب: بزرگمهر

حرفه: حکیم و وزیر

دوران زندگی: دوران ساسانیان، پادشاهی خسرو انوشیروان

ادامه
صبا آذرپیک بیوگرافی صبا آذرپیک روزنامه نگار سیاسی و ماجرای دستگیری وی

تاریخ تولد: ۱۳۶۰

ملیت: ایرانی

نام مستعار: صبا آذرپیک

حرفه: روزنامه نگار و خبرنگار گروه سیاسی روزنامه اعتماد

آغاز فعالیت: سال ۱۳۸۰ تاکنون

ادامه
یاشار سلطانی بیوگرافی روزنامه نگار سیاسی؛ یاشار سلطانی و حواشی وی

ملیت: ایرانی

حرفه: روزنامه نگار فرهنگی - سیاسی، مدیر مسئول وبگاه معماری نیوز

شغل های دولتی: کاندید انتخابات شورای شهر تهران سال ۱۳۹۶

حزب سیاسی: اصلاح طلب

یاشار سلطانیبیوگرافی یاشار سلطانی

ادامه
زندگینامه امام زاده صالح زندگینامه امامزاده صالح تهران و محل دفن ایشان

نام پدر: اما موسی کاظم (ع)

محل دفن: تهران، شهرستان شمیرانات، شهر تجریش

تاریخ تاسیس بارگاه: قرن پنجم هجری قمری

روز بزرگداشت: ۵ ذیقعده

زندگینامه امامزاده صالح

باورها و اعتقادات مذهبی، نقشی پررنگ در شکل گیری فرهنگ و هویت ایرانیان داشته است. احترام به سادات و نوادگان پیامبر اکرم (ص) از جمله این باورهاست. از این رو، در طول تاریخ ایران، امامزادگان همواره به عنوان واسطه های فیض الهی و امامان معصوم (ع) مورد توجه مردم قرار داشته اند. آرامگاه این بزرگواران، به اماکن زیارتی تبدیل شده و مردم برای طلب حاجت، شفا و دفع بلا به آنها توسل می جویند.

ادامه
شاه نعمت الله ولی زندگینامه شاه نعمت الله ولی؛ عارف نامدار و شاعر پرآوازه

تاریخ تولد: ۷۳۰ تا ۷۳۱ هجری قمری

محل تولد: کوهبنان یا حلب سوریه

حرفه: شاعر و عارف ایرانی

دیگر نام ها: شاه نعمت‌الله، شاه نعمت‌الله ولی، رئیس‌السلسله

آثار: رساله‌های شاه نعمت‌الله ولی، شرح لمعات

درگذشت: ۸۳۲ تا ۸۳۴ هجری قمری

ادامه
آپولو سایوز ماموریت آپولو سایوز؛ دست دادن در فضا

ایده همکاری فضایی میان آمریکا و شوروی، در بحبوحه رقابت های فضایی دهه ۱۹۶۰ مطرح شد. در آن دوران، هر دو ابرقدرت در تلاش بودند تا به دستاوردهای فضایی بیشتری دست یابند. آمریکا با برنامه فضایی آپولو، به دنبال فرود انسان بر کره ماه بود و شوروی نیز برنامه فضایی سایوز را برای ارسال فضانورد به مدار زمین دنبال می کرد. با وجود رقابت های موجود، هر دو کشور به این نتیجه رسیدند که برقراری همکاری در برخی از زمینه های فضایی می تواند برایشان مفید باشد. ایمنی فضانوردان، یکی از دغدغه های اصلی به شمار می رفت. در صورت بروز مشکل برای فضاپیمای یکی از کشورها در فضا، امکان نجات فضانوردان توسط کشور دیگر وجود نداشت.

مذاکرات برای انجام ماموریت مشترک آپولو سایوز، از سال ۱۹۷۰ آغاز شد. این مذاکرات با پیچیدگی های سیاسی و فنی همراه بود. مهندسان هر دو کشور می بایست بر روی سیستم های اتصال فضاپیماها و فرآیندهای اضطراری به توافق می رسیدند. موفقیت ماموریت آپولو سایوز، نیازمند هماهنگی و همکاری نزدیک میان تیم های مهندسی و فضانوردان آمریکا و شوروی بود. فضانوردان هر دو کشور می بایست زبان یکدیگر را فرا می گرفتند و با سیستم های فضاپیمای طرف مقابل آشنا می شدند.

فضاپیماهای آپولو و سایوز

ماموریت آپولو سایوز، از دو فضاپیمای کاملا متفاوت تشکیل شده بود:

ادامه
نیلوفر اردلان بیوگرافی نیلوفر اردلان؛ سرمربی فوتسال و فوتبال بانوان ایران

چکیده بیوگرافی نیلوفر اردلان

نام کامل: نیلوفر اردلان

تاریخ تولد: ۸ خرداد ۱۳۶۴

محل تولد: تهران 

حرفه: بازیکن سابق فوتبال و فوتسال، سرمربی تیم ملی فوتبال و فوتسال بانوان

سال های فعالیت: ۱۳۸۵ تاکنون

قد: ۱ متر و ۷۲ سانتی متر

ادامه
حمیدرضا آذرنگ بیوگرافی حمیدرضا آذرنگ؛ بازیگر سینما و تلویزیون ایران

چکیده بیوگرافی حمیدرضا آذرنگ

نام کامل: حمیدرضا آذرنگ

تاریخ تولد: تهران

محل تولد: ۲ خرداد ۱۳۵۱ 

حرفه: بازیگر، نویسنده، کارگردان و صداپیشه

تحصیلات: روان‌شناسی بالینی از دانشگاه آزاد رودهن 

ادامه
محمدعلی جمال زاده بیوگرافی محمدعلی جمال زاده؛ پدر داستان های کوتاه فارسی

تاریخ تولد: ۲۳ دی ۱۲۷۰

محل تولد: اصفهان، ایران

حرفه: نویسنده و مترجم

سال های فعالیت: ۱۳۰۰ تا ۱۳۴۴

درگذشت: ۲۴ دی ۱۳۷۶

آرامگاه: قبرستان پتی ساکونه ژنو

ادامه
ویژه سرپوش