Computational Linguistics, Sharif University of Technology

زبان‌شناسی رایانشی دانشگاه صنعتی شریف

Computational Linguistics, Sharif University of Technology

زبان‌شناسی رایانشی دانشگاه صنعتی شریف

نویسه‌خوان نوری(OCR)

آغاز پروژه ایجاد پایگاه‌های داده نویسه‌خوان نوری حروف فارسی از سال آینده   

 

معاون فنی دبیرخانه شورای عالی اطلاع‌رسانی از آغاز پروژه ایجاد "پایگاه‌های داده نویسه‌خوان نوری حروف فارسی" از سال آینده خبر داد .

معاون فنی شورای عالی اطلاع‌رسانی خاطرنشان کرد: در این پژوهش‌نامه 9 پروژه زیرساختی تعریف شده است و وظایف بخش‌های مرتبط با حوزه خط و زبان فارسی مانند شورای عالی اطلاع‌رسانی و دیگر مراکز تعریف شده است.

به گفته وی با سرمایه‌گذاری در این پروژه‌ها، مبانی کلیدی نویسه‌خوان فارسی به صورت بومی امکان‌پذیر خواهد شد و پایگاه‌های اطلاعاتی در حوزه دست‌نویس و تایپی فارسی قابل دسترس می‌شوند و از سوی دیگر نمونه دستخط‌های فارسی تعریف خواهد شد.

مینایی خاطرنشان کرد: از این رو در این حوزه نیاز به ایجاد یک پایگاه‌ها داده‌ها بود که قرار است شورای عالی اطلاع‌رسانی پروژه ایجاد پایگاه‌های داده برای نویسه­خوانی نوری حروف فارسی را از سال آینده آغاز کند.

گفتنی است نویسه‌خوان نوری(OCR) به عنوان تنها ابزار بازیابی اطلاعات متنی از تصویر، یکی از ابزارهای تبدیل اطلاعات موجود به صورت قابل استفاده و پردازش در رایانه‌هاست و ایجاد پایگاه‌های داده یکی از گام‌های نخستین تحقق این امر است.  

در حال حاضر به هنگام اسکن کردن یک متن، اطلاعات آن در قالب تصویر ذخیره می‌شود، ولی می‌توان با استفاده از برخی از نرم‌افزارها اطلاعات را در قالب‌های متنی ذخیره کرد. هم اکنون این برنامه‌ها درباره حروف فارسی وجود ندارد و قرار است با ایجاد پایگاه‌های داده نویسه‌خوان نوری، این ذخیره‌سازی متنی در زبان فارسی نیز امکان‌پذیر شود.

                                                                                                            منبع

                 
نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد