آغاز پروژه ایجاد پایگاههای داده نویسهخوان نوری حروف فارسی از سال آینده
معاون فنی دبیرخانه شورای عالی اطلاعرسانی از آغاز پروژه ایجاد "پایگاههای داده نویسهخوان نوری حروف فارسی" از سال آینده خبر داد .
معاون فنی شورای عالی اطلاعرسانی خاطرنشان کرد: در این پژوهشنامه 9 پروژه زیرساختی تعریف شده است و وظایف بخشهای مرتبط با حوزه خط و زبان فارسی مانند شورای عالی اطلاعرسانی و دیگر مراکز تعریف شده است.
به گفته وی با سرمایهگذاری در این پروژهها، مبانی کلیدی نویسهخوان فارسی به صورت بومی امکانپذیر خواهد شد و پایگاههای اطلاعاتی در حوزه دستنویس و تایپی فارسی قابل دسترس میشوند و از سوی دیگر نمونه دستخطهای فارسی تعریف خواهد شد.
مینایی خاطرنشان کرد: از این رو در این حوزه نیاز به ایجاد یک پایگاهها دادهها بود که قرار است شورای عالی اطلاعرسانی پروژه ایجاد پایگاههای داده برای نویسهخوانی نوری حروف فارسی را از سال آینده آغاز کند.
گفتنی است نویسهخوان نوری(OCR) به عنوان تنها ابزار بازیابی اطلاعات متنی از تصویر، یکی از ابزارهای تبدیل اطلاعات موجود به صورت قابل استفاده و پردازش در رایانههاست و ایجاد پایگاههای داده یکی از گامهای نخستین تحقق این امر است.
در حال حاضر به هنگام اسکن کردن یک متن، اطلاعات آن در قالب تصویر ذخیره میشود، ولی میتوان با استفاده از برخی از نرمافزارها اطلاعات را در قالبهای متنی ذخیره کرد. هم اکنون این برنامهها درباره حروف فارسی وجود ندارد و قرار است با ایجاد پایگاههای داده نویسهخوان نوری، این ذخیرهسازی متنی در زبان فارسی نیز امکانپذیر شود.