(OCR(Optical Character Recognition از لحاظ لغوی به معنی تشخیص متون موجود در تصاویر می باشد و به یک تعبیر ساده تبدیل تصاویر اسناد مکتوب به متن کامپیوتری است. از آنجاییکه نیاز بود تا حجم بالایی از اطلاعات اسناد مکتوب به سیستم های کامپیوتری وارد شوند و تنها راه ذخیره شان نیز ذخیره کردن تصویر این اسناد بود ، مشکلات زیادی ایجاد شده بود (از جمله اینکه ذخیره اطلاعات بصورت تصویری امکان جستجو در اسناد و اطلاعات ، تغییر ، اصلاح ، کپی و … را غیر ممکن می کرد ؛ همچنین تصاویر دارای حجم بالایی بودند و حافظه سخت افزاری زیادی برای نگهداری آنها نیاز بود و مواردی از این قبیل). بنابراین محققین و کارشناسان امور کامپیوتر ، پژوهش بر روی روش هایی جهت اتوماسیون کردن این فرآیند را آغاز کردند و نتیجه این تحقیقات ایجاد سیستم های نرم افزاری تشخیص حروف از تصاویر بود. این سیستم ها متکی بر فن آوری پیچیده و پیشرفته پردازش تصویر می باشد که با تبدیل تصاویر به میلیون ها نقطه و بکارگیری الگوریتم های پردازش تصویر ، حروف را در داخل آنها تشخیص داده و آنها را به یک متن پیوسته تبدیل می کند.
ویژگی های افزار واژه شناس OCR
نرم افزار واژه شناس OCR با بکارگیری یک رابط کاربر مناسب (GUI) ، فرآیند ورود تصویر و تشخیص متون را برای کاربر تا حد امکان ساده و سریع کرده است.قابلیت یادگیری یکی از ویژگی های برجسته این نرم افزار می باشد که در بالا بردن دقت تشخیص و کیفیت خروجی نرم افزار قدم بزرگی را برداشته است.وجود راهبرهای اتوماتیک (wizards) یکی دیگر از ویژگی های این نرم افزار می باشد که کاربرد آن را بسیار ساده و سریع کرده است ، بگونه ای که می توان حجم زیادی از تصاویر را با یکبار تنظیم نرم افزار ، اسکن کرده و سپس با زمانبندی دلخواه متون آنها را استخراج نمود. ورودی نرم افزار واژه شناس می تواند به دو صورت تأمین شود : اولین نوع ، تصاویر از پیش ذخیره شده می باشد که می تواند با انواع فرمت های رایج تصویری مانند bmp ، tiff ، Jpeg ، Pcx ، Gif و Multiage به عنوان ورودی به نرم افزار وارد شود و روش دیگر ورودی به نرم افزار ، اسکن تصاویر مستقیما از درون برنامه می باشد.
بعد از بارکردن تصویر از اسکنر یا فایل تصویری می توان اعمال بعدی شامل چرخش اتوماتیک یا دستی ، معکوس کردن رنگ همه یا قسمتی از تصویر ، اصلاح تصویر ، قاب بندی و انتخاب موتور تشخیص و غیره را انجام داد.پس از پایان عملیات تشخیص متون در تصاویر ، می توان عملیات آموزش یا بهبود فونت های قبلی یا جدید را انجام داد ، بگونه ای که نرم افزار بطور هوشمند حروف غیر مشخص را نمایش داده و از کاربر مقدار صحیح درخواست می کند و آن را در فایل فونت ذخیره می نماید. لازم به ذکر است که به همراه این نرم افزار رابط های برنامه نویسی و راهنمای کاملی وجود دارد که می تواند براحتی برای مجتمع کردن قابلیت OCR در هر سیستم دلخواهی استفاده شود.
نیازها و چالش های نرم افزار OCR فارسی
OCR (بازشناسی نوری کاراکترها) فناوری ای است که امکان تبدیل اسناد چاپی و دست نویس به متن قابل ویرایش دیجیتال را فراهم می کند. برای زبان فارسی، توسعه و پیاده سازی این فناوری با چالش های ویژه ای روبروست. یکی از نیازمندی های اساسی نرم افزار OCR فارسی ، دسترسی به پایگاه داده های بزرگ و متنوع از متون فارسی است. این پایگاه ها باید شامل انواع فونت ها، اندازه ها و سبک های مختلف نوشتاری باشند تا سیستم بتواند دقت بالایی در تشخیص متون داشته باشد.

از چالش های مهم نرم افزار OCR فارسی می توان به ساختار پیچیده زبان فارسی اشاره کرد. اتصال حروف، وجود نقاط و تشابه برخی حروف با یکدیگر از مواردی هستند که تشخیص صحیح کاراکترها را دشوار می کنند. علاوه بر این، خط فارسی به صورت راست به چپ نوشته می شود که این مسئله نیز نیازمند تنظیمات و الگوریتم های خاصی است که با این جهت گیری سازگار باشند .
دیگر چالش ها شامل کیفیت پایین تصاویر ورودی و نویزهای موجود در آن هاست. ﻧرم اﻓزار OCR ﻓﺎرسی باید توانایی حذف نویز و افزایش کیفیت تصاویر را داشته باشد تا بتواند کاراکترها را با دقت بالاتری تشخیص دهد. در نهایت، برای بهبود کارایی این سیستم ها، نیاز به پژوهش های بیشتر و استفاده از فناوری های پیشرفته مانند یادگیری ماشین و هوش مصنوعی داریم تا بتوانیم به سطح بالاتری از دقت و عملکرد در تشخیص متون فارسی دست یابیم.
مقایسه ویژگیها و عملکرد نرم افزار OCR فارسی واژه شناس با نمونه های خارجی
در این بخش به مقایسه ویژگی ها و عملکرد نرم افزارهای OCR فارسی پرداخته می شود. مهم ترین معیارهای مقایسه شامل دقت و سرعت بازشناسی متون، قابلیت ویرایش و اعمال تعمیرات در متن اسکن شده و پشتیبانی از انواع اسناد چاپی و دست نویس) هستند.
دقت و سرعت بازشناسی متون چاپی
نرم افزارOCR فارسی واژه شناس محصول شرکت هوش مصنوعی رایورز با دقت به مراتب بالاتر از نمونه های خارجی مانند ABBYY Finereader و IRIS Finereader می تواند متون چاپی فارسی را تشخیص دهد است.
پشتیبانی از انواع اسناد دست نویس
نرم افزارOCR فارسی واژه شناس محصول شرکت هوش مصنوعی رایورز قابلیت تشخیص نمونه دستنویس فارسی را دارد در حالیکه محصولات خارجی مانند ABBYY Finereader و IRIS Finereader و Naunce Omnipage به هیچ وجه قابلیت تشخیص دستخط فارسی را ندارند.





نقد و بررسیها
هنوز بررسیای ثبت نشده است.