萬盛學電腦網

 萬盛學電腦網 >> 硬件知識 >> 掃描儀知識 >> 如何提高掃描儀OCR識別率

如何提高掃描儀OCR識別率

;;;;購買了掃描儀,你一定會發現,附贈的軟件中有中英文OCR識別軟件,當然一般都是基礎版。很多人認為此類OCR的識別率不是很高,甚至懷疑只有那些正版的數千元的OCR軟件其識別率才很高。其實,你只要注意使用技巧,此類OCR的識別率完全可達實用化水平。;

;;;;1、處理原稿掃描圖像,使之清晰可“辨。在其它因素都滿足的前提下,對一般的印刷稿、打印稿(包括清晰的針打稿)等質量較好的文稿進行識別,其識別率一般可達到98%以上。而對報紙、復印件等不太清晰的文稿進行識別,無論哪種OCR都難以達到較高的識別率。對那些原稿不太清晰的,要注意識別前對圖像加以處理,除去其上的污跡。並注意將偏斜的版面“改斜歸正,通常OCR軟件均有此功能,且一般都設有自動糾偏和手動糾偏。;

;;;;2、分辨率應選擇適宜。一般選擇300dpi較合適,分辨率選小了會使識別率降低,選得太大了並不能有效提高識別率,還會大幅度加長文件長度,浪費處理時間。有的掃描軟件設備上有一項“OCR掃描,干脆將分辨率鎖定為300dpi,這是很有道理的。;

;;;;3、調整好亮度值和對比度值。這條非常關鍵,對識別率的影響很大。亮度值的調整是在識別前,先看看掃描得到的圖像中文字質量如何,如果文字線條凹凸不平,甚至有斷線,說明亮度值太大了,應減小亮度值;當文字線條很黑很粗,甚至擠成了黑疙瘩,分不清筆劃時,則說明亮度值太小了,應增加亮度值;對比度的調節要視原稿確定,筆者常根據預掃時圖像清晰度確定。;

;;;;4、利用OCR的自學習功能。有時OCR對某些字總是難以識別,比如OCR開始對“的和“二等字總是搞錯,這時可以利用OCR軟件的自學習功能,“引導它正確識別一次(有些不同的字體各需一次),它以後就對這些字“熟識了。具體操作極易,上機看一下菜單即可明白。另外,若原稿全是英文或其中中文很少,最好用附贈的英文OCR軟件。還有,現在已有一些很好的文字校對軟件,其中一般都設置了OCR校對,利用這些軟件先行處理一下所得文本文件,則可大大減輕人工校對負擔。
copyright © 萬盛學電腦網 all rights reserved