1、 對於是圖片做成的PDF(特別是掃描件做成的PDF)文件
推薦用下面軟件轉換
(1) 頁數比較少的用 CAJviewer 7.0 (帶OCR組件完整版),支持直接打開PDF文件,識別文字。下載地址及詳細介紹:
(2) 頁數比較多的可以用 Readiris Corporate 12軟件來進行識別 (需要安裝亞洲語言包,不然不識別中文)。下載地址及詳細介紹:
頁數比較多的還可以用 ABBYY finereader 9或者9以上版本(有簡體中文版)進行識別轉換。下載地址及詳細介紹:。
這個軟件的識別率很高,轉換出來的版面基本保持原樣,還可以手動人工框選識別,缺點就是識別速度較慢。
上面幾個軟件的識別率都還可以,不建議用什麼OFFICE組件識別,太麻煩識別率也不高。
2、對於一些不允許做修改的PDF文件(就是加密加了權限的PDF),那麼就先要去除密碼或者去除數字證書,才能照上面兩個步驟做。