大部分PDF文件可以用OCR識別,圖片不行
http://www./forum/dispq.asp?LID=28281 如何將caj格式轉化為word格式 caj文件的識別: 1)局部文字識別:直接使用caj瀏覽器的ocr 2)全文件識別:打印到Microsoft Office Document Image Writer打印機,選擇打印形成的文件的保存位置,然后會自動形成一個MDI文件,并且自動用Microsoft Office Document Image打開此文件,然后選擇“工具”菜單下的“使用ocr識別文本”,識別完成后,在選擇“工具”下的,“將文本發(fā)送到word”,最后將把整個PDF文件識別輸出到word文件中。 注意:Microsoft Office Document Image可以非常準確的全文件識別轉化中文、英文、表格,但是無法將圖形輸出到word,而是把文件中的所有圖形單獨形成一個個獨立的圖片文件,放在相同位置的一個相同名稱的文件夾中,因此可用snagit軟件將圖形打開,然后復制到word中。(所有的識別軟件都不能很好的處理圖形的識別問題,Microsoft Office Document Image的這種處理方法已經是非常好的解決這個問題了。) 3)博碩論文全文下載:在線閱讀博碩論文,待可以看到最后一頁后,不要關閉caj瀏覽器,到caj安裝目錄下cache中找到一個較大的文件,拷貝到其他位置即可。然后使用2)全部轉化為word。 二種方法: 先用CAJViewer打開caj文件,然后,然后請看以下: 在編輯菜單欄中包括【復制】、【復制位圖】、【查找】、【全部選擇】,可以方便地實現(xiàn)文本摘錄,摘錄結果可以方便的粘貼到WPS、WORD 等編輯器中進行任意編輯,方便讀者摘錄和保存。 【操作】 1.在【瀏覽】菜單中點擊【鼠標用于選擇后】(鼠標變?yōu)?箭頭+T形狀),按方向鍵上下移動,可以滾動瀏覽屏幕。箭頭指向左上方時點擊開頭,指向右上方時點擊結尾,使其呈反色顯示,按工具欄的【復制】按鈕。 2. 打開word新建文檔進行【粘貼】即可得到摘錄的文本。同時也可以編輯存盤。 【復制】:可以復制選定的文件或其中部分內容。 【復制位圖】:系統(tǒng)默認設置,鼠標所在的位置出現(xiàn)一個十字,點住拖到選定位置 劃出一片區(qū)域,點復制,將選中區(qū)域內容復制到剪貼板。 【查找】:在彈出的對話框里輸入要查找的文字,點擊【查找】進行查找,按下【向前查找】或【向后查找】按紐, 可以翻到上一頁、下一頁查找。 【全部選擇】:將頁面的內容全部選定。 |
|