你也可以輕鬆做文字辨識(OCR)

| 13 Comments | No TrackBacks 分享

 筆者最近拿到一份舊的合約書需要重新修改,但因為沒有原稿,所以需要一個字一個字打進去。但打字又慢,又覺得很花時間,原本想跟朋友借丹青(一種圖文掃描軟體),但臨時又找不到人(人際太差了 ^^"),無意間發現了另一個節省時間的好方法。

 如果你時常需要將一些圖片或是雜誌上的文字用打字的方式輸入到電腦,或是有需要把一份DM或是合約書修改(在沒有原稿的情況下)的話,那以下的方式或許可以幫你節省不少時間。

 

 圖文辨識軟體(OCR)在台灣算是丹青辨識率最高(以中文字來說),但平常又不常用到,又不想為了臨時的需求去買一套軟體,那微軟(Microsoft)的Office軟體中的圖文辨識軟體(OCR),可能就會是最好的幫手了。
 
 Microsoft Office Document Image Writer 可以輕鬆把圖片中的文字,轉成文字檔。這樣即使沒有像丹青這樣的軟體,也可以輕鬆做圖文辨識。但前提是你必須擁有微軟Office2003以上的版本才有喔。

 以下就來跟各位介紹如何使用它的10個步驟。


 筆者從Yahoo新聞上用螢幕截取(Print Screen)做成了一張圖作為範本。


Step1:在圖檔上用活屬按右鍵,選擇列印功能。



Step2:點選下一步


Step3:選擇印表機時,請選擇Microsoft Office Document Image Writer


Step4:在列印喜好設定裡將頁面大小改成A3,這樣會比較好辨識。


Step5:直接點選下一步


Step6:將檔案存檔(預設會存成,mdi檔)。


Step7:這時微軟的文字Office的問字辨識軟體就會自動開啟。


Step8:在工具列上選擇使用OCR辨識文字,就會開始做圖文辨識。


 辨識完成的圖片,在左邊的預覽圖右下角就會出現已辨識的圖樣。


Step9:點選工具列中傳送文字到Word選項。


Step10:接下來就是要把沒有便是好的部分做修改嚕(以下是辨識出來的結果)。


 以上介紹的是直接用列印方式做辨識,所以任何格式的圖片都可以辨識,只要可以列印。但缺點是有時接析度會不好,所以如果想要比較好的解析度來做辨識,可以將原始的掃描圖檔存成tif的格式。然後用開啟的方式,將檔案叫入,再從Step8開始做,這樣可以得到較好的辨識效果。


PS.有時想直接叫出Microsoft Office Document Image Writer,也可以在開始->執行上打MSPVIEW,也可以把軟體直接呼叫出來。

相關文章:

[分享]MSN銀光影音館推出Climax系列日劇免費看

No TrackBacks

TrackBack URL: /cgi-bin/mt/mt-tb.cgi/133

13 Comments

呵呵!馬上就現學現賣,成功了喔 真好用呢

是 Office 2003 以上才有的功能,並不是 2000。

謝謝你的糾正^^


不錯,
試過了,好用!

JPG、BNP、PNG,OK。

GIF,不能開啟(會以別的製圖軟體開啟)
TIF,不能開啟(會直接跳進列表機列印)
改副檔名為JPG,則OK。

謝謝分享有效資訊。

很實用的工具,謝謝您的分享..
將它引用喔~

我到"使用ocr文字辨識"就卡住了耶,需安裝 要有磁片才行

我是2003的沒錯
我到"使用ocr文字辨識"就卡住了,需安裝 要有磁片才行

給小青:
因為你的OFFICE2003並未使用完整安裝的項目,預設該功能不會安裝,除非你將OFFICE2003的光碟放入才行。

我實在太晚看到這篇了

前一陣子公司的企劃還問我.mdi是什麼檔案格式

今天才看到

太好了.
如果我常有一堆檔案需要做OCR, 是否有更快的方式?

請問一下:
我是使用HP印表機本身贈送的掃描軟體,系統是 Windows XP SP3,我原始文件中的文字是用打字的「從左到右橫向排列」的,在掃瞄文件時,我要把文字轉為可以編輯的文字,但HP的掃瞄軟體有時將我文件中的文字當成「從上到下直向排列」,以至轉換後的文字雖然可以編輯但是順序大亂!不知道這要如何修正呢?或者是否能在 Microsoft Office Document Image Writer 軟體中修正回來?

謝謝你的分享!!!對我很受用

沒地上下載

Leave a comment

September 2011

Sun Mon Tue Wed Thu Fri Sat
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

Archives

Powered by Movable Type 4.25