光學字元辨識 (OCR) 有時是指文字辨識。它已推出將近 50 年。隨著技術融入我們的工作,對於我們的日常生活影響就越大。

技術讓我們的工作和個人專案,跟著我們從辦公室空間,移動到家庭當中,乃至於到世界上幾乎任何地點。技術的成長讓更多人可以對世界的發展方向表達意見。在內容與技術世界當中,方便性與簡單是基本要點。OCR 可將靜態內容轉換成可搜尋的智慧檔案。

什麼是 OCR?

光學字元辨識 (OCR) 是一種可將列印文件轉變為數位影像檔案的技術。它就如同數位影印機一樣,可使用自動化作業將掃描完成的文件轉換為機器可讀取的 PDF 檔案,供您進行編輯和共用。當您使用電腦掃描一張收據時就會用到 OCR。您的電腦會接著將掃描工作另存成影像。當您無法對影像進行掃描、編輯或計算字數時,您可以使用 OCR 將影像轉變成文字文件,將其內容另存為文字。OCR 程式可以從相機影像、僅有影像的 PDF 和掃描文件中提取資料。其可讓靜態內容變成可調整的形式,且讓您無須手動輸入資料。

為何 OCR 如此重要?

儘管數位領域大量進駐我們所處的世界,大多數企業仍然在使用印刷媒體。這當中包括像是發票、合約、掃描的法律文件,以及其他紙本形式等文件。紙本文件佔據了大量的實體空間,而且需要花費時間人力進行管理。無紙文件在企業之間的應用越來越普及。將文件掃描成影像可能極為費時,因為這個作業需要手動輸入。OCR 由於可以將影像轉換成文字資料,以供其他企業軟體讀取,因此節省了個人與公司許多時間和金錢。這項技術簡化了許多作業,可以進行分析、自動化流程,同時提高整體產能。

盲人或視障人士使用者

OCR 除了提供掃描與搜尋文字的便利功能,還能方便盲人或視障人士使用者操作使用。OCR 辨識作業可展現語言和結構,並且修正所發現的拼字錯誤。它的拼字檢查技術可讓使用者得到最準確的資訊。OCR 系統中還配備合成器,可以朗讀出辨識的文字。盲人或視障人士可利用自適應式技術裝置掃描的文字來了解文件內容,這類裝置會放大電腦螢幕,或是以語音提供給使用者聽取,或是以盲文 (Braille) 提供閱讀。透過這種軟體,掃描文件中的文字會依個人需求規格讀出。

https://video.tv.adobe.com/v/3415714?end=nothing&learn=on

光學字元辨識運作方式

OCR 軟體或引擎的運作會透過一組步驟進行。

1.影像分析, 掃描器會讀取文件,並將其轉變為二進位資料。OCR 軟體將檢測掃描的檔案,並將亮色區域分類為背景,將深色區域分類為文字。

2.分析前作業, OCR 技術會透過一些不同的技術,使影像更加完善:

  • 平滑處理文字影像的邊緣,以及消除數位影像污點。
  • 透過傾斜掃描文件,修正在掃描期間發生的對齊問題。
  • 多語言 OCR 技術的字跡辨識
  • 整理影像中的線條與方塊。

3.辨識文字, OCR 技術會使用特徵擷取與圖樣比對來處理文字:

  • 特徵擷取會將語言分解成幾個部分,例如封閉環、線條、線條方向與線條交點。從這裡開始,它將會使用這些部分來搜尋最符合或是最接近的結果。
  • 圖樣比對則是指被稱為「字符」的字元影像完成分離,並與已經存檔的類似字符相互比較。只有在已存入的字符中有類似於所加入字符的尺寸與字型時,圖樣辨識作業才會進行。當影像掃描來源的文件字元為已知字型時,這種方法的發揮效果最好。

4.處理後作業, 當內容完成分析之後,系統會將擷取的文字資料轉變為電腦檔案。特定 OCR 軟體可以製作掃描文件前後版本的已註解的 PDF。如果 OCR 未能辨識文字,請務必檢查掃描是否為高品質、光線是否充足,且掃描內容並未傾斜。

OCR 技術的歷史

這是 1974 年由 Kurzweil Computer Products, Inc. 的創辦人 Ray Kurzweil 所開發的文件轉換技術。這項新技術可以辨識幾乎任何字型列印的文字。Kurzweil 判定最適合其所發明技術應用的情況應該是盲人專用的機器學習裝置。他製作了一部朗讀機器,可以用於大聲朗讀文字,以及轉譯文字成文字轉換成語音格式。1980 年,他的公司賣給了 Xerox (全錄) 公司,因為 Xerox 當時希望繼續將紙本轉換成電腦文字轉換技術商業化。

這項技術一直到 1990 初期才開始流行於市,當時人們是用這項技術來數位化舊報紙。OCR 從這時起經歷了數次開發改進。如今 OCR 可以為使用者提供幾乎完美的準確轉換。文件處理工作流程可經由進階的 OCR 方法達到自動化。 這項軟體推出前,文件必須用手重新鍵入,花費更多的時間、精力與資源。因此,當時內容中的錯誤率更高。OCR 現在廣泛開放供個人與專業目的使用,並且效能更高。

OCR 技術的類型

資料科學家將根據其應用範圍與使用,區分不同類型的 OCR 軟體類型。以下是幾個範例:

  • 簡易光學字元辨識軟體會儲存不同的文字和字型影像圖樣為範本。這個軟體會使用圖樣比對演算法,找出文字影像之間的差異。它將在內部資料庫中逐字元進行分析。系統逐字詞複製文字就是光學字詞辨識。這項技術不可能擷取到每種字型和手寫樣式,因為這兩個要素都有無限數量,所以這個解決方案有其限制。
  • 智慧字元辨識 (ICR) 軟體是現代 OCR 技術的其中一部分。ICR 會以人類方式進行文字閱讀。使用機器學習軟體時,機器可以如訓練成如人類一般的行為。被稱為神經網路的機器學習系統能研究文字,並重複處理影像。它會搜尋多種影像層面,例如,線條、曲線、環圈和交點,最後合併不同資料層面的結果,得到最後結論。
  • 智慧字詞辨識技術的運作規則與 ICR 相同,但是這些技術會研究整個字詞,而不用先將影像修改成字元。
  • 光學標記辨識會尋找文件中的浮水印、標誌和其他文字符號。
A laptop uses Adobe software to open, view, and edit scanned documents using OCR.

OCR 使用案例

OCR 的其中一種熱門用途是將印製媒體內容轉換成機器可讀取文字文件。OCR 的其他使用案例包括協助視障人士與盲人存取內容、資料自動化,以及為搜尋引擎列出車牌、發票、護照等文件。

家庭和企業都適用的優秀 OCR 軟體

下面介紹一些家庭和企業都適用的優秀 OCR 軟體選項:

1.Adobe Acrobat Pro

Acrobat Pro 可為您提供所需的所有 OCR 工具,讓您能夠簡化工作流程並確保文件管理效率。使用 Pro 版的 Acrobat 時,您可使用所有基本 OCR 功能以及對文件加上注釋和留下回饋意見,比較兩份文件的選項,掃描表格的特殊工具,以及其他功能。在掃描完成後幾秒鐘,文件便可在您的電腦上進行調整。Acrobat OCR 可完美搭配免費 Adobe Scan 應用程式使用,讓您掃描文件,並且轉換成 PDF。藉由 Adobe OCR 工具的協助,文字將自動進行辨識,而且您還可以視需要進行調整。

2.OmniPage Ultimate

這個軟體以高轉換準確性聞名業界。OmniPage Ultimate 可建立自訂工作流程,讓文件自動以正確格式傳送到正確位置

3.Abbyy FineReader

Abbyy FineReader 提供在轉換紙本文件至數位文件時的所有必要工具。這個軟體可以辨識文字,並將結果轉換為 PDF、不同的 Microsoft Office 格式與其他格式。您可以比較文件、加上註解、注釋和其他標示。這套軟體可以批次轉換大量文件,並可處理許多輸出格式及 192 種不同語言。

4.Readiris

Readiris 可支援許多不同的檔案格式,以及在文件中加入簽章與安全性保護,還有注釋、浮水印與註解等功能。

5. Rossum

這套 OCR 解決方案可用於掃描發票上的重要資訊,並匯出至您使用的任何程式。這套軟體使用 AI 來掃描文件上的重要資訊,而非使用範本格式進行掃描。這個做法很有用,因為不同的發票可能有不同的資訊呈現格式。

真實世界的 OCR 應用

有許多種 OCR 軟體和工具可因應不同日常的個人和專業需求。

  • 版面分析軟體會將掃描的文件區分成適合使用 OCR 的不同區段。
  • OCR 引擎會識別字元。
  • 可在其他軟體中加入 OCR 能力的軟體開發套件。範例包括文件影像處理管理系統、記錄管理解決方案,或是表格處理應用程式。
  • 在一或多個 OCR 引擎上的圖形化介面。

企業運用的 OCR

文件建立和協作是企業運作的重要部分。隨著企業成長,工作負載也隨之成長。儘管團隊中經常會加入更多員工,某些人力工作可能會因為這項便利的技術而消失。

在人力輸入資料的特定工作需求降低之後,員工就能專注在其他的重要企業工作。透過自動化的資料擷取和儲存空間功能,企業的工作流程和效能便會改善。在數位化之後,成本降低,而且資料會更集中與更安全。企業可使用 OCR 將資料轉入 Excel 工作表,接著輕鬆地從線上檢視井然有序的內容。使用線上內容時,文件發生遺失或遭竊的風險大幅降低。每個人可以更輕鬆同時保持步調一致,因為數位文件化可讓所有人都獲得最新的資訊。

教育界運用的 OCR 技術

OCR 軟體是協助學生與其課業的絕佳工具。下面列出這項技術有助於教育界的一些範例:

  • 筆記作業變得更簡單,因為 OCR 可以大聲朗讀字詞,將文字轉換成語音。
  • 文字的顏色和大小可進行變更。
  • 字詞、句子和段落可採用螢光標示。
  • 可以放置數位書籤,讓學生可以輕鬆來回瀏覽文字。

OCR 是有助於閱讀障礙症學生的絕佳工具。單張紙本家庭作業可以經過掃描,再轉換成數位文件。學生們可以使用工具來協助文件閱讀。

醫療保健業中運用 OCR

在醫療保健業中,OCR 可用來處理病患的各種記錄,像是檢查、醫院病歷、治療與保險支付。這項技術會簡化工作流程,降低產業必須負擔的人力成本,所以幫助很大。OCR 讓記錄管理更簡單,而且能確保內容隨時更新。資料加入電子記錄的花費時間大為縮短,而且輸入資料的準確性也提高了。OCR 可降低資料輸入發生錯誤的可能性。

OCR 有助於擷取來自電子醫療保健記錄 (EHR) 的資訊。例如,某位病患的就醫記錄可能以 EHR 儲存,而某位醫師可能需要存取這份資訊。他們可以使用 OCR 搜尋,快速找到所需的資訊。紙本就醫記錄可經過掃描、數位化,讓醫療保健專業人員輕鬆取得其所需要的資訊。這項技術可以用於掃描處方與其他重要文件,減少錯誤發生機率,並且保護病患安全。數位表格可以經由 OCR 技術建立,節省紙本資源與時間,並讓文件管理更簡單。

OCR 與機器學習,未來趨勢?

過去幾十年來,OCR 和機器學習呈指數成長,而且肯定未來幾年也會繼續成長。下一代的 OCR 採用機器學習和人工智慧打造,不再侷限於過去軟體的字元比對軟體。OCR 軟體獨立思考並繼續學習更多內容。

OCR 技術將不只繼續接收掃描的文字,而且會察覺文字的意義,理解內容。機器學習可能屬於過去的做法,因為深度學習正在持續發展,將促使 OCR 技術轉型。深度學習技術包括了神經網路,這個技術會模擬人腦功能來檢驗演算法不需要依賴歷史圖樣以確認準確性。深度學習代表這項技術可以獨立作業,而且不只是查看文字,還能尋找文字背後的意義。

A phone uses OCR software to scan a paper copy of a recipe and converts it to a PDF you can open and edit on your laptop.

OCR 如何協助簡化流程及提高效率

人力、時間和成本都能透過 OCR 軟體和技術大幅降低。將靜態文件轉換成數位、智慧型、可搜尋的文件時,可讓資訊搜尋更簡單,因此利於公司為客戶與員工提供更棒的經驗。將 OCR 技術整合至企業模式之後,您可以:

  • 轉換手寫文件成可編輯數位文件。
  • 掃描表格(手寫內容),以供自動檢閱、驗證、分析與編輯。節省花在手動處理文件和資料輸入的時間。
  • 尋找重要文件時可採用快速搜尋資料庫中的詞組,而且不需要手動翻閱實體檔案。
  • 資料獲得安全保障與集中管理,因為數位文件發生遺失或遭竊的機會較低。
  • 獲取最準確且最新的資訊。

透過 OCR 技術,方便性與存取性都大為提高,而且企業可以為用戶提供更好的服務,同時減輕員工的壓力。

https://main--dc--adobecom.hlx.page/dc-shared/fragments/seo-articles/acrobat-color-blade