OCR ——光學字符識別

OCR究竟是什麼？

光學字符識別或OCR是一種使您能夠將不同類型的文檔（如掃描的紙張文檔，僅含圖片的PDF檔或數碼相機獲取的圖像）轉換為可編輯和可搜索的資料的技術。

所有掃描器可以做的是創建文檔的圖像或快照，這只不過是黑白或彩色點的匯合，稱為點陣影像。為了從掃描的文檔、攝像機圖像或PDF中提取和重新利用資料，您需要一個能將圖片上字母挑出，將它們組成單詞並轉換為句子的OCR軟件，從而使您能夠訪問及編輯原始文檔的內容。

OCR究竟有什麼技術？

最先進的光學字符識別系統，如ABBYY FineReader OCR，專注于複製自然的或“像動物一樣的”識別。這些系統的核心在於三個基本原則：完整性、有目的性和適應性。完整性原則即，觀察物件必須總是被認為是由許多相互關聯的部分組成的“整體”。目的性原則假定對資料的任何解釋必須總是用於某種目的。適應性原則意味著程式必須能夠自我學習。

FineReader OCR通過幾個步驟識別文本：

分析文檔圖像的結構
將頁面劃分為諸如文本、表格、圖像等元素
行被分成單詞，然後分成字符
然後程式將字符與一組圖案圖像進行比較。
基於這些假設，程式分析將行分解成詞和字的不同變體。
該程序最終做出結論，向您呈現識別的文本。此外，ABBYY FineReader為48種語言提供字典支援。這使得能夠在詞組級別上對文本元素進行二次分析。借助字典支援，該程式確保對文檔的更準確的分析和識別，並簡化對識別結果的進一步驗證。

人們不必作為OCR專家來瞭解基於IPA原則構建的OCR應用程式的優點。這些原則賦予該項目最大的靈活性和智慧，使其盡可能接近人工識別。

經過多年的研究，ABBYY能夠在其OCR技術中實施上述IPA原則。

數碼相機圖像識別

由數碼相機捕獲的圖像與掃描的文檔或僅含圖像的PDF不同。它們通常具有缺陷，例如邊緣處的失真和光線不足，使大多數OCR應用難以正確地識別文本。最新版本的 ABBYY FineReader支持專門為處理攝像機圖像而設計的自我調整識別技術。它提供了一系列功能，以提高這些圖像的品質，使您能夠充分利用您的數位設備的功能。

有關識別數碼相機OCR的更多資訊請與我們聯繫 >>.

如何使用OC軟件？

ABBYY FineReader OCR易於使用：過程一般包括三個階段：打開（掃描）文檔、識別，然後以方便的格式（DOC，RTF，XLS，PDF，HTML，TXT等）保存或直接將資料匯出到一個Office應用程式，如Microsoft Word，Excel或Adobe Acrobat。

此外，最新版本的ABBYY FineReader支援自動任務模式，當您定期處理常規任務時，這是必不可少的。使用此功能，識別任務自動運行，而不必手動執行所有上述步驟。

優點

在創建、處理和重新利用各種文檔時節省大量的時間和精力。
掃描紙質文檔以進一步編輯並能與同事和合作夥伴共用。
提取書籍和雜誌的報價，無需重新鍵入便可利用它們來創建課程研究和論文。
在戶外從橫幅、海報和時間表中擷取文本，然後使用擷取的資訊來完成目的。
使用OCR軟件創建可搜索的PDF文檔。
從原始紙質文檔、圖像或PDF進行資料轉換的整個過程需要不到一分鐘，識別的最終文檔看起來和原始文檔一樣。

OCR ——光學字符識別

OCR ——光學字符識別

OCR究竟是什麼？

OCR究竟有什麼技術？

FineReader OCR通過​​幾個步驟識別文本：

數碼相機圖像識別

如何使用OC軟件？

優點

FineReader OCR通過幾個步驟識別文本：