Windows安装用于OCR的Tesseract及使用命令行参数进行OCR
Windows安裝用于OCR的Tesseract及使用命令行參數進行OCR
- 1. 效果圖
- 2. Tesseract 安裝及驗證
- 參考
這篇博客將介紹如何安裝和使用光學字符識別(OCR Optical Character Recognition)的Tesseract庫,并使用命令行對圖像中的字符進行識別;**除非圖像被清晰地分割,否則 Tesseract 會產生很差的結果。**在“嘈雜”輸入圖像的情況下,需要通過訓練自定義機器學習模型來識別特定用例中的字符來獲得更高的準確性。
OCR(Optical Character Recognition)光學字符識別是將鍵入、手寫或打印文本自動轉換為機器編碼文本的過程,然后可以通過字符串變量訪問和操作這些文本。
Tesseract最初由Hewlett-Packard在20世紀80年代開發,在2005年開源。后來在2006年,谷歌采用了該項目,并從那時起一直是贊助商。
- Tesseract軟件適用于多種自然語言,從英語到現在支持100多種書面語言,并有代碼,因此可以輕松地在其他語言上進行訓練。
- Tesseract 最適合構建文檔處理管道,其中掃描圖像、預處理,然后需要應用光學字符識別。
- Tesseract 最適合具有高分辨率輸入的情況,其中前景文本與背景清晰地分割開來。
1. 效果圖
OCR 命令行識別效果圖如下:
可以看到僅英文字符(紅色劃線和紫色圓圈標識區),僅數字(藍色箭頭標識區)都被成功識別;
Tesseract局限性例子,如信用卡上的數字識別效果如下:
并沒有正確識別到;
2. Tesseract 安裝及驗證
1. 安裝Tesseract
- MacOS
brew install tesseract
- ubuntu
sudo apt-get install tesseract-ocr
- windows
官方安裝文檔見:https://github.com/UB-Mannheim/tesseract/wiki
tesseract-ocr-w32-setup-v5.0.0-alpha.20210811.exe (32 bit) 下載
tesseract-ocr-w64-setup-v5.0.0-alpha.20210811.exe (64 bit) 下載
2. 驗證是否已安裝Tesseract
tesseract -v
安裝成功可以看到屏幕上的Tesseract版本,以及Tesseract與兼容的圖像文件格式庫列表。
3. 測試Tesseract OCR
使用Tesseract時,建議:
- 使用盡可能高的分辨率和DPI作為輸入圖像。
- 應用閾值從背景分割文本。
- 確保前景與背景盡可能清晰地分割(即,沒有像素化或角色變形)。
- 對輸入圖像應用文本傾斜校正,以確保文本正確對齊。
不預處理可能會導致不正確的OCR結果。
參考
- https://www.pyimagesearch.com/2017/07/03/installing-tesseract-for-ocr/
- https://github.com/tesseract-ocr
總結
以上是生活随笔為你收集整理的Windows安装用于OCR的Tesseract及使用命令行参数进行OCR的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 详解OpenCV中的Lucas Kana
- 下一篇: Matplotlib绘制象限图——支持中