人工智能学习--文本识别实践-tesseract-ocr
前提假設:
1. 所要檢測的圖片是純文本或者文字,最好是只有一行; 或者截圖只有一行文本的圖片。如下圖
圖片名稱: text03.jpg
?
2. 從文本檢測(深度學習網絡)軟件檢測到的 包含文本區域的圖片。
?
開源文本識別軟件(OCR)
Tesseract-OCR?
下載鏈接:https://digi.bib.uni-mannheim.de/tesseract/
可以根據自己的電腦操作系統位數決定下載32位 或者 64位,按照時間順序,可以下載最新的版本。
安裝步驟:
下載完后,是 .exe格式文件,點擊安裝,一直下一步就可以了。
注釋: 如果有提示:選擇下載包(在additional language data (download 下選擇中數學公式庫和中文庫Chinese(simplified)(traditional)),兩者都選上, 點擊“next”繼續
注釋:如果選中additional的√ 鉤號, 安裝時可能提示一個錯誤,不管它,直接按 enter 鍵盤按鍵,直到裝完。
筆者是裝在 E:| 盤,,,目錄是E:\ Tesseract-OCR
?
環境配置:
1. 將Tesseract-OCR安裝目錄(E:\Tesseract-OCR)加入環境變量path中;? ? 環境變量獲取方式:右鍵 桌面上的 “計算機”圖標, 然后如下圖所示。 雙擊 PATH 在最末尾加入剛剛軟件安裝的目錄。
2 新建環境變量,變量名TESSDATA_PREFIX?并賦值為E:\Tesseract-OCR\tessdata
?
?
運行方法:
Windows的 cmd命令行模式下 運行, 如下圖紅色框里,可以正確檢測前面 text.jpg 圖片里的英文內容。
tesseract 是命令
第一個目錄是要識別的圖片目錄和文件名
第二個目錄是結果要保存的目錄和文件名
-l 是選項符號,(-后面那個小寫字母是L的小寫)
eng 是English的縮寫,在目錄 E:\Tesseract-OCR\tessdata目錄下, 完整名稱是下圖的紅色框內? eng.traineddata文件名。
makebox是固定的寫法
注釋:如果想要檢測中文文字的圖片,則需要下載?chi_sim.traineddata文件, 下載地址:https://github.com/tesseract-ocr/tessdata
注釋: 如果以上GitHub打不開可以試試,CSDN的加速計劃?https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator
?
運行結果:
運行結果是一個 .box 文件, 可以用 文本類編輯工具軟件打開或記事本打開 查看內容
結果是一行一個字母,如果圖像比較干凈,無干擾背景紋理的話,檢測準確率很高。
?
Python 版本,沒測試:可以參考:
https://zhuanlan.zhihu.com/p/113961004
https://blog.csdn.net/qq_41030861/article/details/99842001?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control
?
總結:
用于簡單的圖片,例如白底黑字,一行或者多行文字,字符直接比較松散,則檢測結果質量較高,準確率較高。
若,圖片中背景顏色很雜很多干擾因素,或者黑底白粗字,或者傾斜或者 其他門牌號廣告牌等大字體,藝術字體,則幾乎無法正確識別。 想要識別這些場景下的文字,則需要用深度學習神經網絡模型,網上有很多開源軟件,需要GPU伺候。
總結
以上是生活随笔為你收集整理的人工智能学习--文本识别实践-tesseract-ocr的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器人学习--Turtelbot3学习-
- 下一篇: 机器人学习--粒子滤波及其在定位中的应用