3测试图片显示置信度_告别腾讯百度图片文字识别API调用,OCR图片文字识别就用这条代码...
上期文章我們分享了tesseract的基本安裝,本期我們來分享一下如何使用python與tesseract進(jìn)行代碼的編程來實(shí)現(xiàn)tesseract的文字識(shí)別
在開始本期文章之前,請(qǐng)認(rèn)真閱讀一下小編前期分享的了tesseract的安裝教程,確保你電腦里面安裝了pytesseract 與tesseract,最好是4.0以上的版本
pytesseract 與python的完美結(jié)合
import pytesseract
import cv2
from pytesseract import Outpu
image = cv2.imread('11.png')
rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
results = pytesseract.image_to_data(rgb, output_type=Output.DICT)
首先我們導(dǎo)入pytesseract第三方庫
使用cv2.imread讀取需要檢測(cè)的圖片
由于CV2讀取的圖片是在BGR空間,這里需要cv2.cvtColor(image, cv2.COLOR_BGR2RGB)來轉(zhuǎn)換為RGB空間
然后使用pytesseract.image_to_data來識(shí)別,結(jié)果保存在results里面
ok ,本期文章到此結(jié)束,就這幾條代碼
哈哈,開個(gè)玩笑,再怎么也得介紹一下代碼的具體含義
pytesseract一般具有如下功能:
這里我們使用image_to_data來獲取檢測(cè)到的字符以及置信度與具體的邊界位置,其他功能小伙伴們可以自行測(cè)試
image_to_data(image,lang = None,config ='', nice = 0,output_type = Output.STRING)
image Object,PIL Image /由Tesseract處理的圖像的NumPy數(shù)組
lang String,Tesseract語言代碼字符串
config String,任何其他配置為字符串
nice Integer,修改Tesseract運(yùn)行的處理器優(yōu)先級(jí)。Windows不支持。
output_type Class屬性,指定輸出的類型,默認(rèn)為string
我們這里選擇輸入一個(gè)字典,字典里面存放著測(cè)到的字符以及置信度與具體的邊界位置
for i in range(0, len(results["text"])):
x = results["left"][i]
y = results["top"][i]
w = results["width"][i]
h = results["height"][i]
text = results["text"][i]
conf = int(results["conf"][i])
我們遍歷整個(gè)字典,獲取了檢測(cè)字符串的初始位置(x,y),以及字符串的長度與高度(w,h),這樣我們就可以畫一個(gè)box來提示以及檢測(cè)到的字符串。
text = results["text"][i]獲取識(shí)別到的字符串
conf = int(results["conf"][i])獲取識(shí)別到字符串的置信度
if conf > 50:
text = "".join([c if ord(c) < 128 else "" for c in text]).strip()
print(text)
cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv2.imshow("Image", image)
cv2.waitKey(0)
我們選擇置信度大于50%的,把檢測(cè)到的字符串全部打印,并顯示到圖片上
檢測(cè)到的字符
tesseract 默認(rèn)只識(shí)別英文,你若想識(shí)別其它語言,請(qǐng)下載對(duì)應(yīng)的tessdata
https://github.com/tesseract-ocr/tessdata
image_to_data(image,lang = None,config ='', nice = 0,output_type = Output.STRING)
然后修改此處的lang=“chi_sim”或者其他語言
只檢測(cè)英文
超強(qiáng)干貨來襲 云風(fēng)專訪:近40年碼齡,通宵達(dá)旦的技術(shù)人生總結(jié)
以上是生活随笔為你收集整理的3测试图片显示置信度_告别腾讯百度图片文字识别API调用,OCR图片文字识别就用这条代码...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: goland设置goroot_go环境搭
- 下一篇: 数字电路技术可能出现的简答题_数字电子技