python tesseract ocr_使用Python和Tesseract OCR解决Captch
我不打算發(fā)垃圾郵件,而且谷歌已經(jīng)用reCaptcha使captcha過時。我做這個項目是為了了解更多關(guān)于OCR的知識,最終可能是神經(jīng)網(wǎng)絡(luò)。在
所以我有了一個來自Captcha的圖像,我已經(jīng)取得了一定的進展,但是關(guān)于tesseract的文檔并沒有完全文檔化。這是我到目前為止的代碼,結(jié)果如下。在from selenium import webdriver
from selenium.webdriver.common import keys
import time
import random
import pytesseract
from pytesseract import image_to_string
from PIL import Image, ImageEnhance, ImageFilter
def ParsePic():
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
im = Image.open("path\\screenshot.png")
im = im.filter(ImageFilter.CONTOUR)
im = im.filter(ImageFilter.DETAIL)
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(4)
im = im.convert('L')
im.save('temp10.png')
text = image_to_string(Image.open('temp10.png'))
print(text)
我知道Captcha是專門用來打敗OCR的,但我讀到它不再是這樣了,我有興趣了解它是如何做到的。在
我的問題是,如何使背景顏色相同,以便文本變得易于閱讀?在
總結(jié)
以上是生活随笔為你收集整理的python tesseract ocr_使用Python和Tesseract OCR解决Captch的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 动易php,动易数据转成dedecms的
- 下一篇: matlab卷积完为什么要归一化,为什么