文档扫描识别——OpenCV与C++实现OCR文字识别
前言
1.前面演示了如何通過線段檢測后得到拍照文檔的四個校正點,后把文檔校正,接下就是OCR識別,其實在OCR的時,也可以不用做校正,但對部分場景下的文檔,識別精度可能沒有那么好而已。
2.考慮到之后要在移動端上做APP,在選擇網(wǎng)絡(luò)模型時要考慮到移動端的算力,只能選擇適合移動端的小模型,chineseocr_lite和paddle Mobile都是移動端上不錯的選擇,我這里試用了chineseocr_lite的模型。
3.我的開發(fā)環(huán)境是win10, vs2019, opencv4.5, ncnn,如果要啟用GPU加速,所以用到VulkanSDK,實現(xiàn)語言是C++。
4.帶GUI的效果演示:
校正過之后的效果:
沒有校正的效果:
項目流程
1.文本檢測就是把文檔上所有的文字給檢測出來,檢測到之后才能切行識別,在一些場景下,如果沒有做文檔校正的話,文檔里面很容易出現(xiàn)檢測不到的文本。
2.文本行角度檢測,就是檢測當前文本行的文字方向,其實這步可以不做,這個模型也可以用來做文檔文字方向旋轉(zhuǎn)。
3.文本識別,就是把檢測到的文本行一行一行的識別。
工程源碼
1.代碼太多了,這里就不展示了,整個工程源碼和可執(zhí)行GUI測試程序都上傳到CSND,源碼都按接口方式寫好,只要實例化一個對象就可以調(diào)用接口,調(diào)用示例如下:
#include "MasterOCR.h" #include <iostream> #include <opencv2/opencv.hpp>//OCR std::string ocr_model = "models/ocr/ncnn/"; std::string key_path = "models/ocr/key/keys_v1.txt";int main() {LiteNcnnOCR lite_ocr;lite_ocr.initModel(ocr_model, key_path, 4, true);cv::Mat cv_src = cv::imread("1.jpg",1);if (!cv_src.empty()){std::vector<std::string> result_str;lite_ocr.masterOcr(cv_src, result_str);cv::cvtColor(lite_ocr.cv_padding, cv_src, cv::COLOR_RGB2BGR);drawTextBoxs(cv_src, lite_ocr.text_boxs, 2);for (auto v : result_str){std::cout << v << std::endl;}} }2.資源
可執(zhí)行exe:https://download.csdn.net/download/matt45m/76348219
OCR源碼:https://download.csdn.net/download/matt45m/76348353?spm=1001.2014.3001.5503
總結(jié)
以上是生活随笔為你收集整理的文档扫描识别——OpenCV与C++实现OCR文字识别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 文档扫描识别——基于M-LSD线段检测的
- 下一篇: C/C++指针与内存管理