當前位置：首頁 > 编程语言 > c/c++ >内容正文

c/c++

文档扫描识别——OpenCV与C++实现OCR文字识别

發(fā)布時間：2025/3/21 c/c++ 24 豆豆

生活随笔收集整理的這篇文章主要介紹了文档扫描识别——OpenCV与C++实现OCR文字识别小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

前言

1.前面演示了如何通過線段檢測后得到拍照文檔的四個校正點，后把文檔校正，接下就是OCR識別，其實在OCR的時，也可以不用做校正，但對部分場景下的文檔，識別精度可能沒有那么好而已。
2.考慮到之后要在移動端上做APP，在選擇網(wǎng)絡(luò)模型時要考慮到移動端的算力，只能選擇適合移動端的小模型，chineseocr_lite和paddle Mobile都是移動端上不錯的選擇，我這里試用了chineseocr_lite的模型。
3.我的開發(fā)環(huán)境是win10， vs2019, opencv4.5, ncnn,如果要啟用GPU加速，所以用到VulkanSDK，實現(xiàn)語言是C++。
4.帶GUI的效果演示：
校正過之后的效果：

沒有校正的效果：

項目流程

1.文本檢測就是把文檔上所有的文字給檢測出來，檢測到之后才能切行識別，在一些場景下，如果沒有做文檔校正的話，文檔里面很容易出現(xiàn)檢測不到的文本。
2.文本行角度檢測，就是檢測當前文本行的文字方向，其實這步可以不做，這個模型也可以用來做文檔文字方向旋轉(zhuǎn)。
3.文本識別，就是把檢測到的文本行一行一行的識別。

工程源碼

1.代碼太多了，這里就不展示了，整個工程源碼和可執(zhí)行GUI測試程序都上傳到CSND，源碼都按接口方式寫好，只要實例化一個對象就可以調(diào)用接口，調(diào)用示例如下：

#include "MasterOCR.h" #include <iostream> #include <opencv2/opencv.hpp>//OCR std::string ocr_model = "models/ocr/ncnn/"; std::string key_path = "models/ocr/key/keys_v1.txt";int main() {LiteNcnnOCR lite_ocr;lite_ocr.initModel(ocr_model, key_path, 4, true);cv::Mat cv_src = cv::imread("1.jpg",1);if (!cv_src.empty()){std::vector<std::string> result_str;lite_ocr.masterOcr(cv_src, result_str);cv::cvtColor(lite_ocr.cv_padding, cv_src, cv::COLOR_RGB2BGR);drawTextBoxs(cv_src, lite_ocr.text_boxs, 2);for (auto v : result_str){std::cout << v << std::endl;}} }

2.資源
可執(zhí)行exe：https://download.csdn.net/download/matt45m/76348219
OCR源碼：https://download.csdn.net/download/matt45m/76348353?spm=1001.2014.3001.5503

總結(jié)

以上是生活随笔為你收集整理的文档扫描识别——OpenCV与C++实现OCR文字识别的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：文档扫描识别——基于M-LSD线段检测的
下一篇： C/C++指针与内存管理