VS2010调用tesseract步骤
我的tesseract安裝路徑為D:\Tesseract-OCR,如果你的安裝路徑和我不一樣,將這份文檔里所有的D:\Tesseract-OCR改為你的安裝路徑即可。
1.?下載lib和dll(所有需要下載的東西在附件里下載)
??首先安裝tesseract-ocr-setup-3.02.02.exe文件,我的安裝路徑為D:\Tesseract-OCR;
??安裝完成后解壓tesseract-3.02.02-win32-lib-include-dirs.zip文件,將里面的lib和include文件夾復制到Tesseract-OCR目錄下;
??最后解壓縮??liblept168和VS2010編譯出的libtesseract302.rar??文件,將該壓縮文件里的三個dll文件復制到Tesseract-OCR\lib目錄下,替換該目錄下的文檔
(原因:該目錄下被替換的文檔時在VS2008平臺下編譯生成的,替換的文檔則是VS2010平臺下生成的,這個事從網上直接找的)
??將chi_sim.traineddata.gz解壓縮,然后將chi_sim.traineddata復制到D:\Tesseract-OCR\tessdata下,這是已經有的簡體中文訓練集
2.?檢查并修改環境變量
一般情況下環境安裝好tesseract后環境變量就自動配置好了,但是為了確保后面不出錯,最好還是檢查一下,在環境變量Path中增加指向安裝目錄下lib的路徑,比如D:?\Tesseract-OCR\lib??,以便exe運行時能找到所需要的dll。
??還有一步特別重要,就是一定要查看環境變量TESSDATA_PREFIX,將其路徑改到D:\Tesseract-OCR\下。
3.然后需要添加包含的庫和目錄,如下:(我新建的工程名為test)
(1)?在工程(不是解決方案)上單擊右鍵,選擇屬性,依次單擊配置屬性——C/C++——常規,在右側找到附加包含目錄,該目錄下添加D:?\Tesseract-OCR\include\tesseract;
(2)?配置屬性——鏈接器——常規,找到附加庫目錄,添加D:?\Tesseract-OCR\lib
?4. 新建一個C++ 工程 ,我建的是一個空的 win3 程序。建好后新建一個CPP 文件 ,添加這幾行代碼:#include"stdafx.h"? #include?"strngs.h"??
#include?"baseapi.h"
#include?<iostream>
using?namespace?std;
#pragma??comment(lib,"?D:\\Tesseract-OCR\\lib\\libtesseract302d.lib ")?
int?main()
{
char?*?str?=?"D:\\20.jpg";??//這是要識別圖像的絕對路徑
tesseract::TessBaseAPI??api;????
api.Init(NULL,?"chi_sim",?tesseract::OEM_DEFAULT);?
?//初始化,設置語言包,中文簡體:chi_sim;英文:eng;也可以自己訓練語言包??
STRING?text_out;???//定義輸出的變量?
if?(!api.ProcessPages(str,?NULL,?0,?&text_out))????
{????
return?0;????
}
cout<<text_out.string();??//輸出到命令行中
}
然后運行文件,可以發現將識別出的文字顯示在了命令行中。
總結
以上是生活随笔為你收集整理的VS2010调用tesseract步骤的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Matlab与C++混合编程(依赖Ope
- 下一篇: 关于main函数中argc和argv的简