机器视觉(十):印刷体字符识别
目錄:
機器視覺(一):概述
機器視覺(二):機器視覺硬件技術
機器視覺(三):攝像機標定技術
機器視覺(四):空域圖像增強
機器視覺(五):機器視覺與世界杯
機器視覺(六):頻域圖像增強
機器視覺(七):圖像分割
機器視覺(八):圖像特征提取
機器視覺(九):圖像配準
機器視覺(十):印刷體字符識別
機器視覺(十一):一維條碼識別
機器視覺(十二):二維條碼識別
🌏🧐以下為正文🦄🪐
????????模式識別是對圖像或各種物理對象的分類與描述的技術,在機器視覺中具有廣泛的應用,涉及到圖形、圖像和文字的識別,也涉及到有形物件的測量、分類與描述。
? ? ? ? 本章節主要介紹印刷體字符識別。
一、印刷體字符識別流程
①掃描輸入文本圖像;
②圖像的預處理,包括傾斜校正和濾除干擾噪聲等;
③圖像版面的分析和理解;
④圖像的行切分和字切分;
⑤單字圖像特征選擇和提取;
⑥單字圖像特征的模式分類;
⑦將被分類的模式賦予識別結果;
⑧識別結果的編輯修改后處理。
?一、字符圖像分割
?1.圖像亮度調整
????????在亮度過大的情況下,正常度量的閾值分割就會將本應保留的區域濾除,而亮度過小的情況下,很多噪聲點無法被濾除掉。
2.色彩分割
3.基于離散余弦變換(DCT for Discrete Cosine Transform)的頻域分割
????????離散余弦變換相當于一個長度大概是它兩倍的離散傅里葉變換,這個離散傅里葉變換是對一個實偶函數進行的(因為一個實偶函數的傅里葉變換仍然是一個實偶函數),在有些變形里面需要將輸入或者輸出的位置移動半個單位(DCT有8種標準類型,其中4種是常見的)。
????????在字符識別的應用中,字符區域按一定的行列結構分布,在頻域能夠呈現出特殊的能量分布,通常來說,其水平和垂直能量較大,高中頻分量更加豐富,因此可以通過這些頻域分布的特征將其與背景分割開來。
基于DCT的圖像頻域分割流程圖?4.基于小波變換(wavelet transform,WT)的圖像小波域分割
基于小波變換的圖像小波域分割流程圖二、字符區域校正與切分
1.基于哈夫變換的區域矯正
基于Hough變換的區域校正(在圖像的多層分辨率下分級進行Hough變換 )????????Hough變換主要用于圖像中直線的檢測。圖像中的字符多是橫向成串出現的,因此可以利用Hough變換的方法擬合字符串邊緣,形成字符串邊緣直線,從而求得字符傾角。
2.基于仿射變換的圖像旋轉
????????通過仿射變換矩陣,把旋轉后的圖像坐標仿射回原圖像點,并通過一定的方法計算出該點在原圖像上的灰度值,作為旋轉后圖像該點的灰度值。
? ? ??
3.字符圖像縮放
????????有些字符識別方法,需要將圖像大小指定在某一個標準上這就需要在識別前對該字符圖像區域大小進行歸一化。歸一化一般采用灰度插值的方法。最簡單的插值方法是最鄰近插值,即令輸出像素的灰度值等于離它所映射位置最近的輸入像素灰度值。但這種插值方法會使輸出圖像摻入鋸齒噪聲。
4.粘連字符切分
????????一串字符在結構和形態上存在如下特征:單個字符長寬比例一致;多個數字和英文字符輪廓存在凹凸結構;多數情況下字符不會出現重疊交叉。根據這些特點,可以檢測字符串凹凸結構,并結合字符長寬比來分割單個字符 。
總結
以上是生活随笔為你收集整理的机器视觉(十):印刷体字符识别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一看就会的奇偶分频电路
- 下一篇: java 代码佛像_论面向组合子程序设计