OpenCV修养(三)——图像处理(上)
文章目錄
- 致謝
- 3 圖像處理(上)
- 3.1 幾何變換
- 3.1.1 圖像縮放
- 3.1.2 圖像平移
- 3.1.3 圖像旋轉(zhuǎn)
- 3.1.4 仿射變換
- 3.2 圖像閾值
- 3.3 圖像平滑
- 3.3.1 圖像噪聲
- 3.3.1.1 椒鹽噪聲
- 3.3.1.2 高斯噪聲
- 3.3.2 均值濾波
- 3.3.3 方框?yàn)V波
- 3.3.4 高斯濾波
- 3.3.5 中值濾波
- 3.3.6 小結(jié)
- 3.4 形態(tài)學(xué)操作
- 3.4.1 連通性
- 3.4.1.1 鄰接
- 3.4.1.2 連通
- 3.4.2 腐蝕和膨脹
- 3.4.2.1 腐蝕
- 3.4.2.2 膨脹
- 3.4.3 開閉運(yùn)算
- 3.4.4 黑帽和禮帽
- 3.4.5 梯度
- 3.5 圖像梯度處理
- 3.5.1 Sobel算子
- 3.5.2 Scharr算子
- 3.5.3 laplacian算子
致謝
OpenCV高斯濾波GaussianBlur_godadream的博客-CSDN博客_gaussianblur
opencv 圖像平移、縮放、旋轉(zhuǎn)、翻轉(zhuǎn) 圖像仿射變換_Ibelievesunshine的博客-CSDN博客_opencv 圖像仿射變換
opencv 圖像變換原理詳解 圖像平移 圖像旋轉(zhuǎn) 圖像縮放 - 我堅(jiān)信陽光燦爛 - 博客園 (cnblogs.com)
3 圖像處理(上)
3.1 幾何變換
3.1.1 圖像縮放
cv2.resize(src,dsize,fx=0,fy=0,interpolation = cv2.INTER_LINEAR)
參數(shù):
- src:輸入圖像
- dsize:按固定比例縮小
- fx、fy:自定義比例縮小
- interpolation:插值方法
| cv2.INTER_LINEAR | 雙線性插值法 |
| cv2.INTER_NEAREST | 最近鄰插值 |
| cv2.INTER_AREA | 像素區(qū)域重采樣 |
| cv2.INTER_CUBIC | 雙三次插值 |
3.1.2 圖像平移
cv.warpAffine(src,M,dsize)
- src:輸入的圖像
- M:2×3的移動(dòng)矩陣
- 移動(dòng)矩陣通常為2*3,對(duì)于處于(x,y)的像素點(diǎn),要把他們移動(dòng)到(x+tx,y+tyx+t_x,y+t_yx+tx?,y+ty?),則只需構(gòu)建M = [10tx01ty]\left [\begin{array}{ccc}1&0&t_x \\0&1&t_y \end{array}\right][10?01?tx?ty??],并且該矩陣必須是np.fload32類型的矩陣
- dsize:輸出圖像的大小
out:
3.1.3 圖像旋轉(zhuǎn)
圖像旋轉(zhuǎn)是指圖像按照某個(gè)位置轉(zhuǎn)動(dòng)一定角度的過程,旋轉(zhuǎn)中圖像仍然保持原始尺寸。
同樣地,圖像的選擇也需要提供一個(gè)矩陣,我們?cè)诖朔Q其為旋轉(zhuǎn)矩陣,在openCV中,通過cv2.getRotationMatrix2D可以返回一個(gè)矩陣。
cv.warpAffine(src,M,dsize)
- src:輸入的圖像
- M:旋轉(zhuǎn)矩陣
- dsize:輸出圖像的大小
cv.getRotationMatrix2D(center,anger,scale)
- center:旋轉(zhuǎn)中心
- angle:旋轉(zhuǎn)角度
- scale:縮放比例
- return:旋轉(zhuǎn)矩陣
out:
3.1.4 仿射變換
圖像的仿射變換設(shè)計(jì)到圖像的形狀位置角度的變化,是深度學(xué)習(xí)預(yù)處理中常用到的一個(gè)功能。仿射變換的主要工作是對(duì)圖像進(jìn)行縮放、旋轉(zhuǎn)、翻轉(zhuǎn)、平移的一系列組合操作。
仿射變換的內(nèi)核是兩個(gè)點(diǎn):
- 變換前是直線的,變換后依然是直線
- 直線比例保持不變
在OpenCV中,仿射變換的矩陣是一個(gè)2×3的矩陣。如下所示:
M=[A,B]=[a00a01b0a10a11b1]M = [A,B] = \left[ \begin{array}{ccc} a_{00} & a_{01} & b_0\\ a_{10} & a_{11} & b_1\\ \end{array} \right ] M=[A,B]=[a00?a10??a01?a11??b0?b1??]
其中該矩陣的2×2子矩陣是線性變換矩陣,右邊2×1矩陣是平移項(xiàng)。
對(duì)于圖像中任一位置(x,y),仿射變換執(zhí)行的是如下的操作:
Taffine=A[xy]+B=M[xy1]T_{affine} = A\left[\begin{array}{ccc}x\\y\end{array}\right]+B = M\left[\begin{array}{ccc}x\\y\\1\end{array}\right]Taffine?=A[xy?]+B=M???xy1????
需要注意的是,對(duì)于圖像而言,寬度方向是x,高度方向是y,坐標(biāo)的順序和圖像像素對(duì)應(yīng)下標(biāo)一致。所以原點(diǎn)的位置不是左下角而是右上角,y的方向也不是向上,而是向下。
在仿射變換中,原圖中所有的平行線在結(jié)果圖像中同樣平行。為了創(chuàng)建這個(gè)矩陣我們需要從原圖像中找到三個(gè)點(diǎn)以及它們?cè)谳敵鰣D像中的位置,然后通過OpenCV提供的cv2.getAffineTransform來創(chuàng)建仿射變換的2*3矩陣。
import cv2 as cv import numpy as np import matplotlib.pyplot as plt import matplotlibmatplotlib.rcParams['font.family'] = 'SimHei'# 讀取圖像 img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")# 設(shè)置平移矩陣 rows, cols = img.shape[:2] pts1 = np.float32([[50, 50], [200, 50], [50, 200]]) pts2 = np.float32([[100, 100], [200, 50], [100, 250]]) M = cv.getAffineTransform(pts1, pts2) dst = cv.warpAffine(img, M, (cols, rows))# 圖像顯示 fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(10, 8), dpi=100) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("原圖") axes[1].imshow(dst[:, :, ::-1]) axes[1].set_title("平移后結(jié)果") plt.show()out:
3.2 圖像閾值
ret,dst = cv2.threshold(src,thresh,maxval,type)
- src:輸入圖,只能輸入單通道圖像,通常來說為灰度圖
- dst:輸出圖
- thresh:閾值
- maxval:當(dāng)像素值超過了閾值,所賦予的值
- type:二值化操作的類型
- cv2.THRESH_BINARY:超過閾值部分取maxval,否則取0
- cv2.THRESH_BINARY_INV:THRESH_BINARY的反轉(zhuǎn)
- cv2.THRESH_TRUNC:大于閾值部分設(shè)為閾值,否則不變
- cv2.THRESH_TOZERO:大于閾值部分不改變,否則設(shè)為0
- cv2.THRESH_TOZERO_INV:cv2.THRESH_TOZERO的反轉(zhuǎn)
out:
3.3 圖像平滑
3.3.1 圖像噪聲
由于圖像采集、處理、傳輸?shù)冗^程不可避免的會(huì)受到噪聲的污染,妨礙人們對(duì)圖像理解及分析處理,常見的噪聲有高斯噪聲、椒鹽噪聲等。
3.3.1.1 椒鹽噪聲
椒鹽噪聲也稱為脈沖噪聲,是圖像中經(jīng)常見到的一種噪聲,它是一種隨機(jī)出現(xiàn)的白點(diǎn)或者黑點(diǎn),其出現(xiàn)的原因可能是因?yàn)橛跋裼嵦?hào)受到突如其來的強(qiáng)烈干擾而產(chǎn)生。如下圖所示:
3.3.1.2 高斯噪聲
高斯噪聲滿足高斯分布。
3.3.2 均值濾波
均值濾波實(shí)際上就是深度學(xué)習(xí)里面的平均池化。
讓我們先給出一張帶有噪點(diǎn)的圖片,以便下面做處理。
我們來解釋一下池化的含義。
池化是卷積神經(jīng)網(wǎng)絡(luò)CNN的術(shù)語。認(rèn)識(shí)什么是池化之前,我們要先了解什么是卷積,卷積就是通過一個(gè)小型矩陣(卷積核)對(duì)原圖片矩陣做掃描來輸入另外一個(gè)矩陣,這個(gè)另外的矩陣我們叫做卷積層。
小型矩陣和原圖片矩陣的映射關(guān)系是通過互相關(guān)運(yùn)算來實(shí)現(xiàn)的,即對(duì)應(yīng)的元素相乘在相加。如下圖所示:
理解了原理就好說了。池化層也是通過某種關(guān)系來輸出新矩陣的,根據(jù)這種關(guān)系我們將池化層分為平均池化層和最大池化層,其本質(zhì)是用一個(gè)n×n的卷積核去掃描,而這個(gè)卷積核是沒有數(shù)字的,且他也不和原圖片做互相關(guān)運(yùn)算。如果是平均池化層,那么是輸出卷積核覆蓋區(qū)域的平均數(shù);而如果是最大池化層,則輸出卷積核覆蓋區(qū)域的最大數(shù)。
舉個(gè)例子,用2×2的池化窗口去掃描,如果窗口內(nèi)的值是
-
max(0,1,3,4)=4,
-
max(1,2,4,5)=5,
-
max(3,4,6,7)=7,
-
max(4,5,7,8)=8。
說完了池化,讓我們回到濾波器。實(shí)際上,均值濾波的本質(zhì)實(shí)際上就是平均池化窗口。
讓我們?cè)囍鴮?duì)上面的圖片做一下均值濾波處理。
import cv2 as cv import matplotlib.pyplot as plt import numpy as npimg = cv.imread(r"C:\Users\13966\Desktop\Test03.jpg") blur_img = cv.blur(img, (3, 3)) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(blur_img[:, :, ::-1]) axes[1].set_title("blur_img") plt.show()out:
3.3.3 方框?yàn)V波
cv2.boxFilter( src, ddepth, ksize, anchor, normalize, borderType)
- src指的是處理的圖像
- ddepth:處理結(jié)果圖像的圖像深度,一般使用1 表示與原始圖像使用相同的圖像深度
- normalize:是否進(jìn)行歸一化
方框?yàn)V波使用歸一化時(shí)效果和均值濾波完全一樣,而不使用歸一化時(shí),超過255的像素點(diǎn)默認(rèn)會(huì)變成255,,如下所示。
import cv2 as cv import matplotlib.pyplot as pltimg = cv.imread(r"C:\Users\13966\Desktop\Test03.jpg") blur_img = cv.boxFilter(img, -1, (3, 3), normalize=False) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(blur_img[:, :, ::-1]) axes[1].set_title("blur_img") plt.show()out:
3.3.4 高斯濾波
cv2.GaussianBlur(src, ksize, sigmaX, sigmaY=0, borderType=BORDER_DEFAULT);
-
src:輸入圖像
-
ksize:高斯卷積核的大小
-
sigmaX:表示水平方向的標(biāo)準(zhǔn)差
sigmaY:表示垂直方向的標(biāo)準(zhǔn)差,默認(rèn)為0,表示于sigmaX相同
- borderType:邊緣填充類型,默認(rèn)無填充
高斯濾波器(卷積核)里的數(shù)值滿足高斯分布。
高斯濾波是一種線性平滑濾波,適用于消除高斯噪聲,廣泛應(yīng)用于圖像處理的減噪過程。通俗的講,高斯濾波就是對(duì)整幅圖像進(jìn)行加權(quán)平均的過程,每一個(gè)像素點(diǎn)的值,都由其本身和領(lǐng)域內(nèi)的其他像素值經(jīng)過加權(quán)平均后得到。
import cv2 as cv import matplotlib.pyplot as pltimg = cv.imread(r"C:\Users\13966\Desktop\Test03.jpg") blur_img = cv.GaussianBlur(img, (3, 3), 1) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(blur_img[:, :, ::-1]) axes[1].set_title("blur_img") plt.show()out:
3.3.5 中值濾波
中值濾波是效果最好的濾波器,它是這么做的。用一個(gè)n×n(n一般為奇數(shù))的卷積核去掃描一副圖像,在卷積核每一次覆蓋到的位置中,將里面所有的數(shù)字從小到大排列后取中位數(shù),用中位數(shù)替換卷積核所在位置的中間值。如下圖所示:
import cv2 as cv import matplotlib.pyplot as pltimg = cv.imread(r"C:\Users\13966\Desktop\Test03.jpg") blur_img = cv.medianBlur(img, 5) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(blur_img[:, :, ::-1]) axes[1].set_title("blur_img") plt.show()out:
3.3.6 小結(jié)
圖像處理中,常用的濾波算法有均值濾波、中值濾波以及高斯濾波等。
兩種噪聲:
| 椒鹽噪聲 | 圖像中隨機(jī)出現(xiàn)的白點(diǎn)或者黑點(diǎn) |
| 高斯噪聲 | 噪聲的概率分布是正態(tài)分布 |
三種濾波器的對(duì)比:
| 均值濾波 | 使用模板內(nèi)所有像素的平均值代替模板中心像素灰度值 | 算法簡(jiǎn)單計(jì)算速度快,易收到噪聲的干擾,不能完全消除噪聲,只能相對(duì)減弱噪聲 |
| 中值濾波 | 計(jì)算模板內(nèi)所有像素中的中值,并用所計(jì)算出來的中值體改模板中心像素的灰度值 | 對(duì)噪聲不是那么敏感,能夠較好的消除椒鹽噪聲,但是容易導(dǎo)致圖像的不連續(xù)性 |
| 高斯濾波 | 對(duì)圖像鄰域內(nèi)像素進(jìn)行平滑時(shí),鄰域內(nèi)不同位置的像素被賦予不同的權(quán)值 | 對(duì)圖像進(jìn)行平滑的同時(shí),同時(shí)能夠更多的保留圖像的總體灰度分布特征,對(duì)于高斯噪聲處理效果很好 |
我不是很建議你在初次學(xué)習(xí)的時(shí)候深究這些濾波器背后的數(shù)學(xué)原理,因?yàn)閷?duì)于數(shù)學(xué)基礎(chǔ)不好的人來說一旦陷進(jìn)去對(duì)自己的打擊很大。
3.4 形態(tài)學(xué)操作
形態(tài)學(xué)轉(zhuǎn)換是基于圖像形狀的一些簡(jiǎn)單操作,它通常在二進(jìn)制圖像上執(zhí)行。腐蝕和膨脹是兩個(gè)基本的形態(tài)學(xué)運(yùn)算符,他也有一些變體形式,如開運(yùn)算、閉運(yùn)算、禮帽黑帽等。
3.4.1 連通性
3.4.1.1 鄰接
在圖像中,最小的單位是像素,每個(gè)像素周圍有8個(gè)鄰接像素。常見的鄰接關(guān)系有3種:4鄰接、8鄰接和D鄰接。
其中我們用N4(p)N_4(p)N4?(p)表示像素p的4鄰接,同理ND(p)N_D(p)ND?(p),N8(p)N_8(p)N8?(p)。
3.4.1.2 連通
連通性是描述區(qū)域和邊界的重要概念,兩個(gè)像素連通的兩個(gè)必要條件是:
- 兩個(gè)像素的位置是否相鄰
- 兩個(gè)像素的灰度值是否滿足特定的相似性準(zhǔn)則
連通也分三種,即4連通、8連通和m連通。
- 4連通:對(duì)于具有值V的像素p和q,如果q在集合N4(p)N_4(p)N4?(p)中,則稱這兩個(gè)像素是4連通。
- 8連通:對(duì)于具有值V的像素p和q,如果q在集合N8(p)N_8(p)N8?(p)中,則稱這兩個(gè)像素是8連通。
- m連通:m連通就是同時(shí)滿足4連通和D連通即為m連通。
3.4.2 腐蝕和膨脹
腐蝕和膨脹是最基本的形態(tài)學(xué)操作,其都是針對(duì)白色部分而言。換而言之就是對(duì)高亮區(qū)域的擴(kuò)大與縮小。
3.4.2.1 腐蝕
腐蝕的具體操作是用一個(gè)結(jié)構(gòu)元素掃描圖像中的每一個(gè)元素,用結(jié)構(gòu)元素中的每一個(gè)元素與其覆蓋的像素做“與”操作,如果都為1,則該像素為1,否則為0。如下圖所示,結(jié)構(gòu)A被結(jié)構(gòu)B(我們暫且看做是卷積核)腐蝕后:
腐蝕的作用就是消除物體邊界點(diǎn),使目標(biāo)縮小,其可以消除小于結(jié)構(gòu)元素的噪聲點(diǎn)。通俗來說就是讓白色部分變小。
cv.erode(src,kernel,iterations,borderType,bordervalue)
- src:要處理的圖像
- kernel:核結(jié)構(gòu)
- iterations:腐蝕次數(shù),默認(rèn)為1
- borderType:填充類型
- bordervalue:填充值
out:
3.4.2.2 膨脹
膨脹的具體操作是用一個(gè)結(jié)構(gòu)元素掃描圖像中的每一個(gè)元素,用結(jié)構(gòu)元素中的每一個(gè)元素與其覆蓋的像素做“與”操作,如果都為0,則該像素為0,否則為1。其原理和腐蝕很像的,我就不畫圖了,太累了。通俗來講,膨脹實(shí)際上就是擴(kuò)大白色部分。
cv.dilate(src,kernel,iterations,borderType,bordervalue)
- src:要處理的圖像
- kernel:核結(jié)構(gòu)
- iterations:腐蝕次數(shù),默認(rèn)為1
- borderType:填充類型
- bordervalue:填充值
out:
3.4.3 開閉運(yùn)算
開運(yùn)算和閉運(yùn)算和按照一定的次序去進(jìn)行腐蝕和膨脹,但將原圖開運(yùn)算后是無法通過閉運(yùn)算返回原圖的。
開運(yùn)算是先腐蝕后膨脹,其作用是分離物體,消除小區(qū)域。說成人話就是,如果你的圖像是全是黑的,但是其中有一些白色的噪聲點(diǎn),那么開運(yùn)算可以使你的圖片先去除白色噪聲,然后又恢復(fù)原來的圖片,這實(shí)際上是一個(gè)去除毛刺的操作;閉運(yùn)算是先膨脹后腐蝕,其作用是消除/閉合物體里面的孔洞,可以填充閉合區(qū)域。說成人話就是,先膨脹讓白色噪聲變大,后腐蝕白色噪聲就無法消除了,所以所得圖片應(yīng)該是和原圖差不多的白色噪聲或比原圖還大的白色噪聲。說了我們也聽不太懂,我們?cè)囍鴣硖幚硪幌隆?/p>
cv.morphologyEx(src,op,kernel)
- src:要處理的圖像
- op:處理的方式,進(jìn)行開運(yùn)算則cv.MORPH_OPEN,若進(jìn)行閉運(yùn)算,則設(shè)為cv.MORPH_CLOSE
- Kernel:核結(jié)構(gòu)
有沒有感覺,這車子有點(diǎn)快跑出來的感覺。
import cv2 as cv import matplotlib.pyplot as plt import numpy as npimg = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg") kernel = np.ones((3, 3)) new_img = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("new_img") plt.show()3.4.4 黑帽和禮帽
禮帽運(yùn)算實(shí)際上是原圖像和開運(yùn)算結(jié)果之差。
試想,開運(yùn)算實(shí)際上就是消除白色毛刺,而原圖像又帶有刺,你用帶有刺的減去沒帶刺的,得到的結(jié)果(禮帽)不就是只有刺的圖了嗎。
開運(yùn)算雖然優(yōu)化了圖片,但是放大了裂縫或者局部低亮度的區(qū)域,因此,從原圖中減去開運(yùn)算后的圖,得到的效果圖突出了比原圖輪廓周圍的區(qū)域更明亮的區(qū)域,且這一操作和選擇的核的大小有關(guān)。
而黑帽運(yùn)算實(shí)際上是閉運(yùn)算和原圖像之差。簡(jiǎn)單來說,閉運(yùn)算使得噪聲變大或不變,減去原圖像,得到的就是噪聲的輪廓。
黑帽運(yùn)算后的效果圖突出了比原圖輪廓周圍的區(qū)域更暗的區(qū)域,且這一操作和選擇的核的大小有關(guān)。
黑帽運(yùn)算用來分離比鄰近點(diǎn)暗一些的斑塊。
同樣的,黑帽運(yùn)算和禮帽運(yùn)算使用的是與開閉運(yùn)算一樣的API。
cv.morphologyEx(src,op,kernel)
- op部分選擇MORPH_TOPHAT則為禮帽,選擇MORPH_BLACKHAT則為黑帽
out:
3.4.5 梯度
做一個(gè)梯度運(yùn)算實(shí)際上就是先膨脹,再拿原圖膨脹的結(jié)果減去原圖腐蝕的結(jié)果。膨脹擴(kuò)大白色區(qū)域,腐蝕縮小白色區(qū)域,兩個(gè)一做差,那么得到的肯定是白色區(qū)域的輪廓。如下圖所示:
import cv2 as cv import matplotlib.pyplot as plt import numpy as npimg = cv.imread(r"C:\Users\13966\Desktop\Test04.jpg") kernel = np.ones((3, 3)) new_img = cv.morphologyEx(img, cv.MORPH_GRADIENT, kernel) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("new_img") plt.show()3.5 圖像梯度處理
3.5.1 Sobel算子
如上圖,我們?nèi)绻趫D中畫一根紅線,紅線的左右有梯度嗎?明顯地,這里我們講的梯度可以用一個(gè)更簡(jiǎn)單的詞來代替,即色差。可以看出,這條紅線左右是不存在梯度的。
那我們不禁想問,哪里有梯度呢?當(dāng)然是這個(gè)白圈的邊緣了。
在形態(tài)學(xué)操作中,我們似乎都是用一個(gè)核去掃描圖像,在這里我們同樣這么做。我們可以用以下的卷積核去檢測(cè)區(qū)域的左右邊緣。
Gx=[?10+1?20+2?10+1]?AG_x = \left[\begin{array}{cc}-1&0&+1\\ -2&0&+2\\ -1&0&+1\end{array}\right]*A Gx?=????1?2?1?000?+1+2+1?????A
我們可以用以下的卷積核去檢測(cè)區(qū)域的上下邊緣。
Gy=[?1?2?1000+1+2+1]?AG_y = \left[\begin{array}{cc}-1&-2&-1\\ 0&0&0\\ +1&+2&+1\end{array}\right]*A Gy?=????10+1??20+2??10+1?????A
我們把以上兩個(gè)卷積核叫做Sobel算子矩陣,其用于增強(qiáng)邊緣的差異。當(dāng)檢測(cè)目標(biāo)區(qū)域邊緣時(shí),我們可以用對(duì)應(yīng)的核與目標(biāo)區(qū)域做互相關(guān)運(yùn)算。拿GxG_xGx?來說,其計(jì)算的結(jié)果我們可以看成是0列左右的差異值,即看成是梯度。
說完原理,讓我們看一下在OpenCV中如何使用Sobel算子。
dst = cv2.Sobel(src,ddepth,dx,dy,ksize)
- ddeph:圖像深度
- dx和dy分別表示水平和豎直方向
- ksize是Sobel算子的大小
out:
從指定參數(shù)和輸出結(jié)果來看,由于在sobel中我們指定參數(shù)dy = 0,dx = 1,說明使用上述Sobel算子矩陣GxG_xGx?。此矩陣右邊為正左邊為負(fù)。在圖像中,看往左半邊圓圈為白(255)方框?yàn)楹?0),則結(jié)果Sobel運(yùn)算后得出結(jié)果為正數(shù),所以得出的圖像左半圈留白明顯。其他情況也可按照上述推導(dǎo)過程推出結(jié)果,這里不過多贅述。
在Sobel運(yùn)算中,白到黑是正數(shù),黑到白是負(fù)數(shù),而負(fù)數(shù)會(huì)被截?cái)喑?,所以通常我們要取絕對(duì)值。
import cv2 import cv2 as cv import matplotlib.pyplot as plt import numpy as npimg = cv.imread(r"C:\Users\13966\Desktop\Test04.jpg") # kernel = np.ones((3, 3)) new_img = cv.Sobel(img, cv2.CV_64F, 1, 0, ksize=3) new_img = cv2.convertScaleAbs(new_img) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("new_img") plt.show()out:
當(dāng)你想要同時(shí)檢測(cè)左右邊緣和上下邊緣時(shí),同時(shí)對(duì)參數(shù)dx和dy設(shè)為1未嘗不可,但是由于dx設(shè)為1時(shí)上下會(huì)黑,dy設(shè)為1時(shí)左右會(huì)黑,當(dāng)同時(shí)開啟時(shí),可以會(huì)導(dǎo)致上下左右都會(huì)黑,而不會(huì)出現(xiàn)完美檢測(cè)輪廓的效果。如下圖所示:
import cv2 import cv2 as cv import matplotlib.pyplot as pltimg = cv.imread(r"C:\Users\13966\Desktop\Test04.jpg") new_img = cv.Sobel(img, cv2.CV_64F, 1, 1, ksize=3) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("new_img") plt.show()out:
為此,我們可以分別求解GxG_xGx?和GyG_yGy?,然后將兩者用圖像混合操作按比例混合即可。如下所示:
import cv2 import cv2 as cv import matplotlib.pyplot as plt import numpy as npimg = cv.imread(r"C:\Users\13966\Desktop\Test04.jpg") new_img_x = cv.Sobel(img, cv2.CV_64F, 1, 0, ksize=3) new_img_y = cv.Sobel(img, cv2.CV_64F, 0, 1, ksize=3) new_img = cv.addWeighted(new_img_x, 0.5, new_img_y, 0.5, 0) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("image") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("new_img") plt.show()out:
上面的圖片似乎不是很能看出效果,我們用另外一張圖片來看看效果:
import cv2 import cv2 as cv import matplotlib.pyplot as plt import matplotlibmatplotlib.rcParams['font.family']='SimHei'img = cv.imread(r"C:\Users\13966\Desktop\Test02.jpg") new_img = cv.Sobel(img, cv2.CV_64F, 1, 1, ksize=3) new_img_x = cv.Sobel(img, cv2.CV_64F, 1, 0, ksize=3) new_img_y = cv.Sobel(img, cv2.CV_64F, 0, 1, ksize=3) new_img1 = cv.addWeighted(new_img_x, 0.5, new_img_y, 0.5, 0) fig, axes = plt.subplots(nrows=1, ncols=3) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("原圖") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("指定參數(shù)效果") axes[2].imshow(new_img1[:, :, ::-1]) axes[2].set_title("混合效果") plt.show()out:
3.5.2 Scharr算子
Scharr算子與Sobel算子類似,只不過它對(duì)于邊緣的檢測(cè)效果會(huì)放大。
Gx=[?303?10010?303]?AG_x = \left[\begin{array}{cc}-3&0&3\\ -10&0&10\\ -3&0&3\end{array}\right]*A Gx?=????3?10?3?000?3103?????A
Gy=[?3?10?3000?3?10?3]?AG_y = \left[\begin{array}{cc}-3&-10&-3\\ 0&0&0\\ -3&-10&-3\end{array}\right]*A Gy?=????30?3??100?10??30?3?????A
我們來看看它對(duì)于圖片的處理效果:
import cv2 import cv2 as cv import matplotlib.pyplot as plt import matplotlibmatplotlib.rcParams['font.family'] = 'SimHei'img = cv.imread(r"C:\Users\13966\Desktop\Test02.jpg") new_img_x = cv.Scharr(img, cv2.CV_64F, 1, 0) new_img_y = cv.Scharr(img, cv2.CV_64F, 0, 1) new_img = cv.addWeighted(new_img_x, 0.5, new_img_y, 0.5, 0) fig, axes = plt.subplots(nrows=1, ncols=2) axes[0].imshow(img[:, :, ::-1]) axes[0].set_title("原圖") axes[1].imshow(new_img[:, :, ::-1]) axes[1].set_title("Scharr算子效果") plt.show()out:
3.5.3 laplacian算子
laplacian算子和上述兩個(gè)算子不同,其由二階導(dǎo)組成,對(duì)于一些邊緣十分敏感,這雖然能夠提高精度,但是卻易受噪點(diǎn)影響。
G=[0131?41010]G = \left[\begin{array}{cc}0&1&3\\ 1&-4&1\\ 0&1&0\end{array}\right] G=???010?1?41?310????
對(duì)于拉普拉斯算子,其由于是二階導(dǎo),所以不必在添加dx和dy參數(shù)。如下所示:
out:
總結(jié)
以上是生活随笔為你收集整理的OpenCV修养(三)——图像处理(上)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 网吧管理系统数据库设计
- 下一篇: 监控视频统一汇聚集中录像存储方案