深度学习中不变性是什么?平移不变性Translation Invariance、旋转/视角不变性Ratation/Viewpoint Invariance、尺度不变性Size、Illumination
文章目錄
- 不變性定義
- 不變性分類
- 為什么卷積神經(jīng)網(wǎng)絡(luò)具有平移不變性
不變性定義
意味著即使目標(biāo)的外觀發(fā)生了某種變化,但是你依然可以把它識別出來。這對圖像分類來說是一種很好的特性,因為我們希望圖像中目標(biāo)無論是被平移,被旋轉(zhuǎn),還是被縮放,甚至是不同的光照條件、視角,都可以被成功地識別出來。
不變性分類
- 平移不變性:Translation Invariance
- 旋轉(zhuǎn)/視角不變性:Ratation/Viewpoint Invariance
- 尺度不變性:Size Invariance
- 光照不變性:Illumination Invariance
為什么卷積神經(jīng)網(wǎng)絡(luò)具有平移不變性
簡單地說,卷積+最大池化約等于平移不變性。
卷積:簡單地說,圖像經(jīng)過平移,相應(yīng)的特征圖上的表達(dá)也是平移的。下圖只是一個為了說明這個問題的例子。輸入圖像的左下角有一個人臉,經(jīng)過卷積,人臉的特征(眼睛,鼻子)也位于特征圖的左下角。
假如人臉特征在圖像的左上角,那么卷積后對應(yīng)的特征也在特征圖的左上角。
在神經(jīng)網(wǎng)絡(luò)中,卷積被定義為不同位置的特征檢測器,也就意味著,無論目標(biāo)出現(xiàn)在圖像中的哪個位置,它都會檢測到同樣的這些特征,輸出同樣的響應(yīng)。比如人臉被移動到了圖像左下角,卷積核直到移動到左下角的位置才會檢測到它的特征。
池化:比如最大池化,它返回感受野中的最大值,如果最大值被移動了,但是仍然在這個感受野中,那么池化層也仍然會輸出相同的最大值。這就有點(diǎn)平移不變的意思了。
所以這兩種操作共同提供了一些平移不變性,即使圖像被平移,卷積保證仍然能檢測到它的特征,池化則盡可能地保持一致的表達(dá)。
參考文章1:卷積神經(jīng)網(wǎng)絡(luò)為什么具有平移不變性?
參考文章2:深度學(xué)習(xí)基礎(chǔ)–卷積神經(jīng)網(wǎng)絡(luò)的不變性
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的深度学习中不变性是什么?平移不变性Translation Invariance、旋转/视角不变性Ratation/Viewpoint Invariance、尺度不变性Size、Illumination的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python tensorflow tf
- 下一篇: 平移不变性:Translation In