全连接层FC
                            
                            
                            作者:魏秀參
鏈接:https://www.zhihu.com/question/41037974/answer/150522307
來源:知乎
 
  
 
                        
                        
                        鏈接:https://www.zhihu.com/question/41037974/answer/150522307
來源:知乎
全連接層到底什么用?我來談三點(diǎn)。
- 全連接層(fully connected layers,FC)在整個卷積神經(jīng)網(wǎng)絡(luò)中起到“分類器”的作用。如果說卷積層、池化層和激活函數(shù)層等操作是將原始數(shù)據(jù)映射到隱層特征空間的話,全連接層則起到將學(xué)到的“分布式特征表示”映射到樣本標(biāo)記空間的作用。在實際使用中,全連接層可由卷積操作實現(xiàn):對前層是全連接的全連接層可以轉(zhuǎn)化為卷積核為1x1的卷積;而前層是卷積層的全連接層可以轉(zhuǎn)化為卷積核為hxw的全局卷積,h和w分別為前層卷積結(jié)果的高和寬(注1)。
- 目前由于全連接層參數(shù)冗余(僅全連接層參數(shù)就可占整個網(wǎng)絡(luò)參數(shù)80%左右),近期一些性能優(yōu)異的網(wǎng)絡(luò)模型如ResNet和GoogLeNet等均用全局平均池化(global average pooling,GAP)取代FC來融合學(xué)到的深度特征,最后仍用softmax等損失函數(shù)作為網(wǎng)絡(luò)目標(biāo)函數(shù)來指導(dǎo)學(xué)習(xí)過程。需要指出的是,用GAP替代FC的網(wǎng)絡(luò)通常有較好的預(yù)測性能。具體案例可參見我們在ECCV'16(視頻)表象性格分析競賽中獲得冠軍的做法:「冠軍之道」Apparent Personality Analysis競賽經(jīng)驗分享 - 知乎專欄 ,project:Deep Bimodal Regression for Apparent Personality Analysis
- 在FC越來越不被看好的當(dāng)下,我們近期的研究發(fā)現(xiàn),FC可在模型表示能力遷移過程中充當(dāng)“防火墻”的作用。具體來講,假設(shè)在ImageNet上預(yù)訓(xùn)練得到的模型為 ,則ImageNet可視為源域(遷移學(xué)習(xí)中的source domain)。微調(diào)(fine tuning)是深度學(xué)習(xí)領(lǐng)域最常用的遷移學(xué)習(xí)技術(shù)。針對微調(diào),若目標(biāo)域(target domain)中的圖像與源域中圖像差異巨大(如相比ImageNet,目標(biāo)域圖像不是物體為中心的圖像,而是風(fēng)景照,見下圖),不含F(xiàn)C的網(wǎng)絡(luò)微調(diào)后的結(jié)果要差于含F(xiàn)C的網(wǎng)絡(luò)。因此FC可視作模型表示能力的“防火墻”,特別是在源域與目標(biāo)域差異較大的情況下,FC可保持較大的模型capacity從而保證模型表示能力的遷移。(冗余的參數(shù)并不一無是處。)
 
注1: 有關(guān)卷積操作“實現(xiàn)”全連接層:
以VGG-16為例,對224x224x3的輸入,最后一層卷積可得輸出為7x7x512,如后層是一層含4096個神經(jīng)元的FC,則可用卷積核為7x7x512x4096的全局卷積來實現(xiàn)這一全連接運(yùn)算過程,其中該卷積核參數(shù)如下:
“filter size = 7, padding = 0, stride = 1, D_in = 512, D_out = 4096”
經(jīng)過此卷積操作后可得輸出為1x1x4096。
如需再次疊加一個2048的FC,則可設(shè)定參數(shù)為“filter size = 1, padding = 0, stride = 1, D_in = 4096, D_out = 2048”的卷積層操作。
 
總結(jié)
 
                            
                        - 上一篇: CentOS 7系统上制作Clonezi
- 下一篇: arduino控制寻迹传感器
