深度学习系列之CNN核心内容
導讀
怎么樣來理解最近異常火熱的深度學習網(wǎng)絡?深度學習有什么亮點呢?答案其實很簡答,今年十月份有幸參加了深圳高交會的中科院院士論壇,IEEE fellow湯曉歐做了一場精彩的報告,這個問題被湯大神一語道破,他說深度學習網(wǎng)絡說白了就是一個多層的神經網(wǎng)絡。同20年前相比,計算機硬件性能提升很多,有了實現(xiàn)處理大數(shù)據(jù)和并行運算的能力,deep learning才被重新重視起來。這里,再重復一遍CNN的實質:CNN就是一個更深層次、具有更多節(jié)點的ANN網(wǎng)絡,但與簡單的ANN相比:CNN主要是卷積使得權值共享,降低連接的數(shù)量級,同時兼顧二維特征;從算法層面上,CNN的核心還是同BP網(wǎng)絡一樣權值正向傳播誤差反向傳播,并利用誤差來更新每一層的權值。
DNN的背景
DNN,deep neural network,近幾年機器學習算法中崛起的旗艦方法,作為分類精度最高、處理高維大數(shù)據(jù)的算法,挽救了機器學習在半個世紀里發(fā)展緩慢的頹勢,也為人工智能新領域的拓展起著重要作用,來看看最近一些IT巨頭在深度學習領域中的開展的工作。
2012年,《紐約時報》報道的google Brian項目,引起廣泛關注,這個項目由機器學習領域大師級人物吳恩達和大規(guī)模計算機系統(tǒng)方面的世界頂級專家JeffDean主導,使用萬為數(shù)量級的CPU數(shù)量搭建并行計算平臺,模擬出10億數(shù)量級的神經節(jié)點,讓這個巨大的系統(tǒng)收看YouTube視頻能夠自學習和識別具有一個小孩的智力水平。微軟在天津舉辦一次公開的活動展示了全自動的同聲傳譯系統(tǒng),演講者用英語說話,后臺計算機一氣呵成地完成語音識別、英中文翻譯、語音合成,效果非常流暢。這個系統(tǒng)背后的關鍵技術就是DNN,或者說DL(Deep Learning)。2013年,李彥宏在百度年會上高調宣布成立“深度學習研究院”。
Why DNN
深度學習,體現(xiàn)出仿生生物學和人工智能等領域的光輝思想,借用獲得諾貝爾生理學獎的“視覺分層”理論,深度學習采用多層的分層形式來模擬視覺系統(tǒng)的原理,從底層的像素獲取形狀方向,到大腦皮層不同區(qū)域抽象迭代獲得局部特征,再到提取高層特征直到能夠簡單識別出模式。正因為深度學習神經網(wǎng)絡中的深層次結構,能夠無遺漏地提取樣本特征,具有強大的分類能力,所以深度學習相比于其他機器學習的算法,能夠降低誤差率,成為近年來非常熱門的算法。
深度學習有著多層深層的層次結構,將底層的特征不斷抽象和迭代出可標示的特征,能夠發(fā)現(xiàn)大數(shù)據(jù)中的復雜結構,具有強大的分類能力,因而在視頻圖像識別、語音識別、海量文本分類等方面具有重要應用。
深度學習的思想是通過深層網(wǎng)絡的結構自動學習和提取海量數(shù)據(jù)的特征。如果將深度學習網(wǎng)絡看成一個信號處理系統(tǒng),輸入是一堆數(shù)據(jù)(一批圖片或一疊文本),通過多層網(wǎng)絡 (i=1,2..)的處理后無損地得到輸出,形象表示為: I=>S1=>S2=>…=>Sn => O,如果I和O相等,說明該系統(tǒng)能夠無損處理輸入信號,這樣可以不斷迭代訓練網(wǎng)絡得到一個多層網(wǎng)絡 每層網(wǎng)絡從低到高來表述特征。所以深度學習的目的就是訓練這個多層網(wǎng)絡,得到正確的分類參數(shù)。深度學習網(wǎng)絡的目前主流的模型主要有三種,深度信念網(wǎng)絡,受限玻爾茲曼機和卷積神經網(wǎng)絡。這里主要講解機器學習課程上的卷積神經網(wǎng)絡模型。
How CNN work
這里從兩個方面來闡述這個龐大的問題:
- 理論方面
例如,CNN如何權值正向傳播并進行誤差反向?卷積過程?
- 實例代碼講解
例如,如何使用matlab工具箱構建CNN網(wǎng)絡?如何訓練網(wǎng)絡?
Typical Example
這里就機器學習方面的大師級人物LecunYann設計訓練的CNN網(wǎng)絡模型來說明問題,。
CNN流程圖詳解
---------------------
原文:https://blog.csdn.net/wqthaha/article/details/46669835
總結
以上是生活随笔為你收集整理的深度学习系列之CNN核心内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图像处理与计算机视觉开源软件库及学习站点
- 下一篇: 数据挖掘 概念与技术(原书第3版)