人工智能、机器学习、深度学习的关系,终于有人讲明白了
作者:史丹青
來源:大數(shù)據(jù)DT(ID:hzdashuju)
2012年以后,信息爆炸帶來的數(shù)據(jù)量猛增、計算機算力的高速提升、深度學習的出現(xiàn)以及運用,使人工智能的研究領域不斷擴展,迎來大爆發(fā)。除了傳統(tǒng)的專家系統(tǒng)、機器學習等,進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統(tǒng)也接二連三有了里程碑式的成果[1],見圖1-10。
▲圖1-10 人工智能的分支
機器學習屬于人工智能的分支之一,且處于核心地位。顧名思義,機器學習的研究旨在讓計算機學會學習,能夠模擬人類的學習行為,建立學習能力,實現(xiàn)識別和判斷。機器學習使用算法來解析海量數(shù)據(jù),從中找出規(guī)律,并完成學習,用學習出來的思維模型對真實事件做出決策和預測。這種方式也稱為“訓練”。
深度學習是機器學習的一種實現(xiàn)技術,在2006年被Hinton等人首次提出。深度學習遵循仿生學,源自神經(jīng)元以及神經(jīng)網(wǎng)絡的研究,能夠模仿人類神經(jīng)網(wǎng)絡傳輸和接收信號的方式,進而達到學習人類的思維方式的目的[2]。
簡而言之,機器學習是一種實現(xiàn)人工智能的方法,深度學習是一種實現(xiàn)機器學習的技術,而生成對抗網(wǎng)絡則是深度學習中的一種分類。它們之間的關系可以通過圖1-11清晰地表示。
▲圖1-11 人工智能、機器學習、深度學習與生成對抗網(wǎng)絡四者的關系
01 機器學習分類
在機器學習或者人工智能領域,有幾種主要的學習方式:監(jiān)督式學習、無監(jiān)督式學習、強化學習。監(jiān)督式學習主要用于回歸和分類,無監(jiān)督式學習主要用于聚類。
1.?監(jiān)督式學習
監(jiān)督式學習[3]是從有標簽訓練集中學到或建立一個模式,并根據(jù)此模式推斷新的實例。訓練集由輸入數(shù)據(jù)(通常是向量)和預期輸出標簽所組成。當函數(shù)的輸出是一個連續(xù)的值時稱為回歸分析,當預測的內容是一個離散標簽時,稱為分類。
2.?無監(jiān)督式學習
無監(jiān)督式學習[4]是另外一種比較常用的學習方法,與監(jiān)督式學習不同的是,它沒有準確的樣本數(shù)據(jù)進行訓練。
舉個例子,比如我們去看畫展,如果我們對藝術一無所知,是很難直接區(qū)分出藝術品的流派的。但當我們?yōu)g覽完所有的畫作,則可以有一個大概的分類,即使不知道這些分類對應的準確繪畫風格是什么,也可以把觀看過的某兩個作品歸為一個類型。
這就是無監(jiān)督式學習的流程,并不需要人力來輸入標簽,適用于聚類,把相似的東西聚在一起,而無須考慮這一類到底是什么。
3.?強化學習
強化學習[5]是另外一種重要的機器學習方法,強調如何基于環(huán)境而行動,以取得最大化的預期利益。在這種模式下,輸入的樣本數(shù)據(jù)也會對模型進行反饋,不過不像監(jiān)督式學習那樣直接告訴正確的分類,強化學習的反饋僅僅檢查模型的對錯,模型會在接收到類似于獎勵或者懲罰的刺激后,逐步做出調整。
相比于監(jiān)督式學習,強化學習更加專注于規(guī)劃,需要在探索未知領域和遵從現(xiàn)有知識之間找到一個合理的平衡點。
圖1-12展示了監(jiān)督式學習、無監(jiān)督式學習和強化學習之間的區(qū)別。
▲圖1-12 監(jiān)督式學習、無監(jiān)督式學習和強化學習的區(qū)別
02 神經(jīng)網(wǎng)絡與深度學習
神經(jīng)網(wǎng)絡是一種實現(xiàn)機器學習的技術,旨在模擬人腦神經(jīng)網(wǎng)絡的運作機制。
1943年,抽象的神經(jīng)元模型被首次提出。1949年,心理學家Hebb提出了“學習率”這一概念,即信息在人腦神經(jīng)細胞的突觸上傳遞時,強度是可以變化的。于是研究人員開始用調整權值的方法進化機器學習算法。1958年,計算科學家Rosenblatt提出了由兩層神經(jīng)元組成的單層神經(jīng)網(wǎng)絡,它可以完成線性分類任務。
1986年,BP算法的提出解決了兩層神經(jīng)網(wǎng)絡所需要的復雜計算量問題。這個算法在兩層神經(jīng)網(wǎng)絡(輸入層和輸出層)中增加了一個中間層。但盡管使用了BP算法,一次神經(jīng)網(wǎng)絡的訓練仍然耗時太久,局部最優(yōu)解作為困擾訓練優(yōu)化的一大問題,使得神經(jīng)網(wǎng)絡的優(yōu)化較為困難。
2006年,Hinton在Science和相關期刊上發(fā)表了論文,首次提出了深度學習的概念,并增加了兩種優(yōu)化技術——“預訓練”(pre-training)和“微調”(fine-tunin)。這兩種技術的運用可以讓神經(jīng)網(wǎng)絡的權值找到一個接近最優(yōu)解的值,并大幅減少對整個網(wǎng)絡進行優(yōu)化訓練的學習時間[6]。
圖1-13中展示了單層、兩層和多層神經(jīng)網(wǎng)絡。
▲圖1-13 從單層、兩層和多層神經(jīng)網(wǎng)絡
深度學習實際上指的是深度神經(jīng)網(wǎng)絡學習,普通神經(jīng)網(wǎng)絡由于訓練代價較高,一般只有3~4層,而深度神經(jīng)網(wǎng)絡由于采用了特殊的訓練方法和一些技術算法,可以達到8~10層。深度神經(jīng)網(wǎng)絡能夠捕捉到數(shù)據(jù)中的深層聯(lián)系,從而能夠得到更精準的模型,而這些聯(lián)系不容易被普通的機器學習方法所發(fā)覺。
03 深度學習的應用
目前,深度神經(jīng)網(wǎng)絡學習(見圖1-14)在人工智能界占據(jù)統(tǒng)治地位。但凡有關人工智能的產(chǎn)業(yè)報道,必然離不開深度學習。深度學習的引入也確實讓使用傳統(tǒng)機器學習方法的各個領域都取得了突破性的進展。
▲圖1-14 深度神經(jīng)網(wǎng)絡學習
自2000年開始,人們開始用機器學習解決計算機視覺問題——可以很好地實現(xiàn)車牌識別、安防、人臉識別等技術。在深度學習出現(xiàn)以前,大多數(shù)識別任務要經(jīng)過手工特征提取和分類器判斷兩個基本步驟,而深度學習可以自動地從訓練樣本中學習特征。深度學習的發(fā)展使其應用場景不斷擴大,如無人車、電商等領域。
Mobileye及NVIDIA公司把基于深度卷積神經(jīng)網(wǎng)絡的方法用于汽車的視覺系統(tǒng)中,率先將深度學習應用于無人駕駛領域,為無人駕駛提供了硬件基礎。2018年2月2日,谷歌宣布將于2018年啟動無人駕駛出租車服務,無人駕駛首次開啟商業(yè)運營(見圖1-15)。除此之外,通用、特斯拉、百度、Uber、蘋果等公司也進入無人駕駛賽道[7]。
▲圖1-15 谷歌無人駕駛車
在語音技術上,2010年后深度學習的廣泛應用使語音識別的準確率大幅提升,成熟產(chǎn)品如蘋果的Siri、亞馬遜的Echo(見圖1-16)等,可以很輕松地識別出用戶說出的一段話,并可以協(xié)助用戶完成一些任務,比如開關應用、搜索,甚至幫助預訂晚餐座位。
▲圖1-16 亞馬遜智能音箱Echo
與圖像相比,語音的識別更加復雜,不同語言、不同口音,甚至充滿暗喻的內容,這些對機器的理解能力提出很高的要求[8]。
在自然語言處理上,目前取得最大突破的成熟產(chǎn)品就是機器翻譯。谷歌的翻譯系統(tǒng)可以理解原文的連貫語義,給出完整的翻譯結果,這是人工智能的一個標桿性事件。2016年,谷歌翻譯升級成谷歌神經(jīng)網(wǎng)絡翻譯系統(tǒng)(Google Neural Machine Translation),在機器翻譯上實現(xiàn)顛覆性突破。
相關參考:
[1]https://www.msra.cn/zh-cn/news/features/ai-hot-words-20171010?
[2]https://blog.csdn.net/Michaelwubo/article/details/79625212?
[3]https://zh.wikipedia.org/wiki/監(jiān)督式學習
[4]https://zh.wikipedia.org/wiki/非監(jiān)督式學習
[5]https://zh.wikipedia.org/wiki/強化學習
[6]計算機的潛意識,
https://www.cnblogs.com/subconscious/p/5058741.html
[7]http://www.sohu.com/a/226424941_465591?
[8]https://blog.csdn.net/qq_41020134/article/details/80612872?
關于作者:史丹青,語憶科技聯(lián)合創(chuàng)始人兼技術負責人,畢業(yè)于同濟大學電子信息工程系。擁有多年時間的AI領域創(chuàng)業(yè)與實戰(zhàn)經(jīng)驗,具備深度學習、自然語言處理以及數(shù)據(jù)可視化等相關知識與技能。是AI技術的愛好者,并擁抱一切新興科技,始終堅信技術分享和開源精神的力量。
本文摘編自《生成對抗網(wǎng)絡入門指南》(第2版),經(jīng)出版方授權發(fā)布。
延伸閱讀《生成對抗網(wǎng)絡入門指南》(第2版)
點擊上圖了解及購買
轉載請聯(lián)系微信:DoctorData
推薦語:揭秘AI如何生成逼真人臉圖像,追蹤GAN前沿技術更新。
劃重點👇
干貨直達👇
首次公開,用了三年的 pandas 速查表!
盤點數(shù)據(jù)治理的6個價值
3.14圓周率節(jié),這5本書帶你領略數(shù)學的魅力
終于有人把辛普森悖論講明白了
更多精彩👇
在公眾號對話框輸入以下關鍵詞
查看更多優(yōu)質內容!
讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手
大數(shù)據(jù)?|?云計算?|?數(shù)據(jù)庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學習?|?深度學習?|?NLP
5G?|?中臺?|?用戶畫像?|?數(shù)學?|?算法?|?數(shù)字孿生
據(jù)統(tǒng)計,99%的大咖都關注了這個公眾號
👇
總結
以上是生活随笔為你收集整理的人工智能、机器学习、深度学习的关系,终于有人讲明白了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [zz]母牛生牛问题解析
- 下一篇: 如何下载Lucene.net源码