还纠结选机器学习还是深度学习?看完你就有数了
導(dǎo)語(yǔ):「機(jī)器學(xué)習(xí)」還是「深度學(xué)習(xí)」,哪個(gè)更適合我呢?
大哥你好,我是來(lái)學(xué)「人工智能」的。但是,啥是「深度學(xué)習(xí)」?啥是「機(jī)器學(xué)習(xí)」?「深度學(xué)習(xí)」和「機(jī)器學(xué)習(xí)」有啥關(guān)系?我究竟該學(xué)「深度學(xué)習(xí)」還是「機(jī)器學(xué)習(xí)」?
在入門時(shí),很多人都會(huì)被這幾個(gè)問(wèn)題繞暈了。但相信我,看完這篇文章,所有的這些疑惑都會(huì)被解決!
搞懂概念
首先,我們來(lái)搞懂「人工智能」、「機(jī)器學(xué)習(xí)」和「深度學(xué)習(xí)」這三個(gè)概念和概念之間的聯(lián)系。
?
一、什么是人工智能?
人工智能是通過(guò)軟件和硬件來(lái)「模擬」和「模仿」智能人類行為的研究。大家記得《終結(jié)者》里的天網(wǎng)和T-800嗎?它們就是「人工智能」哦!
二、什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)是AI的一個(gè)子領(lǐng)域,它通過(guò)算法將AI概念應(yīng)用于計(jì)算系統(tǒng)。計(jì)算機(jī)識(shí)別數(shù)據(jù)模式并根據(jù)數(shù)據(jù)模式采取行動(dòng),隨著時(shí)間的推移學(xué)習(xí)提高其準(zhǔn)確性而無(wú)需明確的編程。機(jī)器學(xué)習(xí)的背后是預(yù)測(cè)編碼,聚類和視覺(jué)熱圖等分析方法。我們打開(kāi)某寶、某東時(shí)的購(gòu)物推薦就是機(jī)器學(xué)習(xí)的一個(gè)應(yīng)用啦~
三、什么是深度學(xué)習(xí)?
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的子領(lǐng)域,是人工神經(jīng)網(wǎng)絡(luò)的另一個(gè)名字。深度學(xué)習(xí)網(wǎng)絡(luò)模仿人類大腦感知與組織的方式,根據(jù)數(shù)據(jù)輸入做出決策。AlphaGo就是我們最耳熟能詳?shù)纳疃葘W(xué)習(xí)的應(yīng)用!此外,雖然現(xiàn)在「天網(wǎng)」還沒(méi)出現(xiàn),但是「天網(wǎng)」的基礎(chǔ),深度學(xué)習(xí)已經(jīng)出現(xiàn)啦!
簡(jiǎn)而言之,機(jī)器學(xué)習(xí)是人工智能的一部分,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一部分,這就是三者的關(guān)系。
「機(jī)器學(xué)習(xí)」vs. 「深度學(xué)習(xí)」,我應(yīng)該學(xué)哪個(gè)?
?
剛才說(shuō)了,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一部分,它們的關(guān)系就像「扳手」和「整套工具」 的關(guān)系。因此,如果你想搞個(gè)應(yīng)用,你更應(yīng)該先學(xué)機(jī)器學(xué)習(xí),了解一下整套工具。而是否要學(xué)習(xí)深度學(xué)習(xí)(扳手)要仔細(xì)考慮考慮——畢竟,深度學(xué)習(xí)是一個(gè)在發(fā)展中的技術(shù),并且用花掉你大把的錢!(買顯卡……)
話說(shuō)回來(lái),深度學(xué)習(xí)雖然仍在發(fā)展中,但已經(jīng)有很多深度學(xué)習(xí)的產(chǎn)品已經(jīng)進(jìn)入市場(chǎng)了,假以時(shí)日,深度學(xué)習(xí)的應(yīng)用將會(huì)變得更加廣泛,這個(gè)扳手的作用將會(huì)越來(lái)越大。
深度剖析
現(xiàn)在,讓我們分別來(lái)了解一下「機(jī)器學(xué)習(xí)」和「深度學(xué)習(xí)」的知識(shí)和它們的應(yīng)用案例吧!
一、機(jī)器學(xué)習(xí)詳解
機(jī)器學(xué)習(xí)通過(guò)算法分析數(shù)據(jù),從結(jié)果中進(jìn)行學(xué)習(xí),然后將「學(xué)習(xí)后的算法」用來(lái)做出決策或進(jìn)行預(yù)測(cè),例子有我們熟悉的聚類、貝葉斯網(wǎng)絡(luò)和視覺(jué)數(shù)據(jù)映射等等。
機(jī)器學(xué)習(xí)可以分成兩種類型——「有監(jiān)督學(xué)習(xí)」和「無(wú)監(jiān)督學(xué)習(xí)」。
?
監(jiān)督式學(xué)習(xí)依賴于人為生成的「數(shù)據(jù)種子集」。這些「數(shù)據(jù)種子集」調(diào)教程序它該如何「看待」數(shù)據(jù)。
舉個(gè)監(jiān)督室學(xué)習(xí)的例子,我有一套電子郵件數(shù)據(jù),我給每一封郵件都打上「垃圾郵件」或「非垃圾郵件」的標(biāo)簽,那么,這套數(shù)據(jù)便是「數(shù)據(jù)種子集」,程序可以利用這套數(shù)據(jù)種子集進(jìn)行訓(xùn)練,從而得到一個(gè)判斷垃圾郵件的模型。
無(wú)監(jiān)督學(xué)習(xí)是這樣的——觀察數(shù)據(jù)中的模式,將它們和其他的數(shù)據(jù)比較或進(jìn)行搜索查詢。隨著數(shù)據(jù)集的增長(zhǎng)、更多模式的浮現(xiàn),機(jī)器學(xué)習(xí)算法不斷「自我優(yōu)化」。無(wú)監(jiān)督學(xué)習(xí)的例子有聚類、概念搜索和接近重復(fù)數(shù)據(jù)刪除等等。
再以郵件為例,我有一套電子郵件數(shù)據(jù),但是我并沒(méi)有人為的給它「打標(biāo)簽」,而是直接進(jìn)行聚類,程序會(huì)自動(dòng)的分出「垃圾郵件」和「非垃圾郵件」。
機(jī)器學(xué)習(xí)的「基礎(chǔ)設(shè)施」差異很大。單一系統(tǒng)可以處理有限的數(shù)據(jù),而大型系統(tǒng)則包含數(shù)十臺(tái)服務(wù)器和大規(guī)模并行處理(MPP)架構(gòu),用于跨多個(gè)數(shù)據(jù)源的海量數(shù)據(jù)。
二、深度學(xué)習(xí)詳解
深度學(xué)習(xí),又叫人工神經(jīng)網(wǎng)絡(luò),和其它所有機(jī)器學(xué)習(xí)一樣都是基于算法。然而它并非像「數(shù)據(jù)分類」一樣根據(jù)任務(wù)選擇的算法,而是模仿人類大腦結(jié)構(gòu)與運(yùn)算過(guò)程——識(shí)別非結(jié)構(gòu)化輸入的數(shù)據(jù),輸出精確地行為和決策。
機(jī)器學(xué)習(xí)可以是監(jiān)督的也可以是非監(jiān)督的,這意味著大型神經(jīng)網(wǎng)絡(luò)可以接受「標(biāo)簽化輸入」,但并不需要。當(dāng)一個(gè)神經(jīng)網(wǎng)絡(luò)處理輸入時(shí),它通過(guò)輸入數(shù)據(jù)和輸出數(shù)據(jù)創(chuàng)造層,這種級(jí)別的深度學(xué)習(xí)讓神經(jīng)網(wǎng)絡(luò)從原始數(shù)據(jù)中「自動(dòng)抽取特征」而無(wú)需人工來(lái)貼標(biāo)簽。
?
神經(jīng)網(wǎng)絡(luò)由大量被稱為神經(jīng)元的簡(jiǎn)單處理器構(gòu)成,處理器用數(shù)學(xué)公式模仿人類大腦中的神經(jīng)元。這些人造神經(jīng)元就是神經(jīng)網(wǎng)絡(luò)最基礎(chǔ)的「部件」。
簡(jiǎn)而言之,每一個(gè)神經(jīng)元接受兩個(gè)或更多的輸入,處理它們,然后輸出一個(gè)結(jié)果。一些神經(jīng)元從額外的傳感器接收輸入,然后其他神經(jīng)元被其他已激活的神經(jīng)元激活。神經(jīng)元可能激活其它的神經(jīng)元,或者通過(guò)觸發(fā)的行動(dòng)影響外部環(huán)境。所有的行為都是在「自動(dòng)生成」的隱藏層中發(fā)生的,每個(gè)連續(xù)的圖層都會(huì)輸入前一層的輸出。
在實(shí)際項(xiàng)目中,神經(jīng)網(wǎng)絡(luò)大量攝取非結(jié)構(gòu)化數(shù)據(jù)——聲音、文字、影像和圖片。神經(jīng)網(wǎng)絡(luò)將數(shù)據(jù)分離為數(shù)據(jù)塊,然后將它發(fā)送到獨(dú)立的神經(jīng)元和網(wǎng)絡(luò)層中去處理。一旦這些離散的處理都完成了,神經(jīng)網(wǎng)絡(luò)就產(chǎn)生最后的輸出,我們就大功告成了!
人工神經(jīng)網(wǎng)絡(luò),或者說(shuō)深度學(xué)習(xí)有什么優(yōu)點(diǎn)?它的一大優(yōu)點(diǎn)在于「可擴(kuò)展性」。神經(jīng)網(wǎng)絡(luò)的性能取決于它可以吸收、訓(xùn)練和處理多少數(shù)據(jù)。所以,更多的數(shù)據(jù)意味著更好的結(jié)果——這是和「其它機(jī)器學(xué)習(xí)算法」的另一個(gè)區(qū)別,其它機(jī)器學(xué)習(xí)算法的效果通常穩(wěn)定在一個(gè)明確的水平。深度學(xué)習(xí)僅通過(guò)資源衡量它的性能,層數(shù)更深,則輸出更為廣泛,性能也更為強(qiáng)勁。
所以,盡管深度學(xué)習(xí)不快也不容易,但是通過(guò)更低的價(jià)格能得到更好的計(jì)算能力這一點(diǎn),還是讓各大公司「買買買」。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的流行應(yīng)用場(chǎng)景
機(jī)器學(xué)習(xí)已經(jīng)在市場(chǎng)上「無(wú)孔不入」了,而深度學(xué)習(xí)還處于「初級(jí)階段」,商業(yè)化程度有限。
在某些應(yīng)用案例中,二者可以說(shuō)十分相似,區(qū)別在于神經(jīng)網(wǎng)絡(luò)可以增長(zhǎng)到接近無(wú)限的學(xué)習(xí)和輸出規(guī)模;機(jī)器學(xué)習(xí)更受約束,適合具體的實(shí)際計(jì)算任務(wù)。
注意啦,「機(jī)器學(xué)習(xí)」和「深度學(xué)習(xí)」并非相斥而是互補(bǔ)的關(guān)系。
?
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的未來(lái)
你不會(huì)走在大街上就碰見(jiàn)「深度學(xué)習(xí)」,它們需要大量的標(biāo)記數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí),或大量的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行無(wú)監(jiān)督學(xué)習(xí)。因此,苦逼的技術(shù)人員需要花費(fèi)大量的時(shí)間標(biāo)記和向神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù),或者需要輸入數(shù)以百萬(wàn)計(jì)的非結(jié)構(gòu)化對(duì)象來(lái)實(shí)現(xiàn)無(wú)監(jiān)督學(xué)習(xí)。
在現(xiàn)代這個(gè)IT社會(huì),缺乏數(shù)據(jù)不再是問(wèn)題——挑戰(zhàn)是標(biāo)記足夠的數(shù)據(jù),或者將足夠的未標(biāo)記數(shù)據(jù)導(dǎo)入神經(jīng)網(wǎng)絡(luò)。盡管處理能力不斷增加,價(jià)格也有所下降,但密集計(jì)算仍然需要對(duì)系統(tǒng)和支持進(jìn)行大量的投資。
盡管如此,深度學(xué)習(xí)在許多不同的業(yè)務(wù)垂直領(lǐng)域都有很好的案例。像谷歌和Facebook這樣的深度學(xué)習(xí)大佬正在使用深度學(xué)習(xí)開(kāi)發(fā)炫酷的應(yīng)用程序,而其他的開(kāi)發(fā)者們則在「跟著大佬走」。
不管怎樣,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是時(shí)代的大勢(shì)所趨。就像整個(gè)世界因?yàn)榛ヂ?lián)網(wǎng)而變成了另一種樣子,機(jī)器學(xué)習(xí)也會(huì)重塑這個(gè)世界。在這個(gè)過(guò)程中,越來(lái)越多的人會(huì)認(rèn)識(shí)到機(jī)器學(xué)習(xí)的價(jià)值,機(jī)器學(xué)習(xí)也會(huì)變得越來(lái)越容易上手。說(shuō)不定有一天,小學(xué)生也要開(kāi)始學(xué)習(xí)機(jī)器學(xué)習(xí)了。
- 發(fā)表于: 2018-04-03
- 原文鏈接:http://kuaibao.qq.com/s/20180403B1CYA300?refer=cp_1026
總結(jié)
以上是生活随笔為你收集整理的还纠结选机器学习还是深度学习?看完你就有数了的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 写给想转行机器学习深度学习的同学
- 下一篇: 一篇文章解决机器学习,深度学习入门疑惑