4种不同类别的机器学习概述
導(dǎo)讀:機器學(xué)習(xí)涉及方方面面的內(nèi)容,包含許多不同類型的算法,其學(xué)習(xí)方式也不相同。我們將簡要介紹這些學(xué)習(xí)方式及其對應(yīng)的情景。
作者:列奧納多·德·馬爾希(Leonardo De Marchi),勞拉·米切爾(Laura Mitchell)
來源:大數(shù)據(jù)DT(ID:hzdashuju)
我們可以根據(jù)算法執(zhí)行學(xué)習(xí)的方式將它們分為以下不同類別:
有監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)
強化學(xué)習(xí)
01 有監(jiān)督學(xué)習(xí)
有監(jiān)督學(xué)習(xí)是目前商業(yè)過程中最常見的機器學(xué)習(xí)形式。這些算法試圖找到映射輸入和輸出的函數(shù)的一個很好的近似。
為此,顧名思義,我們需要自己為算法提供輸入值和輸出值,并且嘗試找到一個能夠使預(yù)測值和實際輸出值之間誤差最小的函數(shù)。
學(xué)習(xí)階段稱為訓(xùn)練(training)。模型經(jīng)過訓(xùn)練后,可以針對未見過的數(shù)據(jù)預(yù)測輸出。此階段通常被視為評分或預(yù)測,如圖1-1所示。
▲圖?1-1
02 無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)適用于未標(biāo)記的數(shù)據(jù),因此我們不需要實際的輸出值,僅需要輸入。它嘗試在數(shù)據(jù)中查找模式并根據(jù)這些共同屬性做出反應(yīng),將輸入劃分為多個不同聚類(如圖1-2所示)。
▲圖 1-2
通常,無監(jiān)督學(xué)習(xí)通常與有監(jiān)督學(xué)習(xí)結(jié)合使用,以減少輸入空間并將數(shù)據(jù)中的信號集中在較少數(shù)量的變量上,但無監(jiān)督學(xué)習(xí)還有其他目標(biāo)。從這個角度來看,當(dāng)標(biāo)記數(shù)據(jù)很昂貴或不太可靠時,無監(jiān)督學(xué)習(xí)比有監(jiān)督學(xué)習(xí)更適用。
常見的無監(jiān)督學(xué)習(xí)技術(shù)有聚類(clustering)和主成分分析(Principal Component Analysis,PCA)、獨立成分分析(Independent Component Analysis,ICA),以及一些神經(jīng)網(wǎng)絡(luò),例如生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)和自編碼器(Autoencoder,AE)。
03 半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)是介于有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間的一種技術(shù)。它可以說不屬于機器學(xué)習(xí)中一個單獨的類別,而只是有監(jiān)督學(xué)習(xí)的一種泛化,但在這將其單獨列出是有用的。
其目的是通過將一些有標(biāo)記的數(shù)據(jù)擴(kuò)展到類似的未標(biāo)記數(shù)據(jù),從而降低收集標(biāo)記數(shù)據(jù)的成本。我們把一些生成模型分類為半監(jiān)督學(xué)習(xí)。
半監(jiān)督學(xué)習(xí)可以分為直推學(xué)習(xí)和歸納學(xué)習(xí)。直推學(xué)習(xí)適用于推斷未標(biāo)記數(shù)據(jù)的標(biāo)簽,歸納學(xué)習(xí)適用于推斷從輸入到輸出的正確映射。
我們可以看到此過程與我們在學(xué)校學(xué)習(xí)的大多數(shù)過程相似。老師向?qū)W生展示一些例子,并讓學(xué)生回家完成作業(yè)。為了完成這些作業(yè),他們需要進(jìn)行泛化。
04 強化學(xué)習(xí)
強化學(xué)習(xí)(RL)是我們目前所見的最獨特的類別。這個概念非常有趣:該算法試圖找出一個策略來最大化獎勵總和。
該策略由使用它在環(huán)境中執(zhí)行動作的智能體來學(xué)習(xí)。然后,環(huán)境返回反饋,智能體使用該反饋來改進(jìn)其策略。反饋是對所執(zhí)行動作的獎勵,可以是正數(shù)、空值或負(fù)數(shù),如圖1-3所示。
▲圖?1-3
關(guān)于作者:列奧納多·德·馬爾希(Leonardo De Marchi),目前是Badoo的數(shù)據(jù)科學(xué)家主管,Badoo是世界上的大型交友網(wǎng)站之一,擁有超過4億名用戶。他也是ideai.io(一家專門從事機器學(xué)習(xí)培訓(xùn)的公司)的首席教練,為大型機構(gòu)和有活力的初創(chuàng)企業(yè)提供技術(shù)和管理培訓(xùn)。他擁有人工智能專業(yè)碩士學(xué)位,曾在體育界擔(dān)任數(shù)據(jù)科學(xué)家。
勞拉·米切爾(Laura Mitchell),目前是Badoo的首席數(shù)據(jù)科學(xué)家。Laura在NLP、圖像分類和推薦系統(tǒng)等項目的交付方面具有豐富的實踐經(jīng)驗,包括從最初的構(gòu)思到產(chǎn)品化。她熱衷于學(xué)習(xí)新技術(shù)并緊跟行業(yè)趨勢。
本文摘編自《神經(jīng)網(wǎng)絡(luò)設(shè)計與實現(xiàn)》,經(jīng)出版方授權(quán)發(fā)布。
延伸閱讀《神經(jīng)網(wǎng)絡(luò)設(shè)計與實現(xiàn)》
點擊上圖了解及購買
轉(zhuǎn)載請聯(lián)系微信:DoctorData
推薦語:本書是一本神經(jīng)網(wǎng)絡(luò)實踐進(jìn)階指南,適合對AI和深度學(xué)習(xí)感興趣并且想進(jìn)一步提高技能的讀者閱讀。
劃重點????
干貨直達(dá)????
10本最火的中臺與數(shù)字化轉(zhuǎn)型圖書,朋友圈都在傳
終于有人把碳達(dá)峰、碳中和講明白了
終于找到了!AI學(xué)習(xí)路線圖——從零基礎(chǔ)到就業(yè)
終于有人把數(shù)據(jù)倉庫講明白了
更多精彩????
在公眾號對話框輸入以下關(guān)鍵詞
查看更多優(yōu)質(zhì)內(nèi)容!
讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手
大數(shù)據(jù)?|?云計算?|?數(shù)據(jù)庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學(xué)習(xí)?|?深度學(xué)習(xí)?|?NLP
5G?|?中臺?|?用戶畫像?|?數(shù)學(xué)?|?算法?|?數(shù)字孿生
據(jù)統(tǒng)計,99%的大咖都關(guān)注了這個公眾號
????
總結(jié)
以上是生活随笔為你收集整理的4种不同类别的机器学习概述的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 让AI学习AI:自动化机器学习的概述、发
- 下一篇: 微软著名程序员、歌手、NBA球队老板保罗