无监督学习与有监督学习的本质区别是什么_人工智能中的无监督学习
這些誤解中的許多原因都歸因于這些形式的統計AI的名稱
例如,有些人認為僅將機器學習用作反饋循環就是強化學習。其他人則認為,無人監督的全自動機器學習應用程序就是無監督學習的例子,但是這些類別的真正區別在于訓練數據。通過強化學習,沒有培訓數據,代理與環境互動,并根據獎懲來學習,監督學習需要(主要是人類)標記的訓練數據來教授模型以預測所需的結果。
無監督學習涉及訓練沒有標簽的數據,其中“系統試圖在您的數據中找到一組穩定的集群”
因此,數據組成了自己的類別,這種無監督學習的主要價值主張(用于機器學習模型,基于發現的結果來對數據進行探索和分類,而不是人類施加的分層)對于從通用數據發現到有針對性的用例(例如精密醫學)而言,都是非常有用的,正確實施后,它會產生高度特定的分析見解,而這些見解很容易被遺漏。
聚類技術是無監督學習的典型形式
降維是無監督學習的另一個方面,也適用于有監督學習,群集使機器學習系統可以根據數據的相似性將數據分組。在某些情況下,人們可能沒有意識到數據中的這些相似之處,這就是為什么群集是一種出色的數據發現技術的原因,例如企業可以使用聚類方法用各種源數據填充知識圖,或對記錄進行重復數據刪除以確保數據質量,影響聚類的一些最實用的措施包括。
1、K-Means:這種聚類算法部分基于空間,需要“將三維空間中的所有數據都劃分為……組”,這種技術的潛在局限性是“人類必須決定想要多少個集群”,就像你是上帝,你已經知道。” 但是,其他聚類技術克服了這一限制,“讓軟件確定最穩定的聚類數可以最好地說明數據的可變性。
2、拓撲分析:拓撲數據分析是一種現代聚類方法,它的集群通常比K-Means的集群更小且數量更多,該技術對于為整個生產環境設計全面的數字雙胞胎至關重要。在醫療保健中也很有用,糖尿病通常被描述為“糖尿病1和2或普通糖尿病”,在一個特定的用例中,對2型糖尿病和真正衰竭的患者進行拓撲分析會導致“這些患者中有22個類群”。
3、附加學習:聚類在圖設置中真正有價值,在圖設置中,組織可以將單個聚類輸入回圖中,以檢測聚類中的聚類以獲得高度特定的發現。在某些醫療保健環境中使用此做法,以促進個性化醫療,部分是通過為具有某種特定醫療狀況(例如糖尿病)的每個患者提供群集標識符。“這是您可以開始進行精密醫學的方式,您可以將人們置于事物的簇中,并查看該簇的治療效果是否優于該簇。
降維的基本原則適用于監督學習和無監督學習
我可以使用更少的變量,還是可以將變量合并在一起,這樣就不需要400個變量,但是我只能使用三個, 這種方法的主要目標是減少輸入數量,并且仍獲得相同的預測質量,主成分分析是降維的無監督學習形式,其中數據科學家篩選一系列值以通過分析其數據中的相關性來預測其他值。
此計算過程非常昂貴需要“查看整個數據集中每個變量之間的每個相關性……然后在數據中找到它們所謂的因素”
因素是影響機器學習模型輸出的輸入數據屬性,不僅支持將數據集聚類為因子,而且還減少了其中的變量數量,因此“對于每個因子,您都可以找到解釋大部分可變性的最重要變量,磨練這些變量對于建立具有準確預測的模型至關重要,人們可以解構特定因素,并“從100個變量變為20或10個可以解釋一切的變量。
聚類是許多無監督學習方法的核心,即使它們涉及降維
例如,組織可以利用聚類來找到客戶數據中的相似性,以智能地將廣告定向到那些組,通過將群集標識符分配給各個業務概念(例如特定的患者或客戶),在群集中查找群集以及根據結果個性化下一步操作來優化這種形式的無監督學習,需要細化的,精通關系的設置,通過對那些結果執行分析,這些環境對于充分理解分析的輸出是必不可少的。
由于對無監督學習的誤解可能會暫時持續下去,因此重要的是要理解統計AI的這一要素究竟是什么
無監督學習并不僅僅意味著沒有人會忽視機器學習的結果,該術語并不是“循環人類”概念的同義詞,“循環人類”概念最終應涉及到統計AI的所有方面,無監督學習是機器學習的一種,其中學習不是基于(主要是人為的)標記的訓練數據示例,而是基于實際數據本身。
如果喜歡輕點左上方關注我們。
部分文字、圖片來源于網絡,如有版權請聯系刪除!
總結
以上是生活随笔為你收集整理的无监督学习与有监督学习的本质区别是什么_人工智能中的无监督学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python分类算法_用Python实现
- 下一篇: 想哭的个性签名女生