机器学习算法与Python实践之(五)k均值聚类(k-means)
生活随笔
收集整理的這篇文章主要介紹了
机器学习算法与Python实践之(五)k均值聚类(k-means)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
機器學習算法與Python實踐這個系列主要是參考《機器學習實戰》這本書。因為自己想學習Python,然后也想對一些機器學習算法加深下了解,所以就想通過Python來實現幾個比較常用的機器學習算法。恰好遇見這本同樣定位的書籍,所以就參考這本書的過程來學習了。
機器學習中有兩類的大問題,一個是分類,一個是聚類。分類是根據一些給定的已知類別標號的樣本,訓練某種學習機器,使它能夠對未知類別的樣本進行分類。這屬于supervised learning(監督學習)。而聚類指事先并不知道任何樣本的類別標號,希望通過某種算法來把一組未知類別的樣本劃分成若干類別,這在機器學習中被稱作 unsupervised learning (無監督學習)。在本文中,我們關注其中一個比較簡單的聚類算法:k-means算法。
一、k-means算法
通常,人們根據樣本間的某種距離或者相似性來定義聚類,即把相似的(或距離近的)樣本聚為同一類,而把不相似的(或距離遠的)樣本歸在其他類。
我們以一個二維的例子來說明下聚類的目的。如下圖左所示,假
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的机器学习算法与Python实践之(五)k均值聚类(k-means)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习算法与Python实践之(三)支
- 下一篇: 机器学习算法与Python实践之(六)二