當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

6.2 K-Means 算法步骤-机器学习笔记-斯坦福吴恩达教授

發布時間：2025/4/5 编程问答 10 豆豆

生活随笔收集整理的這篇文章主要介紹了 6.2 K-Means 算法步骤-机器学习笔记-斯坦福吴恩达教授小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

K-Means 算法步驟

那么，K-Means 這個算法是如何完成聚類過程的呢？其實算法名稱中對此已有體現：

K: 描述了簇的數量，也就是應當聚合成的幾何數。
Means：均值求解會是該算法的核心。

步驟描述

下面具體看到該算法的步驟：

（1）根據設定的聚類數 $K$ ，隨機地選擇 $K$ 個聚類中心（Cluster Centroid），這就好比古代亂世，天下諸侯并起而逐鹿。

（2）評估各個樣本到聚類中心的距離，如果樣本距離第 $i$ 個聚類中心更近，則認為其屬于第 $i$ 簇，這可以看做四方義士紛紛投奔諸侯，形成不同的勢力。

（3）計算每個簇中樣本的 平均（Mean） 位置，將聚類中心移動至該位置，該過程可以被認為是諸侯調整戰略根據地以達到最強的控制力和凝聚力。

重復以上步驟直至各個聚類中心的位置不再發生改變。

綜上，K-Means 的算法步驟能夠簡單概括為：

分配：樣本分配到簇。

移動：移動聚類中心到簇中樣本的平均位置。

注意，某些聚類中心可能沒有被分配到樣本，這樣的聚類中心就會被淘汰（意味著最終的類數可能會減少）。

偽碼描述

假設簇的個數被定為 $K$ ，樣本數為 $m$ 。
隨機設定 $K$ 個聚類中心： $μ_1,μ_2,...,μ_k∈\R^n$

重復如下過程直至聚類中心的位置不再改變：

分配過程

$fori=1tom：for\quad i=1\ to\ m ：$
$c^{(i)}=距\ x^{(i)}\ 最近的聚類中心$

距離的計算式如下：

$min_k||x^{(i)}?μ_k||^2$

移動過程：

$fork=1toK：for\quad k=1\ to\ K ：$
$μ_k（第 k個聚類中心的新位置）=第\ k\ 簇的平均位置$

假設 $μ_2$ 聚類中心下分配了 4 個樣本：
$x^{(1)},\ x^{(5)},\ x^{(6)},\ x^{(10)}$

亦即：
$c^{(1)}=c^{(5)}=c^{(6)}=c^{(10)}=2$

那么 $μ_2$ 將會移動到這四個樣本的中心位置：
$μ2=14(x(1)+x(5)+x(6)+x(10))μ_2=\frac14(x^{(1)}+x^{(5)}+x^{(6)}+x^{(10)})$

總結

以上是生活随笔為你收集整理的6.2 K-Means 算法步骤-机器学习笔记-斯坦福吴恩达教授的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 6.1 无监督学习-机器学习笔记-斯坦福
下一篇： 6.3 优化-机器学习笔记-斯坦福吴恩达