當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★

發(fā)布時(shí)間：2025/6/17 编程问答 19 豆豆

生活随笔收集整理的這篇文章主要介紹了【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★ 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

一、 K-Means 聚類算法流程
二、二維數(shù)據(jù)的 K-Means 聚類
- 1、第一次迭代
- 2、第二次迭代

參考博客 :

【數(shù)據(jù)挖掘】聚類算法簡介 ( 基于劃分的聚類方法 | 基于層次的聚類方法 | 基于密度的聚類方法 | 基于方格的聚類方法 | 基于模型的聚類方法 )
【數(shù)據(jù)挖掘】基于劃分的聚類方法 ( K-Means 算法簡介 | K-Means 算法步驟 | K-Means 圖示 )
【數(shù)據(jù)挖掘】K-Means 一維數(shù)據(jù)聚類分析示例
【數(shù)據(jù)挖掘】K-Means 二維數(shù)據(jù)聚類分析 ( K-Means 迭代總結(jié) | K-Means 初始中心點(diǎn)選擇方案 | K-Means 算法優(yōu)缺點(diǎn) | K-Means 算法變種 )

一、 K-Means 聚類算法流程

K-Means 算法步驟 : 給定數(shù)據(jù)集 $X\rm X$ , 該數(shù)據(jù)集有 $n\rm n$ 個(gè)樣本 , 將其分成 $K\rm K$ 個(gè)聚類 ;

① 中心點(diǎn)初始化 : 為 $K\rm K$ 個(gè)聚類分組選擇初始的中心點(diǎn) , 這些中心點(diǎn)稱為 Means ; 可以依據(jù)經(jīng)驗(yàn) , 也可以隨意選擇 ;

② 計(jì)算距離 : 計(jì)算 $n\rm n$ 個(gè)對象與 $K\rm K$ 個(gè)中心點(diǎn) 的距離 ; ( 共計(jì)算 $n×K\rm n \times K$ 次 )

③ 聚類分組 : 每個(gè)對象與 $K\rm K$ 個(gè)中心點(diǎn)的值已計(jì)算出 , 將每個(gè)對象分配給距離其最近的中心點(diǎn)對應(yīng)的聚類 ;

④ 計(jì)算中心點(diǎn) : 根據(jù)聚類分組中的樣本 , 計(jì)算每個(gè)聚類的中心點(diǎn) ;

⑤ 迭代直至收斂 : 迭代執(zhí)行 ② ③ ④ 步驟 , 直到 聚類算法收斂 , 即 中心點(diǎn) 和分組經(jīng)過多少次迭代都不再改變 , 也就是本次計(jì)算的中心點(diǎn)與上一次的中心點(diǎn)一樣 ;

給定一組樣本 , 和一組中心點(diǎn) , 計(jì)算所有樣本到所有中心點(diǎn) 的距離 , 給樣本分組 , 計(jì)算分好組的樣本的中心點(diǎn) , 重新計(jì)算所有樣本到所有中心點(diǎn)的距離 , 繼續(xù)進(jìn)行分組 , 一直迭代執(zhí)行上述操作 , 直到連續(xù)兩次樣本分組不再變化 ;

二、二維數(shù)據(jù)的 K-Means 聚類

給定數(shù)據(jù)集 ${A1(2,4),A2(3,7),B1(5,8),B2(9,5),C1(6,2),C2(4,9)}\rm \{ A_1 ( 2 , 4 ) , A_2 ( 3 , 7 ) , B_1 ( 5 , 8 ) , B_2 ( 9 , 5 ) , C_1 ( 6 , 2 ) , C_2 ( 4 , 9 ) \}$ , 初始中心點(diǎn) ${A1(2,4),B1(5,8),C1(6,2)}\rm \{ A_1 ( 2 , 4 ) , B_1 ( 5 , 8 ) , C_1 ( 6 , 2 ) \}$ , 使用 K-Means 算法對數(shù)據(jù)集進(jìn)行聚類分析 ;

曼哈頓距離計(jì)算方式 : 以計(jì)算 $A1(2,4)\rm A_1 ( 2 , 4 )$ 與 $B1(5,8)\rm B_1 ( 5 , 8 )$ 的距離為例 ;

$d(A1,B1)=∣2?5∣+∣4?8∣=7\rm d(A_1 , B_1) = | 2-5 | + | 4-8 | = 7$

1、第一次迭代

第一次迭代 : 計(jì)算每個(gè)樣本值與每個(gè)中心點(diǎn)的距離 , 將樣本分類到最近的中心點(diǎn)所在的分組 , 計(jì)算每個(gè)分組新的中心值 ;

A_1 ( 2 , 4 )

A_2 ( 3 , 7 )

B_1 ( 5 , 8 )

B_2 ( 9 , 5 )

C_1 ( 6 , 2 )

C_2 ( 4 , 9 )

$A_1 ( 2 , 4 )$	$0$	$4$	$7$	$8$	$6$	$7$
$B_1 ( 5 , 8 )$	$7$	$3$	$0$	$7$	$7$	$2$
$C_1 ( 6 , 2 )$	$6$	$8$	$7$	$6$	$0$	$9$

新的聚類分組 :

① 聚類 $1$ : ${ A_1 \}$

② 聚類 $2$ : ${ A_2 , B_1 , C_2 \}$

③ 聚類 $3$ : ${ B_2 , C_1 \}$

新的中心點(diǎn)計(jì)算 :

$C1=(2,4)\rm C_1 = (2, 4)$

$C2=(3+5+43,7+8+93)=(4,8)\rm C_2 =( \cfrac{3 + 5 + 4}{3} , \cfrac{7 + 8 + 9}{3}) = ( 4 , 8 )$

$C3=(9+62,5+22)=(7,3)\rm C_3 = ( \cfrac{9 + 6 }{2} , \cfrac{5 + 2}{2}) = ( 7 , 3 )$

2、第二次迭代

第二次迭代 : 計(jì)算每個(gè)樣本值與每個(gè)中心點(diǎn)的距離 , 將樣本分類到最近的中心點(diǎn)所在的分組 , 計(jì)算每個(gè)分組新的中心值 ;

A_1 ( 2 , 4 )

A_2 ( 3 , 7 )

B_1 ( 5 , 8 )

B_2 ( 9 , 5 )

C_1 ( 6 , 2 )

C_2 ( 4 , 9 )

$(2, 4)$	$0$	$4$	$7$	$8$	$6$	$7$
$(4, 8)$	$6$	$2$	$1$	$8$	$8$	$1$
$(7, 3)$	$6$	$8$	$7$	$4$	$2$	$9$

新的聚類分組 :

① 聚類 $1$ : ${ A_1 \}$

② 聚類 $2$ : ${ A_2 , B_1 , C_2 \}$

③ 聚類 $3$ : ${ B_2 , C_1 \}$

新的中心點(diǎn)計(jì)算 :

$C1=(2,4)\rm C_1 = (2, 4)$

$C2=(3+5+43,7+8+93)=(4,8)\rm C_2 =( \cfrac{3 + 5 + 4}{3} , \cfrac{7 + 8 + 9}{3}) = ( 4 , 8 )$

$C3=(9+62,5+22)=(7,3)\rm C_3 = ( \cfrac{9 + 6 }{2} , \cfrac{5 + 2}{2}) = ( 7 , 3 )$

第二次迭代與第一次迭代值相同 , 因此第三次迭代的結(jié)果就是 K-Means 聚類算法最終結(jié)果 ;

詳細(xì)解析參考【數(shù)據(jù)挖掘】K-Means 二維數(shù)據(jù)聚類分析 ( K-Means 迭代總結(jié) | K-Means 初始中心點(diǎn)選擇方案 | K-Means 算法優(yōu)缺點(diǎn) | K-Means 算法變種 )

總結(jié)

以上是生活随笔為你收集整理的【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：【数据挖掘】数据挖掘总结 ( 拉普拉斯修
下一篇：【CMake】CMake 引入 ( An

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★

文章目錄

一、 K-Means 聚類算法流程

二、 二維數(shù)據(jù)的 K-Means 聚類

1、 第一次迭代

2、 第二次迭代

總結(jié)

一、 K-Means 聚類算法流程

二、二維數(shù)據(jù)的 K-Means 聚類

1、第一次迭代

2、第二次迭代