k均值聚类算法考试例题_K-均值聚类法实例解析
例:
為了更深入了解我國(guó)環(huán)境的污染程度狀況,現(xiàn)利用
2009
年數(shù)據(jù)對(duì)全國(guó)
31
個(gè)省、自治區(qū)、
直轄市進(jìn)行聚類(lèi)分析。
解:
現(xiàn)在要分析我國(guó)各個(gè)地區(qū)的環(huán)境污染程度,
案例中選擇了各地區(qū)
“工業(yè)廢氣排放總量”
、
“工業(yè)廢水排放總量”和“二氧化硫排放總量”三個(gè)指標(biāo)來(lái)反映不同污染程度的環(huán)境狀況,
同時(shí)選擇了北京等省市的數(shù)據(jù)加以研究。
這個(gè)問(wèn)題屬于典型的多元分析問(wèn)題,需要利用多
個(gè)指標(biāo)
來(lái)分析各省市之間環(huán)境污染程度的差異。
因此,
可以考
慮利用快速聚類(lèi)分析來(lái)研究
各省市之間的差異性,具體
操作步驟如下。
1)
打隨書(shū)光盤(pán)中的數(shù)據(jù)文件
9-2.sav
,選擇菜單欄中的【
A?nalyze
(分析)
】→【
Classify
(分
類(lèi))
】→【
K-Means?Cluster
(
K
均值聚類(lèi))
】命令,彈出【
K-Means?Cluster?Analysis
(
K
均
值聚類(lèi)分析)
】對(duì)話(huà)框。
2)
在左側(cè)的候選變量列表框中將
X1
、
X2
和
X3
變量設(shè)定為聚類(lèi)分析變量,將其添加至
【
Variables
(變量)
】列表框
中;同時(shí)選擇
Y
作為標(biāo)識(shí)變量,將其移入【
Label?Cases?by
(個(gè)案標(biāo)記依據(jù))
】列表框中。
3)
在【
Number?of?Clusters
(聚類(lèi)數(shù))
】文本框中輸入數(shù)值“
3
”
,表示將樣品利用聚類(lèi)分析
分為三類(lèi),如下圖所示。
4)
單擊【
Save
(保存)
】按鈕,彈出【
K-Means
Cluster
Analysis
:
Save
(
K
均值聚類(lèi)分析:
保存)
】
對(duì)話(huà)框;
勾選
【
Cluster?membership
(聚類(lèi)新成員)
】
和
【
Distanc?e?from?cluster?center
(與聚類(lèi)中心的距離)
】
復(fù)選
框,
表示輸出樣品的聚類(lèi)類(lèi)別及距離,
其他選項(xiàng)保持系
統(tǒng)
默認(rèn)設(shè)置,如下圖所示,單擊【
Continue
(繼續(xù))
】
按鈕返回主對(duì)話(huà)框。
總結(jié)
以上是生活随笔為你收集整理的k均值聚类算法考试例题_K-均值聚类法实例解析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 求一个古诗个性签名。
- 下一篇: 求一个蒲公英个性签名!