5 模式识别-动态聚类算法(K均值算法、迭代自组织的数据分析ISOData算法)
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                5  模式识别-动态聚类算法(K均值算法、迭代自组织的数据分析ISOData算法)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.                        
                                武漢理工大學(xué)資源 郭志強(qiáng)
?
動(dòng)態(tài)聚類算法:先選取初始的中心(每個(gè)類別的初始中心),然后把所有的樣本進(jìn)行聚類分析,聚類完成后,就去判斷這個(gè)聚類結(jié)果合不合理(滿不滿足設(shè)計(jì)指標(biāo)要求),如果合理就輸出聚類結(jié)果(樣本分類結(jié)果),如果不合理就自動(dòng)修改相應(yīng)的參數(shù)(一般是聚類結(jié)束判斷參數(shù)),得到新的聚類中心之后再重新進(jìn)行聚類,直到這組樣本點(diǎn)的分類效果合理輸出為止。
?
動(dòng)態(tài)聚類算法的常用方法:
?
1. K均值算法(先選出準(zhǔn)則函數(shù)最小的聚類中心,然后將其他樣本按照近鄰聚類法進(jìn) ? ? ? ? ? ? ? ? ? ? ? ? ? 行分類)
準(zhǔn)則函數(shù)是以聚類中心為自變量的函數(shù)。
聚類(將物理或抽象對(duì)象的集合分成由類似的對(duì)象組成的多個(gè)類的過程被稱為聚類)。
?
其中:Z為聚類中心,S為聚類集,X為某個(gè)樣本點(diǎn)特征,N為該聚類集中樣本點(diǎn)個(gè)數(shù)。
求函數(shù)極值,就是對(duì)函數(shù)求導(dǎo),使函數(shù)等于零即斜率為零。
所以由上圖打鉤公式可知,其實(shí)要找到使得準(zhǔn)則函數(shù)J最小的聚類中心,就等同于求所有樣本點(diǎn)特征和的平均數(shù),就能得到該聚類中心。
可以在初始樣本集里面選則K個(gè)聚類中心,這個(gè)K是一開始人為的自己設(shè)定的。
?
?
大體理論運(yùn)作過程:
?
?
所謂動(dòng)態(tài)是指聚類中心在進(jìn)行不斷地調(diào)整,直到達(dá)到最合理狀態(tài),停止調(diào)整。
我們只能通過不斷嘗試改變初始選擇條件去測(cè)試結(jié)果,才可以得到較好的算法效果。
?
K均值算法-計(jì)算實(shí)例
?
?
?
2. 迭代自組織的數(shù)據(jù)分析算法(ISOData算法)
?
該算法的具體代碼實(shí)現(xiàn)可以參考ISOData源碼(可點(diǎn)擊鏈接)獲取。
總結(jié)
以上是生活随笔為你收集整理的5 模式识别-动态聚类算法(K均值算法、迭代自组织的数据分析ISOData算法)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 多功能全能计算机,全能计算机app
- 下一篇: centos7操作大全
