推荐算法-聚类-K-MEANS
????對(duì)于大型的推薦系統(tǒng),直接上協(xié)同過濾或者矩陣分解的話可能存在計(jì)算復(fù)雜度過高的問題,這個(gè)時(shí)候可以考慮用聚類做處理,其實(shí)聚類本身在機(jī)器學(xué)習(xí)中也常用,屬于是非監(jiān)督學(xué)習(xí)的應(yīng)用,我們有的只是一組組數(shù)據(jù),最終我們要把它們分組,但是前期沒有任何的先驗(yàn)知識(shí)告訴我們那個(gè)點(diǎn)是屬于那個(gè)組的。
????當(dāng)我們有足夠的數(shù)據(jù)的時(shí)候可以考慮先用聚類做第一步處理,來(lái)縮減協(xié)同過濾的選擇范圍,從而降低復(fù)雜度。
????對(duì)了還想起來(lái)機(jī)器學(xué)習(xí)里面也經(jīng)常用聚類的方式進(jìn)行降維。這個(gè)在機(jī)器學(xué)習(xí)筆記部分后期我會(huì)整理。
????最終,每個(gè)聚類中的用戶,都會(huì)收到為這個(gè)聚類計(jì)算出的推薦內(nèi)容。聚類的話也有很多種方法時(shí)間,今天是整理最簡(jiǎn)單的那個(gè)姿勢(shì):K-MEANS
????K-MEANS聚類算法是非常常用的聚類算法。它出現(xiàn)在很多介紹性的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)課程中。在代碼中很容易理解和實(shí)現(xiàn)!
????K-MEANS聚類算法的優(yōu)勢(shì)在于它的速度非常快,因?yàn)槲覀兯械闹皇怯?jì)算點(diǎn)和集群中心之間的距離,它有一個(gè)線性復(fù)雜度O(n)[注意不是整體的時(shí)間復(fù)雜度]。
另一方面,K-MEANS也有幾個(gè)缺點(diǎn)。首先,你必須選擇有多少組/類。這并不是不重要的事,理想情況下,我們希望它能幫我門解決這些問題,因?yàn)樗年P(guān)鍵在于從數(shù)據(jù)中國(guó)的一些啟示,K-MEANS也從隨機(jī)的聚類中心開始,因此在不同的算法運(yùn)行中可能產(chǎn)生不同的聚類結(jié)果。因此,結(jié)果可能是不可重復(fù)的,并且缺乏一致性。其他聚類方法更加一致。
????K-Medians是另一種與K-MEANS有關(guān)的聚類算法,除了使用均值的中間值來(lái)重新計(jì)算數(shù)組中心點(diǎn)以外,這種方法對(duì)于離散值的民高度較低(因?yàn)槭褂弥兄?#xff09;,但對(duì)于較大的數(shù)據(jù)集來(lái)說,它要慢得多,因?yàn)樵谟?jì)算中值向量時(shí),每次迭代都需要進(jìn)行排序。
?
?
總結(jié)
以上是生活随笔為你收集整理的推荐算法-聚类-K-MEANS的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐算法-矩阵分解
- 下一篇: 推荐算法-聚类-均值偏移聚类(爬山算法)