探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类
聚類分析
什么是聚類分析?
聚類 (Clustering) 就是將數據對象分組成為多個類或者簇 (Cluster),它的目標是:在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。所以,在很多應用中,一個簇中的數據對象可以被作為一個整體來對待,從而減少計算量或者提高計算質量。
其實聚類是一個人們日常生活的常見行為,即所謂“物以類聚,人以群分”,核心的思想也就是聚類。人們總是不斷地改進下意識中的聚類模式來學習如何區分各個事物和人。同時,聚類分析已經廣泛的應用在許多應用中,包括模式識別,數據分析,圖像處理以及市場研究。通過聚類,人們能意識到密集和稀疏的區域, 發現全局的分布模式,以及數據屬性之間的有趣的相互關系。
聚類同時也在 Web 應用中起到越來越重要的作用。最被廣泛使用的既是對 Web 上的文檔進行分類,組織信息的發布,給用戶一個有效分類的內容瀏覽系統(門戶網站),同時可以加入時間因素,進而發現各個類內容的信息發展,最近被大家關注的主題和話題,或者分析一段時間內人們對什么樣的內容比較感興趣,這些有趣的應用都得建立在聚類的基礎之上。作為一個數據挖掘的功能,聚類分析能作為獨 立的工具來獲得數據分布的情況,觀察每個簇的特點,集中對特定的某些簇做進一步的分析,此外,聚類分析還可以作為其他算法的預處理步驟,簡化計算量,提高分析效率&#
總結
以上是生活随笔為你收集整理的探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 探索推荐引擎内部的秘密,第 2 部分:
- 下一篇: Linux中的通配符