增量数据挖掘论文推荐
生活随笔
收集整理的這篇文章主要介紹了
增量数据挖掘论文推荐
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
論文背景介紹
Fp-tree的改進算法
Cantree算法簡介
對Fp-tree的構造做了精簡,省去了Fp-tree開始對1-itemset的support_count的統計,所以它僅僅需要掃描一次數據庫。在構造樹的過程中對于每個transaction中的itemsets按照一個固定順序排序(比如升序排序),然后按照Fp-tree的構造方法遍歷數據庫。形成的Cantree要比Fp-tree大一些,因為它增加了一些非頻繁項。正因為如此,當有新的db‘加入時,它可以直接對transaction進行掃描加入Cantree當中。
CanTree在查找過程類似于Fp-tree,不同點在于因為Fp-tree中的節點已經按照support_count排序,它的查找過程是自下而上的,而CanTree需要對上下路徑分別進行查找,并排除其中小于min_support_count的項。
詳細的算法介紹和測評結果見論文:CanTree a tree structure for efficient incremental mining of frequent patterns
總結
以上是生活随笔為你收集整理的增量数据挖掘论文推荐的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 线框模型_进行计划之前:线框和模型
- 下一篇: 工作经验教训_在设计工作五年后获得的经验