数据挖掘系列(5)使用mahout做海量数据关联规则挖掘
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘系列(5)使用mahout做海量数据关联规则挖掘
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
上一篇介紹了用開源數據挖掘軟件weka做關聯規則挖掘,weka方便實用,但不能處理大數據集,因為內存放不下,給它再多的時間也是無用,因此需要進行分布式計算,mahout是一個基于hadoop的分布式數據挖掘開源項目(mahout本來是指一個騎在大象上的人)。掌握了關聯規則的基本算法和使用,加上分布式關聯規則挖掘后,就可以處理基本的關聯規則挖掘工作了,實踐中只需要把握業務,理解數據便可游刃有余。
總結
以上是生活随笔為你收集整理的数据挖掘系列(5)使用mahout做海量数据关联规则挖掘的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据挖掘系列(4)使用weka做关联规则
- 下一篇: Hadoop在Ubuntu下的安装配置(