spark聚类调研
https://www.jianshu.com/p/358e43a524bc(沒數(shù)據(jù)集)
https://www.jianshu.com/p/32e895a940a2(這個(gè)博客非常好,舉出了兩個(gè)不適用的例子,可以考慮使用dbscan)
 https://www.oreilly.com.cn/ideas/?p=471 (dbscan的spark使用參考這篇文章)
 http://www.sohu.com/a/125015680_473283(亂七八糟的)
 
https://www.cnblogs.com/ksWorld/p/6905836.html(scala電影聚類這個(gè)非常贊)
 https://blog.csdn.net/u011239443/article/details/51707802(scala電影聚類)
https://www.cnblogs.com/zhw-080/p/5750482.html(兩種分類方法+pyspark)
 https://blog.csdn.net/paicmis/article/details/76484434(有數(shù)據(jù)+scala)
 http://www.360doc.com/content/17/0622/17/37466175_665570772.shtml (scala版本,最后考慮)
 https://blog.csdn.net/chivalrousli/article/details/72639972 (scala版本+顧客聚類)
 https://blog.csdn.net/qq_28743951/article/details/53872757(顧客聚類,轉(zhuǎn)載的,應(yīng)該是上面一篇的)
https://blog.csdn.net/qq_30843221/article/details/54909788 (Java版本的聚類)
https://blog.csdn.net/qq_34531825/article/details/52608003 (scala LDA聚類,寫得不錯(cuò))
https://blog.csdn.net/qq_34531825/article/details/52663509(純理論分析)
 https://www.cnblogs.com/kongchung/p/5776438.html(非常不完整)
注意試一下dbscan
LDA,其實(shí)有兩種含義,
 一種是統(tǒng)計(jì)學(xué)中的分析方法:線性判別分析(Linear Discriminant Analysis)(用來降維)
 一種概率主題模型:隱含狄利克雷分布(Latent Dirichlet Allocation,簡稱LDA),本文闡述后者(聚類)
總結(jié)
 
                            
                        - 上一篇: 市面上的hadoop书籍调研
- 下一篇: NMN产品调研
