MachineLearning(11)-关联规则分析
關(guān)聯(lián)規(guī)則分析
- 1.簡(jiǎn)單來(lái)說(shuō)-關(guān)聯(lián)規(guī)則
- 2.經(jīng)典關(guān)聯(lián)規(guī)則挖掘-Apriori
1.簡(jiǎn)單來(lái)說(shuō)-關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則–通過(guò)量化的數(shù)字描述物品甲的出現(xiàn) 對(duì) 物品乙的出現(xiàn) 有多大影響。
最早是為了發(fā)現(xiàn)超市銷(xiāo)售數(shù)據(jù)庫(kù)中不同的商品之間的關(guān)聯(lián)關(guān)系:哪組商品可能會(huì)在一次購(gòu)物中同時(shí)購(gòu)買(mǎi)。
廣泛應(yīng)用于–購(gòu)物籃數(shù)據(jù),生物信息學(xué),醫(yī)療診斷,網(wǎng)頁(yè)挖掘和科學(xué)數(shù)據(jù)分析。
關(guān)聯(lián)規(guī)則舉例:
購(gòu)買(mǎi)面包的用戶(hù)很有可能會(huì)購(gòu)買(mǎi)牛奶,面包≥牛奶面包\geq 牛奶面包≥牛奶,面包為前項(xiàng),牛奶為后項(xiàng)。面包降價(jià)銷(xiāo)售,適當(dāng)提高牛奶的售價(jià)。這一關(guān)聯(lián)規(guī)則,可能會(huì)增加超市的整體利潤(rùn)。
“啤酒與尿布”–最常聽(tīng)到的例子
關(guān)聯(lián)規(guī)則分析: 找出數(shù)據(jù)集中各項(xiàng)之間的關(guān)聯(lián)關(guān)系。
發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法 為 無(wú)監(jiān)督學(xué)習(xí)算法–Apriori,Eclat,FP-Tree,灰色關(guān)聯(lián)法
2.經(jīng)典關(guān)聯(lián)規(guī)則挖掘-Apriori
Apriori–挖掘頻繁項(xiàng)集,核心思想:通過(guò)連接產(chǎn)生候選項(xiàng)與其支持度,通過(guò)剪枝生成頻繁項(xiàng)集。
基本概念:
依據(jù)公式計(jì)算相應(yīng)的概率就可以了,就是概念的理解。
總結(jié)
以上是生活随笔為你收集整理的MachineLearning(11)-关联规则分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: C++(0)--mac 使用VScode
- 下一篇: Linux(11)--(历史命令)Ctr