Apriori关联规则算法
生活随笔
收集整理的這篇文章主要介紹了
Apriori关联规则算法
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
關(guān)聯(lián)規(guī)則算法中的幾個(gè)重要概念:置信度、支持度、提升度、
例子:
支持度: 支持度是一個(gè)百分比,指某個(gè)商品組合出現(xiàn)的次數(shù)與總次數(shù)之間的比例,支持度越高表示該組合出現(xiàn)的幾率越大。
在上面圖中我們可以發(fā)現(xiàn)“牛奶”出現(xiàn)了 4 次,那么這 5 筆訂單中“牛奶”的支持度就是 4/5=0.8。 同樣“牛奶 + 面包”出現(xiàn)了 3 次,那么這 5 筆訂單中“牛奶 + 面包”的支持度就是 3/5=0.6。置信度: 表示你購(gòu)買了A商品后,你還會(huì)有多大的概率購(gòu)買B商品。
置信度(牛奶→啤酒)=2/4=0.5,代表如果你購(gòu)買了牛奶,有多大的概率會(huì)購(gòu)買啤酒? 置信度(啤酒→牛奶)=2/3=0.67,代表如果你購(gòu)買了啤酒,有多大的概率會(huì)購(gòu)買牛奶? 我們能看到,在 4 次購(gòu)買了牛奶的情況下,有 2 次購(gòu)買了啤酒,所以置信度 (牛奶→啤酒)=0.5,而在 3 次購(gòu)買啤酒的情況下,有 2 次購(gòu)買了牛奶,所以置信度(啤酒→牛奶)=0.67。提升度: 在做商品推薦的時(shí)候,提升度是重點(diǎn)考慮對(duì)象,提升度代表商品A的出現(xiàn),對(duì)商品B的出現(xiàn)概率提升了多少,即“商品 A 的出現(xiàn)?
總結(jié)
以上是生活随笔為你收集整理的Apriori关联规则算法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: K折交叉验证和pipeline
- 下一篇: PageRanke算法