【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
文章目錄
- 一、 Apriori 算法過程
- 二、 Apriori 算法示例
參考博客 :
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 關(guān)聯(lián)規(guī)則簡介 | 數(shù)據(jù)集 與 事物 Transaction 概念 | 項 Item 概念 | 項集 Item Set | 頻繁項集 | 示例解析 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 關(guān)聯(lián)規(guī)則 | 數(shù)據(jù)項支持度 | 關(guān)聯(lián)規(guī)則支持度 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 頻繁項集 | 非頻繁項集 | 強關(guān)聯(lián)規(guī)則 | 弱關(guān)聯(lián)規(guī)則 | 發(fā)現(xiàn)關(guān)聯(lián)規(guī)則 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 關(guān)聯(lián)規(guī)則性質(zhì) | 非頻繁項集超集性質(zhì) | 頻繁項集子集性質(zhì) | 項集與超集支持度性質(zhì) )
一、 Apriori 算法過程
原始數(shù)據(jù)集 D\rm DD ,
111 項集 C1\rm C_1C1? , 222 項集 C2\rm C_2C2? , ?\cdots? , k\rm kk 項集 Ck\rm C_kCk? , 這些項集都是候選項集 ,
根據(jù) 原始數(shù)據(jù)集 D\rm DD , 創(chuàng)造 111 項集 C1\rm C_1C1? , 然后對 C1\rm C_1C1? 執(zhí)行 數(shù)據(jù)集掃描函數(shù) , 找到其中的 頻繁 111 項集 L1\rm L_1L1? ,
根據(jù) 頻繁 111 項集 L1\rm L_1L1? , 創(chuàng)造 222 項集 C2\rm C_2C2? , 然后對 C2\rm C_2C2? 執(zhí)行 數(shù)據(jù)集掃描函數(shù) , 找到其中的 頻繁 222 項集 L2\rm L_2L2? ,
?\vdots?
根據(jù) 頻繁 k?1\rm k-1k?1 項集 Lk?1\rm L_{k-1}Lk?1? , 創(chuàng)造 k\rm kk 項集 Ck\rm C_kCk? , 然后對 Ck\rm C_kCk? 執(zhí)行 數(shù)據(jù)集掃描函數(shù) , 找到其中的 頻繁 k\rm kk 項集 Lk\rm L_kLk? ,
二、 Apriori 算法示例
| 001001001 | 奶粉 , 萵苣 |
| 002002002 | 萵苣 , 尿布 , 啤酒 , 甜菜 |
| 003003003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
| 004004004 | 奶粉 , 萵苣 , 尿布 , 啤酒 |
| 005005005 | 奶粉 , 萵苣 , 尿布 , 橙汁 |
最小支持度閾值為 minsup=0.6\rm minsup= 0.6minsup=0.6
根據(jù) 原始數(shù)據(jù)集 D\rm DD , 創(chuàng)造 111 項集 C1\rm C_1C1? , 然后對 C1\rm C_1C1? 執(zhí)行 數(shù)據(jù)集掃描函數(shù) , 找到其中的 頻繁 111 項集 L1\rm L_1L1? ,
111 項集 {奶粉}\{ 奶粉 \}{奶粉} 支持度 0.80.80.8
111 項集 {萵苣}\{ 萵苣 \}{萵苣} 支持度 0.80.80.8
111 項集 {尿布}\{ 尿布 \}{尿布} 支持度 0.80.80.8
111 項集 {啤酒}\{ 啤酒 \}{啤酒} 支持度 0.60.60.6
111 項集 {甜菜}\{ 甜菜 \}{甜菜} 支持度 0.20.20.2
111 項集 {誠摯}\{ 誠摯 \}{誠摯} 支持度 0.40.40.4
111 項集中只有 {奶粉}\{ 奶粉 \}{奶粉} , {萵苣}\{ 萵苣 \}{萵苣} , {尿布}\{ 尿布 \}{尿布} , {啤酒}\{ 啤酒 \}{啤酒} 是頻繁 111 項集 ;
根據(jù) 頻繁 111 項集 L1\rm L_1L1? , 創(chuàng)造 222 項集 C2\rm C_2C2? , 然后對 C2\rm C_2C2? 執(zhí)行 數(shù)據(jù)集掃描函數(shù) , 找到其中的 頻繁 222 項集 L2\rm L_2L2? ,
222 項集 {奶粉,萵苣}\{ 奶粉 , 萵苣 \}{奶粉,萵苣} 支持度 0.60.60.6
222 項集 {萵苣,尿布}\{ 萵苣 , 尿布 \}{萵苣,尿布} 支持度 0.60.60.6
222 項集 {萵苣,啤酒}\{ 萵苣 , 啤酒 \}{萵苣,啤酒} 支持度 0.40.40.4
222 項集 {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒} 支持度 0.80.80.8
222 項集 {奶粉,尿布}\{ 奶粉 , 尿布 \}{奶粉,尿布} 支持度 0.60.60.6
222 項集 {奶粉,啤酒}\{ 奶粉 , 啤酒 \}{奶粉,啤酒} 支持度 0.40.40.4
222 項集中只有 {奶粉,尿布}\{ 奶粉 , 尿布 \}{奶粉,尿布} , {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒} , {萵苣,尿布}\{ 萵苣 , 尿布 \}{萵苣,尿布} , {奶粉,萵苣}\{ 奶粉 , 萵苣 \}{奶粉,萵苣} 是 頻繁 222 項集 ;
根據(jù) 頻繁 222 項集 L1\rm L_1L1? , 創(chuàng)造 333 項集 C3\rm C_3C3? , 然后對 C3\rm C_3C3? 執(zhí)行 數(shù)據(jù)集掃描函數(shù) , 找到其中的 頻繁 333 項集 L3\rm L_3L3? ,
333 項集 {奶粉,萵苣,尿布}\{ 奶粉 , 萵苣 , 尿布 \}{奶粉,萵苣,尿布} 支持度 0.40.40.4
333 項集 {奶粉,萵苣,啤酒}\{ 奶粉 , 萵苣 , 啤酒 \}{奶粉,萵苣,啤酒} 支持度 0.20.20.2
333 項集 {萵苣,尿布,啤酒}\{ 萵苣 , 尿布 , 啤酒 \}{萵苣,尿布,啤酒} 支持度 0.40.40.4
333 項集 {奶粉,尿布,啤酒}\{ 奶粉 , 尿布 , 啤酒 \}{奶粉,尿布,啤酒} 支持度 0.40.40.4
333 項集中沒有頻繁項集 ;
總結(jié)
以上是生活随笔為你收集整理的【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数据挖掘】关联规则挖掘 Apriori
- 下一篇: 【Android 安全】DEX 加密 (