当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )

发布时间：2025/6/17 编程问答 54 豆豆

生活随笔收集整理的这篇文章主要介绍了【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 ) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

文章目录

一、 Apriori 算法过程
二、 Apriori 算法示例

参考博客 :

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集与事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

一、 Apriori 算法过程

原始数据集 $D\rm D$ ,

$1$ 项集 $C1\rm C_1$ , $2$ 项集 $C2\rm C_2$ , $⋯\cdots$ , $k\rm k$ 项集 $Ck\rm C_k$ , 这些项集都是候选项集 ,

根据原始数据集 $D\rm D$ , 创造 $1$ 项集 $C1\rm C_1$ , 然后对 $C1\rm C_1$ 执行数据集扫描函数 , 找到其中的频繁 $1$ 项集 $L1\rm L_1$ ,

根据频繁 $1$ 项集 $L1\rm L_1$ , 创造 $2$ 项集 $C2\rm C_2$ , 然后对 $C2\rm C_2$ 执行数据集扫描函数 , 找到其中的频繁 $2$ 项集 $L2\rm L_2$ ,

$⋮\vdots$

根据频繁 $k−1\rm k-1$ 项集 $Lk−1\rm L_{k-1}$ , 创造 $k\rm k$ 项集 $Ck\rm C_k$ , 然后对 $Ck\rm C_k$ 执行数据集扫描函数 , 找到其中的频繁 $k\rm k$ 项集 $Lk\rm L_k$ ,

二、 Apriori 算法示例

事物编号事物 ( 商品 )

$001$	奶粉 , 莴苣
$002$	莴苣 , 尿布 , 啤酒 , 甜菜
$003$	奶粉 , 尿布 , 啤酒 , 橙汁
$004$	奶粉 , 莴苣 , 尿布 , 啤酒
$005$	奶粉 , 莴苣 , 尿布 , 橙汁

最小支持度阈值为 $minsup=0.6\rm minsup= 0.6$

根据原始数据集 $D\rm D$ , 创造 $1$ 项集 $C1\rm C_1$ , 然后对 $C1\rm C_1$ 执行数据集扫描函数 , 找到其中的频繁 $1$ 项集 $L1\rm L_1$ ,

$1$ 项集 ${ 奶粉 \}$ 支持度 $0.8$
$1$ 项集 ${ 莴苣 \}$ 支持度 $0.8$
$1$ 项集 ${ 尿布 \}$ 支持度 $0.8$
$1$ 项集 ${ 啤酒 \}$ 支持度 $0.6$
$1$ 项集 ${ 甜菜 \}$ 支持度 $0.2$
$1$ 项集 ${ 诚挚 \}$ 支持度 $0.4$

$1$ 项集中只有 ${ 奶粉 \}$ , ${ 莴苣 \}$ , ${ 尿布 \}$ , ${ 啤酒 \}$ 是频繁 $1$ 项集 ;

根据频繁 $1$ 项集 $L1\rm L_1$ , 创造 $2$ 项集 $C2\rm C_2$ , 然后对 $C2\rm C_2$ 执行数据集扫描函数 , 找到其中的频繁 $2$ 项集 $L2\rm L_2$ ,

$2$ 项集 ${ 奶粉 , 莴苣 \}$ 支持度 $0.6$
$2$ 项集 ${ 莴苣 , 尿布 \}$ 支持度 $0.6$
$2$ 项集 ${ 莴苣 , 啤酒 \}$ 支持度 $0.4$
$2$ 项集 ${ 尿布 , 啤酒 \}$ 支持度 $0.8$
$2$ 项集 ${ 奶粉 , 尿布 \}$ 支持度 $0.6$
$2$ 项集 ${ 奶粉 , 啤酒 \}$ 支持度 $0.4$

$2$ 项集中只有 ${ 奶粉 , 尿布 \}$ , ${ 尿布 , 啤酒 \}$ , ${ 莴苣 , 尿布 \}$ , ${ 奶粉 , 莴苣 \}$ 是频繁 $2$ 项集 ;

根据频繁 $2$ 项集 $L1\rm L_1$ , 创造 $3$ 项集 $C3\rm C_3$ , 然后对 $C3\rm C_3$ 执行数据集扫描函数 , 找到其中的频繁 $3$ 项集 $L3\rm L_3$ ,

$3$ 项集 ${ 奶粉 , 莴苣 , 尿布 \}$ 支持度 $0.4$
$3$ 项集 ${ 奶粉 , 莴苣 , 啤酒 \}$ 支持度 $0.2$
$3$ 项集 ${ 莴苣 , 尿布 , 啤酒 \}$ 支持度 $0.4$
$3$ 项集 ${ 奶粉 , 尿布 , 啤酒 \}$ 支持度 $0.4$

$3$ 项集中没有频繁项集 ;

总结

以上是生活随笔为你收集整理的【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：【数据挖掘】关联规则挖掘 Apriori
下一篇：【音乐理论】音与音高 ( 音域 | 音符