当前位置：首页 > 编程语言 > python >内容正文

python

亲和性分析_0(python数据挖掘入门与实践-实验1)

发布时间：2024/4/18 python 43 豆豆

生活随笔收集整理的这篇文章主要介绍了亲和性分析_0(python数据挖掘入门与实践-实验1) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

文章目录

解析
思路
效果
代码

解析

支持度：事件发生的总次数
置信度：一定条件下，事件发生的概率

思路

第一步：
导入数据，并交由变量X维护
创建特征数组
获取特征数量

第二步：
创建字典
valid_rules：(a,b):num_i的含义
表示买商品 a 之后，又买了商品 b 的消费者数量
invalid_rules：(a,b):num_i的含义
表示买商品 a 之后，没有买了商品 b 的消费者数量
nums_occurances：(a):num_i的含义
表示买商品 a 的消费者数量

第三步：
遍历 X 每 i 行
primise表示前提，conclusion表示结论
(X [i] [primise])=(1)：表示消费者 i 买features[primise]
(X [i] [primise], X [i] [conclusion])=(1,0)：表示消费者 i 买features[primise]之后, 没买了features[conclusion]
(X [i] [primise], X [i] [conclusion])=(1,1)：表示消费者 i 买features[primise]之后, 还买了features[conclusion]
若(X [i] [primise])=(1)，则nums_occurances(primise)+1
若(X [i] [primise], X [i] [conclusion])=(1,0)，则invalid_rules(primise,conclusion)+1
若(X [i] [primise], X [i] [conclusion])=(1,1)，则valid_rules(primise,conclusion)+1
遍历完成

第四步：
由valid_rules定义可得
支持度=valid_rules
置信度=(1, 1)发生的次数 / ((1, 1)发生的次数+(1, 0)发生的次数)

效果

代码

#库导入 import numpy as np from collections import defaultdict#导入数据 dataset_filename="D:/Python/Jupyter/Learning-Data-Mining-with-Python-master/Chapter 1/affinity_dataset.txt" X=np.loadtxt(dataset_filename) features=['bread','milk','cheese','apple','banana'] nums_feature=len(X[0])#遍历数据 valid_rules=defaultdict(int) invalid_rules=defaultdict(int) nums_occurances=defaultdict(int) for sample in X:for primise in range(nums_feature):if sample[primise]==0: continuenums_occurances[primise]+=1for conclusion in range(nums_feature):if conclusion==primise: continueif sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1else: invalid_rules[(primise,conclusion)]+=1#支持度 support=valid_rules #置信度 confidence=defaultdict(float) for primise,conclusion in valid_rules.keys():confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]#结果展示 for primise,conclusion in confidence.keys():print("Rule: If a people buys {0} they will also buy {1}".format(features[primise],features[conclusion]))print("- Support: {0}".format(confidence[(primise,conclusion)]))print("- Confidence: {0}".format(support[(primise,conclusion)]))

总结

以上是生活随笔为你收集整理的亲和性分析_0(python数据挖掘入门与实践-实验1)的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： Leetcode题库 19.删除链表的倒
下一篇： 3.2 python实战_线性回归的梯度