当前位置：首页 > 编程语言 > python >内容正文

python

花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析

发布时间：2025/3/15 python 40 豆豆

生活随笔收集整理的这篇文章主要介绍了花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析小编觉得挺不错的,现在分享给大家,帮大家做个参考.

1、导入数据

#导入花萼数据 from sklearn.datasets import load_iris iris=load_iris() iris.data

前四列为花萼长度，花萼宽度，花瓣长度，花瓣宽度等4个用于识别鸢尾花的属性

2、建模

#创建kmeans聚类 from sklearn.cluster import KMeans kmeans=KMeans(n_clusters=3,init='k-means++',random_state=123) #分为三类 y_kmeans=kmeans.fit_predict(iris.data) y_kmeans

可以看出0聚类得很好，但是2当中夹杂着1，1中夹杂着2，1和2存在混淆

3、可视化聚类模型

import matplotlib.pyplot as plt #画出了三个类的中心点位置 plt.scatter(iris.data[y_kmeans==0,2],iris.data[y_kmeans==0,3],s=100,c='red',label='Cluter 1') plt.scatter(iris.data[y_kmeans==1,2],iris.data[y_kmeans==1,3],s=100,c='blue',label='Cluter 2') plt.scatter(iris.data[y_kmeans==2,2],iris.data[y_kmeans==2,3],s=100,c='green',label='Cluter 3')plt.scatter(kmeans.cluster_centers_[:,2],kmeans.cluster_centers_[:,3],s=100,c='black',label='Controids') plt.legend() plt.show()

从图上可以看出，第0类为花瓣长度，花瓣宽度较低的类别，第1类为花瓣长度，花瓣宽度居中的类别，图中黑点为三个类别的中心点

4、模型优化

对于聚类模型，分多少类是关键点，每类数据到其中心点的距离之和，值越小据类越好，但是当类别越多，k自然就越小，值对应的也就越小，因此有一种判定方法当快速下降趋于平缓下降的转折点，为聚类的最好情况。

vess=[] for i in range(1,4):kmeans=KMeans(n_clusters=i,init='k-means++',random_state=42)kmeans.fit(iris.data)vess.append(kmeans.inertia_)#kmeans.inertia_ 每类数据到其中心点的距离之和 plt.plot(range(1,4),vess) plt.show()

可以发现到横坐标为2时，中心点距离缓慢下降，所以分成两类会比较好

以上简单的聚类模型建立完毕啦，后续再优化吧

总结

以上是生活随笔为你收集整理的花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： python怎么输入一个数字并调用_py
下一篇：代码实现tan graph model