欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

K-means均值聚类算法寻找质心,Python

发布时间:2023/12/29 python 42 豆豆
生活随笔 收集整理的这篇文章主要介绍了 K-means均值聚类算法寻找质心,Python 小编觉得挺不错的,现在分享给大家,帮大家做个参考.
import numpy as np# 欧氏距离计算 def distEclud(x,y):return np.sqrt(np.sum((x-y)**2)) # 计算欧氏距离# 为给定数据集构建一个包含K个随机质心的集合 def randCent(dataSet,k):m,n = dataSet.shapecentroids = np.zeros((k,n))for i in range(k):index = int(np.random.uniform(0,m)) centroids[i,:] = dataSet[index,:]return centroids# k均值聚类 def kmeans_open(dataSet,k):m = np.shape(dataSet)[0] #行的数目# 第一列存样本属于哪一簇# 第二列存样本的到簇的中心点的误差clusterAssment = np.mat(np.zeros((m,2)))clusterChange = True# 第1步 初始化centroidscentroids = randCent(dataSet,k)while clusterChange:clusterChange = False# 遍历所有的样本(行数)for i in range(m):minDist = 100000.0minIndex = -1# 遍历所有的质心#第2步 找出最近的质心for j in range(k):# 计算该样本到质心的欧式距离distance = distEclud(centroids[j,:],dataSet[i,:])if distance < minDist:minDist = distanceminIndex = j# 第 3 步:更新每一行样本所属的簇if clusterAssment[i,0] != minIndex:clusterChange = TrueclusterAssment[i,:] = minIndex,minDist**2#第 4 步:更新质心for j in range(k):pointsInCluster = dataSet[np.nonzero(clusterAssment[:,0].A == j)[0]] # 获取簇类所有的点centroids[j,:] = np.mean(pointsInCluster,axis=0) # 对矩阵的行求均值return clusterAssment.A[:,0], centroids

 

总结

以上是生活随笔为你收集整理的K-means均值聚类算法寻找质心,Python的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。