欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

python聚类分析sklearn_如何使用sklearn k-mean对数据进行聚类分析?

发布时间:2025/3/20 37 豆豆
生活随笔 收集整理的这篇文章主要介绍了 python聚类分析sklearn_如何使用sklearn k-mean对数据进行聚类分析? 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

# -*- coding: utf-8 -*-

from sklearn.cluster import KMeans

from sklearn.externals import joblib

import numpy

final = open('c:/test/final.dat' , 'r')

data = [line.strip().split('\t') for line in final]

feature = [[float(x) for x in row[3:]] for row in data]

#调用kmeans类

clf = KMeans(n_clusters=9)

s = clf.fit(feature)

print s

#9个中心

print clf.cluster_centers_

#每个样本所属的簇

print clf.labels_

#用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数

print clf.inertia_

#进行预测

print clf.predict(feature)

#保存模型

joblib.dump(clf , 'c:/km.pkl')

#载入保存的模型

clf = joblib.load('c:/km.pkl')

'''

#用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数

for i in range(5,30,1):

clf = KMeans(n_clusters=i)

s = clf.fit(feature)

print i , clf.inertia_

'''

总结

以上是生活随笔为你收集整理的python聚类分析sklearn_如何使用sklearn k-mean对数据进行聚类分析?的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。