欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

近邻算法分类

发布时间:2024/10/8 编程问答 35 豆豆
生活随笔 收集整理的这篇文章主要介绍了 近邻算法分类 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

scikit-learn已经封装好很多数据挖掘的算法

现介绍数据挖掘框架的搭建方法

  • 转换器(Transformer)用于数据预处理,数据转换
  • 流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装)
  • 估计器(Estimator)用于分类,聚类,回归分析(各种算法对象)
    • 所有的估计器都有下面2个函数
      • fit() 训练
        • 用法:estimator.fit(X_train, y_train),
        • estimator = KNeighborsClassifier() 是scikit-learn算法对象
        • X_train = dataset.data 是numpy数组
        • y_train = dataset.target 是numpy数组
      • predict() 预测
        • 用法:estimator.predict(X_test)
        • estimator = KNeighborsClassifier() 是scikit-learn算法对象
        • X_test = dataset.data 是numpy数组

电离层数据集
电离层数据集(Ionosphere Dataset)需要根据给定的电离层中的自由电子的雷达回波预测大气结构。

它是一个二元分类问题。每个类的观察值数量不均等,一共有 351 个观察值,34 个输入变量和1个输出变量。变量名如下:

1 17对雷达回波数据。
2 … …
3 类

总结

以上是生活随笔为你收集整理的近邻算法分类的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。