近邻算法分类
scikit-learn已经封装好很多数据挖掘的算法
现介绍数据挖掘框架的搭建方法
- 转换器(Transformer)用于数据预处理,数据转换
- 流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装)
- 估计器(Estimator)用于分类,聚类,回归分析(各种算法对象)
- 所有的估计器都有下面2个函数
- fit() 训练
- 用法:estimator.fit(X_train, y_train),
- estimator = KNeighborsClassifier() 是scikit-learn算法对象
- X_train = dataset.data 是numpy数组
- y_train = dataset.target 是numpy数组
- predict() 预测
- 用法:estimator.predict(X_test)
- estimator = KNeighborsClassifier() 是scikit-learn算法对象
- X_test = dataset.data 是numpy数组
- fit() 训练
- 所有的估计器都有下面2个函数
电离层数据集
电离层数据集(Ionosphere Dataset)需要根据给定的电离层中的自由电子的雷达回波预测大气结构。
它是一个二元分类问题。每个类的观察值数量不均等,一共有 351 个观察值,34 个输入变量和1个输出变量。变量名如下:
1 17对雷达回波数据。
2 … …
3 类
总结
- 上一篇: 使用jieba 提取 关键词
- 下一篇: svm的三个核函数