sklearn中的fit_transform和transform以及什么时候使用
生活随笔
收集整理的这篇文章主要介绍了
sklearn中的fit_transform和transform以及什么时候使用
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
在使用sklearn对数据进行预处理的时候很有可能会遇到fit_transform和transform,网上不少资料写的模棱两可,在这里我回答几个核心问题,也许看完我写的这篇文章,一些疑惑就会豁然开朗。
为什么在训练集进行fit而不在测试集fit
机器学习假设,训练集和测试集的每个样本都是从同一分布中抽样得到的。所以在训练集中fit之后在测试集就不能再fit了。要不然二者可能不是同一分布模型,预测效果会很糟糕。
fit_transform那么fit到底fit什么
可以说不同的sklearn方法fit的东西都是不一样的,对于LabelBinar而言,因为fit阶段没有fit东西,所以训练集和测试集都可以写成fit_transform(我仍然建议不要这样写,统一格式,训练集fit在测试集transform会更好),而对于StandardScalar而言,fit的是均值和方差。所以一定要在训练集写成fit_transform,在测试集写成transform
总结
以上是生活随笔为你收集整理的sklearn中的fit_transform和transform以及什么时候使用的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 如何正确使用迁移学习
- 下一篇: 介绍一种导入文件夹中图片数据集的方法