欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

sklearn中的fit_transform和transform以及什么时候使用

发布时间:2025/4/16 编程问答 34 豆豆
生活随笔 收集整理的这篇文章主要介绍了 sklearn中的fit_transform和transform以及什么时候使用 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

在使用sklearn对数据进行预处理的时候很有可能会遇到fit_transform和transform,网上不少资料写的模棱两可,在这里我回答几个核心问题,也许看完我写的这篇文章,一些疑惑就会豁然开朗。

为什么在训练集进行fit而不在测试集fit

机器学习假设,训练集和测试集的每个样本都是从同一分布中抽样得到的。所以在训练集中fit之后在测试集就不能再fit了。要不然二者可能不是同一分布模型,预测效果会很糟糕。

fit_transform那么fit到底fit什么

可以说不同的sklearn方法fit的东西都是不一样的,对于LabelBinar而言,因为fit阶段没有fit东西,所以训练集和测试集都可以写成fit_transform(我仍然建议不要这样写,统一格式,训练集fit在测试集transform会更好),而对于StandardScalar而言,fit的是均值和方差。所以一定要在训练集写成fit_transform,在测试集写成transform

总结

以上是生活随笔为你收集整理的sklearn中的fit_transform和transform以及什么时候使用的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。