当前位置：首页 >

ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数

发布时间：2025/3/21 36 豆豆

生活随笔收集整理的这篇文章主要介绍了 ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数小编觉得挺不错的,现在分享给大家,帮大家做个参考.

Kaggle比赛之根据城市自行车共享系统数据预测在某个时间段自行车被租出去的个数

一、FE整体设计思路

二、FE分步骤处理

一、FE整体设计思路

二、FE分步骤处理

输出结果

# 处理时间字段：把datetime域切成日期、时间两个字段。 temp = pd.DatetimeIndex(data['datetime']) data['date'] = temp.date data['time'] = temp.time data.head()

#特征向量化 #打算用scikit-learn来建模。对于pandas的dataframe我们有方法/函数可以直接转成python中的dict #还要对离散值和连续值特征区分一下了，以便之后分开做不同的特征处理。from sklearn.feature_extraction import DictVectorizer# 我们把连续值的属性放入一个dict中 featureConCols = ['temp','atemp','humidity','windspeed','dateDays','hour'] dataFeatureCon = dataRel[featureConCols] dataFeatureCon = dataFeatureCon.fillna( 'NA' ) #in case I missed any X_dictCon = dataFeatureCon.T.to_dict().values() # 把离散值的属性放到另外一个dict中 featureCatCols = ['season','holiday','workingday','weather','Saturday', 'Sunday'] dataFeatureCat = dataRel[featureCatCols] dataFeatureCat = dataFeatureCat.fillna( 'NA' ) #in case I missed any X_dictCat = dataFeatureCat.T.to_dict().values() # 向量化特征 vec = DictVectorizer(sparse = False) X_vec_cat = vec.fit_transform(X_dictCat) X_vec_con = vec.fit_transform(X_dictCon)

总结

以上是生活随笔为你收集整理的ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： ML之FE：数据处理—特征工程之特征选择
下一篇： ML之RS：基于用户的CF+LFM实现的

ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数

一、FE整体设计思路

二、FE分步骤处理

相关代码

输出结果

总结