当前位置:
首页 >
深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现
发布时间:2025/4/5
52
豆豆
生活随笔
收集整理的这篇文章主要介绍了
深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
前言
今天博主来介绍一个超级简单并且又极其实用的boosting算法包Catboost,据开发者所说这一boosting算法是超越Lightgbm和XGBoost的又一个神器。
catboost 简介
在博主看来catboost有一下三个的优点:
- 它自动采用特殊的方式处理类别型特征(categorical features)。首先对categorical features做一些统计,计算某个类别特征(category)出现的频率,之后加上超参数,生成新的数值型特征(numerical features)。这也是我在这里介绍这个算法最大的motivtion,有了catboost,再也不用手动处理类别型特征了。
- catboost还使用了组合类别特征,可以利用到特征之间的联系,这极大的丰富了特征维度。
- catboost的基模型采用的是对称树,同时计算leaf-value方式和传统的boosting算法也不一样,传统的boosting算法计算的是平均数,而catboost在这方面做了优化采用了其他的算法,这些改进都能防止模型过拟合。
catboost 实战
这里博主采用的是之前参加一个CTR点击率预估的数据集,首先通过pandas读入数据。
from catboost import CatBoostClassifier import pandas as pd from sklearn.model_selection import train_test_split i
总结
以上是生活随笔为你收集整理的深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 深度学习核心技术精讲100篇(七)-ke
- 下一篇: 深度学习核心技术精讲100篇(十四)-一