当前位置：首页 > web >正文

集成学习 —— 梯度提升树GBDT、XGBoost

web 2025/9/7 6:54:28

目录

一、梯度提升树

1、残差提升树 Boosting Decision Tree

2、梯度提升树 Gradient Boosting Decision Tree

二、构建案例

1、初始化弱学习器(CART树)：

2、构建第1个弱学习器

3、构建第2个弱学习器

4、构建第3个弱学习器

5、构建最终弱学习器

6、构建总结

三、XGBoost

一、梯度提升树

1、残差提升树 Boosting Decision Tree

思想：通过拟合残差的思想来进行提升，残差：真实值 - 预测值

例如：

2、梯度提升树 Gradient Boosting Decision Tree

梯度提升树不再拟合残差，而是利用梯度下降的近似方法，利用损失函数的负梯度作为提升树算法中的残差近似值。

GBDT 拟合的负梯度就是残差。如果我们的 GBDT 进行的是分类问题，则损失函数变为 logloss，此时拟合的目标值就是该损失函数的负梯度值。

二、构建案例

已知：

1、初始化弱学习器(CART树)：

当模型预测值为何值时，会使得第一个弱学习器的平方误差最小，即：求损失函数对 f(xi) 的导数，并令导数为0。

2、构建第1个弱学习器

根据负梯度的计算方法得到下表：

以此类推，计算所有切分点情况，得到：

由此得到，当 6.5 作为切分点时，平方损失最小，此时得到第1棵决策树。

3、构建第2个弱学习器

以此类推，计算所有切分点情况，得到：

以3.5 作为切分点时，平方损失最小，此时得到第2棵决策树

4、构建第3个弱学习器

以此类推，计算所有切分点情况，得到：

以6.5 作为切分点时，平方损失最小，此时得到第3棵决策树

5、构建最终弱学习器

以 x=6 样本为例：输入到最终学习器中的结果：（存在误差，说明学习器不够）

$7.31 + (-1.07) + 0.22 + 0.15 = 6.61$

以此类推计算其他的预测值

6、构建总结

初始化弱学习器（目标值的均值作为预测值）
迭代构建学习器，每一个学习器拟合上一个学习器的负梯度
直到达到指定的学习器个数
当输入未知样本时，将所有弱学习器的输出结果组合起来作为强学习器的输出

三、XGBoost

待补充..........

http://www.xdnf.cn/news/20459.html

相关文章：

Javaweb 14.4 Vue3 视图渲染技术

【MySQL | 高级篇分片规则与管理监控】

从Java全栈到前端框架的全面实战：一次真实面试的深度解析

CentOS下Bind服务的安装与故障排查

pyAutoGUI 模块主要功能介绍-(1)鼠标功能

从 Excel 趋势线到机器学习：拆解 AI 背后的核心框架

【明道云】[工作表控件11] 地理位置控件与地图定位应用

用内存顺序实现三种内存顺序模型

安装es和kibana

Linux之Firewalld防火墙实战篇

[光学原理与应用-435]：晶体光学 - 晶体的结构-基元/原胞/晶胞/点阵

多次base64编码过滤垃圾字符

讲一下模版特化和偏特化的区别

如何在Kali Linux官网下载历史版本

Redis 持久化机制：AOF 日志深度解析

Hystrix与Sentinel-熔断限流

创建阿里云ECS实例操作（免费试用版）

【C++】模板和STL

Unity的UGUI更改背景以及添加中文字体

【FastDDS】XML profiles

AI助力特征工程：智能化数据科学新范式

leetcode 912 排序数组

微前端框架性能对比与选型指南：从理论到实践

Redis 的三种高效缓存读写策略！

从技术架构、接入路径、应用场景全梳理的智慧地产开源了

C++ 并发编程指南并发设计模式：Actor vs. CSP (生活场景版)

[Upscayl图像增强] Electron主进程命令 | 进程间通信IPC

Django 项目6：表单与认证系统