当前位置：首页 > java >正文

Diagnosing bias and variance｜诊断偏差和方差

java 2025/8/28 5:25:59

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章，有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn，这里还有很多有关计算机的知识，欢迎进行留言或者来我的网站进行留言！！！

-----------------------------------------------------------------------------------------------

一、偏差和方差的拟合对比

这张图片通过房价预测（Price vs. Size）的回归问题，展示了不同多项式回归模型的拟合情况，重点对比了高偏差（欠拟合）和理想拟合和高方差（过拟合）的模型表现，并涉及训练误差（Jtrain）和交叉验证误差（Jcv）的变化。

模型方程：

（线性回归，多项式阶数 d=1）

关键观察：

尝试调整模型复杂度（提高 d）：

结论：模型欠拟合，需要增加特征或使用更复杂的模型（如 d≥2）。

模型方程：

（二次多项式回归，多项式阶数 d=2）

关键观察：

结论：模型复杂度恰到好处（d=2），平衡了偏差和方差。

模型方程：

关键观察：

结论：模型过拟合，需要减少特征或使用更简单的模型（如 d≦4）。

模型类型	多项式阶数 d	训练误差 Jtrain	验证误差 Jcv
高偏差（欠拟合）	1	高	高
理想拟合	2	低	低
高方差（过拟合）	4	极低	高

这张图片展示了训练误差（Jtrain）和交叉验证误差（Jcv）随多项式阶数（degree of polynomial）变化的趋势，用于诊断模型的偏差（Bias）和方差（Variance）。

关键元素说明

横轴（degree of polynomial）：
- 表示模型复杂度（多项式阶数 d），从低（如 d=1）到高（如 d=4 或更高）。
纵轴（误差值）：
- Jtrain(W,b)：训练集误差，反映模型对训练数据的拟合程度。
- Jcv(W,b)：交叉验证集误差，反映模型泛化能力。
曲线趋势（图中未绘制但隐含）：
- 低阶（如 d=1）：
  - Jtrain 和 Jcv 均高 → 高偏差（欠拟合）。
- 中阶（如 d=2）：
  - Jtrain 和 Jcv 均较低且接近 → 理想拟合。
- 高阶（如 d≥4）：
  - Jtrain 极低，Jcv 显著升高 → 高方差（过拟合）。

这张图片系统性地展示了如何通过训练误差（J_train）和交叉验证误差（J_cv）来判断算法存在高偏差（欠拟合）还是高方差（过拟合）问题，以及两者的组合情况。

核心诊断逻辑

高偏差（欠拟合）特征：
- Jtrain 很高（模型无法拟合训练数据）
- Jcv 也很高（泛化能力差）
- 典型表现：简单模型（如低阶多项式）
高方差（过拟合）特征：
- Jtrain 可能很低（完美拟合训练数据）
- Jcv 显著高于 Jtrain（泛化能力差）
- 典型表现：复杂模型（如高阶多项式）
高偏差+高方差特殊情况：
- Jtrain 很高（欠拟合训练数据）
- Jcv 比 Jtrain 更高（同时存在泛化问题）
- 典型场景：模型既不够灵活又过度适应噪声