过拟合和欠拟合
1 引言
过拟合和欠拟合是机器学习模型训练中两种常见的问题,分别对应模型复杂度过高或过低导致的泛化能力不足现象。以下从定义、原因、表现及解决方法等方面进行系统分析:
核心区别:欠拟合是模型“学得太少”,而过拟合是模型“死记硬背训练数据但未理解规律”。
2 原因与表现
2.1 欠拟合
① 原因:
- 模型复杂度不足(如用线性模型拟合非线性数据);
- 特征数量少或质量差(如未提取关键特征);
- 训练数据量不足或噪声过多。
② 表现:
- 训练集和测试集上误差均较高,预测结果偏离实际趋势(如分类任务中决策边界过于平滑)。
2.2 过拟合
① 原因:
- 模型复杂度过高(如高阶多项式、深度神经网络层数过多);
- 训练数据量少或噪声大;
- 训练时间过长或未使用正则化。
② 表现:
- 训练误差接近0,但测试误差显著升高,模型对噪声敏感(如分类边界不规则波动)。