人工智能100问☞第28问:什么是过拟合与欠拟合?
目录
一、通俗解释
二、专业解析
三、权威参考
过拟合是模型学得太细导致新数据翻车,欠拟合是学得太糙连现有数据都搞不定,前者死磕训练数据噪音,后者连基本规律都没抓住。
一、通俗解释
过拟合就像一个小学生考试前只背答案不学方法,遇到原题能拿满分,但题目稍作改动就完全不会。比如用高次多项式强行拟合所有数据点,连噪声都记住了,导致面对新数据时“死记硬背”失效。
欠拟合则像连基本公式都没背熟的考生,原题都做不对,更别提新题。比如用直线拟合曲线数据,模型过于简单,连数据的基本规律都抓不住。
二、专业解析
1、过拟合(Overfitting)
定义:模型在训练集上表现优异(低偏差),但在测试集或新数据上泛化能力差(高方差)。其本质是模型复杂度过高,将训练数据中的噪声和局部特征误认为全局规律。
典型表现:
训练误差趋近于0,测试误差显著升高
模型参数过多(如神经网络层数冗余)或特征冗余
解决方法:
正则化(L1/L2约束参数)
数据增强(增加样本量或清洗噪声)
模型简化(减少神经网络层数/决策树剪枝)</