Day16_【机器学习—模型拟合问题】
一、拟合
定义:样本点在模型的分布情况
- 正好拟合 —— 训练集表现好,测试集表现好
- 欠拟合 —— 训练集表现差,测试集表现差,产生原因:模型过于简单
- 过拟合 —— 训练集表现好,测试集表现差,产生原因:模型过于复杂,数据不纯,数据太少(一见钟情属于过拟合,要求特别高)
二、泛化
泛化能力 :模型在新数据集上表现好坏的能力
三、奥卡姆剃刀原则
泛化误差相同的两个模型,取较简单的那个模型
定义:样本点在模型的分布情况
泛化能力 :模型在新数据集上表现好坏的能力
泛化误差相同的两个模型,取较简单的那个模型