📉
有些学生不是“背太多”,而是连基础题型都没学会
原题做不好,换个问法更不会,练了半天分数还是上不去。
AI 也会这样。模型太简单、训练不够或特征太弱时,训练集和新数据都会做不好,这就叫 欠拟合
↓ 往下看,3 分钟搞懂

📉 欠拟合

Underfitting

学得太少,啥都不会。
🧒 极简版 🧑 场景版 🎓 精准版

🗺️ 概念坐标:先知道它在哪

欠拟合和过拟合是机器学习里最常见的一对失衡状态:一个学太浅,一个学太死。

🎯 泛化能力
目标概念
模型真正追求的是:旧题能做、新题也能做。欠拟合说明它连基本规律都没抓住,更谈不上泛化。
📉 欠拟合 ★
本概念
模型太简单、训练不够或表达能力不足,导致训练集和验证集都做不好,像“连课本例题都没吃透”。
📚 过拟合
并列对照
过拟合是“训练集学太死”;欠拟合则是“训练集都没学明白”。两者中间那段,才是理想学习区。
🧰 模型容量 / 特征
解决工具
增加模型能力、延长训练、改进特征表达或减弱正则,常常都是把模型从欠拟合拉回来的关键动作。

🧪 动手试试:模型太简单时会发生什么

拖动“模型复杂度”,看训练误差和验证误差怎么变。左侧那段“两个都很高”的区域,就是欠拟合最典型的样子。

复杂度
2 / 10
拖动滑块:看看什么时候模型连训练集都吃不透。

📦 拆开看:欠拟合由什么组成

点卡片翻面,把“学得不够”这件事拆成几个常见来源。

🧠
模型太简单
点我翻转
如果模型容量太小,自由度不够,它连真正存在的规律都装不进去,就像拿小学公式硬解高中题。
⏱️
训练不够久
点我翻转
有时不是模型太弱,而是还没学到位。训练轮数太少、优化没收敛,模型就停在“半懂不懂”的状态。
🧩
特征太弱
点我翻转
如果输入给模型的信息就不够表达问题本质,模型即使想学,也学不到关键模式。
🛑
约束太狠
点我翻转
正则太强、剪枝太狠、模型被限制得过于保守,也会让它不敢或不能把真实规律学进去。

⚙️ 它是怎么发生的

欠拟合不是“数据太坏”的同义词,更常见的是模型从一开始就没被给足学习能力。

1

模型起点就很弱

参数太少、结构太简单,或者特征表达不够,导致模型一开始就缺少描述规律的工具。

2

训练过程也不充分

如果学习率、训练轮数或优化过程不合适,模型还没来得及把基础模式吃透,就提前停下来了。

3

连训练集都拟合不好

因为能力不够,模型在旧题上都拿不到好成绩。训练误差降不下去,是最明显的信号。

4

验证集当然也不会好

既然连训练集里的基本规律都没学会,遇到新数据时表现自然更谈不上稳定。

5

你得到一个“什么都懂一点,但啥都做不好”的模型

这时模型不像在背答案,而像是课本只翻了封面:每个词都见过,真题一道都不会。

🆚 有它之前 vs 拉回正轨之后

欠拟合最大的坑,不是“模型没训练”,而是“你以为再多等等它就会自己变聪明”。

Before

如果模型太简单、特征太弱或者训练太短,它会在训练集和验证集上同时表现不佳。你看到的不是“谨慎稳健”,而是“根本没抓住问题本质”。

After

当你适当增加模型容量、延长训练、改进特征或放松过强约束后,模型才有机会先把基础规律学明白,再去谈泛化能力和稳定性。

⚠️ 常见误解

很多人看到模型分数低,第一反应是“数据不行”;其实也可能是模型自己太弱了。

训练和验证都差,说明数据肯定有问题。
不一定。也可能是模型太简单、训练不够、特征太弱,连训练集里的规律都没抓住。
欠拟合比较“保守”,所以总比过拟合好。
欠拟合只是另一种失败:它不是更安全,而是根本没学会该学的东西。
只要一直训练下去,欠拟合总会自动消失。
如果模型本身太弱或输入信息太差,光靠多训并不能解决问题,得一起改模型或特征。

🧱 类比边界

“书只翻了封面”这个类比好懂,但也不是一一对应。

🔗 相关概念

顺着这些概念看,欠拟合会更立体。

✅ 秒测

答完这 3 题,基本就能分清“学太少”和“学太死”。

1如果训练误差和验证误差都很高,最可能是哪种状态?
2下面哪个动作最可能帮助模型摆脱欠拟合?
3欠拟合最本质的问题是什么?

手机端可长按上方图片保存到相册