Loss Function
损失函数在 AI 训练体系中的位置——先有地图感,再深入细节
左边是"射击手"(AI模型)的预测,右边是靶心(正确答案)。损失函数测量两者之间的距离。拖动下方滑块模拟 AI 调整过程。
真实答案 = 1.0(是猫) | AI 预测 = 0.30 | 损失 = 1.20
点击卡片翻转,看每个部分在"射击打靶"类比中对应什么
AI 每轮训练中,损失函数扮演的角色
AI 拿到一张猫的图片,用当前参数输出预测:"这是猫的概率 = 0.3"
正确答案是 1.0(确实是猫),损失函数算出距离:交叉熵损失 = 1.20——"你离答案还很远!"
损失函数对每个参数求导,算出梯度:"把第 327 号参数往上调 0.001,把第 1088 号参数往下调 0.003……"
所有参数微调一次。下一轮 AI 预测 0.5 → 0.7 → 0.9 → 0.95……损失越来越小,预测越来越准
拖动斜率和截距,让预测线靠近数据点。右侧损失地形图告诉你"为什么梯度下降要往低处走"
MSE 损失 = 2.45 | 拖动滑块让损失尽可能接近 0
一个天气预报 AI,有没有损失函数,结果天差地别
训练一个天气预报 AI,它预测"明天 25°C",实际是 20°C。
没有损失函数,AI 不知道自己猜错了 5 度,也不知道该调高还是调低,只能瞎猜——永远学不会。
MSE 损失函数算出 (25-20)² = 25。这个数字不仅告诉 AI"你错了",还通过梯度告诉它"你猜高了,下次往低调"。
下一次:22°C → 损失=4
再下一次:20.5°C → 损失=0.25
损失越来越小 = 预测越来越准
大多数人第一次接触损失函数时,都会有这些误解
射击打靶的类比在哪里不完全准确
理解损失函数后,可以继续探索这些概念
3 道题,检验你对损失函数的理解
1损失函数的值越低,一定代表模型越好吗?
2预测房价用什么损失函数最合适?
3损失函数除了告诉模型"差多远",还提供什么关键信息?