Label Smoothing

概念界定

Label Smoothing 是一种目标分布平滑方法：不再把真实标签视为完全 one-hot，而是给非真实类别分配少量概率质量。它常用于缓解模型过度自信。

标准交叉熵训练中，真实标签通常是 one-hot 分布。这会鼓励模型把真实类别概率推到接近 1，把其他类别概率推到接近 0。对于分类任务，这可能导致模型过度自信，影响泛化和校准。

假设类别数为 K，平滑系数为 ε。原本 one-hot 标签：

y_true = 1, y_other = 0

平滑后可写作：

y_true = 1 - ε
y_other = ε / (K - 1)

也有实现会把 ε 分配到所有类别上。

Label Smoothing 相当于告诉模型：即使正确答案是某个类别，也不要对它过度自信。这会让目标分布更平滑，降低模型把概率全部压到单一类别上的倾向。