Calibration and Uncertainty

概念界定

校准描述模型输出概率与真实正确率是否一致，不确定性描述模型对预测结果缺乏确定把握的程度。对大模型而言，概率高不一定代表回答可靠，概率低也不一定表示完全错误。

语言模型会输出 token 概率，但这些概率主要来自训练目标和模型分布，并不天然等同于人类意义上的置信度。模型可能在错误答案上非常自信，也可能在多个合理答案之间分散概率。

理想校准的含义：如果模型对一批预测都给出 80% 的置信度，那么这些预测中约 80% 应该是正确的。

形式化地，可以粗略理解为：

P(correct | confidence = 0.8) ≈ 0.8

不确定性常见来源包括：

模型概率是“模型分布下某个 token 的相对可能性”，不是“这个回答在现实世界中正确的概率”。对于事实问答、医学、法律、金融等场景，这个区别尤其重要。

模型可能对错误事实给出流畅回答：

问题：某个不存在的论文是谁写的？
模型：给出一个看似合理但虚构的作者和年份。

这种情况下，生成文本的局部 token 概率可能很高，但事实正确性并不高。