Logits and Output Head

概念界定

Logits 是模型输出的未归一化分数，输出头是把 hidden state 映射到任务输出空间的线性层。在语言模型中，LM Head 通常把最后一层 hidden state 映射到词表大小的 logits。

Transformer 内部 hidden state 的维度通常是 D，但语言模型最终需要在 V 个词表 token 中预测下一个 token。因此需要一个输出头把 [D] 维表示映射到 [V] 维 logits。

最后一层 hidden state：

h_t: [D]

LM Head 权重：

W_vocab: [D, V]

输出 logits：

z_t = h_t W_vocab
z_t: [V]

再经过 softmax：

p_t = softmax(z_t)

得到下一个 token 的概率分布。

输出头可以理解为对每个候选 token 打分。logit 越高，经过 softmax 后该 token 的概率通常越高。

语言模型预测下一个 token：

final hidden state: [B, T, D]
lm_head:            [D, V]
logits:             [B, T, V]

训练时，对每个位置的 logits 和真实下一个 token 计算交叉熵。