Decoding 模块负责整理大模型如何从概率分布生成 token,包括自回归解码、采样、beam search 和投机解码。 Notes Autoregressive Decoding Sampling 投机解码 Beam Search