TODO: 说明 beam search 的候选序列扩展、beam width、长度惩罚,以及在 LLM 生成中的局限。