TODO: 说明推理 benchmark 方法,包括固定输入输出长度、并发、数据集、warmup、统计指标和公平比较。