🍊 Latent Atlas 🍉

❯

❯

❯

Learning to summarize from human feedback

Learning to summarize from human feedback

2026年5月29日1分钟阅读

source
paper
rlhf
summarization
reward-model

基本信息

Title: Learning to summarize from human feedback
Source type: paper
Related topic notes: RLHF, Reward Model, On-policy KD

TODO

阅读论文原文，整理 summarization 场景中人类偏好、reward model 和 policy optimization 的流程。
回填 RLHF 在开放生成任务中优于纯 supervised learning 的证据与边界。
补充 human evaluation、reward over-optimization 和摘要质量指标之间的关系。

关系图谱

基本信息
TODO

反向链接

Papers
Post-training
On-policy KD
PPO
Reward Model
RLHF

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026