🍊 Latent Atlas 🍉
Search
搜索
暗色模式
亮色模式
探索
标签: alignment
此标签下有7条笔记。
2026年5月29日
Constitutional AI
source
paper
alignment
rlaif
safety
2026年5月29日
Direct Preference Optimization
source
paper
dpo
preference-optimization
alignment
2026年3月07日
DPO
training
post-training
alignment
2026年3月07日
RLHF
training
post-training
alignment
2026年3月01日
Reward Model
training
post-training
alignment
2026年3月01日
SFT
training
post-training
alignment
2025年12月28日
KL Divergence
math
information-theory
alignment