🍊 Latent Atlas 🍉

标签: alignment

此标签下有7条笔记。

  • 2026年5月29日

    Constitutional AI

    • source
    • paper
    • alignment
    • rlaif
    • safety
  • 2026年5月29日

    Direct Preference Optimization

    • source
    • paper
    • dpo
    • preference-optimization
    • alignment
  • 2026年3月07日

    DPO

    • training
    • post-training
    • alignment
  • 2026年3月07日

    RLHF

    • training
    • post-training
    • alignment
  • 2026年3月01日

    Reward Model

    • training
    • post-training
    • alignment
  • 2026年3月01日

    SFT

    • training
    • post-training
    • alignment
  • 2025年12月28日

    KL Divergence

    • math
    • information-theory
    • alignment

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026