🍊 Latent Atlas 🍉

标签: dpo

此标签下有1条笔记。

  • 2026年5月29日

    Direct Preference Optimization

    • source
    • paper
    • dpo
    • preference-optimization
    • alignment

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026