🍊 Latent Atlas 🍉

标签: ppo

此标签下有2条笔记。

  • 2026年5月29日

    Proximal Policy Optimization Algorithms

    • source
    • paper
    • reinforcement-learning
    • ppo
  • 2026年3月07日

    PPO

    • post-training
    • rlhf
    • ppo

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026