🍊 Latent Atlas 🍉

标签: reasoning

此标签下有7条笔记。

  • 2026年5月29日

    Distilling Step-by-Step

    • source
    • paper
    • distillation
    • reasoning
    • rationale
  • 2026年5月29日

    DeepSeekMath

    • source
    • paper
    • reasoning
    • grpo
    • math
  • 2026年5月28日

    RLP: Reinforcement as a Pretraining Objective

    • source
    • paper
    • pretraining
    • reinforcement-learning
    • reasoning
    • chain-of-thought
  • 2026年5月28日

    Reinforcement Pretraining

    • pretraining
    • reinforcement-learning
    • reasoning
  • 2026年5月16日

    Agent

    • application
    • agent
    • reasoning
  • 2026年5月02日

    Chain of Thought

    • prompting
    • reasoning
  • 2026年3月07日

    GRPO

    • post-training
    • grpo
    • reasoning

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026