🍊 Latent Atlas 🍉
Search
搜索
暗色模式
亮色模式
探索
标签: reasoning
此标签下有7条笔记。
2026年5月29日
Distilling Step-by-Step
source
paper
distillation
reasoning
rationale
2026年5月29日
DeepSeekMath
source
paper
reasoning
grpo
math
2026年5月28日
RLP: Reinforcement as a Pretraining Objective
source
paper
pretraining
reinforcement-learning
reasoning
chain-of-thought
2026年5月28日
Reinforcement Pretraining
pretraining
reinforcement-learning
reasoning
2026年5月16日
Agent
application
agent
reasoning
2026年5月02日
Chain of Thought
prompting
reasoning
2026年3月07日
GRPO
post-training
grpo
reasoning