🍊 Latent Atlas 🍉

❯

❯

Mid-training

2026年2月22日1分钟阅读

中训练阶段介于预训练和后训练之间，通常用于继续预训练、领域能力注入、长上下文扩展和训练末期退火。

建议阅读顺序：

Continued Pretraining：理解在已有 checkpoint 上继续训练的基本框架。
Domain Adaptation：理解领域数据注入、replay 和遗忘风险。
Capability Injection：理解数学、代码、工具、多语言等能力塑形。
Long Context Training：理解位置编码扩展、长文档数据和长上下文评测。
Annealing：理解训练末期高质量数据和 learning rate 收敛整理。

Notes

Continued Pretraining
领域适配
长上下文训练
Annealing
能力注入

Related Source TODOs

Position Interpolation
YaRN
LongLoRA
LongRoPE

此文件夹下有5条笔记。

2026年2月28日
Annealing
- mid-training
- annealing
2026年2月28日
Capability Injection
- mid-training
- capability
2026年2月28日
Continued Pretraining
- mid-training
- continued-pretraining
2026年2月28日
Domain Adaptation
- mid-training
- domain-adaptation
2026年2月28日
Long Context Training
- mid-training
- long-context

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026