🍊 Latent Atlas 🍉

❯

Training

2026年2月21日1分钟阅读

大模型训练全流程，从预训练、中训练到后训练，并包含数据工程、训练优化、分布式训练和 scaling 等横切模块。

Main Stages

预训练 — 从大规模通用语料中学习基础语言建模能力。
中训练 — continued pretraining、领域适配、长上下文和能力注入。
后训练 — SFT、RLHF、DPO/GRPO、拒绝采样和蒸馏。
Reinforcement Pretraining — 把 RL-style objective 前移到预训练或 continued pretraining 阶段。

Cross-cutting Modules

训练数据工程 — 数据清洗、去重、过滤、packing 和合成数据。
训练优化工程 — 显存估算、混合精度、checkpointing、optimizer state 和稳定性。
分布式训练 — DP、TP、PP、ZeRO、FSDP、Megatron。
Scaling — scaling law、模型/数据/算力配比和训练预算。

此文件夹下有7条笔记。

2026年3月28日
Scaling
2026年3月21日
Distributed Training
2026年3月15日
Optimization
2026年3月14日
Data Engineering
2026年3月01日
Post-training
- training
- post-training
2026年2月22日
Mid-training
2026年2月21日
Pretraining

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026