🍊 Latent Atlas 🍉

Home

❯

Training

❯

Optimization

Optimization

2026年3月15日1分钟阅读

训练优化工程关注大模型训练过程中的稳定性、效率和资源使用,偏工程实践,不重复基础优化理论。

Notes

  • Training Memory Estimation
  • 混合精度训练
  • Gradient Checkpointing
  • Optimizer State
  • 训练稳定性
  • Loss Spike

此文件夹下有6条笔记。

  • 2026年5月31日

    Training Memory Estimation

    • training
    • training-optimization
    • memory
    • estimation
  • 2026年3月21日

    Loss Spike

    • training-optimization
    • loss-spike
  • 2026年3月21日

    Optimizer State

    • training-optimization
    • optimizer
    • memory
  • 2026年3月21日

    Training Stability

    • training-optimization
    • stability
  • 2026年3月15日

    Gradient Checkpointing

    • training-optimization
    • memory
  • 2026年3月15日

    Mixed Precision Training

    • training
    • optimization
    • memory-optimization

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026