LLM 学习所需的数学、概率、信息论、优化和神经网络基础。这里不追求数学大全,只沉淀理解大模型主线所必需的概念。

Sections

How to Use

  • 先读 linear-algebra/probability/,建立数学与分布建模基础。
  • 再读 information-theory/,理解语言模型训练目标与评估指标。
  • 然后读 optimization/,理解参数如何被训练出来。
  • 最后读 neural-network-basics/,连接到 Transformer 结构。