“Attention is all you need.” — but understanding is what we pursue.
Knowledge Map
主线:从原理到系统
沿着大模型的核心链路组织知识:先理解基础,再进入架构与训练,最后落到推理部署和应用评测。
- Fundamentals — 基础理论:线性代数、概率、信息论、神经网络基础、优化。
- Architecture — 模型架构:Transformer、Attention、位置编码、MoE、Mamba、LLaMA、Qwen、DeepSeek。
- Training — 训练体系:预训练、中训练、后训练、数据工程、分布式训练、Scaling Law。
- Inference — 推理系统:解码、KV Cache、FlashAttention、量化、Serving、性能优化。
- Application — 应用工程:Prompting、RAG、Tool Use、Agents、Benchmark、LLM-as-Judge。
Research Workbench
副线:从资料与实践反哺知识体系
新论文、博客、课程、报告和代码阅读先进入工作台;稳定结论再回流到主题知识地图。
Learning Routes
01 · Build the Foundation
Linear Algebra → Probability → Information Theory → Neural Network Basics → Optimization
02 · Understand the Model
Transformer → Attention → Positional Encoding → Model Families → Sparse & Efficient Architectures
03 · Train and Align
Pretraining → Mid-training → Post-training → Distributed Training → Scaling
04 · Serve and Build
Decoding → KV Cache and Memory → Serving Systems → RAG → Agents → Evaluation
Navigation Protocol
- 使用
Ctrl+K搜索概念、论文、工程记录或具体术语。 - 用
[[双链]]在概念之间跳转;右侧 Graph View 可以观察知识连接密度。 - 主题目录回答“是什么、为什么、如何工作”;
sources/回答“这份资料讲了什么”;projects/回答“我做了什么、结果如何”。 - 阅读资料或实验结论如果变成稳定知识,应回链到对应主题目录。
Lab Status
这是一个持续生长的 AI knowledge garden:先建立清晰骨架,再逐步把每个节点写成可复用的知识单元。