大模型应用方式与评测,按提示词、RAG、工具调用、Agent 和评测五条主线组织。
Modules
- Prompting — Prompt Engineering、system prompt、few-shot、CoT 和结构化输出。
- RAG — 检索、切块、embedding、reranking、混合检索和上下文压缩。
- Tool Use — Function Calling、Tool Calling、MCP 和结构化 API。
- Agents — Agent、planning、memory、reflection、多 Agent 和 workflow agent。
- Evaluation — Benchmark、LLM-as-a-Judge、人评、线上评测和幻觉评测。