基本信息
- Title: Self-Instruct: Aligning Language Models with Self-Generated Instructions
- Source type: paper
- Related topic notes: Instruction Tuning, Synthetic Data, SFT
TODO
- 阅读论文原文,整理 self-generated instruction、input、output 的构造流程。
- 回填合成指令数据的去重、过滤和质量控制方法。
- 补充 synthetic instruction tuning 的收益、风险和后续开放模型实践影响。