🍊 Latent Atlas 🍉
Search
搜索
暗色模式
亮色模式
探索
标签: sft
此标签下有2条笔记。
2026年5月29日
Finetuned Language Models Are Zero-Shot Learners
source
paper
instruction-tuning
sft
2026年5月29日
Training language models to follow instructions with human feedback
source
paper
instructgpt
rlhf
sft
reward-model