TODO: 说明幻觉评测、事实一致性、引用验证、RAG 场景和人工/自动评估方法。