TODO: 说明 prefix cache / prompt cache 的复用机制、适用场景、缓存命中和服务系统收益。