Rate-Distortion

概念界定

率失真思想研究在允许一定信息损失的情况下，如何用更少的编码成本表示数据。它提供了一种理解压缩、量化和表示瓶颈的基础视角。

大模型部署时常需要压缩模型权重、激活或 KV Cache。压缩通常会减少存储和计算成本，但也可能带来精度损失。率失真思想关注的正是“压缩率”和“失真程度”之间的权衡。

直观上，率失真问题关心：

在失真 D 可接受的条件下，最少需要多少编码率 R？

或者反过来：

在编码率 R 固定时，能达到多小的失真 D？

这里：

如果把模型量化到更低 bit，存储和计算更省，但权重表示更粗糙，可能带来性能下降。率失真思想就是用信息论方式理解这种取舍。