Monte Carlo Method

概念界定

蒙特卡罗方法是一类用随机采样近似计算期望、积分、概率或复杂系统行为的方法。它的核心思想是：当精确计算很难时，可以通过大量随机样本的平均结果逼近目标量。

在机器学习和大模型中，很多目标都可以写成期望形式，但真实分布往往无法完整枚举。例如训练 loss 是数据分布上的期望，强化学习中的策略回报是轨迹分布上的期望，评测指标也常需要在样本集合上估计。蒙特卡罗方法提供了“用样本估计整体”的基础思想。

如果我们希望计算：

E[f(X)]

但无法对完整分布精确求和或积分，可以从分布中采样：

x_1, x_2, ..., x_N ~ p(X)

然后用样本平均近似期望：

E[f(X)] ≈ (1/N) Σ_i f(x_i)

这就是最基本的蒙特卡罗估计。

蒙特卡罗方法可以理解为“多抽几次，看平均结果”。如果样本足够多，并且采样方式正确，样本平均通常会接近真实期望。

例如想估计一个模型在真实用户问题上的平均表现，但无法枚举所有问题，就可以抽取一批代表性问题进行评测，用平均分近似整体表现。

训练时的 mini-batch loss 可以看作对总体期望 loss 的随机估计：

L(θ) = E_{x~p_data}[loss_θ(x)]

实践中用一个 batch 近似：

L_batch(θ) = (1/B) Σ_i loss_θ(x_i)

语言模型生成时，从 token 分布中多次采样，也可以用于观察模型输出的多样性和不确定性。