当前位置：首页 > backend >正文

广义矩估计随机近似中1.2和2.1的差异

backend 2025/8/27 3:51:12

1.2和2.1的差异
在这里插入图片描述

在这里插入图片描述
1.2节的S2SLS和2.1节的SGMM虽然公式相似，但存在本质差异，我通过三个维度解析：

维度	1.2节 S2SLS	2.1节 SGMM
统计目标	一致性估计（非最优）	渐近有效估计（达到Cramér-Rao下界）
权重矩阵	$Wi≈(E[zizi′])−1W_i \approx (\mathbb{E}[z_i z_i'])^{-1}$	$Wi≈Ω−1=(E[gigi′])−1W_i \approx \Omega^{-1} = (\mathbb{E}[g_i g_i'])^{-1}$
计算复杂度	低（ $O(d_g^2)$ ）	高（需两阶段设计）

根本矛盾：
最优权重 $\Omega^{-1} = (\mathbb{E}[g_i g_i'])^{-1}$ 依赖残差 $gi=zi(yi−xi′β)g_i = z_i(y_i - x_i'\beta)$
→ 但 $β\beta$ 本身待估计 → 循环依赖
解决方案：
样本分割打破循环：
1. 第一阶段（ $S1\mathbb{S}_1$ ）：
  用S2SLS获得初步一致估计 $βˉn1\bar{\beta}_{n_1}$
2. 第二阶段（ $S2\mathbb{S}_2$ ）：
  用冻结的 $βˉn1\bar{\beta}_{n_1}$ 计算残差 $gi(βˉn1)g_i(\bar{\beta}_{n_1})$
  → 构建在线权重 $Wi→Ω−1W_i \to \Omega^{-1}$

条件 $n1→∞n_1 \to \infty$ 且 $n1/n→0n_1/n \to 0$ ：
- $n1→∞n_1 \to \infty$ ：保证 $βˉn1\bar{\beta}_{n_1}$ 的一致性
- $n1/n→0n_1/n \to 0$ ：确保第二阶段主导渐近分布（效率不损失）

$g_i(\bar{\beta}_{n_1}) = z_i (y_i - x_i' \bar{\beta}_{n_1})$

公式	角色	数学形式
(5c)	构建标量 $m_i$	$mi=n0+i−1+gi(βˉn1)′Wi−1gi(βˉn1)⏟冻结残差的加权范数m_i = n_0 + i - 1 + \underbrace{g_i(\bar{\beta}_{n_1})' W_{i-1} g_i(\bar{\beta}_{n_1})}_{\text{冻结残差的加权范数}}$
(5d)	更新权重矩阵	$Wi∝Wi−1[I−mi−1gi(βˉn1)gi(βˉn1)′⏟冻结外积Wi−1]W_i \propto W_{i-1} \left[ I - m_i^{-1} \underbrace{g_i(\bar{\beta}_{n_1}) g_i(\bar{\beta}_{n_1})'}_{\text{冻结外积}} W_{i-1} \right]$

核心逻辑：
通过冻结的 $gi(βˉn1)g_i(\bar{\beta}_{n_1})$ ， $W_i$ 收敛到 $Ω−1\Omega^{-1}$ （而非次优的 $(Ezizi′)−1(\mathbb{E} z_i z_i')^{-1}$ ）

权重更新（2c-d）：
$m_i$ 依赖 $z_i' W_{i-1} z_i$ （工具变量自相关）
→ $W_i$ 估计 $(Ezizi′)−1(\mathbb{E} z_i z_i')^{-1}$
统计缺陷：
当 $Var(ui∣zi)\text{Var}(u_i \mid z_i)$ 非常数（异方差）时非最优

权重更新（5c-d）：
$m_i$ 依赖 $gi(βˉn1)′Wi−1gi(βˉn1)g_i(\bar{\beta}_{n_1})' W_{i-1} g_i(\bar{\beta}_{n_1})$ （条件异方差感知）
→ $W_i$ 估计 $Ω−1=(E[ui2zizi′])−1\Omega^{-1} = (\mathbb{E}[u_i^2 z_i z_i'])^{-1}$
效率保证：
即使存在异方差，估计量仍渐近有效

方案	计算可行性	统计效率
直接在线估计 $Ω\Omega$	不可行	-
两阶段 SGMM	可行	最优

这种设计是在线学习与统计最优性的黄金交点——它证明：通过精心设计的样本分割和冻结策略，流式算法也能达到离线GMM的统计效率极限。

以下是分阶段执行的精确步骤和冻结逻辑：

更新范围：
$\dots, n_1$ （遍历第一个子集 $S1\mathbb{S}_1$ ）
更新规则：
使用 S2SLS算法（公式2a-2e）在线逐样本更新：
- $βi\beta_i$ ：参数估计（公式2a）
- $Φi\Phi_i$ ：工具变量-解释变量协方差（公式2b）
- $W_i$ ：权重矩阵（公式2c-2d）
- $βˉi\bar{\beta}_i$ ：Polyak平均（公式2e）
输出结果：
在 $i = n_1$ 时获得冻结值：
$\boxed{\bar{\beta}_{n_1} = \frac{1}{n_1} \sum_{j=1}^{n_1} \beta_j}$

更新范围：
$n_1 + 1, \dots, n$ （遍历第二个子集 $S2\mathbb{S}_2$ ）
关键冻结操作：
对每个新样本 $(xi,zi,yi)∈S2(x_i, z_i, y_i) \in \mathbb{S}_2$ ：
- 固定残差计算：
  $g_i(\bar{\beta}_{n_1}) = z_i (y_i - x_i' \bar{\beta}_{n_1}) \quad \text{(不再更新！)}$
- 权重更新（公式5c-5d）：
  $\begin{aligned} m_i &= n_0 + i - 1 + \underbrace{g_i(\bar{\beta}_{n_1})' W_{i-1} g_i(\bar{\beta}_{n_1})}_{\text{固定值}} \\ W_i &= \frac{n_0+i}{n_0+i-1} W_{i-1} \left[ I - m_i^{-1} \underbrace{g_i(\bar{\beta}_{n_1}) g_i(\bar{\beta}_{n_1})'}_{\text{固定外积}} W_{i-1} \right] \end{aligned}$
参数更新（公式5a, 5b, 5e）：
- $βi\beta_i$ ：仍在线更新（依赖当前 $W_i$ ）
- $Φi\Phi_i$ ：仍在线更新（累积 $G_i$ ）
- $βˉi\bar{\beta}_i$ ：Polyak平均（累积 $βi\beta_i$ ）

操作	原因	统计意义
冻结 $βˉn1\bar{\beta}_{n_1}$	避免 $β\beta$ 与 $W_i$ 的循环依赖	保证 $Wi→Ω−1W_i \to \Omega^{-1}$
冻结 $gi(⋅)g_i(\cdot)$	用一致估计 $βˉn1\bar{\beta}_{n_1}$ 计算残差，而非路径依赖的 $βi−1\beta_{i-1}$	消除偏差，确保效率最优

第一阶段（ $i = 1$ 到 $1000$ ）：
- 在线更新所有变量 $(βi,Φi,Wi,βˉi)(\beta_i, \Phi_i, W_i, \bar{\beta}_i)$
- 结束时保存 $βˉ1000\bar{\beta}_{1000}$
第二阶段（ $i = 1001$ 到 $10^6$ ）：
- 对每个新样本：
  - 计算固定残差 $gi=zi(yi−xi′βˉ1000)g_i = z_i(y_i - x_i' \bar{\beta}_{1000})$
  - 更新 $W_i$ （依赖冻结的 $g_i$ ）
  - 更新 $βi,Φi,βˉi\beta_i, \Phi_i, \bar{\beta}_i$ （依赖最新 $W_i$ ）
- 最终输出 $βˉ106\bar{\beta}_{10^6}$