经验过程简介与suprema的集中(Guntuboyina理论统计学笔记)
文章目录
- 经验过程 Overview
- UCLT
- 如何集中
- Bennett 不等式
- 更好的 bound:Talagrand 不等式
Type | Notes |
---|---|
Title | Theoretical Statistics |
Author(s) | Aditya Guntuboyina |
Year | 2018 Spring |
Level | Graduate |
Location | UC Berkeley |
Department | Department of Statistics |
Course Number | 210B |
Lecture(s) | L01–L04 |
UC Berkeley 的课程编号规则是:编号 1–99 的为初级本科课程,编号 100–199 的为高级本科课程,编号 200–299 的为研究生课程。
本课程是 UC Berkeley 理论统计的两门课之一,另外一门是 210A。老师是 UC Berkeley 的副教授。本课程有讲义,讲义typo较多,公式引用有少量错乱。
这门课的第一部分主要讲经验过程理论,讲得比较基础,优点是讲的线索清晰,并且是从动机出发的。
经验过程 Overview
经验过程主要研究两个问题,一个是ULLN,一个是UCLT。
现有 n n n个i.i.d.的随机变量 X 1 , ⋯ , X n ∼ P X_1,\cdots,X_n\sim{\rm P} X1,⋯,Xn∼P,主要要研究的是
sup f ∈ F ∣ 1 n ∑ i = 1 n f ( X i ) − E f ( X 1 ) ∣ \sup_{f\in\cal{F}} |\frac{1}{n} \sum_{i=1}^{n} f(X_i) - {\rm E} f(X_1)| f∈Fsup∣n1i=1∑nf(Xi)−Ef(X1)∣
显然,这是一个非负随机变量,它非常重要,Guntuboyina用了分类器和M-估计量两个例子,说明在这两个例子中,关键部分都和上面这个量有关。
我们要研究的是:它集中于期望附近吗?能否得到用 F \cal{F} F和 P {\rm P} P表示的非渐近的bound?在什么条件下,它可以依概率或几乎必然收敛到 0 0 0?
控制这个量的思路是:首先说明它集中于期望附近,于是可以通过控制它的期望控制它;而想要控制它的期望,可以用对称化技巧控制 F \cal{F} F的Rademacher复杂度;最后, F \cal{F} F的Rademacher复杂度涉及一个sub-Gaussian过程的 E sup ( ⋅ ) {\rm E}\sup(\cdot) Esup(⋅),这可以用chaining方法控制,在其中又会用到VC维的技术。
UCLT
除了ULLN外,还要研究UCLT。
还是以EDF F n ( t ) F_n(t) Fn(t)为例,记 U n ( t ) = n ( F n ( t ) − F ( t ) ) U_n(t) = \sqrt{n}(F_n(t) - F(t)) Un(t)=n(Fn(t)−F(t)),对于每个 t t t,它都是一个随机变量。随着 n → ∞ n\to\infty n→∞,CLT说的是 U n ( t ) U_n(t) Un(t)会依分布收敛于 N ( 0 , t − t 2 ) N(0,t-t^2) N(0,t−t2),或者多元的情形(有限维)下,收敛到多元正态分布,即在随机过程中学过的Brownian bridge,可记为 U ( t ) U(t) U(t)。
但是否有整个随机过程的收敛,即对于无限维的收敛?
首先要明确随机过程的收敛到底是什么意思。 { U n ( t ) : t ∈ [ 0 , 1 ] } \{U_n(t):t\in[0,1]\} {Un(t):t∈[0,1]}是一个随机过程,它的每个实现都是 ℓ ∞ ( [ 0 , 1 ] ) \ell^\infty([0,1]) ℓ∞([0,1])中的元素,如果对于任意有界连续函数 h : ℓ ∞ ( [ 0 , 1 ] ) → R h:\ell^\infty([0,1])\to \mathbb{R} h:ℓ∞([0,1])→R(空间 ℓ ∞ ( [ 0 , 1 ] ) \ell^\infty([0,1]) ℓ∞([0,1])装备了度量 ∥ ⋅ ∥ ∞ \|\cdot\|_\infty ∥⋅∥∞),都有
E h ( U n ) → E h ( U ) {\rm E} h(U_n) \to {\rm E} h(U) Eh(Un)→Eh(U)
那么我们称 U n U_n Un弱收敛于 U U U。这个定义很合理,唯一的问题是可能有可测性问题:存在某个有界连续的 h h h,使得 h ( U n ) h(U_n) h(Un)不可测,因此,上式左侧要用外期望 E ∗ h ( U n ) {\rm E}^* h(U_n) E∗h(Un