UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式
UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式
随机矩阵的Bernstein不等式
假设X1,⋯,XNX_1,\cdots,X_NX1,⋯,XN是一列独立对称零均值的随机矩阵,supi∥Xi∥≤K,a.s.\sup_i \left\| X_i \right\| \le K,a.s.supi∥Xi∥≤K,a.s.,则∀t>0\forall t > 0∀t>0,
P(∥∑i=1NXi∥≥t)≤2ne−t2/2σ2+Kt/3P(\left\| \sum_{i=1}^N X_i \right\| \ge t) \le 2n e^{-\frac{t^2/2}{\sigma^2+Kt/3}}P(∥∥∥∥∥i=1∑NXi∥∥∥∥∥≥t)≤2ne−σ2+Kt/3t2/2
其中σ2=∥∑i=1NEXi2∥\sigma^2 = \left\| \sum_{i=1}^N EX_i^2 \right\|σ2=∥∥∥∑i=1NEXi2∥∥∥。
引理 矩母函数的半正定序上界 假设XXX是一个nnn阶实对称阵零均值随机向量,∥X∥≤K,a.s.\left\| X\right\| \le K,a.s.∥X∥≤K,a.s.,则当∣λ∣<3/K|\lambda|<3/K∣λ∣<3/K时,
eg(λ)EX2≥EeλXe^{g(\lambda)EX^2}\ge Ee^{\lambda X} eg(λ)EX2≥EeλX
其中
g(λ)=λ2/21−∣λ∣K/3g(\lambda) = \frac{\lambda^2/2}{1-|\lambda|K/3}g(λ)=1−∣λ∣K/3λ2/2
证明
主要思路是Taylor展开,对于∣z∣<3|z|<3∣z∣<3,
ez=1+z+z22+⋯=1+z+z2∑p=2∞zp−2/p!e^z = 1+z+\frac{z^2}{2}+\cdots =1+z+z^2 \sum_{p=2}^{\infty}z^{p-2}/p!ez=1+z+2z2+⋯=1+z+z2p=2∑∞zp−2/p!
可以验证对于p≥2p \ge 2p≥2,
p!≥2×3p−2p! \ge 2 \times 3^{p-2}p!≥2×3p−2
于是
ez≤1+z+z2∑p=2∞zp−2/(2×3p−2)=1+z+z2211−∣z∣/3e^z \le 1+z+z^2 \sum_{p=2}^{\infty} z^{p-2}/(2 \times 3^{p-2}) = 1+z+\frac{z^2}{2}\frac{1}{1-|z|/3}ez≤1+z+z2p=2∑∞zp−2/(2×3p−2)=1+z+2z21−∣z∣/31
接下来做换元,z=λxz = \lambda xz=λx,∣x∣≤K|x| \le K∣x∣≤K,∣λ∣<3/K|\lambda|<3/K∣λ∣<3/K,则
eλx≤1+λx+g(λ)x2e^{\lambda x} \le 1+\lambda x+g(\lambda )x^2eλx≤1+λx+g(λ)x2
我们需要的是矩阵形式,上一讲介绍过矩阵函数,对于指数函数与多项式函数,我们可以直接用矩阵记号,于是
I+λX+g(λ)X2≽eλXI+\lambda X+g(\lambda)X^2 \succcurlyeq e^{\lambda X}I+λX+g(λ)X2≽eλX
根据积分的保序性,
I+g(λ)EX2≥EeλXI+g(\lambda)EX^2 \ge Ee^{\lambda X}I+g(λ)EX2≥EeλX
根据Bernoulli不等式
eg(λ)EX2≥I+g(λ)EX2e^{g(\lambda )EX^2} \ge I+g(\lambda)EX^2eg(λ)EX2≥I+g(λ)EX2
于是引理得证。
证明Bernstein不等式
记S=∑i=1NXi,∥S∥=maxi∣λi(S)∣=max(∣λ1(S)∣,∣λi(S)∣)S=\sum_{i=1}^N X_i ,\left\| S \right\|=\max_i | \lambda_i(S)|=\max(|\lambda_1(S)|,|\lambda_i(S)|)S=i=1∑NXi,∥S∥=imax∣λi(S)∣=max(∣λ1(S)∣,∣λi(S)∣)
我们用Markov不等式,
P(λ1(S)≥t)=P(eηλ1(S)≥eηt)≤e−ηtEeηλ1(S)=e−ηtEλ1(eηS)≤Etr(eηS)P(\lambda_1(S) \ge t) = P(e^{\eta \lambda_1(S)} \ge e^{\eta t}) \le e^{-\eta t}Ee^{\eta \lambda_1(S)} \\ = e^{-\eta t}E\lambda_1(e^{\eta S}) \le Etr(e^{\eta S})P(λ1(S)≥t)=P(eηλ1(S)≥eηt)≤e−ηtEeηλ1(S)=e−ηtEλ1(eηS)≤Etr(eηS)
最后一个不等式是因为对任意实对称矩阵AAA
tr(A)=∑i=1nλi(A)≥λ1(A)tr(A) = \sum_{i=1}^n \lambda_i(A) \ge \lambda_1(A)tr(A)=i=1∑nλi(A)≥λ1(A)
用FN\mathcal{F}_NFN表示σ(X1,⋯,XN)\sigma(X_1,\cdots,X_N)σ(X1,⋯,XN),也就是这个随机矩阵序列的自然滤波,则
Etr(eηS)=EFN−1EXNtr(e∑i=1N−1ηXi+ηXN)Etr(e^{\eta S}) = E_{\mathcal{F}_{N-1}}E_{X_{N}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\eta X_N})Etr(eηS)=EFN−1EXNtr(e∑i=1N−1ηXi+ηXN)
根据Lieb不等式,
EFN−1EXNtr(e∑i=1N−1ηXi+ηXN)≤EFN−1tr(e∑i=1N−1ηXi+logEXNeηXN)E_{\mathcal{F}_{N-1}}E_{X_{N}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\eta X_N}) \le E_{\mathcal{F}_{N-1}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\log E_{X_N} e^{\eta X_N}})EFN−1EXNtr(e∑i=1N−1ηXi+ηXN)≤EFN−1tr(e∑i=1N−1ηXi+logEXNeηXN)
这样就得到了关于这个矩阵序列的递归式,通过递归我们有
Etr(eηS)≤tr(e∑i=1NlogEeηXi)Etr(e^{\eta S}) \le tr(e^{\sum_{i=1}^N\log Ee^{\eta X_i}})Etr(eηS)≤tr(e∑i=1NlogEeηXi)
根据引理,
EeηXi≤eg(η)EXi2Ee^{\eta X_i} \le e^{g(\eta)EX_i^2}EeηXi≤eg(η)EXi2
于是
tr(e∑i=1NlogEeηXi)≤tr(eg(η)∑i=1NEXi2)=tr(eg(η)z)tr(e^{\sum_{i=1}^N\log Ee^{\eta X_i}}) \le tr(e^{g(\eta)\sum_{i=1}^N EX_i^2}) = tr(e^{g(\eta) z})tr(e∑i=1NlogEeηXi)≤tr(eg(η)∑i=1NEXi2)=tr(eg(η)z)
其中z=∑i=1NEXi2z=\sum_{i=1}^N EX_i^2z=∑i=1NEXi2,这是一个n×nn \times nn×n的实对称矩阵,
tr(eg(η)z)≤nλ1(eg(η)z)=neg(η)λ1(z)=neg(η)∥z∥=neg(η)σ2tr(e^{g(\eta)z}) \le n\lambda_1(e^{g(\eta)z}) = ne^{g(\eta)\lambda_1(z)}=ne^{g(\eta)\left\| z \right\|}=ne^{g(\eta)\sigma^2}tr(eg(η)z)≤nλ1(eg(η)z)=neg(η)λ1(z)=neg(η)∥z∥=neg(η)σ2
第一个不等号是因为对任意实对称矩阵AAA
tr(A)=∑i=1nλi(A)≤nλ1(A)tr(A) = \sum_{i=1}^n \lambda_i(A) \le n\lambda_1(A)tr(A)=i=1∑nλi(A)≤nλ1(A)
综上,
P(λ1(S)≥t)≤ne−ηteg(η)σ2P(\lambda_1(S) \ge t) \le ne^{-\eta t}e^{g(\eta)\sigma^2}P(λ1(S)≥t)≤ne−ηteg(η)σ2
选择使得这个上界最小的η\etaη,比如可以选择λ=t/(σ2+Kt/3)\lambda=t/(\sigma^2+Kt/3)λ=t/(σ2+Kt/3),则
P(λ1(S)≥t)≤ne−t2/2σ2+Kt3P(\lambda_1(S) \ge t) \le ne^{-\frac{t^2/2}{\sigma^2+\frac{Kt}{3}}}P(λ1(S)≥t)≤ne−σ2+3Ktt2/2
我们可以重复这个过程,分析λn(S)\lambda_n(S)λn(S),即可得到Bernstein不等式。
总结
以上是生活随笔为你收集整理的UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: UA MATH567 高维统计IV Li
- 下一篇: UA MATH567 高维统计IV Li