欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式

发布时间:2025/4/14 编程问答 66 豆豆
生活随笔 收集整理的这篇文章主要介绍了 UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式

随机矩阵的Bernstein不等式
假设X1,⋯,XNX_1,\cdots,X_NX1,,XN是一列独立对称零均值的随机矩阵,sup⁡i∥Xi∥≤K,a.s.\sup_i \left\| X_i \right\| \le K,a.s.supiXiK,a.s.,则∀t>0\forall t > 0t>0
P(∥∑i=1NXi∥≥t)≤2ne−t2/2σ2+Kt/3P(\left\| \sum_{i=1}^N X_i \right\| \ge t) \le 2n e^{-\frac{t^2/2}{\sigma^2+Kt/3}}P(i=1NXit)2neσ2+Kt/3t2/2

其中σ2=∥∑i=1NEXi2∥\sigma^2 = \left\| \sum_{i=1}^N EX_i^2 \right\|σ2=i=1NEXi2

引理 矩母函数的半正定序上界 假设XXX是一个nnn阶实对称阵零均值随机向量,∥X∥≤K,a.s.\left\| X\right\| \le K,a.s.XK,a.s.,则当∣λ∣<3/K|\lambda|<3/Kλ<3/K时,
eg(λ)EX2≥EeλXe^{g(\lambda)EX^2}\ge Ee^{\lambda X} eg(λ)EX2EeλX

其中
g(λ)=λ2/21−∣λ∣K/3g(\lambda) = \frac{\lambda^2/2}{1-|\lambda|K/3}g(λ)=1λK/3λ2/2

证明
主要思路是Taylor展开,对于∣z∣<3|z|<3z<3
ez=1+z+z22+⋯=1+z+z2∑p=2∞zp−2/p!e^z = 1+z+\frac{z^2}{2}+\cdots =1+z+z^2 \sum_{p=2}^{\infty}z^{p-2}/p!ez=1+z+2z2+=1+z+z2p=2zp2/p!

可以验证对于p≥2p \ge 2p2
p!≥2×3p−2p! \ge 2 \times 3^{p-2}p!2×3p2

于是
ez≤1+z+z2∑p=2∞zp−2/(2×3p−2)=1+z+z2211−∣z∣/3e^z \le 1+z+z^2 \sum_{p=2}^{\infty} z^{p-2}/(2 \times 3^{p-2}) = 1+z+\frac{z^2}{2}\frac{1}{1-|z|/3}ez1+z+z2p=2zp2/(2×3p2)=1+z+2z21z/31

接下来做换元,z=λxz = \lambda xz=λx∣x∣≤K|x| \le KxK∣λ∣<3/K|\lambda|<3/Kλ<3/K,则
eλx≤1+λx+g(λ)x2e^{\lambda x} \le 1+\lambda x+g(\lambda )x^2eλx1+λx+g(λ)x2

我们需要的是矩阵形式,上一讲介绍过矩阵函数,对于指数函数与多项式函数,我们可以直接用矩阵记号,于是

I+λX+g(λ)X2≽eλXI+\lambda X+g(\lambda)X^2 \succcurlyeq e^{\lambda X}I+λX+g(λ)X2eλX

根据积分的保序性,
I+g(λ)EX2≥EeλXI+g(\lambda)EX^2 \ge Ee^{\lambda X}I+g(λ)EX2EeλX

根据Bernoulli不等式
eg(λ)EX2≥I+g(λ)EX2e^{g(\lambda )EX^2} \ge I+g(\lambda)EX^2eg(λ)EX2I+g(λ)EX2

于是引理得证。


证明Bernstein不等式
S=∑i=1NXi,∥S∥=max⁡i∣λi(S)∣=max⁡(∣λ1(S)∣,∣λi(S)∣)S=\sum_{i=1}^N X_i ,\left\| S \right\|=\max_i | \lambda_i(S)|=\max(|\lambda_1(S)|,|\lambda_i(S)|)S=i=1NXi,S=imaxλi(S)=max(λ1(S),λi(S))

我们用Markov不等式,
P(λ1(S)≥t)=P(eηλ1(S)≥eηt)≤e−ηtEeηλ1(S)=e−ηtEλ1(eηS)≤Etr(eηS)P(\lambda_1(S) \ge t) = P(e^{\eta \lambda_1(S)} \ge e^{\eta t}) \le e^{-\eta t}Ee^{\eta \lambda_1(S)} \\ = e^{-\eta t}E\lambda_1(e^{\eta S}) \le Etr(e^{\eta S})P(λ1(S)t)=P(eηλ1(S)eηt)eηtEeηλ1(S)=eηtEλ1(eηS)Etr(eηS)

最后一个不等式是因为对任意实对称矩阵AAA
tr(A)=∑i=1nλi(A)≥λ1(A)tr(A) = \sum_{i=1}^n \lambda_i(A) \ge \lambda_1(A)tr(A)=i=1nλi(A)λ1(A)

FN\mathcal{F}_NFN表示σ(X1,⋯,XN)\sigma(X_1,\cdots,X_N)σ(X1,,XN),也就是这个随机矩阵序列的自然滤波,则
Etr(eηS)=EFN−1EXNtr(e∑i=1N−1ηXi+ηXN)Etr(e^{\eta S}) = E_{\mathcal{F}_{N-1}}E_{X_{N}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\eta X_N})Etr(eηS)=EFN1EXNtr(ei=1N1ηXi+ηXN)

根据Lieb不等式,
EFN−1EXNtr(e∑i=1N−1ηXi+ηXN)≤EFN−1tr(e∑i=1N−1ηXi+log⁡EXNeηXN)E_{\mathcal{F}_{N-1}}E_{X_{N}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\eta X_N}) \le E_{\mathcal{F}_{N-1}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\log E_{X_N} e^{\eta X_N}})EFN1EXNtr(ei=1N1ηXi+ηXN)EFN1tr(ei=1N1ηXi+logEXNeηXN)

这样就得到了关于这个矩阵序列的递归式,通过递归我们有
Etr(eηS)≤tr(e∑i=1Nlog⁡EeηXi)Etr(e^{\eta S}) \le tr(e^{\sum_{i=1}^N\log Ee^{\eta X_i}})Etr(eηS)tr(ei=1NlogEeηXi)

根据引理,
EeηXi≤eg(η)EXi2Ee^{\eta X_i} \le e^{g(\eta)EX_i^2}EeηXieg(η)EXi2

于是
tr(e∑i=1Nlog⁡EeηXi)≤tr(eg(η)∑i=1NEXi2)=tr(eg(η)z)tr(e^{\sum_{i=1}^N\log Ee^{\eta X_i}}) \le tr(e^{g(\eta)\sum_{i=1}^N EX_i^2}) = tr(e^{g(\eta) z})tr(ei=1NlogEeηXi)tr(eg(η)i=1NEXi2)=tr(eg(η)z)

其中z=∑i=1NEXi2z=\sum_{i=1}^N EX_i^2z=i=1NEXi2,这是一个n×nn \times nn×n的实对称矩阵,
tr(eg(η)z)≤nλ1(eg(η)z)=neg(η)λ1(z)=neg(η)∥z∥=neg(η)σ2tr(e^{g(\eta)z}) \le n\lambda_1(e^{g(\eta)z}) = ne^{g(\eta)\lambda_1(z)}=ne^{g(\eta)\left\| z \right\|}=ne^{g(\eta)\sigma^2}tr(eg(η)z)nλ1(eg(η)z)=neg(η)λ1(z)=neg(η)z=neg(η)σ2

第一个不等号是因为对任意实对称矩阵AAA
tr(A)=∑i=1nλi(A)≤nλ1(A)tr(A) = \sum_{i=1}^n \lambda_i(A) \le n\lambda_1(A)tr(A)=i=1nλi(A)nλ1(A)

综上,
P(λ1(S)≥t)≤ne−ηteg(η)σ2P(\lambda_1(S) \ge t) \le ne^{-\eta t}e^{g(\eta)\sigma^2}P(λ1(S)t)neηteg(η)σ2

选择使得这个上界最小的η\etaη,比如可以选择λ=t/(σ2+Kt/3)\lambda=t/(\sigma^2+Kt/3)λ=t/(σ2+Kt/3),则
P(λ1(S)≥t)≤ne−t2/2σ2+Kt3P(\lambda_1(S) \ge t) \le ne^{-\frac{t^2/2}{\sigma^2+\frac{Kt}{3}}}P(λ1(S)t)neσ2+3Ktt2/2

我们可以重复这个过程,分析λn(S)\lambda_n(S)λn(S),即可得到Bernstein不等式。

总结

以上是生活随笔为你收集整理的UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。