欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计I 概率不等式10 Bernstein不等式

发布时间:2025/4/14 编程问答 59 豆豆
生活随笔 收集整理的这篇文章主要介绍了 UA MATH567 高维统计I 概率不等式10 Bernstein不等式 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

UA MATH567 高维统计I 概率不等式10 Bernstein不等式

我们在介绍亚高斯分布后介绍了适用于亚高斯分布的推广的Hoeffding不等式,对于亚指数分布,我们可以得到类似的不等式。因为亚指数分布相对更具有一般性,因此亚指数分布的这个概率不等式是一个适用性比较广的不等式。

Bernstein不等式 版本1 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数随机变量,∀t>0\forall t>0t>0, K=max⁡1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1iNXiψ1
P(∣∑i=1NXi∣≥t)≤2exp⁡(−cmin⁡(tK,t2∑i=1N∥Xi∥ψ12))P\left( \left| \sum_{i=1}^NX_i \right| \ge t\right) \le 2 \exp \left( -c \min \left( \frac{t}{K},\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2} \right) \right)P(i=1NXit)2exp(cmin(Kt,i=1NXiψ12t2))

其中ccc是一个常数。

证明
我们先用Markov不等式讨论P(∑i=1NXi≥t)P(\sum_{i=1}^NX_i \ge t)P(i=1NXit),
P(∑i=1NXi≥t)=P(eλ∑i=1NXi≥eλt)≤e−λtEeλ∑i=1NXi=e−λt∏i=1NEeλXiP(\sum_{i=1}^NX_i \ge t) = P(e^{\lambda\sum_{i=1}^NX_i} \ge e^{\lambda t}) \\\le e^{-\lambda t}Ee^{\lambda\sum_{i=1}^NX_i} = e^{-\lambda t}\prod_{i=1}^N Ee^{\lambda X_i}P(i=1NXit)=P(eλi=1NXieλt)eλtEeλi=1NXi=eλti=1NEeλXi

根据亚指数性5,K5=c∥Xi∥ψ1K_5 = c\left\| X_i \right\|_{\psi_1}K5=cXiψ1
EeλXi≤ec2∥Xi∥ψ12λ2,∀0<λ≤1/K5Ee^{\lambda X_i} \le e^{c^2\left\| X_i \right\|_{\psi_1}^2\lambda^2},\forall 0<\lambda \le 1/K_5EeλXiec2Xiψ12λ2,0<λ1/K5

要使对所有的iii,上式均适用,我们需要进一步限制λ\lambdaλ的取值为
0<λ≤1cmax⁡i∥X∥ψ10 < \lambda \le \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}0<λcmaxiXψ11

于是
e−λt∏i=1NEeλXi≤e−λt∏i=1Nec2∥Xi∥ψ12λ2=exp⁡(−λt+c2λ2∑i=1N∥Xi∥ψ12)e^{-\lambda t}\prod_{i=1}^N Ee^{\lambda X_i} \le e^{-\lambda t}\prod_{i=1}^N e^{c^2\left\| X_i \right\|_{\psi_1}^2\lambda^2} \\= \exp (-\lambda t+c^2\lambda^2 \sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^2)eλti=1NEeλXieλti=1Nec2Xiψ12λ2=exp(λt+c2λ2i=1NXiψ12)

接下来,我们要选择一个λ\lambdaλ使得这个上界最小,即我们需要解
min⁡0<λ≤1cmax⁡i∥X∥ψ1−λt+c2λ2∑i=1N∥Xi∥ψ12\min_{0<\lambda \le \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}}-\lambda t+c^2\lambda^2 \sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^20<λcmaxiXψ11minλt+c2λ2i=1NXiψ12

这个二次函数的最小值要么在全局最小点处取得,要么在边界上取得,即
λ=1cmax⁡i∥X∥ψ1ort2c2∑i=1N∥Xi∥ψ12\lambda = \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}\ or\ \frac{t}{2c^2\sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^2}λ=cmaxiXψ11 or 2c2i=1NXiψ12t

于是最小的上界为
exp⁡(−cmin⁡(tK,t2∑i=1N∥Xi∥ψ12))\exp \left( -c \min \left( \frac{t}{K},\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2} \right) \right)exp(cmin(Kt,i=1NXiψ12t2))

对于P(−∑i=1NXi≥t)P(-\sum_{i=1}^NX_i \ge t)P(i=1NXit),我们可以得到一样的结果,这样就说明了Bernstein不等式 版本1。


Bernstein不等式 版本2 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数随机变量,aaa是一个常向量,∀t>0\forall t>0t>0, K=max⁡1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1iNXiψ1
P(∣∑i=1NaiXi∣≥t)≤2exp⁡(−cmin⁡(tK∥a∥∞,t2K2∥a∥22))P\left( \left| \sum_{i=1}^Na_iX_i \right| \ge t\right) \le 2 \exp \left( -c \min \left( \frac{t}{K\left\| a\right\|_{\infty}},\frac{t^2}{K^2\left\|a \right\|_{2}^2} \right) \right)P(i=1NaiXit)2exp(cmin(Kat,K2a22t2))

其中ccc是一个常数。

说明 我们简单比较一下版本1和版本2,版本2试图讨论的是XiX_iXi的线性组合,我们可以找到版本1和2上界的对应关系。

根据亚指数范数的正齐次性
∑i=1N∥aiXi∥ψ12=∑i=1Nai2∥Xi∥ψ12≤∑i=1Nai2K2=K2∥a∥22\sum_{i=1}^N \left\| a_iX_i \right\|_{\psi_1}^2 = \sum_{i=1}^Na_i^2 \left\| X_i \right\|_{\psi_1} ^2 \le \sum_{i=1}^Na_i^2 K^2 = K^2 \left\| a \right\|_2^2i=1NaiXiψ12=i=1Nai2Xiψ12i=1Nai2K2=K2a22

这体现了版本1中上界t2∑i=1N∥Xi∥ψ12\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2}i=1NXiψ12t2t2K2∥a∥22\frac{t^2}{K^2\left\|a \right\|_{2}^2}K2a22t2的对应关系。

同样根据亚指数范数的正齐次性
max⁡i∥aiXi∥ψ1=max⁡i∣ai∣∥Xi∥ψ1≤∥a∥∞K\max_i \left\| a_iX_i \right\|_{\psi_1}= \max_i |a_i|\left\| X_i \right\|_{\psi_1} \le \left\|a \right\|_{\infty}KimaxaiXiψ1=imaxaiXiψ1aK

这体现了版本1中上界tK\frac{t}{K}KttK∥a∥∞\frac{t}{K\left\| a\right\|_{\infty}}Kat的对应关系。

如果取ai=1/Na_i=1/Nai=1/N,我们可以得到关于样本均值的不等式:

Bernstein不等式 版本3 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数随机变量,∀t>0\forall t>0t>0, K=max⁡1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1iNXiψ1
P(∣Xˉ∣≥t)≤2exp⁡(−cNmin⁡(tK,t2K2))P\left( \left| \bar X \right| \ge t\right) \le 2 \exp \left( -cN \min \left( \frac{t}{K},\frac{t^2}{K^2} \right) \right)P(Xˉt)2exp(cNmin(Kt,K2t2))

其中ccc是一个常数。


Bernstein不等式 版本4 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数上界为KKK的随机变量,∀t>0\forall t>0t>0,
P(∣∑i=1NXi∣≥t)≤2exp⁡(−t2/2σ2+Kt/3)P\left( \left| \sum_{i=1}^NX_i \right| \ge t\right) \le 2 \exp \left( -\frac{t^2/2}{\sigma^2+Kt/3} \right)P(i=1NXit)2exp(σ2+Kt/3t2/2)

σ2=∑i=1NEXi2\sigma^2=\sum_{i=1}^N EX_i^2σ2=i=1NEXi2。这是使用最广泛的一个版本,因为它能提供一个比Hoeffding不等式更小的上界。

总结

以上是生活随笔为你收集整理的UA MATH567 高维统计I 概率不等式10 Bernstein不等式的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。