UA MATH567 高维统计I 概率不等式10 Bernstein不等式
UA MATH567 高维统计I 概率不等式10 Bernstein不等式
我们在介绍亚高斯分布后介绍了适用于亚高斯分布的推广的Hoeffding不等式,对于亚指数分布,我们可以得到类似的不等式。因为亚指数分布相对更具有一般性,因此亚指数分布的这个概率不等式是一个适用性比较广的不等式。
Bernstein不等式 版本1 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数随机变量,∀t>0\forall t>0∀t>0, K=max1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1≤i≤N∥Xi∥ψ1
P(∣∑i=1NXi∣≥t)≤2exp(−cmin(tK,t2∑i=1N∥Xi∥ψ12))P\left( \left| \sum_{i=1}^NX_i \right| \ge t\right) \le 2 \exp \left( -c \min \left( \frac{t}{K},\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2} \right) \right)P(∣∣∣∣∣i=1∑NXi∣∣∣∣∣≥t)≤2exp(−cmin(Kt,∑i=1N∥Xi∥ψ12t2))
其中ccc是一个常数。
证明
我们先用Markov不等式讨论P(∑i=1NXi≥t)P(\sum_{i=1}^NX_i \ge t)P(∑i=1NXi≥t),
P(∑i=1NXi≥t)=P(eλ∑i=1NXi≥eλt)≤e−λtEeλ∑i=1NXi=e−λt∏i=1NEeλXiP(\sum_{i=1}^NX_i \ge t) = P(e^{\lambda\sum_{i=1}^NX_i} \ge e^{\lambda t}) \\\le e^{-\lambda t}Ee^{\lambda\sum_{i=1}^NX_i} = e^{-\lambda t}\prod_{i=1}^N Ee^{\lambda X_i}P(i=1∑NXi≥t)=P(eλ∑i=1NXi≥eλt)≤e−λtEeλ∑i=1NXi=e−λti=1∏NEeλXi
根据亚指数性5,K5=c∥Xi∥ψ1K_5 = c\left\| X_i \right\|_{\psi_1}K5=c∥Xi∥ψ1
EeλXi≤ec2∥Xi∥ψ12λ2,∀0<λ≤1/K5Ee^{\lambda X_i} \le e^{c^2\left\| X_i \right\|_{\psi_1}^2\lambda^2},\forall 0<\lambda \le 1/K_5EeλXi≤ec2∥Xi∥ψ12λ2,∀0<λ≤1/K5
要使对所有的iii,上式均适用,我们需要进一步限制λ\lambdaλ的取值为
0<λ≤1cmaxi∥X∥ψ10 < \lambda \le \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}0<λ≤cmaxi∥X∥ψ11
于是
e−λt∏i=1NEeλXi≤e−λt∏i=1Nec2∥Xi∥ψ12λ2=exp(−λt+c2λ2∑i=1N∥Xi∥ψ12)e^{-\lambda t}\prod_{i=1}^N Ee^{\lambda X_i} \le e^{-\lambda t}\prod_{i=1}^N e^{c^2\left\| X_i \right\|_{\psi_1}^2\lambda^2} \\= \exp (-\lambda t+c^2\lambda^2 \sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^2)e−λti=1∏NEeλXi≤e−λti=1∏Nec2∥Xi∥ψ12λ2=exp(−λt+c2λ2i=1∑N∥Xi∥ψ12)
接下来,我们要选择一个λ\lambdaλ使得这个上界最小,即我们需要解
min0<λ≤1cmaxi∥X∥ψ1−λt+c2λ2∑i=1N∥Xi∥ψ12\min_{0<\lambda \le \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}}-\lambda t+c^2\lambda^2 \sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^20<λ≤cmaxi∥X∥ψ11min−λt+c2λ2i=1∑N∥Xi∥ψ12
这个二次函数的最小值要么在全局最小点处取得,要么在边界上取得,即
λ=1cmaxi∥X∥ψ1ort2c2∑i=1N∥Xi∥ψ12\lambda = \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}\ or\ \frac{t}{2c^2\sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^2}λ=cmaxi∥X∥ψ11 or 2c2∑i=1N∥Xi∥ψ12t
于是最小的上界为
exp(−cmin(tK,t2∑i=1N∥Xi∥ψ12))\exp \left( -c \min \left( \frac{t}{K},\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2} \right) \right)exp(−cmin(Kt,∑i=1N∥Xi∥ψ12t2))
对于P(−∑i=1NXi≥t)P(-\sum_{i=1}^NX_i \ge t)P(−∑i=1NXi≥t),我们可以得到一样的结果,这样就说明了Bernstein不等式 版本1。
Bernstein不等式 版本2 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数随机变量,aaa是一个常向量,∀t>0\forall t>0∀t>0, K=max1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1≤i≤N∥Xi∥ψ1
P(∣∑i=1NaiXi∣≥t)≤2exp(−cmin(tK∥a∥∞,t2K2∥a∥22))P\left( \left| \sum_{i=1}^Na_iX_i \right| \ge t\right) \le 2 \exp \left( -c \min \left( \frac{t}{K\left\| a\right\|_{\infty}},\frac{t^2}{K^2\left\|a \right\|_{2}^2} \right) \right)P(∣∣∣∣∣i=1∑NaiXi∣∣∣∣∣≥t)≤2exp(−cmin(K∥a∥∞t,K2∥a∥22t2))
其中ccc是一个常数。
说明 我们简单比较一下版本1和版本2,版本2试图讨论的是XiX_iXi的线性组合,我们可以找到版本1和2上界的对应关系。
根据亚指数范数的正齐次性
∑i=1N∥aiXi∥ψ12=∑i=1Nai2∥Xi∥ψ12≤∑i=1Nai2K2=K2∥a∥22\sum_{i=1}^N \left\| a_iX_i \right\|_{\psi_1}^2 = \sum_{i=1}^Na_i^2 \left\| X_i \right\|_{\psi_1} ^2 \le \sum_{i=1}^Na_i^2 K^2 = K^2 \left\| a \right\|_2^2i=1∑N∥aiXi∥ψ12=i=1∑Nai2∥Xi∥ψ12≤i=1∑Nai2K2=K2∥a∥22
这体现了版本1中上界t2∑i=1N∥Xi∥ψ12\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2}∑i=1N∥Xi∥ψ12t2与t2K2∥a∥22\frac{t^2}{K^2\left\|a \right\|_{2}^2}K2∥a∥22t2的对应关系。
同样根据亚指数范数的正齐次性
maxi∥aiXi∥ψ1=maxi∣ai∣∥Xi∥ψ1≤∥a∥∞K\max_i \left\| a_iX_i \right\|_{\psi_1}= \max_i |a_i|\left\| X_i \right\|_{\psi_1} \le \left\|a \right\|_{\infty}Kimax∥aiXi∥ψ1=imax∣ai∣∥Xi∥ψ1≤∥a∥∞K
这体现了版本1中上界tK\frac{t}{K}Kt与tK∥a∥∞\frac{t}{K\left\| a\right\|_{\infty}}K∥a∥∞t的对应关系。
如果取ai=1/Na_i=1/Nai=1/N,我们可以得到关于样本均值的不等式:
Bernstein不等式 版本3 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数随机变量,∀t>0\forall t>0∀t>0, K=max1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1≤i≤N∥Xi∥ψ1
P(∣Xˉ∣≥t)≤2exp(−cNmin(tK,t2K2))P\left( \left| \bar X \right| \ge t\right) \le 2 \exp \left( -cN \min \left( \frac{t}{K},\frac{t^2}{K^2} \right) \right)P(∣∣Xˉ∣∣≥t)≤2exp(−cNmin(Kt,K2t2))
其中ccc是一个常数。
Bernstein不等式 版本4 假设{Xi}i=1N\{X_i\}_{i=1}^N{Xi}i=1N是一列零均值独立亚指数上界为KKK的随机变量,∀t>0\forall t>0∀t>0,
P(∣∑i=1NXi∣≥t)≤2exp(−t2/2σ2+Kt/3)P\left( \left| \sum_{i=1}^NX_i \right| \ge t\right) \le 2 \exp \left( -\frac{t^2/2}{\sigma^2+Kt/3} \right)P(∣∣∣∣∣i=1∑NXi∣∣∣∣∣≥t)≤2exp(−σ2+Kt/3t2/2)
σ2=∑i=1NEXi2\sigma^2=\sum_{i=1}^N EX_i^2σ2=∑i=1NEXi2。这是使用最广泛的一个版本,因为它能提供一个比Hoeffding不等式更小的上界。
总结
以上是生活随笔为你收集整理的UA MATH567 高维统计I 概率不等式10 Bernstein不等式的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: UA MATH567 高维统计I 概率不
- 下一篇: UA MATH563 概率论的数学基础