当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计专题1 稀疏信号及其恢复6 随机设计矩阵下LASSO的估计误差

发布时间：2025/4/14 编程问答 46 豆豆

生活随笔收集整理的这篇文章主要介绍了 UA MATH567 高维统计专题1 稀疏信号及其恢复6 随机设计矩阵下LASSO的估计误差小编觉得挺不错的,现在分享给大家,帮大家做个参考.

UA MATH567 高维统计专题1 稀疏信号及其恢复6 随机设计矩阵下LASSO的估计误差

上一讲我们推导了noisy setting下LASSO估计误差的阶 $O(slog⁡d/n)O(\sqrt{s\log d/n})$ ，但它的假设是design matrix为常矩阵；这一讲我们放宽假设，推导随机设计矩阵下LASSO的估计误差。

定理假设 $\sim \mathbb{R}^{n \times d}$ ，并且它的行向量iid服从 $N(0,Σ)N(0,\Sigma)$ ，则存在常数 $C_1<1<C_2$ 使得
$∥Ax∥22n≥C1∥Σx∥22−C2ρ2(Σ)log⁡dn∥x∥12\frac{\left\| A x \right\|_2^2}{n} \ge C_1 \left\| \sqrt{\Sigma}x \right\|_2^2-C_2\rho^2(\Sigma)\frac{\log d}{n}\left\| x\right\|_1^2$

成立的概率不小于 $1−e−n/321−e−n/321-\frac{e^{-n/32}}{1-e^{-n/32}}$ ，其中 $ρ2(Σ)=max⁡iΣii\rho^2(\Sigma)=\max_i\Sigma_{ii}$

评注
这个定理的证明可以参考Manwright的high-dimensional statistics那本书的section 7.6 proof of theorem 7.16；

这个定理蕴涵Restricted Eigenvalue Condition，记 $γmin⁡\gamma_{\min}$ 为 $Σ\Sigma$ 的最小的特征值，
$C1∥Σx∥22≥C1(γmin⁡∥x∥2)2=C1γmin⁡∥x∥22C_1 \left\| \sqrt{\Sigma}x\right\|_2^2 \ge C_1(\sqrt{\gamma_{\min}}\left\| x\right\|_2)^2=C_1\gamma_{\min}\left\|x \right\|_2^2$

取 $\in C_{\alpha}(S)$ ，则
$∥x∥1=∥xS∥1+∥xSC∥1≤(1+α)∥xS∥1≤(1+α)s∥xS∥2≤(1+α)s∥x∥2\left\|x \right\|_1=\left\|x_S \right\|_1+\left\|x_{S^C} \right\|_1 \le (1+\alpha)\left\|x_S \right\|_1 \\ \le (1+\alpha)\sqrt{s}\left\|x_S \right\|_2 \le (1+\alpha)\sqrt{s}\left\|x \right\|_2$

根据这个定理，
$∥Ax∥22n≥C1γmin⁡∥x∥22−C2ρ2(Σ)log⁡dn(1+α)2s∥x∥22≥C12γmin⁡∥x∥22\frac{\left\| A x \right\|_2^2}{n} \ge C_1\gamma_{\min}\left\|x \right\|_2^2-C_2\rho^2(\Sigma)\frac{\log d}{n}(1+\alpha)^2s\left\|x \right\|_2^2 \\ \ge \frac{C_1}{2}\gamma_{\min}\left\|x \right\|_2^2$

只要
$C2ρ2(Σ)log⁡dn(1+α)2s∥x∥22<C12γmin⁡∥x∥22C_2\rho^2(\Sigma)\frac{\log d}{n}(1+\alpha)^2s\left\|x \right\|_2^2<\frac{C_1}{2}\gamma_{\min}\left\|x \right\|_2^2$ 上式第二个不等号就成立，而这个条件实际上是对sparsity的限制（这个条件非常有趣，可以发现稀疏性的上界关于样本量 $n$ 是线性的，关于特征数 $d$ 是对数的，因此高维最小二乘模型中允许 $d > n$ 的情况存在），
$\le \frac{C_1}{2}\gamma_{\min} \frac{n}{\log d} \frac{1}{C_2\rho^2(\Sigma)(1+\alpha)^2}$

如果 $α=3\alpha=3$ ，这个上界为
$C132γmin⁡nlog⁡d1C2ρ2(Σ)\frac{C_1}{32}\gamma_{\min} \frac{n}{\log d} \frac{1}{C_2\rho^2(\Sigma)}$

综上，当 $\in C_3(S)$ 时
$∥Ax∥22n≥C12γmin⁡∥x∥22\frac{\left\| A x \right\|_2^2}{n} \ge \frac{C_1}{2}\gamma_{\min}\left\|x \right\|_2^2$

对所有满足 $\le \frac{C_1}{32}\gamma_{\min} \frac{n}{\log d} \frac{1}{C_2\rho^2(\Sigma)}$ 的指标集 $S$ 成立，因此这个定理蕴涵 $RE(C12γmin⁡,3)RE(\frac{C_1}{2}\gamma_{\min},3)$ 。

Design Matrix的Dependence Structure
协方差矩阵 $Σ\Sigma$ 决定Design Matrix的Dependence Structure，在simulation study中，常用的dependence structure比如

$A R (1)$ : $ρ\rho$ 是自相关性系数
$Σ=[1ρρ2⋯1ρ⋯⋯1]\Sigma = \left[ \begin{matrix} 1 & \rho & \rho^2 \cdots \\ & 1 & \rho & \cdots \\ \cdots \\ & & & & 1\\ \end{matrix} \right]$

也就是 $A R (1)$ 序列的协方差矩阵；

Compound Symmetry：
$Σ=(1−ρ)Id+ρ1⃗1⃗T\Sigma=(1-\rho)I_d+\rho \vec 1 \vec 1^T$

定理对于Penalized Least Square形式的LASSO，如果 $λn≥2∥ATwn∥∞\lambda_n \ge 2 \left\|\frac{A^Tw}{n} \right\|_{\infty}$ ，则对任意满足 $\le \frac{C_1}{64C_2}\frac{\kappa}{\rho^2(\Sigma)}\frac{n}{\log d}$ 的指标集 $S$ ，
$∥x^−x∗∥22≤144C12λn2κ2∣S∣+16C1λnκ∥xSC∗∥1+32C2C1ρ2(Σ)κlog⁡dn∥xSC∗∥12\left\| \hat x - x^* \right\|_2^2 \le \frac{144}{C_1^2}\frac{\lambda_n^2}{\kappa^2}|S|+\frac{16}{C_1}\frac{\lambda_n}{\kappa}\left\| x^*_{S^C} \right\|_1+\frac{32C_2}{C_1}\frac{\rho^2(\Sigma)}{\kappa}\frac{\log d}{n}\left\| x^*_{S^C}\right\|_1^2$

这个上界可以由 $∣ S ∣$ 与 $∥θSC∗∥1\left\|\theta_{S^C}^*\right\|_1$ 控制，当二者均比较小时，这个上界就会比较小，但它们是此消彼长的关系。

总结

以上是生活随笔为你收集整理的UA MATH567 高维统计专题1 稀疏信号及其恢复6 随机设计矩阵下LASSO的估计误差的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： UA MATH567 高维统计专题1 稀
下一篇：马尔可夫“折棍子”过程 Markovia