UA MATH567 高维统计专题1 稀疏信号及其恢复3 Coherence与RIP简介
UA MATH567 高维统计专题1 稀疏信号及其恢复3 Coherence与RIP简介
- Pairwise inc oherence
- Mutual Coherence
- RIP
前两讲介绍了L0-minimization
min∥x∥0s.t.y=Ax\min \ \ \left\| x\right\|_0 \\ s.t. \ \ y = Axmin ∥x∥0s.t. y=Ax
以及作为它的convex relaxation的L1-minimization
min∥x∥1s.t.y=Ax\min \ \ \left\| x\right\|_1 \\ s.t. \ \ y = Axmin ∥x∥1s.t. y=Ax
当二者取相同的角点解时,可以实现full recovery;并且AAA的性质越好(用Kruskal rank衡量),能被recovery的xxx就可以越dense;现在我们尝试对AAA“性质好”这个说法给一个更准确的定义,从而给L1-minimization一个更准确的适用范围。
Pairwise inc oherence
定义矩阵A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n的pairwise为
δ(A)=maxj,k∣⟨Aj,Ak⟩m−δjk∣\delta(A)=\max_{j,k}\left| \frac{\langle A_j,A_k \rangle}{m}-\delta_{jk}\right|δ(A)=j,kmax∣∣∣∣m⟨Aj,Ak⟩−δjk∣∣∣∣
其中AjA_jAj表示AAA的第jjj列,δ\deltaδ是Kronecker符号;定义这个量的思路是样本二阶原点矩为AAT/mAA^T/mAAT/m,在高维统计理论部分我们推导过,isotropic的随机向量样本二阶原点矩会concentrate到InI_nIn;因此δ(A)\delta(A)δ(A)可以衡量矩阵AAA所代表的signal是否接近isotropic,如果δ(A)\delta(A)δ(A)非常小,那么signal就是接近isotropic的。
性质 如果δ(A)≤13s\delta(A) \le \frac{1}{3s}δ(A)≤3s1,则对于所有满足∣S∣≤s|S| \le s∣S∣≤s的指标集SSS,矩阵AAA满足restricted nullspace property。
推论 如果δ(A)≤13∥x∗∥0\delta(A) \le \frac{1}{3\left\| x^* \right\|_0}δ(A)≤3∥x∗∥01,则对于所有满足∣S∣≤∥x∗∥0|S| \le \left\| x^* \right\|_0∣S∣≤∥x∗∥0的指标集SSS,矩阵AAA满足restricted nullspace property;再根据上一讲介绍的定理,x∗x^*x∗就是basis pursuit的唯一解。
证明 只需说明AAA满足restricted nullspace property即可。取x∈Null(A)∖{0}x \in Null(A)\setminus \{0\}x∈Null(A)∖{0},则
Ax=0ASxX+ASCxSC=0Ax = 0 \\ A_Sx_X+A_{S^C}x_{S^C}=0Ax=0ASxX+ASCxSC=0
其中
A=[ASASC]x=[xSxSC]A = \left[ \begin{matrix} A_S & A_{S^C} \end{matrix} \right] \\ x = \left[ \begin{matrix} x_S \\ x_{S^C} \end{matrix} \right]A=[ASASC]x=[xSxSC]
同时左乘AST/mA_S^T/mAST/m,
ASTASmxS+ASTASCmxSC=0∥ASTASmxS∥1=∥ASTASCmxSC∥1\frac{A_S^TA_S}{m}x_S+\frac{A_S^TA_{S^C}}{m}x_{S^C}=0 \\ \left\|\frac{A_S^TA_S}{m}x_S \right\|_1 = \left\| \frac{A_S^TA_{S^C}}{m}x_{S^C}\right\|_1mASTASxS+mASTASCxSC=0∥∥∥∥mASTASxS∥∥∥∥1=∥∥∥∥mASTASCxSC∥∥∥∥1
其中
∥ASTASmxS∥1=∥IxS+(ASTASm−I)xS∥1≥∥xS∥1−∥(ASTASm−I)xS∥1\left\|\frac{A_S^TA_S}{m}x_S \right\|_1 =\left\| Ix_S+\left(\frac{A_S^TA_S}{m}-I \right)x_S \right\|_1 \\ \ge \left\| x_S\right\|_1-\left\| \left(\frac{A_S^TA_S}{m}-I \right)x_S\right\|_1∥∥∥∥mASTASxS∥∥∥∥1=∥∥∥∥IxS+(mASTAS−I)xS∥∥∥∥1≥∥xS∥1−∥∥∥∥(mASTAS−I)xS∥∥∥∥1
记ASTASm−I\frac{A_S^TA_S}{m}-ImASTAS−I的pairwise为δS\delta_SδS,则
∥(ASTASm−I)xS∥1≤sδS∥xS∥1≤13∥xS∥1\left\| \left(\frac{A_S^TA_S}{m}-I \right)x_S\right\|_1 \le s \delta_S \left\| x_S\right\|_1 \le \frac{1}{3} \left\|x_S \right\|_1∥∥∥∥(mASTAS−I)xS∥∥∥∥1≤sδS∥xS∥1≤31∥xS∥1
所以
∥ASTASmxS∥1≥23∥xS∥1\left\|\frac{A_S^TA_S}{m}x_S \right\|_1 \ge \frac{2}{3}\left\|x_S \right\|_1∥∥∥∥mASTASxS∥∥∥∥1≥32∥xS∥1
另外,用同样的技巧可以说明,
∥ASTASCmxSC∥1≤s∥ASTASCm∥∞∥xS∥1≤13∥xS∥1\left\| \frac{A_S^TA_{S^C}}{m}x_{S^C}\right\|_1 \le s \left\|\frac{A_S^TA_{S^C}}{m} \right\|_{\infty}\left\| x_S\right\|_1 \le \frac{1}{3}\left\|x_S \right\|_1∥∥∥∥mASTASCxSC∥∥∥∥1≤s∥∥∥∥mASTASC∥∥∥∥∞∥xS∥1≤31∥xS∥1
于是restricted nullspace property成立。
Mutual Coherence
Mutual Coherence与Pairwise in Coherence是类似的工具,都是描述AAA的性质的。定义AAA的Mutual Coherence为
μ(X)=maxj≠k∣⟨Aj∥Aj∥2,Ak∥Ak∥2⟩∣\mu(X)=\max_{j \ne k}\left| \langle \frac{A_j}{\left\| A_j \right\|_2},\frac{A_k}{\left\|A_k \right\|_2} \rangle \right|μ(X)=j=kmax∣∣∣∣⟨∥Aj∥2Aj,∥Ak∥2Ak⟩∣∣∣∣
它可以用来衡量AAA列向量spread out的程度,从统计的角度看,如果列向量是centered,那么μ(X)\mu(X)μ(X)实际上就是样本相关性系数矩阵减去单位阵之差的L∞L_{\infty}L∞-norm;
性质 如果krank(A)≥1μ(A)krank(A) \ge \frac{1}{\mu(A)}krank(A)≥μ(A)1,具体一点地说,如果∥x∗∥0≤12μ(A)\left\| x^* \right\|_0 \le \frac{1}{2\mu(A)}∥x∗∥0≤2μ(A)1,则x∗x^*x∗就是L0-minimization的唯一解。
这个性质的相关叙述可以看Wright and Ma (2020)那本高维数据分析的第74-75页,Proposition 3.2的相关内容。
另一个性质 A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n,并且∥Aj∥2=1,∀j\left\| A_j\right\|_2=1,\forall j∥Aj∥2=1,∀j,如果
∥x∗∥≤12(1+1μ(A))\left\| x^*\right\| \le \frac{1}{2}(1+\frac{1}{\mu(A)})∥x∗∥≤21(1+μ(A)1)
则x∗x^*x∗是basis pursuit的唯一解。
这个性质的证明可以参考Wright and Ma (2020)那本书的第76页,定理3.3以及评注3.4;原书中定理3.3的条件是
∥x∗∥≤12μ(A)\left\| x^*\right\| \le \frac{1}{2\mu(A)}∥x∗∥≤2μ(A)1
上文“另一个性质”列的条件是评注3.4中提出的一个更为宽松的条件。
RIP
假设design matrix AAA的每一个元素都是iid标准正态的,那么上一讲介绍的Coherence方法就不适用了(因为coherence相关定理条件对Gauss随机矩阵来说比较严格)。这时就需要RIP, restricted isometry property,这个性质是由陶哲轩提出来的,作用是替代coherence作为full recovery的条件,因为Gauss随机矩阵具有RIP的条件比coherence的条件弱,所以RIP更适合design matrix随机(尤其是Gaussian)的情形。
RIP 称矩阵A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n满足restricted isometry property of order sss with constant δs(A)>0\delta_s(A)>0δs(A)>0,如果
∥ASTASm−IS∥2≤δs(A)\left\| \frac{A^T_SA_S}{m}-I_S \right\|_2 \le \delta_s(A)∥∥∥∥mASTAS−IS∥∥∥∥2≤δs(A)
对所有满足∣S∣≤s|S| \le s∣S∣≤s的指标集均成立。
性质 如果δs(A)<1/3\delta_s(A)<1/3δs(A)<1/3,则AAA满足restricted nullspace property,因此对满足∥x∗∥≤s\left\| x^* \right\|\le s∥x∗∥≤s的θ∗\theta^*θ∗,它一定是basis pursuit的唯一解。
关于RIP与这个性质的完整叙述与推导,需要了解的同学可以看Wright and Ma (2020)的section 3.3
总结
以上是生活随笔为你收集整理的UA MATH567 高维统计专题1 稀疏信号及其恢复3 Coherence与RIP简介的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: UA MATH567 高维统计专题1 稀
- 下一篇: UA MATH567 高维统计专题1 稀