UA MATH567 高维统计专题1 稀疏信号及其恢复3 Coherence与RIP简介
UA MATH567 高維統計專題1 稀疏信號及其恢復3 Coherence與RIP簡介
- Pairwise inc oherence
- Mutual Coherence
- RIP
前兩講介紹了L0-minimization
min?∥x∥0s.t.y=Ax\min \ \ \left\| x\right\|_0 \\ s.t. \ \ y = Axmin??∥x∥0?s.t.??y=Ax
以及作為它的convex relaxation的L1-minimization
min?∥x∥1s.t.y=Ax\min \ \ \left\| x\right\|_1 \\ s.t. \ \ y = Axmin??∥x∥1?s.t.??y=Ax
當二者取相同的角點解時,可以實現full recovery;并且AAA的性質越好(用Kruskal rank衡量),能被recovery的xxx就可以越dense;現在我們嘗試對AAA“性質好”這個說法給一個更準確的定義,從而給L1-minimization一個更準確的適用范圍。
Pairwise inc oherence
定義矩陣A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n的pairwise為
δ(A)=max?j,k∣?Aj,Ak?m?δjk∣\delta(A)=\max_{j,k}\left| \frac{\langle A_j,A_k \rangle}{m}-\delta_{jk}\right|δ(A)=j,kmax?∣∣∣∣?m?Aj?,Ak????δjk?∣∣∣∣?
其中AjA_jAj?表示AAA的第jjj列,δ\deltaδ是Kronecker符號;定義這個量的思路是樣本二階原點矩為AAT/mAA^T/mAAT/m,在高維統計理論部分我們推導過,isotropic的隨機向量樣本二階原點矩會concentrate到InI_nIn?;因此δ(A)\delta(A)δ(A)可以衡量矩陣AAA所代表的signal是否接近isotropic,如果δ(A)\delta(A)δ(A)非常小,那么signal就是接近isotropic的。
性質 如果δ(A)≤13s\delta(A) \le \frac{1}{3s}δ(A)≤3s1?,則對于所有滿足∣S∣≤s|S| \le s∣S∣≤s的指標集SSS,矩陣AAA滿足restricted nullspace property。
推論 如果δ(A)≤13∥x?∥0\delta(A) \le \frac{1}{3\left\| x^* \right\|_0}δ(A)≤3∥x?∥0?1?,則對于所有滿足∣S∣≤∥x?∥0|S| \le \left\| x^* \right\|_0∣S∣≤∥x?∥0?的指標集SSS,矩陣AAA滿足restricted nullspace property;再根據上一講介紹的定理,x?x^*x?就是basis pursuit的唯一解。
證明 只需說明AAA滿足restricted nullspace property即可。取x∈Null(A)?{0}x \in Null(A)\setminus \{0\}x∈Null(A)?{0},則
Ax=0ASxX+ASCxSC=0Ax = 0 \\ A_Sx_X+A_{S^C}x_{S^C}=0Ax=0AS?xX?+ASC?xSC?=0
其中
A=[ASASC]x=[xSxSC]A = \left[ \begin{matrix} A_S & A_{S^C} \end{matrix} \right] \\ x = \left[ \begin{matrix} x_S \\ x_{S^C} \end{matrix} \right]A=[AS??ASC??]x=[xS?xSC??]
同時左乘AST/mA_S^T/mAST?/m,
ASTASmxS+ASTASCmxSC=0∥ASTASmxS∥1=∥ASTASCmxSC∥1\frac{A_S^TA_S}{m}x_S+\frac{A_S^TA_{S^C}}{m}x_{S^C}=0 \\ \left\|\frac{A_S^TA_S}{m}x_S \right\|_1 = \left\| \frac{A_S^TA_{S^C}}{m}x_{S^C}\right\|_1mAST?AS??xS?+mAST?ASC??xSC?=0∥∥∥∥?mAST?AS??xS?∥∥∥∥?1?=∥∥∥∥?mAST?ASC??xSC?∥∥∥∥?1?
其中
∥ASTASmxS∥1=∥IxS+(ASTASm?I)xS∥1≥∥xS∥1?∥(ASTASm?I)xS∥1\left\|\frac{A_S^TA_S}{m}x_S \right\|_1 =\left\| Ix_S+\left(\frac{A_S^TA_S}{m}-I \right)x_S \right\|_1 \\ \ge \left\| x_S\right\|_1-\left\| \left(\frac{A_S^TA_S}{m}-I \right)x_S\right\|_1∥∥∥∥?mAST?AS??xS?∥∥∥∥?1?=∥∥∥∥?IxS?+(mAST?AS???I)xS?∥∥∥∥?1?≥∥xS?∥1??∥∥∥∥?(mAST?AS???I)xS?∥∥∥∥?1?
記ASTASm?I\frac{A_S^TA_S}{m}-ImAST?AS???I的pairwise為δS\delta_SδS?,則
∥(ASTASm?I)xS∥1≤sδS∥xS∥1≤13∥xS∥1\left\| \left(\frac{A_S^TA_S}{m}-I \right)x_S\right\|_1 \le s \delta_S \left\| x_S\right\|_1 \le \frac{1}{3} \left\|x_S \right\|_1∥∥∥∥?(mAST?AS???I)xS?∥∥∥∥?1?≤sδS?∥xS?∥1?≤31?∥xS?∥1?
所以
∥ASTASmxS∥1≥23∥xS∥1\left\|\frac{A_S^TA_S}{m}x_S \right\|_1 \ge \frac{2}{3}\left\|x_S \right\|_1∥∥∥∥?mAST?AS??xS?∥∥∥∥?1?≥32?∥xS?∥1?
另外,用同樣的技巧可以說明,
∥ASTASCmxSC∥1≤s∥ASTASCm∥∞∥xS∥1≤13∥xS∥1\left\| \frac{A_S^TA_{S^C}}{m}x_{S^C}\right\|_1 \le s \left\|\frac{A_S^TA_{S^C}}{m} \right\|_{\infty}\left\| x_S\right\|_1 \le \frac{1}{3}\left\|x_S \right\|_1∥∥∥∥?mAST?ASC??xSC?∥∥∥∥?1?≤s∥∥∥∥?mAST?ASC??∥∥∥∥?∞?∥xS?∥1?≤31?∥xS?∥1?
于是restricted nullspace property成立。
Mutual Coherence
Mutual Coherence與Pairwise in Coherence是類似的工具,都是描述AAA的性質的。定義AAA的Mutual Coherence為
μ(X)=max?j≠k∣?Aj∥Aj∥2,Ak∥Ak∥2?∣\mu(X)=\max_{j \ne k}\left| \langle \frac{A_j}{\left\| A_j \right\|_2},\frac{A_k}{\left\|A_k \right\|_2} \rangle \right|μ(X)=j?=kmax?∣∣∣∣??∥Aj?∥2?Aj??,∥Ak?∥2?Ak???∣∣∣∣?
它可以用來衡量AAA列向量spread out的程度,從統計的角度看,如果列向量是centered,那么μ(X)\mu(X)μ(X)實際上就是樣本相關性系數矩陣減去單位陣之差的L∞L_{\infty}L∞?-norm;
性質 如果krank(A)≥1μ(A)krank(A) \ge \frac{1}{\mu(A)}krank(A)≥μ(A)1?,具體一點地說,如果∥x?∥0≤12μ(A)\left\| x^* \right\|_0 \le \frac{1}{2\mu(A)}∥x?∥0?≤2μ(A)1?,則x?x^*x?就是L0-minimization的唯一解。
這個性質的相關敘述可以看Wright and Ma (2020)那本高維數據分析的第74-75頁,Proposition 3.2的相關內容。
另一個性質 A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n,并且∥Aj∥2=1,?j\left\| A_j\right\|_2=1,\forall j∥Aj?∥2?=1,?j,如果
∥x?∥≤12(1+1μ(A))\left\| x^*\right\| \le \frac{1}{2}(1+\frac{1}{\mu(A)})∥x?∥≤21?(1+μ(A)1?)
則x?x^*x?是basis pursuit的唯一解。
這個性質的證明可以參考Wright and Ma (2020)那本書的第76頁,定理3.3以及評注3.4;原書中定理3.3的條件是
∥x?∥≤12μ(A)\left\| x^*\right\| \le \frac{1}{2\mu(A)}∥x?∥≤2μ(A)1?
上文“另一個性質”列的條件是評注3.4中提出的一個更為寬松的條件。
RIP
假設design matrix AAA的每一個元素都是iid標準正態的,那么上一講介紹的Coherence方法就不適用了(因為coherence相關定理條件對Gauss隨機矩陣來說比較嚴格)。這時就需要RIP, restricted isometry property,這個性質是由陶哲軒提出來的,作用是替代coherence作為full recovery的條件,因為Gauss隨機矩陣具有RIP的條件比coherence的條件弱,所以RIP更適合design matrix隨機(尤其是Gaussian)的情形。
RIP 稱矩陣A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n滿足restricted isometry property of order sss with constant δs(A)>0\delta_s(A)>0δs?(A)>0,如果
∥ASTASm?IS∥2≤δs(A)\left\| \frac{A^T_SA_S}{m}-I_S \right\|_2 \le \delta_s(A)∥∥∥∥?mAST?AS???IS?∥∥∥∥?2?≤δs?(A)
對所有滿足∣S∣≤s|S| \le s∣S∣≤s的指標集均成立。
性質 如果δs(A)<1/3\delta_s(A)<1/3δs?(A)<1/3,則AAA滿足restricted nullspace property,因此對滿足∥x?∥≤s\left\| x^* \right\|\le s∥x?∥≤s的θ?\theta^*θ?,它一定是basis pursuit的唯一解。
關于RIP與這個性質的完整敘述與推導,需要了解的同學可以看Wright and Ma (2020)的section 3.3
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计专题1 稀疏信号及其恢复3 Coherence与RIP简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计专题1 稀
- 下一篇: UA MATH567 高维统计专题1 稀