UA MATH567 高维统计专题1 稀疏信号及其恢复1 L0-norm minimization
UA MATH567 高維統計專題1 稀疏信號及其恢復1 L0-norm minimization
- L0L^0L0-norm
- L0L_0L0?-norm minimization
- Exhaustive Search
- L0L_0L0?-norm minimization的性質
- L0L_0L0?-norm minimization是NP-hard問題
這個專題我們討論sparse signal recovery,作為這個專題的開頭,我們先簡單介紹一下sparse vector的norm;熟悉DSP的同學應該比較清楚,用vector和matrix來表示signal是非常常規的操作,那么sparse signal用sparse vector來表示就非常合理,之所以要從sparse vector的norm開始討論是因為我們需要去理解一個很長的sparse vector的結構,并以此設計一些更高效的算法。
下圖摘自Wright, Ma的高維數據分析圖2.6
LpL^pLp-norm是我們高維數據中最常用的范數,
∥x∥p=(∑i=1n∣xi∣p)1/p\left\| x \right\|_p = \left( \sum_{i=1}^n |x_i|^p \right)^{1/p}∥x∥p?=(i=1∑n?∣xi?∣p)1/p
如果p≥1p \ge 1p≥1,則上面的定義是范數;如果0<p<10<p<10<p<1,則上式不滿足范數公理化定義中的三角不等式,無法成為范數,如果需要三角不等式,則可以用下面這個定義
∑i=1n∣xi∣p\sum_{i=1}^n |x_i|^pi=1∑n?∣xi?∣p
但這個定義不滿足正齊次性。從上圖可以看出,當ppp減小時,LpL^pLp-ball中的vector被shrink得越厲害,對應在sparse signal的設定中,noise就會被shrink掉,而signal得以保留。因此我們總是希望被復原的signal的范數(ppp越小的范數越好)不大于某一個閾值。
L0L^0L0-norm
最小可能的ppp為0,按上面的分析L0L^0L0-norm就是最好用的,直觀理解L0L^0L0-norm就是向量中不為0的元素個數
∥x∥0=#{i:xi≠0}\left\| x\right\|_0=\#\{i:x_i \ne 0\}∥x∥0?=#{i:xi??=0}
但是雖然叫L0L^0L0-norm,但它本身并不是一個范數,因為它不滿足正齊次性:
?c∈R,∥cx∥0=∥x∥0≠c∥x∥0\forall c \in \mathbb{R},\left\| c x \right\|_0 =\left\| x\right\|_0 \ne c\left\| x\right\|_0 ?c∈R,∥cx∥0?=∥x∥0??=c∥x∥0?
所以盡管它滿足三角不等式,它也不是一個范數。
之所以我們稱之為范數,并把它歸為LpL^pLp-norm這一類,是因為
lim?p→0∥x∥pp=lim?p→0∑i=1n∣xi∣p=∑i=1nlim?p→0∣xi∣p=∑i=1n1xi≠0=∥x∥0\lim_{p \to 0}\left\| x \right\|_{p}^p =\lim_{p \to 0} \sum_{i=1}^n |x_i|^p= \sum_{i=1}^n\lim_{p \to 0}|x_i|^p=\sum_{i=1}^n 1_{x_i \ne 0}=\left\| x\right\|_0p→0lim?∥x∥pp?=p→0lim?i=1∑n?∣xi?∣p=i=1∑n?p→0lim?∣xi?∣p=i=1∑n?1xi??=0?=∥x∥0?
L0L_0L0?-norm minimization
我們先不考慮隨機性,假設yyy是我們對稀疏信號的測量,y=Axoy=Ax_oy=Axo?;討論最簡單的問題,即測量方程中的系數AAA已知,我們的目標是從測量中還原出信號xox_oxo?,一種可行的操作是在y=Axy=Axy=Ax的解集中找到最稀疏的向量,以此作為sparse signal的估計,用優化表示,我們要求解的問題是:
min?∥x∥0s.t.y=Ax\min \ \ \left\| x\right\|_0 \\ s.t. \ \ y = Axmin??∥x∥0?s.t.??y=Ax
Exhaustive Search
引入xxx的支撐集supp(x)={i:xi≠0}?{1,?,n}supp(x)=\{i:x_i \ne 0\} \subset \{1,\cdots,n\}supp(x)={i:xi??=0}?{1,?,n},則L0L_0L0?-norm minimization的目標是找到y=Axy=Axy=Ax的解集中支撐集最小的解;比較粗放的想法是考慮{1,?,n}\{1,\cdots,n\}{1,?,n}的所有子集,記為III,對每一個子集III,我們求解
AIxI=yA_Ix_I = yAI?xI?=y
這里的AIA_IAI?表示在AAA中把III對應的那幾列選出來形成的子矩陣,把xIx_IxI?解出來后填入III的對應位置,其他位置填0,這樣形成一個可行解,把所有的這些可行解比較得到的支撐集最小的那個就是L0L_0L0?-norm minimization的解:
L0L_0L0?-norm minimization的性質
上面的Exhaustive Search有一個非常有趣的理論性質:當∥xo∥0\left\| x_o \right\|_0∥xo?∥0?不太大時,Exhaustive Search的解一定是xox_oxo?。更嚴謹的敘述需要引入Kruskal rank:記krank(A)krank(A)krank(A)為矩陣AAA的Kruskal rank,任意krank(A)krank(A)krank(A)個AAA的列向量線性無關,但存在krank(A)+1krank(A)+1krank(A)+1個AAA的列向量線性無關。
定理(L0L^0L0 Recovery) 假設y=Axoy=Ax_oy=Axo?,并且∥xo∥0≤12krank(A)\left\| x_o \right\|_0 \le \frac{1}{2}krank(A)∥xo?∥0?≤21?krank(A),則xox_oxo?是L0L_0L0?-norm minimization的唯一解。
評述 這個定理說明當xox_oxo?足夠sparse的時候(∥xo∥0≤12krank(A)\left\| x_o \right\|_0 \le \frac{1}{2}krank(A)∥xo?∥0?≤21?krank(A)),L0L_0L0?-norm minimization可以把xox_oxo?準確還原出來。
L0L_0L0?-norm minimization失效的情況:不妨假設x^\hat xx^是L0L_0L0?-norm minimization的解,如果?xo∈null(A),∥xo∥0=k\exists x_o \in null(A),\left\| x_o \right\|_0=k?xo?∈null(A),∥xo?∥0?=k,此時y=Axo=0y=Ax_o=0y=Axo?=0,求解L0L_0L0?-norm minimization得到的結果一定是x^=0\hat x=0x^=0,這個推理說明AAA的核空間存在非零的稀疏矩陣時,L0L_0L0?-norm minimization失效。
避免L0L_0L0?-norm minimization失效引入假設:
{δ∈null(A):∥δ∥0≤2k}={0}\{\delta \in null(A):\left\| \delta\right\|_0 \le 2k\}=\{0\}{δ∈null(A):∥δ∥0?≤2k}={0}
其中k≥∥xo∥0k \ge \left\| x_o \right\|_0k≥∥xo?∥0?;簡單解釋一下這個假設取2k2k2k的原因,因為x^\hat xx^是L0L_0L0?-norm minimization的解,所以∥x^∥0≤∥xo∥0≤k\left\| \hat x \right\|_0 \le \left\|x_o \right\|_0 \le k∥x^∥0?≤∥xo?∥0?≤k,用δ\deltaδ表示L0L_0L0?-norm minimization的估計誤差,即δ=x^?xo\delta=\hat x-x_oδ=x^?xo?,用三角不等式
∥δ∥0=∥x^?xo∥0≤∥x^∥0+∥xo∥0≤2k\left\| \delta \right\|_0=\left\| \hat x-x_o \right\|_0 \le \left\| \hat x\right\|_0+\left\|x_o \right\|_0 \le 2k∥δ∥0?=∥x^?xo?∥0?≤∥x^∥0?+∥xo?∥0?≤2k
另外Aδ=A(x?xo)=y?y=0A\delta=A(x-x_o)=y-y=0Aδ=A(x?xo?)=y?y=0,所以δ∈null(A)\delta \in null(A)δ∈null(A);了解到這些之后我們可以發現,如果上面的假設成立,那么x^=xo\hat x=x_ox^=xo?。
假設與矩陣AAA的聯系:上面的假設主要約束的是AAA的核空間,那些核空間沒有sparse vector的AAA才是好的AAA,才能得到準確的signal recovery;這個假設可以用AAA的列向量重新敘述,{δ∈null(A):∥δ∥0≤2k}={0}\{\delta \in null(A):\left\| \delta\right\|_0 \le 2k\}=\{0\}{δ∈null(A):∥δ∥0?≤2k}={0}成立的條件是AAA的任意2k2k2k個列向量線性無關,用Kruskal rank表示就是
krank(A)≥2k≥2∥xo∥0krank(A) \ge 2k \ge 2 \left\| x_o \right\|_0krank(A)≥2k≥2∥xo?∥0?
這就是定理的結果。
L0L_0L0?-norm minimization是NP-hard問題
用PPP表示多項式時間內可以求解的問題,NPNPNP表示多項式時間內可以驗證某個解是否正確的問題;NP可以在多項式時間內化歸成NP-complete問題,一個很重要的猜想是P=NPP=NPP=NP(右圖);NP-hard不一定能在多項式時間內被驗證,是至少與NP-complete一樣困難的問題。
定理 L0L^0L0-norm minimization是NP-hard問題。
評述
說明某一個問題是NP-hard問題只需要找到一個已知的NP-hard問題,然后說明這個問題與已知的NP-hard問題等價即可。
Exact 3-set Cover (E3C):S={1,?,m}S = \{1,\cdots,m\}S={1,?,m},C={U1,?,Un}\mathcal{C}=\{U_1,\cdots,U_n\}C={U1?,?,Un?},Uj?SU_j \subset SUj??S,∣Uj∣=3|U_j|=3∣Uj?∣=3,是否存在C′?C\mathcal{C'} \subset \mathcal{C}C′?C,使得C′\mathcal{C'}C′覆蓋SSS,也就是?i∈S,?!U∈C′,i∈U\forall i \in S,\exists ! U \in \mathcal{C}',i \in U?i∈S,?!U∈C′,i∈U。
E3C是一個公認的NP-hard的問題,我們可以證明L0L^0L0-norm minimization與E3C等價。
證明
假設矩陣A∈{0,1}m×nA \in \{0,1\}^{m \times n}A∈{0,1}m×n,使得Aij=1i∈UjA_{ij}=1_{i \in U_j}Aij?=1i∈Uj??,取y=1y=1y=1,則Ax=yAx=yAx=y有稀疏解xox_oxo?, ∥xo∥0≤m/3\left\| x_o \right\|_0 \le m/3∥xo?∥0?≤m/3的充要條件是存在Exact 3-set Cover;
?\Leftarrow?: 假設存在Exact 3-set Cover C′\mathcal{C}'C′,顯然∣C′∣=m/3|\mathcal{C}'|=m/3∣C′∣=m/3,定義x=(x1,?,n)′,xj=1Uj∈C′x=(x_1,\cdots,n)',x_j=1_{U_j \in \mathcal{C}'}x=(x1?,?,n)′,xj?=1Uj?∈C′?,則y=Axy=Axy=Ax并且∥x∥0≤m/3\left\| x \right\|_0 \le m/3∥x∥0?≤m/3;
?\Rightarrow?: 假設y=Axo,∥xo∥0≤m/3y=Ax_o,\left\| x_o \right\|_0 \le m/3y=Axo?,∥xo?∥0?≤m/3,定義C′={Uj:xo(j)≠0}\mathcal{C}'=\{U_j:x_o(j) \ne 0\}C′={Uj?:xo?(j)?=0},則C′\mathcal{C'}C′是Exact 3-set Cover。因為∥xo∥0≤m/3\left\| x_o \right\|_0 \le m/3∥xo?∥0?≤m/3,所以AAA的列向量有333個非零元素,定義I=supp(xo)I=supp(x_o)I=supp(xo?),AIA_IAI?至多有m/3m/3m/3列,并且至多有mmm個非零元素;又因為AIxoI=yA_Ix_{oI}=yAI?xoI?=y,所以AIA_IAI?的每一行至少有一個非零元。綜上,AIA_IAI?每一行恰好有一個非零元,所以C′\mathcal{C'}C′是Exact 3-set Cover。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计专题1 稀疏信号及其恢复1 L0-norm minimization的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: aMCMC for Horseshoe:
- 下一篇: UA STAT675 统计计算I 随机数