UA MATH567 高维统计专题1 稀疏信号及其恢复6 随机设计矩阵下LASSO的估计误差
UA MATH567 高維統(tǒng)計專題1 稀疏信號及其恢復6 隨機設計矩陣下LASSO的估計誤差
上一講我們推導了noisy setting下LASSO估計誤差的階O(slog?d/n)O(\sqrt{s\log d/n})O(slogd/n?),但它的假設是design matrix為常矩陣;這一講我們放寬假設,推導隨機設計矩陣下LASSO的估計誤差。
定理 假設A~Rn×dA \sim \mathbb{R}^{n \times d}A~Rn×d,并且它的行向量iid服從N(0,Σ)N(0,\Sigma)N(0,Σ),則存在常數(shù)C1<1<C2C_1<1<C_2C1?<1<C2?使得
∥Ax∥22n≥C1∥Σx∥22?C2ρ2(Σ)log?dn∥x∥12\frac{\left\| A x \right\|_2^2}{n} \ge C_1 \left\| \sqrt{\Sigma}x \right\|_2^2-C_2\rho^2(\Sigma)\frac{\log d}{n}\left\| x\right\|_1^2n∥Ax∥22??≥C1?∥∥∥?Σ?x∥∥∥?22??C2?ρ2(Σ)nlogd?∥x∥12?
成立的概率不小于1?e?n/321?e?n/321-\frac{e^{-n/32}}{1-e^{-n/32}}1?1?e?n/32e?n/32?,其中ρ2(Σ)=max?iΣii\rho^2(\Sigma)=\max_i\Sigma_{ii}ρ2(Σ)=maxi?Σii?
評注
這個定理的證明可以參考Manwright的high-dimensional statistics那本書的section 7.6 proof of theorem 7.16;
這個定理蘊涵Restricted Eigenvalue Condition,記γmin?\gamma_{\min}γmin?為Σ\SigmaΣ的最小的特征值,
C1∥Σx∥22≥C1(γmin?∥x∥2)2=C1γmin?∥x∥22C_1 \left\| \sqrt{\Sigma}x\right\|_2^2 \ge C_1(\sqrt{\gamma_{\min}}\left\| x\right\|_2)^2=C_1\gamma_{\min}\left\|x \right\|_2^2C1?∥∥∥?Σ?x∥∥∥?22?≥C1?(γmin??∥x∥2?)2=C1?γmin?∥x∥22?
取x∈Cα(S)x \in C_{\alpha}(S)x∈Cα?(S),則
∥x∥1=∥xS∥1+∥xSC∥1≤(1+α)∥xS∥1≤(1+α)s∥xS∥2≤(1+α)s∥x∥2\left\|x \right\|_1=\left\|x_S \right\|_1+\left\|x_{S^C} \right\|_1 \le (1+\alpha)\left\|x_S \right\|_1 \\ \le (1+\alpha)\sqrt{s}\left\|x_S \right\|_2 \le (1+\alpha)\sqrt{s}\left\|x \right\|_2∥x∥1?=∥xS?∥1?+∥xSC?∥1?≤(1+α)∥xS?∥1?≤(1+α)s?∥xS?∥2?≤(1+α)s?∥x∥2?
根據(jù)這個定理,
∥Ax∥22n≥C1γmin?∥x∥22?C2ρ2(Σ)log?dn(1+α)2s∥x∥22≥C12γmin?∥x∥22\frac{\left\| A x \right\|_2^2}{n} \ge C_1\gamma_{\min}\left\|x \right\|_2^2-C_2\rho^2(\Sigma)\frac{\log d}{n}(1+\alpha)^2s\left\|x \right\|_2^2 \\ \ge \frac{C_1}{2}\gamma_{\min}\left\|x \right\|_2^2n∥Ax∥22??≥C1?γmin?∥x∥22??C2?ρ2(Σ)nlogd?(1+α)2s∥x∥22?≥2C1??γmin?∥x∥22?
只要
C2ρ2(Σ)log?dn(1+α)2s∥x∥22<C12γmin?∥x∥22C_2\rho^2(\Sigma)\frac{\log d}{n}(1+\alpha)^2s\left\|x \right\|_2^2<\frac{C_1}{2}\gamma_{\min}\left\|x \right\|_2^2C2?ρ2(Σ)nlogd?(1+α)2s∥x∥22?<2C1??γmin?∥x∥22?上式第二個不等號就成立,而這個條件實際上是對sparsity的限制(這個條件非常有趣,可以發(fā)現(xiàn)稀疏性的上界關于樣本量nnn是線性的,關于特征數(shù)ddd是對數(shù)的,因此高維最小二乘模型中允許d>nd>nd>n的情況存在),
s≤C12γmin?nlog?d1C2ρ2(Σ)(1+α)2s \le \frac{C_1}{2}\gamma_{\min} \frac{n}{\log d} \frac{1}{C_2\rho^2(\Sigma)(1+\alpha)^2}s≤2C1??γmin?logdn?C2?ρ2(Σ)(1+α)21?
如果α=3\alpha=3α=3,這個上界為
C132γmin?nlog?d1C2ρ2(Σ)\frac{C_1}{32}\gamma_{\min} \frac{n}{\log d} \frac{1}{C_2\rho^2(\Sigma)}32C1??γmin?logdn?C2?ρ2(Σ)1?
綜上,當x∈C3(S)x \in C_3(S)x∈C3?(S)時
∥Ax∥22n≥C12γmin?∥x∥22\frac{\left\| A x \right\|_2^2}{n} \ge \frac{C_1}{2}\gamma_{\min}\left\|x \right\|_2^2 n∥Ax∥22??≥2C1??γmin?∥x∥22?
對所有滿足∣S∣=s≤C132γmin?nlog?d1C2ρ2(Σ)|S|=s \le \frac{C_1}{32}\gamma_{\min} \frac{n}{\log d} \frac{1}{C_2\rho^2(\Sigma)}∣S∣=s≤32C1??γmin?logdn?C2?ρ2(Σ)1?的指標集SSS成立,因此這個定理蘊涵RE(C12γmin?,3)RE(\frac{C_1}{2}\gamma_{\min},3)RE(2C1??γmin?,3)。
Design Matrix的Dependence Structure
協(xié)方差矩陣Σ\SigmaΣ決定Design Matrix的Dependence Structure,在simulation study中,常用的dependence structure比如
AR(1)AR(1)AR(1): ρ\rhoρ是自相關性系數(shù)
Σ=[1ρρ2?1ρ??1]\Sigma = \left[ \begin{matrix} 1 & \rho & \rho^2 \cdots \\ & 1 & \rho & \cdots \\ \cdots \\ & & & & 1\\ \end{matrix} \right]Σ=?????1??ρ1?ρ2?ρ???1??????
也就是AR(1)AR(1)AR(1)序列的協(xié)方差矩陣;
Compound Symmetry:
Σ=(1?ρ)Id+ρ1?1?T\Sigma=(1-\rho)I_d+\rho \vec 1 \vec 1^TΣ=(1?ρ)Id?+ρ11T
定理 對于Penalized Least Square形式的LASSO,如果λn≥2∥ATwn∥∞\lambda_n \ge 2 \left\|\frac{A^Tw}{n} \right\|_{\infty}λn?≥2∥∥∥?nATw?∥∥∥?∞?,則對任意滿足∣S∣≤C164C2κρ2(Σ)nlog?d|S| \le \frac{C_1}{64C_2}\frac{\kappa}{\rho^2(\Sigma)}\frac{n}{\log d}∣S∣≤64C2?C1??ρ2(Σ)κ?logdn?的指標集SSS,
∥x^?x?∥22≤144C12λn2κ2∣S∣+16C1λnκ∥xSC?∥1+32C2C1ρ2(Σ)κlog?dn∥xSC?∥12\left\| \hat x - x^* \right\|_2^2 \le \frac{144}{C_1^2}\frac{\lambda_n^2}{\kappa^2}|S|+\frac{16}{C_1}\frac{\lambda_n}{\kappa}\left\| x^*_{S^C} \right\|_1+\frac{32C_2}{C_1}\frac{\rho^2(\Sigma)}{\kappa}\frac{\log d}{n}\left\| x^*_{S^C}\right\|_1^2∥x^?x?∥22?≤C12?144?κ2λn2??∣S∣+C1?16?κλn??∥xSC??∥1?+C1?32C2??κρ2(Σ)?nlogd?∥xSC??∥12?
這個上界可以由∣S∣|S|∣S∣與∥θSC?∥1\left\|\theta_{S^C}^*\right\|_1∥∥?θSC??∥∥?1?控制,當二者均比較小時,這個上界就會比較小,但它們是此消彼長的關系。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计专题1 稀疏信号及其恢复6 随机设计矩阵下LASSO的估计误差的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计专题1 稀
- 下一篇: 马尔可夫“折棍子”过程 Markovia