UA MATH567 高维统计I 概率不等式3 亚高斯性与亚高斯范数
UA MATH567 高維統計I 概率不等式3 亞高斯性與亞高斯范數
- 亞高斯性
- 亞高斯范數
概率不等式1中介紹了Hoeffding不等式與Chernoff不等式,這兩個不等式的共性是它們的上界關于ttt的遞減階數都是指數級的,這類上界有非常好的性質,比如尾部概率迅速降低,概率集中在分布中心位置等。但這兩個不等式使用條件非常受限,只能適用于Bernoulli分布或者有界的分布,這一講我們要嘗試的是尋找具有尾部概率遞減階數滿足e?ct2e^{-ct^2}e?ct2的所有可能的分布,注意到e?ct2e^{-ct^2}e?ct2這個形式就是正態的kernel,而正態分布,比如X~N(0,1)X \sim N(0,1)X~N(0,1),也滿足
P(∣X∣≥t)≤e?t2/2P(|X| \ge t) \le e^{-t^2/2}P(∣X∣≥t)≤e?t2/2
所以我們稱滿足這個條件的分布為亞高斯分布 (sub-Gaussian distribution)。
亞高斯性
亞高斯性 (sub-Gaussian property)
這五個條件是等價的,我們稱滿足這五個條件中的任何一個的隨機變量為亞高斯隨機變量。我們下一講簡單分析一下這五條性質。
亞高斯范數
在亞高斯隨機變量空間上可以定義亞高斯范數(sub-Gaussian norm):
∥X∥ψ2=inf?{t>0:EeX2/t2≤2}\left\|X \right\|_{\psi_2} = \inf\{t>0:Ee^{X^2/t^2} \le 2\}∥X∥ψ2??=inf{t>0:EeX2/t2≤2}
我們先驗證一下這個定義的確是范數:
非負性:
非負是顯然的,我們考慮是否有∥X∥ψ2=0?X=0,a.s.\left\|X \right\|_{\psi_2}=0 \Leftrightarrow X = 0,a.s.∥X∥ψ2??=0?X=0,a.s.,后者直接能推出前者,而前者成立意味著?t>0\forall t>0?t>0, EeX2/t2≤2Ee^{X^2/t^2} \le 2EeX2/t2≤2,根據Markov不等式(對∣X∣|X|∣X∣與g(x)=ex2/t2g(x)=e^{x^2/t^2}g(x)=ex2/t2)P(∣X∣>?)≤e??2/t2EeX2/t2≤2e??2/t2→0,?0<t<<?P(|X|>\epsilon) \le e^{-\epsilon^2/t^2}Ee^{X^2/t^2} \le 2e^{-\epsilon^2/t^2} \to 0,\forall 0<t<<\epsilonP(∣X∣>?)≤e??2/t2EeX2/t2≤2e??2/t2→0,?0<t<<?因此∥X∥ψ2=0?X=0,a.s.\left\|X \right\|_{\psi_2}=0 \Rightarrow X = 0,a.s.∥X∥ψ2??=0?X=0,a.s.
正齊次性:?λ∈R\forall \lambda \in \mathbb{R}?λ∈R
∥λX∥ψ2=inf?{t>0:Eeλ2X2/t2≤2}=∣λ∣inf?{t>0:Eeλ2X2/(λt)2≤2}=∣λ∣∥X∥ψ2\left\|\lambda X \right\|_{\psi_2} = \inf\{t>0:Ee^{\lambda^2X^2/t^2} \le 2\} \\ =|\lambda|\inf\{t>0:Ee^{\lambda^2X^2/(\lambda t)^2} \le 2\}=|\lambda|\left\|X \right\|_{\psi_2}∥λX∥ψ2??=inf{t>0:Eeλ2X2/t2≤2}=∣λ∣inf{t>0:Eeλ2X2/(λt)2≤2}=∣λ∣∥X∥ψ2??
三角不等式:
記s=∥X∥ψ2,t=∥X∥ψ2s=\left\| X \right\|_{\psi_2},t=\left\| X \right\|_{\psi_2}s=∥X∥ψ2??,t=∥X∥ψ2??,對于函數f(x)=ex2f(x)=e^{x^2}f(x)=ex2,用Jensen不等式:f(X+Ys+t)≤f(∣X∣+∣Y∣s+t)≤ts+tf(∣X∣t)+ss+tf(∣Y∣s)f\left(\frac{X+Y}{s+t}\right)\le f\left(\frac{|X|+|Y|}{s+t}\right) \\\le \frac{t}{s+t}f\left(\frac{|X|}{t}\right)+\frac{s}{s+t}f\left(\frac{|Y|}{s}\right)f(s+tX+Y?)≤f(s+t∣X∣+∣Y∣?)≤s+tt?f(t∣X∣?)+s+ts?f(s∣Y∣?)對這個式子兩端計算期望:Eexp?(X+Ys+t)2≤ts+tEexp?(∣X∣t)2+ss+tEexp?(∣Y∣s)2≤2E\exp\left(\frac{X+Y}{s+t}\right)^2 \\ \le \frac{t}{s+t}E\exp\left(\frac{|X|}{t}\right)^2+\frac{s}{s+t}E\exp\left(\frac{|Y|}{s}\right)^2 \le 2Eexp(s+tX+Y?)2≤s+tt?Eexp(t∣X∣?)2+s+ts?Eexp(s∣Y∣?)2≤2因此∥X+Y∥ψ2≤s+t\left\| X+Y \right\|_{\psi_2}\le s+t∥X+Y∥ψ2??≤s+t
這個范數是非常有用的,因為亞高斯性的五個條件中,每個不等式都一個參數,我們可以用亞高斯范數統一這些參數:參數C,c>0C,c>0C,c>0
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计I 概率不等式3 亚高斯性与亚高斯范数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA SIE545 优化理论基础9 优先
- 下一篇: UA STAT687 线性模型II 最小