UA MATH567 高维统计I 概率不等式7 亚指数性与亚指数分布
UA MATH567 高維統(tǒng)計I 概率不等式7 亞指數(shù)分布與亞指數(shù)范數(shù)
第三講到第六講討論了亞高斯分布,這類分布的尾部概率滿足
P(∣X∣≥t)?e?t2/2P(|X| \ge t) \lesssim e^{-t^2/2}P(∣X∣≥t)?e?t2/2
隨著ttt增長,尾部概率下降的速率是非常大的,另一個與之類似的分布族是亞指數(shù)分布,這類分布的尾部概率滿足
P(∣X∣≥t)?e?tP(|X| \ge t) \lesssim e^{-t}P(∣X∣≥t)?e?t
這個尾部概率下降的概率比亞高斯分布尾部概率下降得更慢,所以亞指數(shù)分布族包含的分布比亞高斯分布族包含的分布更多。這一講我們討論亞指數(shù)性。
亞指數(shù)性 (sub-exponential property)
稱滿足這五條性質(zhì)的分布叫亞指數(shù)分布(sub-exponential distribution)與亞高斯性類似,前四個性質(zhì)等價性的證明與亞高斯分布類似(1推2,2推3,3推4,4推1),這里介紹一下第五條性質(zhì)與其他性質(zhì)的等價性(亞高斯性是3推5,5推1;亞指數(shù)性我們用5推2,2推5)。
2推5
假設(shè)性質(zhì)2成立,取K2=1K_2=1K2?=1,考慮EeλXEe^{\lambda X}EeλX,假設(shè)EX=0EX=0EX=0,做Taylor展開,
EeλX=E[1+λX+∑p=2∞(λX)pp!]=1+∑p=2∞λpE[Xp]p!Ee^{\lambda X} = E \left[ 1+\lambda X + \sum_{p=2}^{\infty} \frac{(\lambda X)^p}{p!} \right]=1+\sum_{p=2}^{\infty} \frac{\lambda^pE[X^p]}{p!}EeλX=E[1+λX+p=2∑∞?p!(λX)p?]=1+p=2∑∞?p!λpE[Xp]?
性質(zhì)2說明
E[Xp]≤pp,?p≥1E[X^p] \le p^p,\forall p \ge 1E[Xp]≤pp,?p≥1
根據(jù)Stirling公式,
p!≥(p/e)pp! \ge (p/e)^pp!≥(p/e)p
于是,當(dāng)∣eλ∣<1|e\lambda|<1∣eλ∣<1時
EeλX≤1+∑p=2∞λppp(p/e)p=1+∑p=2∞(eλ)p=1+(eλ)21?eλEe^{\lambda X} \le 1+\sum_{p=2}^{\infty} \frac{\lambda^pp^p}{(p/e)^p}=1+\sum_{p=2}^{\infty}(e\lambda)^p=1+\frac{(e\lambda)^2}{1-e\lambda}EeλX≤1+p=2∑∞?(p/e)pλppp?=1+p=2∑∞?(eλ)p=1+1?eλ(eλ)2?
當(dāng)∣eλ∣<1/2|e\lambda|<1/2∣eλ∣<1/2時,
1+(eλ)21?eλ≤1+2(eλ)2≤e2e2λ21+\frac{(e\lambda)^2}{1-e\lambda} \le 1+2(e\lambda)^2 \le e^{2e^2\lambda^2}1+1?eλ(eλ)2?≤1+2(eλ)2≤e2e2λ2
于是
EeλX≤e2e2λ2,?∣λ∣<1/2eEe^{\lambda X} \le e^{2e^2\lambda^2},\forall |\lambda|<1/2eEeλX≤e2e2λ2,?∣λ∣<1/2e
5推2 假設(shè)性質(zhì)5成立,取K5=1K_5=1K5?=1,根據(jù)不等式
∣x∣p≤pp(ex+e?x),?x∈R,p>0|x|^p \le p^p(e^x+e^{-x}),\forall x \in \mathbb{R},p >0∣x∣p≤pp(ex+e?x),?x∈R,p>0
我們可以得到期望的估計:
E∣X∣p≤pp(EeX+Ee?X)E|X|^p \le p^p(Ee^X+Ee^{-X})E∣X∣p≤pp(EeX+Ee?X)
性質(zhì)5說明
EeX≤e,Ee?X≤eEe^X \le e,Ee^{-X} \le eEeX≤e,Ee?X≤e
所以
E∣X∣p≤2eppE|X|^p \le 2ep^pE∣X∣p≤2epp
這就驗證了K2=2eK_2=2eK2?=2e時性質(zhì)2成立。
例 亞指數(shù)分布的應(yīng)用
在判別分析、特征選擇等統(tǒng)計學(xué)習(xí)模型中,我們總是需要對特征X=(X1,?,Xp)TX=(X_1,\cdots,X_p)^TX=(X1?,?,Xp?)T的協(xié)方差矩陣Σ\SigmaΣ進(jìn)行估計,記估計量為Σ^\hat \SigmaΣ^,目標(biāo)是這個估計量與真實的協(xié)方差不要差別太大,也就是二者之差的某個范數(shù)∥Σ^?Σ∥\left\| \hat \Sigma - \Sigma \right\|∥∥∥?Σ^?Σ∥∥∥?需要足夠小。
但Σ^\hat \SigmaΣ^并不是一個確定的值,它是一個隨機變量,所以一種保證∥Σ^?Σ∥\left\| \hat \Sigma - \Sigma \right\|∥∥∥?Σ^?Σ∥∥∥?足夠小的充分條件是Σ^\hat \SigmaΣ^的每一個元素σ^ij\hat \sigma_{ij}σ^ij?的分布都盡量集中在對應(yīng)的真實值σij\sigma_{ij}σij?附近,也就是
P(∣σ^ij?σij∣)P(|\hat \sigma_{ij}-\sigma_{ij}|)P(∣σ^ij??σij?∣)
這個概率要足夠的小。
一種非常常用的協(xié)方差的估計是
σ^ij=XiTXjn\hat \sigma_{ij} = \frac{X_i^TX_j}{n}σ^ij?=nXiT?Xj??
這里nnn表示樣本量,如果XXX是高斯的,則我們下一講會證明,XiTXjX_i^TX_jXiT?Xj?是亞指數(shù)分布,于是我們可以用亞指數(shù)性來研究概率P(∣σ^ij?σij∣)P(|\hat \sigma_{ij}-\sigma_{ij}|)P(∣σ^ij??σij?∣)的大小。
總結(jié)
以上是生活随笔為你收集整理的UA MATH567 高维统计I 概率不等式7 亚指数性与亚指数分布的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH563 概率论的数学基础
- 下一篇: UA MATH567 高维统计I 概率不