UA MATH567 高维统计I 概率不等式10 Bernstein不等式
UA MATH567 高維統計I 概率不等式10 Bernstein不等式
我們在介紹亞高斯分布后介紹了適用于亞高斯分布的推廣的Hoeffding不等式,對于亞指數分布,我們可以得到類似的不等式。因為亞指數分布相對更具有一般性,因此亞指數分布的這個概率不等式是一個適用性比較廣的不等式。
Bernstein不等式 版本1 假設{Xi}i=1N\{X_i\}_{i=1}^N{Xi?}i=1N?是一列零均值獨立亞指數隨機變量,?t>0\forall t>0?t>0, K=max?1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1≤i≤N?∥Xi?∥ψ1??
P(∣∑i=1NXi∣≥t)≤2exp?(?cmin?(tK,t2∑i=1N∥Xi∥ψ12))P\left( \left| \sum_{i=1}^NX_i \right| \ge t\right) \le 2 \exp \left( -c \min \left( \frac{t}{K},\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2} \right) \right)P(∣∣∣∣∣?i=1∑N?Xi?∣∣∣∣∣?≥t)≤2exp(?cmin(Kt?,∑i=1N?∥Xi?∥ψ1?2?t2?))
其中ccc是一個常數。
證明
我們先用Markov不等式討論P(∑i=1NXi≥t)P(\sum_{i=1}^NX_i \ge t)P(∑i=1N?Xi?≥t),
P(∑i=1NXi≥t)=P(eλ∑i=1NXi≥eλt)≤e?λtEeλ∑i=1NXi=e?λt∏i=1NEeλXiP(\sum_{i=1}^NX_i \ge t) = P(e^{\lambda\sum_{i=1}^NX_i} \ge e^{\lambda t}) \\\le e^{-\lambda t}Ee^{\lambda\sum_{i=1}^NX_i} = e^{-\lambda t}\prod_{i=1}^N Ee^{\lambda X_i}P(i=1∑N?Xi?≥t)=P(eλ∑i=1N?Xi?≥eλt)≤e?λtEeλ∑i=1N?Xi?=e?λti=1∏N?EeλXi?
根據亞指數性5,K5=c∥Xi∥ψ1K_5 = c\left\| X_i \right\|_{\psi_1}K5?=c∥Xi?∥ψ1??
EeλXi≤ec2∥Xi∥ψ12λ2,?0<λ≤1/K5Ee^{\lambda X_i} \le e^{c^2\left\| X_i \right\|_{\psi_1}^2\lambda^2},\forall 0<\lambda \le 1/K_5EeλXi?≤ec2∥Xi?∥ψ1?2?λ2,?0<λ≤1/K5?
要使對所有的iii,上式均適用,我們需要進一步限制λ\lambdaλ的取值為
0<λ≤1cmax?i∥X∥ψ10 < \lambda \le \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}0<λ≤cmaxi?∥X∥ψ1??1?
于是
e?λt∏i=1NEeλXi≤e?λt∏i=1Nec2∥Xi∥ψ12λ2=exp?(?λt+c2λ2∑i=1N∥Xi∥ψ12)e^{-\lambda t}\prod_{i=1}^N Ee^{\lambda X_i} \le e^{-\lambda t}\prod_{i=1}^N e^{c^2\left\| X_i \right\|_{\psi_1}^2\lambda^2} \\= \exp (-\lambda t+c^2\lambda^2 \sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^2)e?λti=1∏N?EeλXi?≤e?λti=1∏N?ec2∥Xi?∥ψ1?2?λ2=exp(?λt+c2λ2i=1∑N?∥Xi?∥ψ1?2?)
接下來,我們要選擇一個λ\lambdaλ使得這個上界最小,即我們需要解
min?0<λ≤1cmax?i∥X∥ψ1?λt+c2λ2∑i=1N∥Xi∥ψ12\min_{0<\lambda \le \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}}-\lambda t+c^2\lambda^2 \sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^20<λ≤cmaxi?∥X∥ψ1??1?min??λt+c2λ2i=1∑N?∥Xi?∥ψ1?2?
這個二次函數的最小值要么在全局最小點處取得,要么在邊界上取得,即
λ=1cmax?i∥X∥ψ1ort2c2∑i=1N∥Xi∥ψ12\lambda = \frac{1}{c\max_i \left\| X \right\|_{\psi_1}}\ or\ \frac{t}{2c^2\sum_{i=1}^N\left\| X_i \right\|_{\psi_1}^2}λ=cmaxi?∥X∥ψ1??1??or?2c2∑i=1N?∥Xi?∥ψ1?2?t?
于是最小的上界為
exp?(?cmin?(tK,t2∑i=1N∥Xi∥ψ12))\exp \left( -c \min \left( \frac{t}{K},\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2} \right) \right)exp(?cmin(Kt?,∑i=1N?∥Xi?∥ψ1?2?t2?))
對于P(?∑i=1NXi≥t)P(-\sum_{i=1}^NX_i \ge t)P(?∑i=1N?Xi?≥t),我們可以得到一樣的結果,這樣就說明了Bernstein不等式 版本1。
Bernstein不等式 版本2 假設{Xi}i=1N\{X_i\}_{i=1}^N{Xi?}i=1N?是一列零均值獨立亞指數隨機變量,aaa是一個常向量,?t>0\forall t>0?t>0, K=max?1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1≤i≤N?∥Xi?∥ψ1??
P(∣∑i=1NaiXi∣≥t)≤2exp?(?cmin?(tK∥a∥∞,t2K2∥a∥22))P\left( \left| \sum_{i=1}^Na_iX_i \right| \ge t\right) \le 2 \exp \left( -c \min \left( \frac{t}{K\left\| a\right\|_{\infty}},\frac{t^2}{K^2\left\|a \right\|_{2}^2} \right) \right)P(∣∣∣∣∣?i=1∑N?ai?Xi?∣∣∣∣∣?≥t)≤2exp(?cmin(K∥a∥∞?t?,K2∥a∥22?t2?))
其中ccc是一個常數。
說明 我們簡單比較一下版本1和版本2,版本2試圖討論的是XiX_iXi?的線性組合,我們可以找到版本1和2上界的對應關系。
根據亞指數范數的正齊次性
∑i=1N∥aiXi∥ψ12=∑i=1Nai2∥Xi∥ψ12≤∑i=1Nai2K2=K2∥a∥22\sum_{i=1}^N \left\| a_iX_i \right\|_{\psi_1}^2 = \sum_{i=1}^Na_i^2 \left\| X_i \right\|_{\psi_1} ^2 \le \sum_{i=1}^Na_i^2 K^2 = K^2 \left\| a \right\|_2^2i=1∑N?∥ai?Xi?∥ψ1?2?=i=1∑N?ai2?∥Xi?∥ψ1?2?≤i=1∑N?ai2?K2=K2∥a∥22?
這體現了版本1中上界t2∑i=1N∥Xi∥ψ12\frac{t^2}{\sum_{i=1}^N \left\|X_i \right\|_{\psi_1}^2}∑i=1N?∥Xi?∥ψ1?2?t2?與t2K2∥a∥22\frac{t^2}{K^2\left\|a \right\|_{2}^2}K2∥a∥22?t2?的對應關系。
同樣根據亞指數范數的正齊次性
max?i∥aiXi∥ψ1=max?i∣ai∣∥Xi∥ψ1≤∥a∥∞K\max_i \left\| a_iX_i \right\|_{\psi_1}= \max_i |a_i|\left\| X_i \right\|_{\psi_1} \le \left\|a \right\|_{\infty}Kimax?∥ai?Xi?∥ψ1??=imax?∣ai?∣∥Xi?∥ψ1??≤∥a∥∞?K
這體現了版本1中上界tK\frac{t}{K}Kt?與tK∥a∥∞\frac{t}{K\left\| a\right\|_{\infty}}K∥a∥∞?t?的對應關系。
如果取ai=1/Na_i=1/Nai?=1/N,我們可以得到關于樣本均值的不等式:
Bernstein不等式 版本3 假設{Xi}i=1N\{X_i\}_{i=1}^N{Xi?}i=1N?是一列零均值獨立亞指數隨機變量,?t>0\forall t>0?t>0, K=max?1≤i≤N∥Xi∥ψ1K=\max_{1\le i \le N}\left\| X_i\right\|_{\psi_1}K=max1≤i≤N?∥Xi?∥ψ1??
P(∣Xˉ∣≥t)≤2exp?(?cNmin?(tK,t2K2))P\left( \left| \bar X \right| \ge t\right) \le 2 \exp \left( -cN \min \left( \frac{t}{K},\frac{t^2}{K^2} \right) \right)P(∣∣?Xˉ∣∣?≥t)≤2exp(?cNmin(Kt?,K2t2?))
其中ccc是一個常數。
Bernstein不等式 版本4 假設{Xi}i=1N\{X_i\}_{i=1}^N{Xi?}i=1N?是一列零均值獨立亞指數上界為KKK的隨機變量,?t>0\forall t>0?t>0,
P(∣∑i=1NXi∣≥t)≤2exp?(?t2/2σ2+Kt/3)P\left( \left| \sum_{i=1}^NX_i \right| \ge t\right) \le 2 \exp \left( -\frac{t^2/2}{\sigma^2+Kt/3} \right)P(∣∣∣∣∣?i=1∑N?Xi?∣∣∣∣∣?≥t)≤2exp(?σ2+Kt/3t2/2?)
σ2=∑i=1NEXi2\sigma^2=\sum_{i=1}^N EX_i^2σ2=∑i=1N?EXi2?。這是使用最廣泛的一個版本,因為它能提供一個比Hoeffding不等式更小的上界。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计I 概率不等式10 Bernstein不等式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计I 概率不
- 下一篇: UA MATH563 概率论的数学基础