UA MATH567 高维统计I 概率不等式12 McDiarmid不等式
UA MATH567 高維統(tǒng)計(jì)I 概率不等式12 McDiarmid不等式
這一講我們介紹基于Lipschitz性導(dǎo)出概率不等式的思路,這個(gè)思路在下一講正式進(jìn)入隨機(jī)向量之后應(yīng)用非常廣泛。但這一講我們先不正式引入Lipschitz函數(shù)的概念,我們介紹一個(gè)與之相關(guān)的概念,隨機(jī)變量序列的Lipschitz組合(Lipschitz combinations)。
Lipschitz組合 假設(shè)X1,?,XnX_1,\cdots,X_nX1?,?,Xn?是一列獨(dú)立的,值域分別為R1,?,RnR_1,\cdots,R_nR1?,?,Rn?的隨機(jī)變量,假設(shè)F:R1×?×Rn→RF:R_1 \times \cdots \times R_n \to \mathbb{R}F:R1?×?×Rn?→R是一個(gè)實(shí)值函數(shù)滿足?ci>0\exists c_i>0?ci?>0,?xi,xi′\forall x_i,x_i'?xi?,xi′?,當(dāng)其他自變量不變時(shí),有
∣F(x1,?,xi,?,xn)?F(x1,?,xi′,?,xn)∣≤ci|F(x_1,\cdots,x_i,\cdots,x_n)-F(x_1,\cdots,x_i',\cdots,x_n) | \le c_i∣F(x1?,?,xi?,?,xn?)?F(x1?,?,xi′?,?,xn?)∣≤ci?
我們就稱F(X1,?,Xn)F(X_1,\cdots,X_n)F(X1?,?,Xn?)是X1,?,XnX_1,\cdots,X_nX1?,?,Xn?的一個(gè)Lipschitz組合。
評(píng)注 Lipschitz組合可以理解成有界的一種推廣,我們回顧一下Hoeffding不等式:假設(shè)Xi∈[mi,Mi],i=1,?,NX_i \in [m_i,M_i],i=1,\cdots,NXi?∈[mi?,Mi?],i=1,?,N, ?t>0\forall t>0?t>0, 下面的不等式被稱為Hoeffding不等式,
P(∑i=1N(Xi?EXi)≥t)≤exp?(?2t2∑i=1N(Mi?mi)2)P \left( \sum_{i=1}^N (X_i - EX_i)\ge t \right) \le \exp \left( -\frac{2t^2}{\sum_{i=1}^N (M_i - m_i)^2} \right)P(i=1∑N?(Xi??EXi?)≥t)≤exp(?∑i=1N?(Mi??mi?)22t2?)
也就是說(shuō)有界的隨機(jī)變量,他們的tail probability的階大概是e?t2e^{-t^2}e?t2。如果考慮
F(X1,?,XN)=∑i=1N(Xi?EXi)F(X_1,\cdots,X_N)=\sum_{i=1}^N (X_i - EX_i)F(X1?,?,XN?)=i=1∑N?(Xi??EXi?)
要使F(X1,?,XN)F(X_1,\cdots,X_N)F(X1?,?,XN?)成為L(zhǎng)ipschitz組合的充要條件是XiX_iXi?有界,于是Lipschitz組合可以看做是對(duì)有界性的一種推廣,并且我們可以預(yù)期Lipschitz組合tail probability的階也大概是e?t2e^{-t^2}e?t2,如果這個(gè)猜測(cè)成立,那么Hoeffding不等式的結(jié)果就不僅僅局限于隨機(jī)變量的和或者線性組合了,而是對(duì)更一般的Lipschitz組合都成立,這個(gè)結(jié)果由下面的McDiarmid不等式給出。
McDiarmid不等式 F(X)=F(X1,?,Xn)F(X)=F(X_1,\cdots,X_n)F(X)=F(X1?,?,Xn?)為X1,?,XnX_1,\cdots,X_nX1?,?,Xn?的Lipschitz組合,則?C,c>0\exists C,c>0?C,c>0
P(∣F(X)?EF(X)∣≥λσ2)≤Ce?cλ2P(|F(X)-EF(X)| \ge \lambda \sigma^2) \le Ce^{-c\lambda^2}P(∣F(X)?EF(X)∣≥λσ2)≤Ce?cλ2
其中σ2=∑i=1nci2\sigma^2=\sum_{i=1}^n c_i^2σ2=∑i=1n?ci2?。
證明
這里展示單邊的證明方法:
P(F(X)?EF(X)≥λσ2)≤Ce?cλ2P(F(X)-EF(X) \ge \lambda \sigma^2) \le Ce^{-c\lambda^2}P(F(X)?EF(X)≥λσ2)≤Ce?cλ2
另一邊的證明方法類似。
與前面所有基于Markov不等式證明的概率不等式類似,我們計(jì)算EetF(X)Ee^{tF(X)}EetF(X),這個(gè)期望計(jì)算的難點(diǎn)在于F(X)F(X)F(X)是同時(shí)和X1,?,XnX_1,\cdots,X_nX1?,?,Xn?有關(guān)的,也就是不存在可以把F(X)F(X)F(X)拆分成分別用X1,?,XnX_1,\cdots,X_nX1?,?,Xn?表示的分量的方法,這就與上一講介紹的Azuma不等式的證明很類似了,Azuma不等式證明中,因?yàn)殡S機(jī)變量之間的dependence,我們用的條件期望來(lái)處理,在McDiarmid不等式的證明中我們也可以用類似的技術(shù)。定義
Fn=σ({X1,X2,?,Xn})Yn=E[etF(X)∣Fn?1]\mathcal{F}_n = \sigma(\{X_1,X_2,\cdots,X_n\}) \\ Y_n = E[e^{tF(X)}|\mathcal{F}_{n-1}]Fn?=σ({X1?,X2?,?,Xn?})Yn?=E[etF(X)∣Fn?1?]
則
EetF(X)=E[Yn]=E[Yn∣Fn]Ee^{tF(X)} = E[Y_n]=E[Y_n|\mathcal{F}_n]EetF(X)=E[Yn?]=E[Yn?∣Fn?]
在Azuma不等式的證明中,做了這個(gè)構(gòu)造之后,下一步我們要做的是試圖對(duì)條件期望用Hoeffding不等式,這里我們也采用這個(gè)技術(shù),先用centering技巧對(duì)F(X)F(X)F(X)做一個(gè)分解:
F(X)=E[F(X)∣Fn?1]+(F(X)?E[F(X)∣Fn])F(X)=E[F(X)|\mathcal{F}_{n-1}]+(F(X)-E[F(X)|\mathcal{F}_n])F(X)=E[F(X)∣Fn?1?]+(F(X)?E[F(X)∣Fn?])
所以
Yn=E[et{E[F(X)∣Fn?1]+(F(X)?E[F(X)∣Fn])}∣Fn?1]=etE[F(X)∣Fn?1]E[et(F(X)?E[F(X)∣Fn])∣Fn?1]Y_n = E[e^{t\{E[F(X)|\mathcal{F}_{n-1}]+(F(X)-E[F(X)|\mathcal{F}_n])\}}|\mathcal{F}_{n-1}] \\ = e^{tE[F(X)|\mathcal{F}_{n-1}]}E[e^{t(F(X)-E[F(X)|\mathcal{F}_n])}|\mathcal{F}_{n-1}]Yn?=E[et{E[F(X)∣Fn?1?]+(F(X)?E[F(X)∣Fn?])}∣Fn?1?]=etE[F(X)∣Fn?1?]E[et(F(X)?E[F(X)∣Fn?])∣Fn?1?]
對(duì)于F(X)?E[F(X)∣Fn]F(X)-E[F(X)|\mathcal{F}_n]F(X)?E[F(X)∣Fn?],它的含義就相當(dāng)于是固定x1,?,xn?1x_1,\cdots,x_{n-1}x1?,?,xn?1?,只允許xnx_nxn?變化,根據(jù)Lipschitz組合的定義,它的絕對(duì)值的上界是cnc_ncn?,于是根據(jù)Hoeffding不等式,
E[et(F(X)?E[F(X)∣Fn])∣Fn?1]≤eant2cn2,?an>0E[e^{t(F(X)-E[F(X)|\mathcal{F}_n])}|\mathcal{F}_{n-1}] \le e^{a_nt^2c_n^2},\exists a_n >0E[et(F(X)?E[F(X)∣Fn?])∣Fn?1?]≤ean?t2cn2?,?an?>0
這樣我們就獲得了一個(gè)遞推式
E[Yn∣Fn]E[Yn∣Fn?1]≤eant2cn2,?an>0\frac{E[Y_n|\mathcal{F}_n]}{E[Y_n|\mathcal{F}_{n-1}]} \le e^{a_nt^2c_n^2},\exists a_n >0E[Yn?∣Fn?1?]E[Yn?∣Fn?]?≤ean?t2cn2?,?an?>0
類似Azuma不等式的證明,根據(jù)這個(gè)遞推式我們可以得到
Eet(F(X)?EF(X))≤eAt2cn2,A=max?nanEe^{t(F(X)-EF(X))} \le e^{At^2c_n^2},A = \max_n a_nEet(F(X)?EF(X))≤eAt2cn2?,A=nmax?an?
最后用一下Markov不等式就可以了。
總結(jié)
以上是生活随笔為你收集整理的UA MATH567 高维统计I 概率不等式12 McDiarmid不等式的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: [概统]本科二年级 概率论与数理统计 第
- 下一篇: UA MATH563 概率论的数学基础