霍夫丁不等式及其他相关不等式证明
霍夫丁不等式及其他相關不等式證明
周志華老師的書和臺大的基石課程都用到了霍夫丁不等式,其常見形式如下:隨機變量xi,xi∈{0,1},x ̄=1n(x1+x2+???+xn)隨機變量x_i,x_i\in \{0,1\}, \overline x=\frac1n(x_1+x_2+···+x_n)隨機變量xi?,xi?∈{0,1},x=n1?(x1?+x2?+???+xn?)
則有P((x ̄?E[x ̄])≥t)≤e?2nt2則有P((\overline x-E[\overline x])\geq t)\leq e^{-2nt^2}則有P((x?E[x])≥t)≤e?2nt2
含義: 給出二項分布均值偏離期望的概率上限.(上限與偏離值和次數有關)置信區間.
先證霍夫丁不等式的一般形式
霍夫丁一般形式
若:xi相互獨立,且xi∈[ai,bi],Sn=x1+x2+???+xnx_i相互獨立,且x_i\in [a_i,b_i],S_n=x_1+x_2+···+x_nxi?相互獨立,且xi?∈[ai?,bi?],Sn?=x1?+x2?+???+xn?
則有:P(Sn?E[Sn]≥t)≤exp(?2t2∑1n(bi?ai)2)P(S_n-E[S_n]\geq t)\leq exp(-\frac {2t^2}{\sum_{1}^n{(b_i-a_i)^2}})P(Sn??E[Sn?]≥t)≤exp(?∑1n?(bi??ai?)22t2?)
證明過程要用到霍夫丁引理和馬爾科夫不等式
馬爾科夫不等式
馬爾科夫不等式非常好證明,其形式如下
若a>0,x為非負隨機變量,則P(x≥a)≤E[x]a若a>0,x為非負隨機變量,則P(x\geq a)\leq \frac {E[x ]}{a} 若a>0,x為非負隨機變量,則P(x≥a)≤aE[x]?
證明:
得證.
(1)式中x≥a,縮放成a;x≥0,縮放成0x\geq a,縮放成a;x\geq0,縮放成0x≥a,縮放成a;x≥0,縮放成0
證法2:可以用指示變量證明
馬爾科夫不等式的意義:
給出非負隨機變量大于某正數的概率的上界;
**實際應用:**不超過1/5的人口會有超過五倍人均收入的收入.
霍夫丁引理
若E[x]=0且x∈[a,b],則對于任意的λ∈R,都有E[eλx]≤exp{λ2(b?a)28}若E[x]=0且x\in [a,b],則對于任意的\lambda\in R,都有E[e^{\lambda x}]\leq exp\{\frac{\lambda ^2(b-a)^2}8\}若E[x]=0且x∈[a,b],則對于任意的λ∈R,都有E[eλx]≤exp{8λ2(b?a)2?}
證明:
凸函數性質:(a,f(a)),(b,f(b))線段在f(x)圖像上面(a,f(a)),(b,f(b))線段在f(x)圖像上面(a,f(a)),(b,f(b))線段在f(x)圖像上面
因為 eλxe^{\lambda x}eλx 是一個凸函數(下凸)
所以 eλx≤b?xb?aeλa+x?ab?aeλbe^{\lambda x} \leq\frac{b-x}{b-a}e^{\lambda a}+ \frac {x-a}{b-a}e^{\lambda b}eλx≤b?ab?x?eλa+b?ax?a?eλb
所以 E[eλx]≤b?E[x]b?aeλa+E[x]?ab?aeλbE[e^{\lambda x}] \leq\frac{b-E[x]}{b-a}e^{\lambda a}+ \frac {E[x]-a}{b-a}e^{\lambda b}E[eλx]≤b?ab?E[x]?eλa+b?aE[x]?a?eλb
令 h=λ(b?a),P=?ab?a,L(h)=?hP+ln(1?P+Peh)h=\lambda (b-a),P=-\frac a{b-a},L(h)=-hP+ln(1-P+Pe^h)h=λ(b?a),P=?b?aa?,L(h)=?hP+ln(1?P+Peh)
帶入上面的表達式的右邊可以得到:
E[eλx]≤eL(h)E[e^{\lambda x}] \leq e^{L(h)}E[eλx]≤eL(h)
查看L(h)L(h)L(h),
L(0)=0,L′(0)=0,L′′(h)≤14(還沒證明)L(0)=0,L'(0)=0,L''(h)\leq\frac 14(還沒證明)L(0)=0,L′(0)=0,L′′(h)≤41?(還沒證明)
由泰勒展開的二階形式得:
(二階項作為余項,所以不用L′′(0)L''(0)L′′(0))
存在v∈(0,h),使得存在v\in(0,h),使得存在v∈(0,h),使得
L(h)=12!L′′(v)?v2≤18h2=18λ2(b?a)2L(h)=\frac1{2!}L''(v)*v^2\leq\frac18h^2=\frac18\lambda^2(b-a)^2L(h)=2!1?L′′(v)?v2≤81?h2=81?λ2(b?a)2
所以E[eλx]≤exp{λ2(b?a)28}E[e^{\lambda x}]\leq exp\{\frac{\lambda ^2(b-a)^2}8\}E[eλx]≤exp{8λ2(b?a)2?}得證.
作用:有E[x]=0,x∈[a,b],可以給出E[eλx]的一個上界有E[x]=0,x\in [a,b],可以給出E[e^{\lambda x}]的一個上界有E[x]=0,x∈[a,b],可以給出E[eλx]的一個上界
證明霍夫丁不等式
若:xi相互獨立,且xi∈[ai,bi],Sn=x1+x2+???+xnx_i相互獨立,且x_i\in [a_i,b_i],S_n=x_1+x_2+···+x_nxi?相互獨立,且xi?∈[ai?,bi?],Sn?=x1?+x2?+???+xn?
則有:P(Sn?E[Sn]≥t)≤exp(?2t2∑1n(bi?ai)2)P(S_n-E[S_n]\geq t)\leq exp(-\frac {2t^2}{\sum_{1}^n{(b_i-a_i)^2}})P(Sn??E[Sn?]≥t)≤exp(?∑1n?(bi??ai?)22t2?)
證明:
對于s,t>0有
s是我們額外引入的變量,取合適的s值使(650)式最小.(得到盡可能緊致的上界)
由一般式得到特殊形式(常見形式)
1.若xi∈[0,1],x ̄=1n(x1+x2???+xn),若x_i\in [0,1],\overline x=\frac 1n(x_1+x_2···+x_n),若xi?∈[0,1],x=n1?(x1?+x2????+xn?),
用xin代xi,ai=0,bi=1n用\frac {x_i}n代x_i,a_i=0,b_i=\frac 1n用nxi??代xi?,ai?=0,bi?=n1?
P(x ̄?E[x ̄]≥t)≤exp(?2t2∑i=1n1n2)=exp(?2nt2)P(\overline x-E[\overline x]\geq t)\leq exp(\frac{-2t^2}{\sum_{i=1}^{n }{\frac 1{n^2}}})=exp(-2nt^2)P(x?E[x]≥t)≤exp(∑i=1n?n21??2t2?)=exp(?2nt2)
2.二項分布 xi∈{0,1},P(xi=1)=p,x=(x1+???xn)x_i \in \{0,1\},P(x_i=1)=p,x=(x_1+···x_n)xi?∈{0,1},P(xi?=1)=p,x=(x1?+???xn?)
令x的偏離值t=?n,也就是p的偏離值為?(?>0)令x的偏離值t=\epsilon n,也就是p的偏離值為\epsilon(\epsilon> 0)令x的偏離值t=?n,也就是p的偏離值為?(?>0),
有hoeffding不等式知:有hoeffding 不等式知:有hoeffding不等式知:
P(x?pn≥?n)≤exp(?2t2∑1n(bi?ai)2)=exp(?2(?n)2∑1n(1?0)2)=exp(?2n?2)P(x-pn\geq \epsilon n)\leq exp(-\frac {2t^2}{\sum_{1}^n{(b_i-a_i)^2}})=exp(-\frac {2(\epsilon n)^2}{\sum_{1}^n{(1-0)^2}})=exp(-2n\epsilon^2)P(x?pn≥?n)≤exp(?∑1n?(bi??ai?)22t2?)=exp(?∑1n?(1?0)22(?n)2?)=exp(?2n?2)
即P(x?pn≥?n)≤exp(?2n?2)(1)P(x-pn\geq \epsilon n)\leq exp(-2n\epsilon^2) (1)P(x?pn≥?n)≤exp(?2n?2) (1)
對稱寫出:
P(x?pn≤??n)≤exp(?2n?2)(2)P(x-pn\leq -\epsilon n)\leq exp(-2n\epsilon^2) (2)P(x?pn≤??n)≤exp(?2n?2) (2)
有(1)(2)得:
P(|x?pn|≤?n)≤1?2exp(?2n?2)P(|x-pn|\leq \epsilon n)\leq 1-2exp(-2n\epsilon^2)P(|x?pn|≤?n)≤1?2exp(?2n?2)
或者寫成
P(x∈[n(p??),n(p+?)])≤1?2exp(?2n?2)P(x\in [n(p-\epsilon),n(p+\epsilon)])\leq 1-2exp(-2n\epsilon^2)P(x∈[n(p??),n(p+?)])≤1?2exp(?2n?2)
若記x/n=p~x/n=\tilde px/n=p~?
P(p~∈[p??,p+?])≤1?2exp(?2n?2)P(\tilde p\in [p-\epsilon,p+\epsilon])\leq 1-2exp(-2n\epsilon^2)P(p~?∈[p??,p+?])≤1?2exp(?2n?2)
該公式給出置信區間.
P(∣p~?p∣>?)≤2exp(?2n?2)P(|\tilde p-p|>\epsilon)\leq 2exp(-2n\epsilon^2)P(∣p~??p∣>?)≤2exp(?2n?2)
關于置信區間,一下引用自,維基百科-置信區間
在統計學中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體參數的區間估計。置信區間展現的是,這個總體參數的真實值有一定概率落在與該測量結果有關的某對應區間。置信區間給出的是,聲稱總體參數的真實值在測量值的區間所具有的可信程度,即前面所要求的“一定概率”。這個概率被稱為置信水平。舉例來說,如果在一次大選中某人的支持率為55%,而置信水平0.95上的置信區間是(50%,60%),那么他的真實支持率落在50%和60%之區間的機率為95%,因此他的真實支持率不足50%的可能性小于2.5%(假設分布是對稱的)
總結
以上是生活随笔為你收集整理的霍夫丁不等式及其他相关不等式证明的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CSU 1259 bfs找最短路
- 下一篇: Nginx工作原理