UA MATH567 高维统计I 概率不等式2 在Erdős–Rényi随机图模型中的应用
UA MATH567 高維統計I 概率不等式2 在Erd?s–Rényi隨機圖模型中的應用
Erd?s–Rényi隨機圖模型是第一個系統性討論隨機圖的模型,它討論了兩類模型,G(n,M)G(n,M)G(n,M)和G(n,p)G(n,p)G(n,p),前者表示一個有nnn個點的圖要隨機選出MMM條邊;后者表示一個有nnn個點的圖每條邊存在的概率是ppp。給定每條邊存在的概率為ppp,每種G(n,M)G(n,M)G(n,M)的概率都是
pM(1?p)Cn2?Mp^M(1-p)^{C_n^2-M}pM(1?p)Cn2??M
稱與某一個點相連的邊的數目為這個點的度,G(n,p)G(n,p)G(n,p)中每個點的度的期望記為ddd,則
d=(n?1)pd = (n-1)pd=(n?1)p
基于Chernoff不等式,我們可以證明G(n,p)G(n,p)G(n,p)具有下面的性質:
稠密圖幾乎正則,這句話非常不嚴謹,我們用數學語言精確描述一下。?C>0\exists C>0?C>0, 當d≥Clog?nd \ge C\log nd≥Clogn時,G(n,p)G(n,p)G(n,p)每個點的度有很大概率位于0.9d?1.1d0.9d-1.1d0.9d?1.1d之間。具體有多大概率是可以用Chernoff Bound來近似的,下面我們簡單推導一下。
引理1 小偏差下的Chernoff不等式
P(∣SN?μ∣≥δμ)≤2e?cμδ2P(|S_N-\mu| \ge \delta \mu)\le 2e^{-c\mu\delta^2}P(∣SN??μ∣≥δμ)≤2e?cμδ2
其中SN=∑i=1NXi,ESN=μS_N = \sum_{i=1}^NX_i, ES_N = \muSN?=∑i=1N?Xi?,ESN?=μ.
考慮頂點iii,記它的度為did_idi?,記Xj(i)X_{j(i)}Xj(i)?表示第jjj個點是否與頂點iii相連,j∈I(i)={1,?,i?1,i+1,n}j \in I(i) = \{1,\cdots,i-1,i+1,n\}j∈I(i)={1,?,i?1,i+1,n},Xj~iidBer(p)X_j \sim_{iid} Ber(p)Xj?~iid?Ber(p),則
di=∑j∈I(i)Xj(i),Edi=dd_i = \sum_{j \in I(i)} X_{j(i)},\ Ed_i = ddi?=j∈I(i)∑?Xj(i)?,?Edi?=d
應用引理1并取δ=0.1\delta = 0.1δ=0.1,可以得到
P(∣di?d∣≥0.1d)≤2e?cdP(|d_i-d|\ge 0.1d) \le 2e^{-cd}P(∣di??d∣≥0.1d)≤2e?cd
這里的ccc是一個與引理1中的ccc不一樣的常數了。當d≥Clog?nd \ge C\log nd≥Clogn的時候,可以發現
2e?cd≤2n?cC2e^{-cd} \le 2n^{-cC}2e?cd≤2n?cC
因此圖的階數越高,尾部概率上界越小,概率在∣di?d∣≤0.1d|d_i-d|\le 0.1d∣di??d∣≤0.1d上的集中度就會越高。
對于G(n,p)G(n,p)G(n,p)的所有頂點而言,根據概率的次可加性
P(?i,∣di?d∣≥0.1d)≤∑i=1nP(∣di?d∣≥0.1d)≤2ne?cdP(\forall i,|d_i-d|\ge 0.1d) \le \sum_{i=1}^n P(|d_i-d|\ge 0.1d) \le 2ne^{-cd}P(?i,∣di??d∣≥0.1d)≤i=1∑n?P(∣di??d∣≥0.1d)≤2ne?cd
當CCC足夠大時,2ne?cd≤0.12ne^{-cd} \le 0.12ne?cd≤0.1,因此
P(?i,∣di?d∣≤0.1d)≥0.9P(\forall i,|d_i-d|\le 0.1d)\ge 0.9P(?i,∣di??d∣≤0.1d)≥0.9
也就是說所有頂點的度都在0.9d?1.1d0.9d-1.1d0.9d?1.1d之間的概率至少是0.9。
下面給出引理1的簡單證明:
Consider P(SN≤t)=P(?SN≥?t)P(S_N \le t) = P(-S_N \ge -t)P(SN?≤t)=P(?SN?≥?t). By the same procedure as proof of Chernoff’s upper tails,
P(?SN≥?t)≤eλt∏i=1NEexp?(?λXi)P(-S_N \ge -t) \le e^{\lambda t}\prod_{i=1}^N E\exp (-\lambda X_i) P(?SN?≥?t)≤eλti=1∏N?Eexp(?λXi?)
Similarly,
Eexp?(?λXi)=pie?λ+(1?pi)=1+(e?λ?1)pi≤exp?[(e?λ?1)pi]E\exp (-\lambda X_i) = p_ie^{-\lambda}+(1-p_i) \\= 1+(e^{-\lambda}-1)p_i \le \exp [(e^{-\lambda}-1)p_i]Eexp(?λXi?)=pi?e?λ+(1?pi?)=1+(e?λ?1)pi?≤exp[(e?λ?1)pi?]
Now apply this boundary,
P(?SN≥?t)≤eλt∏i=1NEexp?(?λXi)≤eλtexp?[(e?λ?1)μ]P(-S_N \ge -t) \le e^{\lambda t}\prod_{i=1}^N E\exp (-\lambda X_i) \le e^{\lambda t}\exp [(e^{-\lambda}-1)\mu] P(?SN?≥?t)≤eλti=1∏N?Eexp(?λXi?)≤eλtexp[(e?λ?1)μ]
Notice t<μt < \mut<μ. So in this case, let λ=ln?(μ/t)\lambda = \ln(\mu/t)λ=ln(μ/t),
eλtexp?[(e?λ?1)μ]=etln?(μ/t)exp?(t?μ)=e?μ(eμ/t)te^{\lambda t}\exp [(e^{-\lambda}-1)\mu] =e^{t\ln(\mu/t) } \exp(t-\mu) = e^{-\mu}(e\mu/t)^teλtexp[(e?λ?1)μ]=etln(μ/t)exp(t?μ)=e?μ(eμ/t)t
Consider that P(∣SN?μ∣≥δμ)=P(SN≥(1+δ)μ)+P(SN≤(1?δ)μ)P(|S_N-\mu|\ge \delta \mu) =P(S_N \ge (1+\delta)\mu)+P(S_N \le (1-\delta)\mu)P(∣SN??μ∣≥δμ)=P(SN?≥(1+δ)μ)+P(SN?≤(1?δ)μ)
By Thm 2.3.1 and Ex 2.3.2
P(SN≥(1+δ)μ)≤e?μ(eμ(1+δ)μ)(1+δ)μP(SN≤(1?δ)μ)≤e?μ(eμ(1?δ)μ)(1?δ)μP(S_N \ge (1+\delta)\mu) \le e^{-\mu}\left( \frac{e\mu}{(1+\delta)\mu} \right)^{(1+\delta)\mu} \\ P(S_N \le (1-\delta)\mu) \le e^{-\mu}\left( \frac{e\mu}{(1-\delta)\mu} \right)^{(1-\delta)\mu}P(SN?≥(1+δ)μ)≤e?μ((1+δ)μeμ?)(1+δ)μP(SN?≤(1?δ)μ)≤e?μ((1?δ)μeμ?)(1?δ)μ
Let’s analyze
e?μ(eμ(1+δ)μ)(1+δ)μ+e?μ(eμ(1?δ)μ)(1?δ)μ=eδμ(1+δ)?(1+δ)μ+e?δμ(1?δ)?(1?δ)μe^{-\mu}\left( \frac{e\mu}{(1+\delta)\mu} \right)^{(1+\delta)\mu} + e^{-\mu}\left( \frac{e\mu}{(1-\delta)\mu} \right)^{(1-\delta)\mu} \\ = e^{^{\delta \mu}}(1+\delta)^{-(1+\delta)\mu}+e^{-\delta \mu}(1-\delta)^{-(1-\delta)\mu}e?μ((1+δ)μeμ?)(1+δ)μ+e?μ((1?δ)μeμ?)(1?δ)μ=eδμ(1+δ)?(1+δ)μ+e?δμ(1?δ)?(1?δ)μ
Here’re two interesting terms,
(1+δ)?(1+δ)μ=exp?(?(1+δ)μln?(1+δ))≤exp?(?(1+δ)μ(Aδ))=e?μδ?Aμδ2(1+\delta)^{-(1+\delta)\mu} = \exp(-(1+\delta)\mu\ln(1+\delta) ) \\ \le \exp(-(1+\delta)\mu (A\delta )) =e^{-\mu \delta -A\mu\delta^2}(1+δ)?(1+δ)μ=exp(?(1+δ)μln(1+δ))≤exp(?(1+δ)μ(Aδ))=e?μδ?Aμδ2
(1?δ)?(1?δ)μ=exp?(?(1?δ)μln?(1?δ))≤exp?(?(1?δ)μ(?Bδ))=eμδ?Bμδ2(1-\delta)^{-(1-\delta)\mu} = \exp(-(1-\delta)\mu\ln(1-\delta) ) \\ \le \exp(-(1-\delta)\mu (-B\delta )) =e^{\mu \delta -B\mu\delta^2}(1?δ)?(1?δ)μ=exp(?(1?δ)μln(1?δ))≤exp(?(1?δ)μ(?Bδ))=eμδ?Bμδ2
Notice for δ∈(0,1]\delta \in (0,1]δ∈(0,1], ln?(1+δ)δ∈[ln?2,1)\frac{\ln(1+\delta)}{\delta} \in [\ln2,1)δln(1+δ)?∈[ln2,1) and ?δln?(1?δ)∈(0,1]\frac{-\delta}{\ln(1-\delta)} \in (0,1]ln(1?δ)?δ?∈(0,1]. So ?A,B>0\exists A,B>0?A,B>0,
ln?(1+δ)≥Aδ,ln?(1?δ)≤B(?δ)\ln(1+\delta) \ge A\delta, \ln(1-\delta) \le B(-\delta)ln(1+δ)≥Aδ,ln(1?δ)≤B(?δ)
Hence,
eδμ(1+δ)?(1+δ)μ+e?δμ(1?δ)?(1?δ)μ=eδμe?μδ?Aμδ2+e?δμeμδ?Bμδ2=e?Aμδ2+e?Bμδ2e^{^{\delta \mu}}(1+\delta)^{-(1+\delta)\mu}+e^{-\delta \mu}(1-\delta)^{-(1-\delta)\mu} \\ = e^{^{\delta \mu}}e^{-\mu \delta -A\mu\delta^2}+e^{-\delta \mu}e^{\mu \delta -B\mu\delta^2} = e^{-A\mu\delta^2}+e^{-B\mu\delta^2}eδμ(1+δ)?(1+δ)μ+e?δμ(1?δ)?(1?δ)μ=eδμe?μδ?Aμδ2+e?δμeμδ?Bμδ2=e?Aμδ2+e?Bμδ2
?c>0\exists c>0?c>0, 2e?cμδ2=e?Aμδ2+e?Bμδ22e^{-c\mu\delta^2}=e^{-A\mu\delta^2}+e^{-B\mu\delta^2}2e?cμδ2=e?Aμδ2+e?Bμδ2, i.e. c=?1μδ2ln?e?Aμδ2+e?Bμδ22c=-\frac{1}{\mu\delta^2}\ln\frac{e^{-A\mu\delta^2}+e^{-B\mu\delta^2}}{2}c=?μδ21?ln2e?Aμδ2+e?Bμδ2?. Above all,
P(∣SN?μ∣≥δμ)≤2e?cμδ2P(|S_N-\mu|\ge \delta \mu) \le 2e^{-c\mu\delta^2}P(∣SN??μ∣≥δμ)≤2e?cμδ2
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计I 概率不等式2 在Erdős–Rényi随机图模型中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA SIE545 优化理论基础5 搜索
- 下一篇: UA STAT687 线性模型II 最小