UA MATH567 高维统计IV Lipschitz组合4 对称群上的均匀分布
UA MATH567 高維統計IV Lipschitz組合4 對稱群上的均勻分布
用SnS_nSn?表示一個對稱群,為簡化起見,我們假設SnS_nSn?包含{1,2,?,n}\{1,2,\cdots,n\}{1,2,?,n}上的所有置換,則SnS_nSn?有n!n!n!個元素。我們可以在SnS_nSn?上引入度量使之成為度量空間:?σ,τ∈Sn\forall \sigma,\tau \in S_n?σ,τ∈Sn?,引入normalized Hamming distance
d(σ,τ)=1n∑i=1n1σ(i)≠τ(i)d(\sigma,\tau) = \frac{1}{n} \sum_{i=1}^n 1_{\sigma(i) \ne \tau (i)}d(σ,τ)=n1?i=1∑n?1σ(i)?=τ(i)?
以S5S_5S5?為例,假設
σ=(1234523451),τ=(1234535421)\sigma = \left( \begin{matrix} 1& 2& 3& 4& 5 \\ 2 & 3& 4 & 5 & 1 \end{matrix} \right),\tau = \left( \begin{matrix} 1& 2& 3& 4& 5 \\ 3 & 5& 4 & 2 & 1 \end{matrix} \right)σ=(12?23?34?45?51?),τ=(13?25?34?42?51?)
這種記號表示置換σ\sigmaσ把上一行的指標置換為下一行的對應指標,于是
σ(1)=2≠3=τ(1)σ(2)=3≠5=τ(2)σ(4)=5≠2=τ(4)\sigma(1) = 2 \ne 3 = \tau(1) \\ \sigma(2) = 3 \ne 5 = \tau(2)\\ \sigma(4) = 5 \ne 2 = \tau(4)σ(1)=2?=3=τ(1)σ(2)=3?=5=τ(2)σ(4)=5?=2=τ(4)
所以
d(σ,τ)=3/5d(\sigma,\tau)=3/5d(σ,τ)=3/5
接下來,我們可以在度量空間(Sn,d)(S_n,d)(Sn?,d)上定義Borel代數,用B(Sn)\mathcal{B}(S_n)B(Sn?)來表示,這樣我們就有了一個可測空間(Sn,B(Sn))(S_n,\mathcal{B}(S_n))(Sn?,B(Sn?)),在這個可測空間上,我們用古典概型的思路定義均勻概率測度:
P(A)=∣A∣n!,?A∈B(Sn)P(A) = \frac{|A|}{n!},\forall A \in \mathcal{B}(S_n)P(A)=n!∣A∣?,?A∈B(Sn?)
綜上,我們在nnn階對稱群上定義了概率空間:(Sn,B(Sn),P)(S_n,\mathcal{B}(S_n),P)(Sn?,B(Sn?),P)。
假設XXX是對稱群上的均勻分布,記為X~Unif(Sn)X \sim Unif(S_n)X~Unif(Sn?),則我們有如下結論:
對稱群上的均勻分布的Lipschitz函數是亞高斯的
f:Sn→Rf:S_n \to \mathbb{R}f:Sn?→R是均勻分布,則?C>0\exists C>0?C>0
∥f(X)?Ef(X)∥ψ2≤C∥f∥Lipn\left\| f(X) - Ef(X)\right\|_{\psi_2} \le \frac{C \left\| f \right\|_{Lip}}{\sqrt{n}}∥f(X)?Ef(X)∥ψ2??≤n?C∥f∥Lip??
評注
在嘗試證明這個結論之前,我們先按照慣例推一下對稱群上的Isoperimetric不等式,?A∈B(Sn)\forall A \in \mathcal{B}(S_n)?A∈B(Sn?),定義
At={x∈Sn:?y∈A,d(x,y)≤t}A_t = \{x \in S_n:\exists y \in A,d(x,y) \le t\}At?={x∈Sn?:?y∈A,d(x,y)≤t}
如果0≤t<1/n0 \le t<1/n0≤t<1/n,則At=AA_t=AAt?=A,如果1/n≤t<2/n1/n \le t<2/n1/n≤t<2/n,則AtA_tAt?包含所有與AAA中的置換不超過一位不相同的所有置換;如果k/n≤t<(k+1)/nk/n \le t<(k+1)/nk/n≤t<(k+1)/n,則AtA_tAt?包含所有與AAA中的置換不超過kkk(注意到k=[nt]k=[nt]k=[nt])位不相同的所有置換。現在假設P(A)>1/2P(A)>1/2P(A)>1/2,則
P(At)=P({x∈Sn:?y∈A,d(x,y)≤t})P(A_t) = P(\{x \in S_n:\exists y \in A,d(x,y) \le t\})P(At?)=P({x∈Sn?:?y∈A,d(x,y)≤t})
用XXX表示置換x,yx,yx,y的差別,相同位記為000,不相同記為000,則XXX的取值在Hamming cube {0,1}n\{0,1\}^n{0,1}n上,d(x,y)≤td(x,y) \le td(x,y)≤t說明
∑i=1nXi≤[nt]\sum_{i=1}^n X_i \le [nt]i=1∑n?Xi?≤[nt]
因此,如果X~Unif({?1,1}n)X \sim Unif(\{-1,1\}^n)X~Unif({?1,1}n)
P({x∈Sn:?y∈A,d(x,y)≤t})≥P(∑i=1n(Xi+1)/2≤[nt])P(\{x \in S_n:\exists y \in A,d(x,y) \le t\})\ge P(\sum_{i=1}^n (X_i+1)/2 \le [nt])P({x∈Sn?:?y∈A,d(x,y)≤t})≥P(i=1∑n?(Xi?+1)/2≤[nt])
Unif({?1,1}n)Unif(\{-1,1\}^n)Unif({?1,1}n)是一個亞高斯隨機向量,根據推廣Hoeffding不等式,?C>0\exists C>0?C>0
P(∑i=1nXi/2≤a)≥1?2exp?(?Ca2/n)P(\sum_{i=1}^n X_i /2 \le a) \ge 1-2 \exp \left( -Ca^2/n \right)P(i=1∑n?Xi?/2≤a)≥1?2exp(?Ca2/n)
所以?C>0\exists C>0?C>0
P(∑i=1n(Xi+1)/2≤[nt])≥1?2exp?(?Cnt2)P(\sum_{i=1}^n (X_i+1)/2 \le [nt]) \ge 1-2\exp(-Cnt^2)P(i=1∑n?(Xi?+1)/2≤[nt])≥1?2exp(?Cnt2)
這樣我們就得到了對稱群上的Isoperimetric不等式。
證明
假設∥f∥Lip=1\left\| f\right\|_{Lip}=1∥f∥Lip?=1,不然我們總是可以分析f/∥f∥Lipf/\left\| f\right\|_{Lip}f/∥f∥Lip?,
第一步:說明f(X)?Mf(X)-Mf(X)?M是亞高斯的,其中MMM是f(X)f(X)f(X)的中位數,也就是
P(f(X)≥M)≥1/2,P(f(X)≤M)≥1/2P(f(X) \ge M) \ge 1/2,P(f(X) \le M) \ge 1/2P(f(X)≥M)≥1/2,P(f(X)≤M)≥1/2
定義
A={x∈Sn:f(x)≤M}A = \{x \in S_n:f(x) \le M\}A={x∈Sn?:f(x)≤M}
則
σ(A)=P(X∈A)=P(f(X)≤M)≥1/2\sigma(A) = P(X \in A) = P(f(X) \le M) \ge 1/2σ(A)=P(X∈A)=P(f(X)≤M)≥1/2
根據對稱群上的Isoperimetric不等式,
P(At)≥1?2e?Cnt2,?C>0P(A_t) \ge 1-2e^{-Cnt^2},\exists C>0P(At?)≥1?2e?Cnt2,?C>0
因為x∈Atx \in A_tx∈At?說明?y∈A\exists y \in A?y∈A, d(x,y)≤td(x,y) \le td(x,y)≤t,根據Lipschitz函數的定義:
f(x)?f(y)≤∥f∥Lipd(x,y)≤tf(x)-f(y) \le \left\| f \right\|_{Lip}d(x,y) \le tf(x)?f(y)≤∥f∥Lip?d(x,y)≤t
y∈Ay \in Ay∈A說明f(y)≤Mf(y) \le Mf(y)≤M,所以
f(x)≤f(y)+t≤M+tf(x) \le f(y)+t \le M+tf(x)≤f(y)+t≤M+t
因此
P(f(X)?M≤t)≥P(X∈At)=P(At)≥1?2e?Cnt2P(f(X)-M \le t) \ge P(X \in A_t)=P(A_t) \ge 1-2e^{-Cnt^2}P(f(X)?M≤t)≥P(X∈At?)=P(At?)≥1?2e?Cnt2
類似地,對于f(X)?M≥?tf(X)-M \ge -tf(X)?M≥?t,我們有
P(f(X)?M≥?t)≥1?2e?Cnt2P(f(X)-M \ge -t) \ge 1-2e^{-Cnt^2}P(f(X)?M≥?t)≥1?2e?Cnt2
所以
P(∣f(X)?M∣≥t)≤4e?Cnt2P(|f(X)-M| \ge t) \le 4e^{-Cnt^2}P(∣f(X)?M∣≥t)≤4e?Cnt2
第二步:使用centering技巧,假設XXX是亞高斯隨機變量,則X?EXX-EXX?EX也是亞高斯隨機變量,并且存在常數CCC使得
∥X?EX∥ψ2≤C∥X∥ψ2\left\| X-EX \right\|_{\psi_2} \le C\left\| X \right\|_{\psi_2}∥X?EX∥ψ2??≤C∥X∥ψ2??
因為f(X)?Mf(X)-Mf(X)?M是亞高斯的,于是f(X)?M?E[f(X)?M]=f(X)?Ef(X)f(X)-M-E[f(X)-M]=f(X)-Ef(X)f(X)?M?E[f(X)?M]=f(X)?Ef(X)也是亞高斯的,證畢。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计IV Lipschitz组合4 对称群上的均匀分布的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计IV Li
- 下一篇: UA MATH567 高维统计IV Li