UA MATH567 高维统计IV Lipschitz组合2 Spherical Distribution的Lipschitz函数 Isoperimetric不等式
UA MATH567 高維統計IV Lipschitz組合2 Spherical Distribution的Lipschitz函數
這一講我們先介紹最簡單的高維分布,也就是球面分布的Lipschitz函數的concentration。
我們在上上部分隨機向量第三講介紹過這個分布,X~Unif(nSn?1)X \sim Unif(\sqrt{n}S^{n-1})X~Unif(n?Sn?1),其中Sn?1S^{n-1}Sn?1表示nnn維空間中的單位球面,這個符號說明XXX在半徑在n\sqrt{n}n?的球面上服從均勻分布,它是零均值各向同性的,并且當nnn足夠大時,N(0,In)≈Unif(nSn?1)N(0,I_n) \approx Unif(\sqrt{n}S^{n-1})N(0,In?)≈Unif(n?Sn?1)。
定理 球面分布的Lipschitz函數是亞高斯的
X~Unif(nSn?1)X \sim Unif(\sqrt{n}S^{n-1})X~Unif(n?Sn?1),f:nSn?1→Rf:\sqrt{n}S^{n-1} \to \mathbb{R}f:n?Sn?1→R是Lipschitz函數,則?C>0\exists C>0?C>0
∥f(X)?Ef(X)∥ψ2≤C∥f∥Lip\left\| f(X) - Ef(X) \right\|_{\psi_2} \le C \left\| f \right\|_{Lip}∥f(X)?Ef(X)∥ψ2??≤C∥f∥Lip?
其中∥f∥Lip\left\| f \right\|_{Lip}∥f∥Lip?是fff的Lipschitz范數。
評注
根據亞高斯性,?c>0\exists c>0?c>0
P(∣f(X)?Ef(X)∣≥t)≤2e?ct2/∥f∥Lip2P(|f(X) - Ef(X)| \ge t) \le 2e^{-ct^2/\left\| f \right\|_{Lip}^2}P(∣f(X)?Ef(X)∣≥t)≤2e?ct2/∥f∥Lip2?
與前兩部分的結論相比,這個結果說明隨機向量的Lipschitz函數具有與線性函數類似的concentration property。
這個定理的證明有一點點復雜,需要用到一些其他的結果,這里先介紹一下要用到的結論:
Isoperimetric不等式1 歐氏空間中,給定體積則表面積最小的一定是球體,基于這個觀察我們有:
A?={x∈Rn:?y∈A,∥x?y∥2≤?}=A+?B2nA_{\epsilon} = \{x \in \mathbb{R}^n:\exists y \in A,\left\| x-y\right\|_2 \le \epsilon\} = A + \epsilon B_2^nA??={x∈Rn:?y∈A,∥x?y∥2?≤?}=A+?B2n?
第二個等號后的B2nB_2^nB2n?表示nnn維單位球,+++表示Minkowski和,這個結論看似顯然但證明復雜,所以這里不展示。
Isoperimetric不等式2 球面上封閉曲線圍成的面積一定時,封閉曲線為圓形需要的長度最短,基于這個觀察我們有:
A?={x∈Sn?1:?y∈A,∥x?y∥2≤?}A_{\epsilon} = \{x \in S^{n-1}:\exists y \in A,\left\| x-y\right\|_2 \le \epsilon\}A??={x∈Sn?1:?y∈A,∥x?y∥2?≤?}
則A?A_{\epsilon}A??是Sn?1S^{n-1}Sn?1與過球心的某個圓錐的交集,進一步地,如果定義σ\sigmaσ為normalized area,使得?A?Sn?1,σ(A)\forall A \subset S^{n-1}, \sigma(A)?A?Sn?1,σ(A)表示將球面縮放為Sn?1S^{n-1}Sn?1后,AAA對應的面積,如果σ(A)≥1/2\sigma(A) \ge 1/2σ(A)≥1/2,則
σ(A?)≥1?e?c?2,?c>0\sigma(A_{\epsilon}) \ge 1-e^{-c\epsilon^2},\exists c>0σ(A??)≥1?e?c?2,?c>0
證明
用HHH表示下半球面:
H={x=(x1,?,xn)∈nSn?1:x1≤0}H=\{x=(x_1,\cdots,x_n) \in \sqrt{n}S^{n-1}:x_1 \le 0\}H={x=(x1?,?,xn?)∈n?Sn?1:x1?≤0}
根據σ\sigmaσ的定義,σ(H)=1/2\sigma(H)=1/2σ(H)=1/2,引入隨機向量X~Unif(nSn?1)X \sim Unif(\sqrt{n}S^{n-1})X~Unif(n?Sn?1),于是
σ(H?)=P(X∈H?)≥P(X∈nSn?1∩{x1≤?/2})=P(X1≤?/2)≥1?e?c?2,?c>0\sigma(H_{\epsilon}) = P(X \in H_{\epsilon}) \ge P(X \in \sqrt{n}S^{n-1} \cap \{x_1 \le \epsilon/\sqrt{2}\}) \\ = P(X_1 \le \epsilon/\sqrt{2}) \ge 1-e^{-c\epsilon^2},\exists c>0σ(H??)=P(X∈H??)≥P(X∈n?Sn?1∩{x1?≤?/2?})=P(X1?≤?/2?)≥1?e?c?2,?c>0
因為X1X_1X1?是亞高斯的。因為σ(A)≥1/2\sigma(A) \ge 1/2σ(A)≥1/2,于是σ(A?)≥σ(H?)≥1?e?c?2\sigma(A_{\epsilon}) \ge \sigma(H_{\epsilon}) \ge 1-e^{-c\epsilon^2}σ(A??)≥σ(H??)≥1?e?c?2
說明
H?={x∈nSn?1:?y∈H,∥x?y∥2≤?}H_{\epsilon}=\{x \in\sqrt{n} S^{n-1}:\exists y \in H,\left\| x-y\right\|_2 \le \epsilon\}H??={x∈n?Sn?1:?y∈H,∥x?y∥2?≤?}
因為XXX限制在nSn?1\sqrt{n} S^{n-1}n?Sn?1上,要使XXX與HHH上的點最近距離不超過?\epsilon?,一種可行的操作是限制一個坐標使其不超過?/2\epsilon/\sqrt{2}?/2?,于是
H??nSn?1∩{x1≤?/2}H_{\epsilon} \supset \sqrt{n}S^{n-1} \cap \{x_1 \le \epsilon /\sqrt{2}\}H???n?Sn?1∩{x1?≤?/2?}
下面我們開始證明那個定理:
證明
假設∥f∥Lip=1\left\| f\right\|_{Lip}=1∥f∥Lip?=1,不然我們總是可以分析f/∥f∥Lipf/\left\| f\right\|_{Lip}f/∥f∥Lip?,
第一步:說明f(X)?Mf(X)-Mf(X)?M是亞高斯的,其中MMM是f(X)f(X)f(X)的中位數,也就是
P(f(X)≥M)≥1/2,P(f(X)≤M)≥1/2P(f(X) \ge M) \ge 1/2,P(f(X) \le M) \ge 1/2P(f(X)≥M)≥1/2,P(f(X)≤M)≥1/2
定義
A={x∈nSn?1:f(x)≤M}A = \{x \in \sqrt{n}S^{n-1}:f(x) \le M\}A={x∈n?Sn?1:f(x)≤M}
則
σ(A)=P(X∈A)=P(f(X)≤M)≥1/2\sigma(A) = P(X \in A) = P(f(X) \le M) \ge 1/2σ(A)=P(X∈A)=P(f(X)≤M)≥1/2
根據Isoperimetric不等式2,
σ(At)≥1?e?ct2,?c>0\sigma(A_t) \ge 1-e^{-ct^2},\exists c>0σ(At?)≥1?e?ct2,?c>0
因為x∈Atx \in A_tx∈At?說明?y∈A\exists y \in A?y∈A, ∥x?y∥2≤t\left\| x-y \right\|_2 \le t∥x?y∥2?≤t,根據Lipschitz函數的定義:
f(x)?f(y)≤∥f∥Lip∥x?y∥2≤tf(x)-f(y) \le \left\| f \right\|_{Lip}\left\| x-y \right\|_2 \le tf(x)?f(y)≤∥f∥Lip?∥x?y∥2?≤t
y∈Ay \in Ay∈A說明f(y)≤Mf(y) \le Mf(y)≤M,所以
f(x)≤f(y)+t≤M+tf(x) \le f(y)+t \le M+tf(x)≤f(y)+t≤M+t
因此
P(f(X)?M≤t)≥P(X∈At)=σ(At)≥1?e?ct2P(f(X)-M \le t) \ge P(X \in A_t)=\sigma(A_t) \ge 1-e^{-ct^2}P(f(X)?M≤t)≥P(X∈At?)=σ(At?)≥1?e?ct2
類似地,對于f(X)?M≥?tf(X)-M \ge -tf(X)?M≥?t,我們有
P(f(X)?M≥?t)≥1?e?ct2P(f(X)-M \ge -t) \ge 1-e^{-ct^2}P(f(X)?M≥?t)≥1?e?ct2
所以
P(∣f(X)?M∣≥t)≤2e?ct2P(|f(X)-M| \ge t) \le 2e^{-ct^2}P(∣f(X)?M∣≥t)≤2e?ct2
第二步:使用centering技巧,假設XXX是亞高斯隨機變量,則X?EXX-EXX?EX也是亞高斯隨機變量,并且存在常數CCC使得
∥X?EX∥ψ2≤C∥X∥ψ2\left\| X-EX \right\|_{\psi_2} \le C\left\| X \right\|_{\psi_2}∥X?EX∥ψ2??≤C∥X∥ψ2??
因為f(X)?Mf(X)-Mf(X)?M是亞高斯的,于是f(X)?M?E[f(X)?M]=f(X)?Ef(X)f(X)-M-E[f(X)-M]=f(X)-Ef(X)f(X)?M?E[f(X)?M]=f(X)?Ef(X)也是亞高斯的,證畢。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计IV Lipschitz组合2 Spherical Distribution的Lipschitz函数 Isoperimetric不等式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计IV Li
- 下一篇: UA MATH567 高维统计IV Li