UA MATH567 高维统计III 随机矩阵3 集网与覆盖
UA MATH567 高維統計III 隨機矩陣3 集網與覆蓋
在介紹隨機矩陣的concentration與尾部概率行為之前,我們先介紹一個在監督學習理論、高維統計與隨機矩陣等領域都非常有用的工具:?\epsilon?-net。這個工具來源于集值分析(set-valued analysis),集值分析要分析的函數值為集合的映射(集值映射),?\epsilon?-net (?\epsilon?-網) 就是鄰域在集值映射上的推廣。
?\epsilon?-net的定義 假設(T,d)(T,d)(T,d)是一個度量空間,KKK是其中的一個集合,?\epsilon?是一個正實數,稱NNN是一個?\epsilon?-net,如果
Covering Number 稱KKK的所有?\epsilon?-net的最小的cardinality是Covering Number。我們之所以關注最小這個概念是因為在?\epsilon?-net的定義中,我們并沒有限制覆蓋KKK的鄰域的數目,這使得即使是非常平凡的構造,KKK中每個點的鄰域的并集就是一個?\epsilon?-net,但這種構造并沒有提供比KKK本身更簡單近似或者提供更多的信息。因此我們希望找一個“最小”的?\epsilon?-net,這樣的?\epsilon?-net其實就是一些點的鄰域的并集,它的結構非常簡單,所以“最小”的?\epsilon?-net可以實現對KKK的近似。我們記N(K,d,?)N(K,d,\epsilon)N(K,d,?)為KKK的Covering Number,
N(K,d,?)=inf?{∣N∣:N?K,?x∈K,?x0∈N,d(x,x0)≤?}N(K,d,\epsilon)=\inf\{|N|:N\subset K,\forall x \in K, \exists x_0 \in N, d(x,x_0)\le \epsilon\}N(K,d,?)=inf{∣N∣:N?K,?x∈K,?x0?∈N,d(x,x0?)≤?}
Covering Number與compactness:??>0,N(K,d,?)<∞?Kˉ\forall \epsilon>0,N(K,d,\epsilon)<\infty \Leftrightarrow \bar K??>0,N(K,d,?)<∞?Kˉ是緊集。
Packing Number 上面提到之所以需要定義Covering Number就是因為在?\epsilon?-net定義的時候我們對鄰域是沒有過多限制的,除了Covering Number外,另一種改進的思路是增加對鄰域的限制。記P(K,d,?)P(K,d,\epsilon)P(K,d,?)是KKK的packing number,
P(K,d,?)=sup?{∣P∣:P?K,?x,y∈P,d(x,y)>?}P(K,d,\epsilon)=\sup\{|P|:P\subset K,\forall x,y \in P, d(x,y)> \epsilon\}P(K,d,?)=sup{∣P∣:P?K,?x,y∈P,d(x,y)>?}
我們可以簡單理解一下PPP集合的含義,因為PPP是一個點集,這個集合中的點兩兩之間的距離超過?\epsilon?(稱這樣的兩個點?\epsilon?-separated),所以PPP中的點的半徑為?/2\epsilon/2?/2的閉鄰域是兩兩不交的,我們找“最大”的一個這樣的集合,其實也是對KKK的一種近似方法,PPP就是一個框架,它所有的點的鄰域是就是對KKK的近似。
關于?\epsilon?-separated:x,yx,yx,y ?\epsilon?-separated等價于B(x,?2)∩B(y,?2)=?B(x,\frac{\epsilon}{2}) \cap B(y,\frac{\epsilon}{2}) = \phiB(x,2??)∩B(y,2??)=?;如果一個集合任意兩個元素都滿足這個關系,就稱這個集合?\epsilon?-separated
Covering與Packing的關系
證明
第一條用下面的引理即可說明。
引理:假設N\mathcal{N}N是KKK的最大的?\epsilon?-separated子集,則N\mathcal{N}N是KKK的一個?\epsilon?-net,
我們用反證法,假設N\mathcal{N}N不是?\epsilon?-net,?x∈K\exists x \in K?x∈K, ?y∈N\forall y \in \mathcal{N}?y∈N, d(x,y)>?d(x,y)>\epsilond(x,y)>?,則N∪{x}\mathcal{N} \cup \{x\}N∪{x}是KKK的?\epsilon?-separated子集,這與N\mathcal{N}N是KKK的最大的?\epsilon?-separated子集矛盾,于是N\mathcal{N}N是KKK的一個?\epsilon?-net。
第二條。
i)記N\mathcal{N}N為KKK的最大的?\epsilon?-separated子集,則
P(K,d,?)=∣N∣P(K,d,\epsilon) = |\mathcal{N}|P(K,d,?)=∣N∣
根據上一條中的引理,N\mathcal{N}N是?\epsilon?-net,根據covering number的定義,
N(K,d,?)≤∣N∣=P(K,d,?)N(K,d,\epsilon) \le |\mathcal{N}| = P(K,d,\epsilon)N(K,d,?)≤∣N∣=P(K,d,?)
ii)記P\mathcal{P}P為KKK的最大的2?2\epsilon2?-separated子集,N\mathcal{N}N為KKK的任意的的?\epsilon?-separated子集,根據定義,?x∈P\forall x \in \mathcal{P}?x∈P,?y∈N\exists y \in \mathcal{N}?y∈N,d(x,y)<?d(x,y)<\epsilond(x,y)<?,于是對任意yyy,至多存在一個xxx使得d(x,y)<?d(x,y)<\epsilond(x,y)<?,因此∣P∣≤∣N∣|\mathcal{P}| \le |\mathcal{N}|∣P∣≤∣N∣,因為N\mathcal{N}N為KKK的任意的的?\epsilon?-separated子集,所以
P(K,d,2?)=∣P∣≤inf?∣N∣=N(K,d,?)P(K,d,2\epsilon) = |\mathcal{P}| \le \inf |\mathcal{N}|=N(K,d,\epsilon)P(K,d,2?)=∣P∣≤inf∣N∣=N(K,d,?)
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计III 随机矩阵3 集网与覆盖的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH563 概率论的数学基础
- 下一篇: UA MATH567 高维统计III 随