UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析
UA MATH567 高維統計III 隨機矩陣8 社區發現 Spectral Clustering的理論分析
上一講我們完成了Stochastic Block Model與社區發現問題的建模,并描述了目標:Community detection in networks的目標是給定一個某個隨機矩陣的樣本數據集,要還原隨機矩陣的期望的特征向量。同時我們明確了算法分析的基本方法是攝動方法,這里描述一個大致思路:
我們對社區發現算法進行理論分析的目的是說明這樣的算法能夠提供一個一致的、誤差可以被控制的輸出,也就是要說明算法還原出來的特征向量(算法輸出)與隨機矩陣期望的特征向量(理論結果)之差的范數足夠小,在理論分析的時候,我們可以認為算法與理論的區別在于算法計算特征向量時用的是帶噪聲的數據,因此我們需要能分析矩陣噪聲對特征值的影響的工具,于是我們選擇了攝動方法。
Davis-Kahan定理 假設S,TS,TS,T是對稱矩陣,假設min?j≠i∣λi(S)?λj(S)∣=δ>0\min_{j \ne i}|\lambda_i(S)-\lambda_j(S)| = \delta>0minj?=i?∣λi?(S)?λj?(S)∣=δ>0,用vi(S)v_i(S)vi?(S)表示矩陣SSS的第iii個特征值對應的標準化的特征向量,用θi(S,T)\theta_{i}(S,T)θi?(S,T)表示矩陣S,TS,TS,T的第iii個特征值對應的特征向量形成的夾角,則
sin?θi(S,T)≤2∥S?T∥δ\sin \theta_i(S,T) \le \frac{2\left\| S-T \right\|}{\delta}sinθi?(S,T)≤δ2∥S?T∥?
評注
i) 雖然這個結果看起來只能說明當S,TS,TS,T兩個矩陣相差不大時,它們的特征向量的夾角也不大,但我們可以進一步得到它們特征向量之差的范數的結果:
因為θi(S,T)∈[0,π/2]\theta_i(S,T) \in [0,\pi/2]θi?(S,T)∈[0,π/2],于是
1≤∥vi(S)?vi(T)∥2sin?θi(S,T)≤21 \le \frac{\left\|v_i(S) - v_i(T) \right\|_2}{\sin \theta_i(S,T)} \le \sqrt{2}1≤sinθi?(S,T)∥vi?(S)?vi?(T)∥2??≤2?
所以
∥vi(S)?vi(T)∥2≤22∥S?T∥δ\left\|v_i(S) - v_i(T) \right\|_2 \le \frac{2\sqrt{2}\left\| S-T \right\|}{\delta}∥vi?(S)?vi?(T)∥2?≤δ22?∥S?T∥?
Spectral Clustering
假設我們使用Spectral Clustering來做Community detection in networks,根據上一講的簡單分析:
如果AAA表示一個隨機網絡,計算它的v2(A)v_2(A)v2?(A),則v2(A)v_2(A)v2?(A)的某個元素的符號表示對應節點所屬的社區。
定理 考慮隨機網絡G(n,p,q)G(n,p,q)G(n,p,q),如果min?(q,p?q)=μ>0\min(q,p-q)=\mu>0min(q,p?q)=μ>0,則?c>0\exists c>0?c>0,Spectral Clustering最多搞錯c/μ2c/\mu^2c/μ2個節點的概率至少是1?4e?n1-4e^{-n}1?4e?n。
證明
用AAA表示這個隨機網絡的伴隨矩陣,做分解
A=D+RA = D+RA=D+R
其中DDD是一個不含隨機性的矩陣,rankD=2rank D=2rankD=2, ∥D∥=λ1=(p+q)n2\left\| D \right\|=\lambda_1 = \frac{(p+q)n}{2}∥D∥=λ1?=2(p+q)n?并且λ2=(p?q)n2\lambda_2 = \frac{(p-q)n}{2}λ2?=2(p?q)n?;P(∥R∥≤2CKn)≥1?4e?nP(\left\| R \right\| \le 2CK\sqrt{n}) \ge 1-4e^{-n}P(∥R∥≤2CKn?)≥1?4e?n
記δ=min?(λ1?λ2,λ2)=nμ>0\delta = \min(\lambda_1-\lambda_2,\lambda_2)=n\mu>0δ=min(λ1??λ2?,λ2?)=nμ>0,于是我們可以使用Davis-Kahan定理以及上面這個概率不等式:?C′>0\exists C'>0?C′>0
∥v2(D)?v2(A)∥2≤22C′nμn\left\| v_2(D)-v_2(A) \right\|_2 \le \frac{2\sqrt{2}C'\sqrt{n}}{\mu n}∥v2?(D)?v2?(A)∥2?≤μn22?C′n??
這個不等式成立的概率是1?e?4n1-e^{-4n}1?e?4n,要考慮搞錯的節點個數,需要考慮n\sqrt{n}n?乘以特征向量,于是
n∥v2(D)?v2(A)∥2≤22C′μn∥v2(D)?v2(A)∥22≤8C′2μ2\sqrt{n}\left\| v_2(D)-v_2(A) \right\|_2 \le \frac{2\sqrt{2}C'}{\mu} \\ \sqrt{n}\left\| v_2(D)-v_2(A) \right\|^2_2 \le \frac{8C'^2}{\mu^2}n?∥v2?(D)?v2?(A)∥2?≤μ22?C′?n?∥v2?(D)?v2?(A)∥22?≤μ28C′2?
記c=8C′2c = 8C'^2c=8C′2,則定理得證。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计III 随
- 下一篇: UA MATH567 高维统计II 随机