第10章* 网络 幂律分布
??????冪律是說節點具有的連線數和這樣的節點數目乘積是一個定值,也就是幾何平均(對各變量值的連乘積開項數次方根)是定值。
例:有10000個連線的大節點有10個,有1000個連線的中節點有100個,100個連線的小節點有1000個,在對數坐標上畫出來會得到一條斜向下的直線。
??????冪律分布的特征:其通式可寫成y=cx^(-r),其中x,y是正的隨機變量,c,r均為大于零的常數。這種分布的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大。對上式兩邊取對數,可知lny與lnx滿足線性關系lny=lnc-rlnx,也即在雙對數坐標下,冪律分布表現為一條斜率為冪指數的負數的直線,這一線性關系是判斷給定的實例中隨機變量是否滿足冪律的依據。
??????判斷兩個隨機變量是否滿足線性關系,可以求解兩者之間的相關系數;利用一元線性回歸模型和最小二乘法,可得lny對lnx的經驗回歸直線方程,從而得到y與x之間的冪律關系式。
??????冪律分布表現為一條斜率為冪指數的負數的直線,這一線性關系是判斷給定的實例中隨機變量是否滿足冪律的依據。
??????冪律分布現象:自然界與社會生活中存在各種各樣性質迥異的冪律分布現象,因而對它們的研究具有廣泛而深遠的意義。借助于有效的物理和數學工具以及強大的計算機運算能力,科學家們對冪律分布的本質有了進一步深層次的理解。
- 1932年,哈佛大學的語言學專家Zipf在研究英文單詞出現的頻率時,發現如果把單詞出現的頻率按由大到小的順序排列,則每個單詞出現的頻率與它的名次的常數次冪存在簡單的反比關系,這種分布就稱為Zipf定律,它表明在英語單詞中,只有極少數的詞被經常使用,而絕大多數詞很少被使用。實際上,包括漢語在內的許多國家的語言都有這種特點。
- 19世紀的意大利經濟學家Pareto研究了個人收入的統計分布,發現少數人的收入要遠多于大多數人的收入,提出了著名的80/20法則,即20%的人口占據了80%的社會財富。個人收入X不小于某個特定值x的概率與x的常數次冪亦存在簡單的反比關系,即為Pareto定律。
Zipf定律與Pareto定律都是簡單的冪函數,我們稱之為冪律分布;還有其它形式的冪律分布,像名次—規模分布,規模—概率分布,這四種形式在數學上是等價的。
統計物理學家習慣于把服從冪律分布的現象稱為無標度現象,即系統中個體的尺度相差懸殊,缺乏一個優選的規模。可以說,凡有生命的地方,有進化,有競爭的地方都會出現不同程度的無標度現象。
帕累托定律
??????自然界中大多數的量都遵循鐘形曲線,而鐘形曲線對應的分布和刻畫隨機網絡的單峰分布非常相似。但是在過去幾十年里,科學家發現,自然界有時會產生一些遵循冪律分布的量,它們不再遵循鐘形曲線。
??????冪律最突出的特征不是有很多小事件,而是大量微小事件和少數非常重大的事件并存。而與之相對,這些非常重大的事件絕對不可能出現在鐘形曲線中。
??????在物理學家和數學家大談冪律時,80/20定律風行于大眾媒體和商業刊物中。只要80/20定律適用,你就可以確定,其背后一定有冪律存在。80/20定律即帕累托定律,源自一位非常有影響力的意大利經濟學家維弗雷多·帕累托。在學術之外,帕累托憑借一個經驗觀察而享有盛名。作為一個勤勞的園丁,他注意到,80%的豌豆是20%的豆莢結出的。作為經濟不平等現象的細心觀察者,他發現意大利80%的土地被20%的人口占有。
??????最近,帕累托定律(也被稱為80/20定律)又演變成管理學中的墨菲定律:80%的利潤由20%的員工創造,80%的客戶服務問題來自20%的顧客,80%的決定在20%的會議時間里完成,諸如此類。80/20法則還在很多領域里以常識的形式出現,例如,80%的犯罪行為來自20%的罪犯。
復雜的萬維網遵循冪律分布
??????經過令人信服的數據分析我們發現,數百萬網頁創造者以某種神秘的方式協同工作,形成了復雜的萬維網,在這里,隨機宇宙不再存在。網絡的連通性由少數樞紐節點保證,是它們讓真實網絡免于瓦解。不均勻性,是冪律度分布網絡的特性。冪律分布迫使研究者們放棄了尺度或者特征節點的想法,在連續的層級中,無法找到一個能夠代表所有節點特性的節點。在這些網絡中,并不存在固有的尺度。冪律分布預言,每個無尺度網絡中都有一些大的樞紐節點,是它們從根本上確定著網絡的拓撲。
??????人們發現,包括萬維網和細胞網絡在內的大多數重要網絡都是無尺度的,這讓人們逐步認可了樞紐節點的存在。我們將看到,樞紐節點決定著真實網絡的結構穩定性、動態行為、健壯性、容錯性和故障容忍性。它們的存在預示著,有一些非常重要的組織規則在支配著網絡的演化。
??????在網絡中觀察到冪律,預示著網絡和其他自然現象之間存在著未知的聯系,從而將網絡置于理解一般復雜系統的最前沿。
整體大于部分之和,相變點理論
??????人類對部分的了解遠多于整體。比如對于水分子,無論是其大小還是內部結構,我們都已經了解得非常清楚。這一點都不奇怪,畢竟水是地球上最常見和被研究最多的物質。但是,玻璃杯里由數十億緊密結合的水分子形成的液態水,對我們而言仍是個挑戰。磁體的有序和無序狀態對應著物質不同的熱力學狀態。在相變點,系統在兩個狀態間面臨的抉擇,就像站在山脊上的登山者要選擇從哪一邊下山一樣。在沒有做出決定之前,系統通常左右搖擺,這種搖擺在臨界點附近達到極致。
??????隨著物理學家仔細研究不同的系統中有序是如何從無序中涌現出來的,越來越多的冪律在相變過程中被發現。
??????1965年的一天,厄巴納的伊利諾伊大學的物理學家利奧·卡達諾夫突然悟到:在臨界點附近,我們不能再把各個原子分開研究。相反,這些原子應該被視為行動一致的群體。原子被由原子形成的盒子取代,每個盒子中的原子行為一致。人們在理解無序到有序的相變方面取得了第一個重大突破。
有序和涌現
??????冪律從數學角度闡釋了這樣的概念:少數幾個大事件發揮了大部分的作用。在完全隨機的系統中,冪律極少出現。我們在萬維網中看到的冪律,首次以嚴格的數學術語表明,真實網絡遠不是隨機的。而物理學家已經明白,冪律通常標志著從無序到有序的過渡。
??????自然界往往厭惡冪律,在常見的系統中,量遵循鐘形曲線,而且相關性按照指數率迅速衰減,但是,當系統被迫發生相變時,所有這一切都改變了。相變理論清清楚楚地告訴我們,從無序到有序的道路,是自組織在強有力地推動,并通過冪律鋪就。它還告訴我們,冪律不僅是刻畫系統行為的另一種方式,更是復雜系統自組織所獨有的特性。冪律具有非常獨特而深遠的意義,由此我們在網絡中看到了一種全新而未知的秩序,這種秩序具有不同尋常的優美和一致性。
總結
以上是生活随笔為你收集整理的第10章* 网络 幂律分布的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 网站服务器的解决方案有,Web网站服务器
- 下一篇: 第10章 图与网络优化