关于幂律分布的一个笔记_哈克_新浪博客
生活随笔
收集整理的這篇文章主要介紹了
关于幂律分布的一个笔记_哈克_新浪博客
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
關(guān)于冪律分布的一個筆記_哈克_新浪博客
關(guān)于冪律分布的一個筆記??? (2011-03-02 18:12:27)
??? 轉(zhuǎn)載▼
??? 標(biāo)簽:
??? 冪律
??? 二八法則
??? 雜談
??? ??? 分類: 公度世界
??? 0:題外話或補(bǔ)記
??? 最早知道二八法則,還是一本介紹猶太民族杰出人物的書,被稱為猶太法則。說猶太人跟錢打交道較其他民族多,很早就知道了這個世界上是80%的人把錢借給了20%的會錢生錢的人,而且論據(jù)之一居然是人體80%是由水組成,只有20%為其他關(guān)鍵物質(zhì);另一論據(jù)是空氣80%由氮氣構(gòu)成,只有20%包括氧氣在內(nèi)的其他氣體。這些固然都是頗有趣的現(xiàn)象,但一直未能上升到理論的高度。
????
??? 1:冪律即Power law是系統(tǒng)科學(xué)中一個常見的現(xiàn)象
??? 經(jīng)濟(jì)學(xué)財富分布滿足Pareto Power law tail分布,語言中有詞頻的冪律分布,城市規(guī)模和數(shù)量滿足冪律分布,音樂中有f分之1噪音(冪律分布)……。通常人們理解冪律分布就是所謂的馬太效應(yīng),二八原則,即少數(shù)人聚集了大量的財富,而大多數(shù)人的財富數(shù)量都很小,因為勝者通吃的原則。
??????????????
??? 股市中有80%的投資者只想著怎么賺錢,僅有20%的投資者考慮到賠錢時的應(yīng)變策略。但結(jié)果是只有那20%投資者能長期盈利,而80%投資者卻常常賠錢。
??? 20%賺錢的人掌握了市場中80%正確的有價值信息,而80%賠錢的人因為各種原因沒有用心收集資訊; 當(dāng)80%人看好后市時,股市已接近短期頭部,當(dāng)80%人看空后市時,股市已接近短期底部。只有20%的人可以做到鏟底逃頂,80%人是在股價處于半山腰時買賣的。
??? 券商的80%傭金是來自于20%短線客的交易,股民的80%收益卻來自于20%的交易次數(shù)。因此,除非有嫻熟的短線投資技巧,否則不要去貿(mào)然參與短線交易。
??? 只占市場20%的大盤指標(biāo)股對指數(shù)的升降起到80%作用,在研判大盤走向時,要密切關(guān)注這些指標(biāo)股的表現(xiàn)。
??? 一輪行情只有20%的個股能成為黑馬,80%個股會隨大盤起伏。80%投資者會和黑馬失之交臂,但僅20%的投資者與黑馬有一面之緣,能夠真正騎穩(wěn)黑馬的更是少之又少。
??? 有80%投資利潤來自于20%的投資個股,其余20%投資利潤來自于80%的投資個股。投資收益有80%來自于20%筆交易,其余80%筆交易只能帶來20%的利潤。所以,投資者需要用80%的資金和精力關(guān)注于其中最關(guān)鍵的20%的投資個股和20%的交易。
??? 股市中20%的機(jī)構(gòu)和大戶占有80%的主流資金,80%的散戶占有20%資金,所以,投資者只有把握住主流資金的動向,才能穩(wěn)定獲利。
??? 成功的投資者用80%時間學(xué)習(xí)研究,用20%時間實際操作。失敗的投資者用80%時間實盤操作,用20%時間后悔。
??? 股價在80%的時間內(nèi)是處于量變狀態(tài)的,僅在20%的時間內(nèi)是處于質(zhì)變狀態(tài)。成功的投資者用20%時間參與股價質(zhì)變的過程,用80%時間休息,失敗的投資者用80%時間參與股價量變的過程,用20%時間休息。
????
????
??? 2:幾種冪率分布模型
??? 以收入或人口數(shù)為橫坐標(biāo),以不低于該收入值或人口數(shù)的個體數(shù)或概率為縱坐標(biāo),可繪出一條向右偏斜得很厲害,拖著長長“尾巴”的累積分布曲線(如圖1右圖所示),它與鐘形的泊松分布曲線有顯著的不同。這種“長尾”分布表明,絕大多數(shù)個體的尺度很小,而只有少數(shù)個體的尺度相當(dāng)大,像國家人口,全世界有300多個國家和地區(qū),只有11個國家的人口數(shù)超過一億。“長尾”分布就屬于冪律分布。
??? 關(guān)于冪律分布的一個筆記
????
???????? 圖1 泊松分布(左)?????????????????? 與??????????? “長尾”分布(右)
??? 對“長尾”分布研究做出重要貢獻(xiàn)的是Zipf和Pareto。
???????? 1932年,語言學(xué)家Zipf在研究英文單詞出現(xiàn)的頻率時,發(fā)現(xiàn)如果把單詞出現(xiàn)的頻率按由大到小的順序排列,則每個單詞出現(xiàn)的頻率與它的名次的常數(shù)次冪存在簡單的反比關(guān)系:P(r)~r^(-α),這種分布就稱為Zipf定律,它表明在英語單詞中,只有極少數(shù)的詞被經(jīng)常使用,而絕大多數(shù)詞很少被使用。實際上,包括漢語在內(nèi)的許多國家的語言都有這種特點。物理世界在相當(dāng)程度上是具有惰性的,動態(tài)過程總能找到能量消耗最少的途徑,人類的語言經(jīng)過千萬年的演化,最終也具有了這種特性,詞頻的差異有助于使用較少的詞匯表達(dá)盡可能多的語義,符合“最小努力原則”。
???????? 19世紀(jì)的意大利經(jīng)濟(jì)學(xué)家帕累托(Pareto)研究了個人收入的統(tǒng)計分布,發(fā)現(xiàn)少數(shù)人的收入要遠(yuǎn)多于大多數(shù)人的收入,提出了著名的80/20法則,即20%的人口占據(jù)了80%的社會財富。個人收入X不小于某個特定值x的概率與x的常數(shù)次冪亦存在簡單的反比關(guān)系:P[X≥k]~x^(-k),上式即為Pareto定律。對Pareto分布P[X >= x] ~ x-k,通過求導(dǎo)很容易得到其概率分布密度:p[X = x] ~ x-(k+1) = x-a,a = 1+k。對于Pareto定律,在成熟市場中,金融資產(chǎn)收益率的冪律分布其冪指數(shù)約等于3.
???????? Zipf定律與Pareto定律都是簡單的冪函數(shù),我們稱之為冪律分布;還有其它形式的冪律分布,像名次——規(guī)模分布、規(guī)模——概率分布,這四種形式在數(shù)學(xué)上是等價的,冪律分布的示意圖如圖1右圖所示,其通式可寫成y=c*x^(-r),其中x,y是正的隨機(jī)變量,c,r均為大于零的常數(shù)。這種分布的共性是絕大多數(shù)事件的規(guī)模很小,而只有少數(shù)事件的規(guī)模相當(dāng)大。對上式兩邊取對數(shù),可知lny與lnx滿足線性關(guān)系,也即在雙對數(shù)坐標(biāo)下,冪律分布表現(xiàn)為一條斜率為冪指數(shù)的負(fù)數(shù)的直線,這一線性關(guān)系是判斷給定的實例中隨機(jī)變量是否滿足冪律的依據(jù)。判斷兩個隨機(jī)變量是否滿足線性關(guān)系,可以求解兩者之間的相關(guān)系數(shù);利用一元線性回歸模型和最小二乘法可得lny對lnx的經(jīng)驗回歸直線方程,從而得到y(tǒng)與x之間的冪律關(guān)系式。圖2顯示的是圖1右圖在雙對數(shù)坐標(biāo)下的圖形,由于某些因素的影響,圖2前半部分的線性特性并不是很強(qiáng),而在后半部分(對應(yīng)于圖1右圖的尾部),則近乎為一直線,其斜率的負(fù)數(shù)就是冪指數(shù)。?
???????????????????????????? 關(guān)于冪律分布的一個筆記????????
????????? 圖2 雙對數(shù)坐標(biāo)下一個冪律分布的示意圖,直線表示對圖1右圖尾部的線性擬合
???????????????????? Gutenberg-Richter law
??? Gutenberg 和Richter 于1954年發(fā)現(xiàn)地震震級為m的地震分布N(m)的對數(shù)和震級m之間存在線性關(guān)系:logN(m) ≈a?bm;
???????
??? 3:冪律可作為自組織臨界的證據(jù)
??? 冪律分布是自組織臨界系統(tǒng)在混沌邊緣,即從穩(wěn)態(tài)過渡到混沌態(tài)的一個標(biāo)志,利用它可以預(yù)測這類系統(tǒng)的相位及相變。它認(rèn)為,由大量相互作用的成分組成的系統(tǒng)會自然地向自組織臨界態(tài)發(fā)展;當(dāng)系統(tǒng)達(dá)到這種狀態(tài)時,即使是很小的干擾事件也可能引起系統(tǒng)發(fā)生一系列災(zāi)變。著名的“沙堆模型”形象地說明了自組織臨界態(tài)的形成和特點(如圖3):
??? 關(guān)于冪律分布的一個筆記
??? 設(shè)想在一平臺上緩緩地添加沙粒,一個沙堆逐漸形成。開始時,由于沙堆平矮,新添加的沙粒落下后不會滑得很遠(yuǎn)。但是,隨著沙堆高度的增加,其坡度也不斷增加,沙崩的規(guī)模也相應(yīng)增大,但這些沙崩仍然是局部性的。到一定時候,沙堆的坡度會達(dá)到一個臨界值,這時,新添加一粒沙子(代表來自外界的微小干擾)就可能引起小到一粒或數(shù)粒沙子,大到涉及整個沙堆表面所有沙粒的沙崩。這時的沙堆系統(tǒng)處于“自組織臨界態(tài)”,有趣的是,臨界態(tài)時沙崩的大小與其出現(xiàn)的頻率呈冪律關(guān)系。這里所謂的“自組織”是指該狀態(tài)的形成主要是由系統(tǒng)內(nèi)部各組成部分間的相互作用產(chǎn)生,而不是由任何外界因素控制或主導(dǎo)所致,這是一個減熵有序化的過程;“臨界態(tài)”是指系統(tǒng)處于一種特殊的敏感狀態(tài),微小的局部變化可以不斷被放大、進(jìn)而擴(kuò)延至整個系統(tǒng)。自組織臨界理論可以解釋諸如火山爆發(fā)、山體滑坡、巖層形成、日輝耀斑、物種滅絕、交通阻塞、以及金融市場中泡沫崩潰的現(xiàn)象。
???????
????? 4:啟示
????? 帕累托法則換句話就是強(qiáng)調(diào)了重要的少數(shù)與瑣碎的多數(shù),也指世界上充滿了不平衡性,比如20%的人口擁有80%的財富,20%的上市公司創(chuàng)造了80%的價值,80%的收入來自20%的商品,80%的利潤來自20%的顧客,等等。
??????? 這一法則潛在地影響了許多成功人士,特別是商界精英、計算機(jī)專家和質(zhì)量工程師。這一法則已經(jīng)幫助人們塑造了一個現(xiàn)代化世界。然而,它現(xiàn)在依然是我們這個時代一個偉大的秘密。即使是那些百里挑一的能理解并運(yùn)用80/20法則的行家們,也不過僅僅發(fā)現(xiàn)了它的冰山一角而已。
總結(jié)
以上是生活随笔為你收集整理的关于幂律分布的一个笔记_哈克_新浪博客的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php stream 函数集
- 下一篇: TFS配置(二)