java累积度分布,累积分布函数
累積分布函數是概率密度函數的積分,即能完整描述一個實隨機變量X的概率分布。對于所有實數x ,累積分布函數定義如下:
F_{X}(x)=P(X<=x)
其代表了實數X的取值小于等于x的概率(請注意大小寫,X代表隨機變量而x代表X的取值)。
若要求得X處于半閉區間(a,b)的概率,其中a < b,則可以根據分布函數進行計算:
P(a
在上面的定義中,“小于或等于”符號“≤”是一種慣例,而不是普遍使用的慣例(例如匈牙利文獻使用“
一般使用小寫字母f代表概率密度函數和概率質量函數,而用大寫字母F表示累積分布函數。
連續隨機變量X的累積分布函數可以表示為其概率密度函數?_{X}的積分,如下式:
F_{X}(x)=\int_{-\intf}^x f_{X}(t)dt
累計分布函數有幾個重要的性質:
·有界性
o$$\varlimsup_{x\rightarrow - \infty}F_{X}(x)=0$$
o$$\varlimsup_{x\rightarrow + \infty}F_{X}(x)=1$$
·單調性:
oF_{x}(x_1)<=F_{x}(x_2) 若x_1
·右連續性:
·$$\varlimsup_{x\rightarrow +x_{0}^+}F_{X}(x_{0})
下圖給出具有不同均值和方差的正態分布的累積分布函數,可以看到雖然其形狀各異,但都具備上述三個性質:
累積分布函數的概念主要用于統計分析中,其有兩種應用,一種是對小于參考值的現象值的出現頻率的分析的累積頻率分析,另一種則是對累計分布函數進行估計,隨后可以求得簡單的統計值,或進行各種統計假設檢驗。如檢驗樣本數據是否來自給定的分布,或兩個樣本是否來自同一個概率分布。如著名的Kolmogorov-Smirnov檢驗即是基于累積分布函數,可用于檢驗兩個經驗分布是否不同,或者經驗分布是否與理想分布不同。
發展歷史
描述
如上文所述,在統計分析中可以利用累積分布的概念對數據進行檢驗,Kolmogorov和Smirnov提出的Kolmogorov-Smirnov檢驗(K-S檢驗)是其中最著名的應用之一,用以檢驗兩個經驗分布是否不同或一個經驗分布與另一個理想分布是否不同。雙樣本K-S檢驗目前仍是比較兩個樣本最有用和最常用的非參數方法之一,因為它對兩個樣本的經驗累積分布函數的位置和形狀的差異很敏感。除此之外,基于累積分布的統計檢驗還有Shapiro-Wilk檢驗,Anderson-Darling檢驗等,Razali等人在2011年對這些檢驗的效力進行了比較。
1951年Massey Jr在發表的論文對Kolmogorov-Smirnov檢驗進行了修改,從而將其用于模型的擬合優度(goodness-of-fit)分析。該檢驗基于實證累積分布(empirical cumulative distribution)和假設累計分布(hypothetical cumulative distribution)之間的最大差異,文章中給出了具體的例子,并認為結果顯示修改后的Kolmogorov-Smirnov檢驗的表現比卡方檢驗(chi-square test)更好。
為將高階變量的分布也納入分析范圍,J. P. Imhof于1961年發表了論文,對已有的方法進行了探討,并提出如何估計隨機變量的二階甚至更高階形式的分布的新方法。
累積分布的應用遠不止于此,在圖像處理領域,基于圖像直方圖均衡方法的圖像增強實際上也依賴于累積分布的概念,Yu Wang等人在其1999年發表的論文對此進行了說明。
主要事件ABC
1年份事件相關論文/Reference
21933-1948Kolmogorov和Smirnov提出了Kolmogorov-Smirnov檢驗Kolmogorov A (1933). Sulla determinazione empirica di una legge di distribuzione. G. Ist. Ital. Attuari. 4: 83–91. // Smirnov N (1948). Table for estimating the goodness of fit of empirical distributions. Annals of Mathematical Statistics. *19*: 279–281.
31951Massey Jr在發表的論文對Kolmogorov-Smirnov檢驗進行了修改,從而將其用于模型的擬合優度(goodness-of-fit)分析Frank J. M. Jr. (1951). The Kolmogorov-Smirnov Test for Goodness of Fit, Journal of the American Statistical Association, 46(253): 68-78.
41961J. P. Imhof提出如何估計隨機變量的二階甚至更高階形式的分布的新方法Imhof. J. P.(1961). Computing the Distribution of Quadratic Forms in Normal Variables. Biometrika. 48(3/4): 419-426.
51999Yu Wang等人提出了基于圖像直方圖均衡方法的圖像增強法,這種方法實際上也是基于累積分布的Wang, Y.; Chen, Q.; Zhang, B. (1999). Image enhancement based on equal area dualistic sub-image histogram equalization method. IEEE Transactions on Consumer Electronics. 45(1):68 - 75.
62011Razali等人對基于累積分布的Shapiro-Wilk檢驗,Anderson-Darling檢驗等進行了比較Razali, N. M.; Wah Y. B.(2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics. 2(1): 21-33.
發展分析
瓶頸
累積分布函數是數學上的一個基本概念,并且經過超過一百年的發展,已經十分成熟,很難說存在什么瓶頸。
未來發展方向
如上文所述,目前有關的研究大部分是基于累積分布函數這個概念的,而不是直接對累積分布函數進行研究。
ByYuanyuan Li
總結
以上是生活随笔為你收集整理的java累积度分布,累积分布函数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 鸿蒙汽车电动尾门工厂,汽车智能电动尾门为
- 下一篇: 电子报纸的分析即制作