捋一捋PDF、PMF、CDF是什么
總第230篇/張俊紅
還記得前段時間看過一篇文章,就是調(diào)查大家疫情期間都干了什么,有一條是疫情期間終于弄清楚了PDF和CDF的區(qū)別。PDF、PMF、CDF這幾個概念確實(shí)很容易混淆。今天就來捋一捋這幾個概念。
1.基本概念
PDF:是英文單詞 probability density function 的縮寫,翻譯過來是指概率密度函數(shù),是用來描述連續(xù)型隨機(jī)變量的輸出值,在某個確定的取值點(diǎn)附近的可能性的大小的函數(shù)。
PMF : 是英文單詞 probability mass function 的縮寫, 翻譯過來是指概率質(zhì)量函數(shù),是用來描述離散型隨機(jī)變量在各特定取值上的概率。
CDF : 是英文單詞 cumulative distribution function 的縮寫,翻譯過來是指累積分布函數(shù),又叫分布函數(shù),是概率密度函數(shù)的積分,用來表示離散型隨機(jī)變量x的概率分布。
總結(jié)一下就是上面三者的橫軸都是隨機(jī)變量x的取值,PDF的縱軸表示連續(xù)型隨機(jī)變量x出現(xiàn)的可能性(非概率),PMF的縱軸表示離散型隨機(jī)變量x出現(xiàn)的概率,CDF的縱軸表示連續(xù)型隨機(jī)變量x的概率。
相信大家看完上面的概念以后對這幾個還是有點(diǎn)懵,接下來我們就仔細(xì)講講這些概念的來龍去脈。
2.頻率分布條形圖
頻率分布條形圖主要用在離散數(shù)據(jù)中,橫軸為一個個具體的點(diǎn)(類別),縱軸為這些點(diǎn)對應(yīng)的頻率。
當(dāng)試驗(yàn)次數(shù)足夠多時,我們可以用頻率來代替概率,也就是可以把頻率分布條形圖中的縱軸當(dāng)作每個類別出現(xiàn)的概率值。此時的頻率分布條形圖就可以當(dāng)作是PMF圖。
3.頻率分布直方圖
在頻率分布直方圖中橫軸表示眾多個連續(xù)變量離散化以后的區(qū)間,這個區(qū)間的大小稱為組距,縱軸表示頻率/組距。
上圖中每個長方形的面積就是該區(qū)間的頻率,即概率。
當(dāng)長方形的寬度無限小,即組距無限小的時候,頻率分布直方圖就無限接近于下方這樣的光滑曲線,我們把這條曲線叫做概率密度曲線,即PDF。
4.累積分布函數(shù)
累計(jì)分布函數(shù)就是從上圖中的概率密度曲線的最左邊開始,然后逐漸往右求取曲線下方的面積,即概率。
以上就是關(guān)于PDF、PMF、CDF三者之間的異同情況,如果對公式推導(dǎo)方面感興趣的話可以直接上網(wǎng)搜索即可。
總結(jié)
以上是生活随笔為你收集整理的捋一捋PDF、PMF、CDF是什么的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LaTeX排版工具使用
- 下一篇: 一种常见的关于率指标的错误分析思路