深度学习(2)--常见概率分布(1)
許多簡單的概率分布在機器學習的眾多領域中都非常有用,這個內容將分為兩個部分來說明,第一個部分介紹伯努利分布、二項式分布、多項式分布及范疇分布,第二個部分介紹高斯分布、指數分布、Laplace分布、Dirac分布、經驗分布及混合分布。
伯努利(Bernoulli)分布
伯努利分布是一種離散分布,有兩種可能的結果:
- 1表示成功,出現的概率為ppp(其中0<p<10 \lt p \lt 10<p<1)。
- 0表示失敗,出現的概率為q=1?pq=1-pq=1?p。
這種分布在機器學習中很有用,比如正面或反面,成功或失敗,有缺陷或沒有缺陷,病人康復或未康復。
可以用數學描述為:隨機變量xxx只取0和1兩個值,其概率為:
- P(x=1)=pP(x = 1) = pP(x=1)=p, P(x=0)=1?p=qP(x = 0) = 1 - p = qP(x=0)=1?p=q
數學期望和方差計算如下:
- E(x)=1?p+0?q=pE(x) = 1 * p + 0 * q = pE(x)=1?p+0?q=p
- E(x2)=12?p+02?q=pE(x^2) = 1^2 * p + 0^2 * q = pE(x2)=12?p+02?q=p
- D(x)=E(x2)?[E(x)]2=p?p2=p(1?p)=pqD(x) = E(x^2) - [E(x)]^2 = p - p^2 = p(1-p) = pqD(x)=E(x2)?[E(x)]2=p?p2=p(1?p)=pq
二項式(Binomial)分布
在nnn次獨立重復的伯努利試驗中,設每次試驗成功的概率為ppp。用xxx表示nnn重伯努利試驗中成功的次數,則xxx取值為{0,1,…,n}\{0, 1, \dots, n\}{0,1,…,n}中的一個。
對每一個k(0≤k≤n)k(0 \le k \le n)k(0≤k≤n),事件{x=k}\{x=k\}{x=k}表示“nnn次試驗成功恰好發生kkk次”,隨機變量xxx的離散概率分布即為二項分布(Binomial Distribution)。
典型例子為:扔硬幣,硬幣正面朝上概率為ppp, 重復扔nnn次硬幣,kkk次為正面的概率即為一個二項分布概率。
用概率表示如下:
- P(x=k)=n!k!(n?k)!pk(1?p)n?kP(x = k) = \frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}P(x=k)=k!(n?k)!n!?pk(1?p)n?k
下圖為不同參數下的二項式分布的圖形:
多項式(Multinomial)分布
多項式分布是二項式分布的推廣。將二項式分布推廣至多種狀態,就得到了多項式分布。舉例說明如下:
- 二項式分布:扔硬幣,硬幣正面朝上概率為ppp, 重復扔nnn次硬幣,kkk次為正面的概率。
- 多項式分布:扔骰子,不同于扔硬幣,骰子有6個面對應6個不同的點數,這樣單次每個點數朝上的概率都是16\frac{1}{6}61?(對應p1p_1p1?~p6p_6p6?,它們的值不一定都是16\frac{1}{6}61?,只要和為1且互斥即可,比如一個形狀不規則的骰子),重復扔nnn次,如果問有kkk次都是點數6朝上的概率。
更一般化的描述如下:投擲nnn次骰子,這個骰子共有6種結果輸出,1點出現概率為p1p_1p1?,2點出現概率p2p_2p2?,…\dots…;多項式分布給出了在nnn次試驗中,骰子1點出現k1k_1k1?次,2點出現k2k_2k2?次,3點出現k3k_3k3?次,…,6點出現k6k_6k6?次。這個結果組合的概率為:
f(k1,k2,…,k6;n,p1,p2,…,p6)f(k_1, k_2, \dots, k_6;n, p_1, p_2, \dots, p_6)f(k1?,k2?,…,k6?;n,p1?,p2?,…,p6?)
=P(x1=k1,x2=k2,…,x6=k6)= P(x_1= k_1, x_2= k_2, \dots, x_6= k_6)=P(x1?=k1?,x2?=k2?,…,x6?=k6?)
=n!k1!k2!…k6!p1k1p2k2…p6k6= \frac{n!}{k_1!k_2! \dots k_6!}p_1^{k_1}p_2^{k_2} \dots p_6^{k_6}=k1?!k2?!…k6?!n!?p1k1??p2k2??…p6k6??,
約束條件為∑i=16ki=n\sum_{i=1}^{6} k_i = n∑i=16?ki?=n.
為了更加簡化,用Γ\GammaΓ函數來表示:
f(k1,k2,…,k6;n,p1,p2,…,p6)f(k_1, k_2, \dots, k_6;n, p_1, p_2, \dots, p_6)f(k1?,k2?,…,k6?;n,p1?,p2?,…,p6?)
=Γ(∑i=16ki+1)∏i=16Γ(ki+1)∏i=16piki=\frac{\Gamma(\sum_{i=1}^{6}k_i + 1)}{\prod_{i = 1}^{6}\Gamma(k_i + 1)}\prod_{i = 1}^{6}p_i^{k_i}=∏i=16?Γ(ki?+1)Γ(∑i=16?ki?+1)?∏i=16?piki??.
【例題-1】同時投擲5枚骰子,投擲出2個一點,2個二點,1個三點的概率是多大?
【解答】
x1x_1x1?~x6x_6x6?表示6個點的出現次數之和為n=5n = 5n=5,利用多項式分布組合概率公式有:
P(x1=2,x2=2,x3=1,x4=0,x5=0,x6=0)P(x_1= 2, x_2= 2, x_3 = 1, x_4 = 0, x_5 = 0, x_6= 0)P(x1?=2,x2?=2,x3?=1,x4?=0,x5?=0,x6?=0)
=5!2!2!1!0!0!0!(16)2(16)2(16)1(16)0(16)0(16)0=\frac{5!}{2!2!1!0!0!0!}(\frac{1}{6})^{2}(\frac{1}{6})^{2}(\frac{1}{6})^{1}(\frac{1}{6})^{0}(\frac{1}{6})^{0}(\frac{1}{6})^{0}=2!2!1!0!0!0!5!?(61?)2(61?)2(61?)1(61?)0(61?)0(61?)0
=51296=\frac{5}{1296}=12965?
【例題-2】同時投擲5枚骰子,出現兩對點數一樣的概率是多少?
【解答】
在【例題-1】的基礎之上,需要考慮x1x_1x1?~x6x_6x6?,其中2個取2,1個取1有多少種?
| 2 | 2 | 1 | 0 | 0 | 0 |
| 2 | 0 | 2 | 1 | 0 | 0 |
| …\dots… | …\dots… | …\dots… | …\dots… | …\dots… | …\dots… |
先從6個里面選擇2個取2,再從4個里面選出1個取1,總共有C62C41=60C_6^2C_4^1 = 60C62?C41?=60種。
出現兩對點數一樣的概率為5?601296\frac{5 * 60}{1296}12965?60? = 25108\frac{25}{108}10825?。
范疇(Categorical)分布
范疇分布又稱為Multinoulli分布、類別分布,它是多項式分布的一個特例。
拋一次骰子,第xkx_kxk?面朝上的概率,這是Categorical分布。
小結:幾種分布的關系
- 將一個小球放入兩個桶,令變量 xxx 為第一個桶里面有的小球個數,那么只有 0 個或者 1 個,服從伯努利分布;
- 將 nnn個小球放入兩個桶,令變量 xxx 為第一個桶里面的小球個數,那么最少可能有 0 個,最多可能有 nnn個,服從二項分布;
- 將一個小球放入 kkk個桶,令變量 x={x1,x2,…,xk}x = \{x_1, x_2, \dots, x_k\}x={x1?,x2?,…,xk?} 為kkk個桶內的小球個數,xxx是一個One-hot形式的向量,因為這個小球只能在一個桶里面,服從Categorical分布;
- 將 nnn個小球放入 kkk個桶,令變量 x={x1,x2,…,xk}x = \{x_1, x_2, \dots, x_k\}x={x1?,x2?,…,xk?} 為kkk個桶內的小球個數,xxx是一個向量,元素和為 nnn,服從多項分布。
總結
以上是生活随笔為你收集整理的深度学习(2)--常见概率分布(1)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数学菜鸟和大佬的关注点有什么不同?
- 下一篇: (pytorch-深度学习系列)pyto