概率论于数理统计(陈希孺)笔记2.3
2.3 條件概率分布與隨機變量的獨立性
2.3.1 條件概率分布的概念
一個隨機變量或向量XXX的條件概率分布,就是在某種給定的條件之下,XXX的概率分布.
考慮之前提到的體重X1X_1X1?與身高X2X_2X2?的二維正態分布N(a,b,σ21,σ22,ρ)N\left(a, b, \sigma_{2}^{1}, \sigma_{2}^{2}, \rho\right)N(a,b,σ21?,σ22?,ρ).根據之前的論述可以知道X1X_1X1?,X2X_2X2?都有單獨的概率分布,分別為N(a,σ12)N\left(a, \sigma_{1}^{2}\right)N(a,σ12?)和N(b,σ22)N\left(b, \sigma_{2}^{2}\right)N(b,σ22?). 現在如限制1.7?X2?1.81.7 \leqslant X_{2} \leqslant 1.81.7?X2??1.8(米 ), 在這個條件下去求X1X_{1}X1?的 條件分布,這就意味著要從這一大群人中把其身高在1.71.71.7米和1.81.81.8米的那些人都挑出來,然后在挑出的人群中求其體重的分布. 容易想像, 這個分布與不設這個條件的分布 (無條件分布)會很不一樣.體重取大值的概率會顯著增加.
從這個例子也看出條件分布這個概念的重要性.
2.3.2 離散型隨機變量的條件概率分布
這個比較簡單,直接給例子.
多項分布的條件概率分布
設(X1,X2,?,Xn)\left(X_{1}, X_{2}, \cdots, X_{n}\right)(X1?,X2?,?,Xn?)服從多項分布M(N;p1,?,M\left(N ; p_{1}, \cdots,\right.M(N;p1?,?,,pnp_{n}pn?). 在給定X2=k2X_{2}=k_{2}X2?=k2?的條件下,X1X_{1}X1?的條件分布為B(N?k2,p1/(1?p2))B\left(N-k_{2}, p_{1} /\left(1-p_{2}\right)\right)B(N?k2?,p1?/(1?p2?))
代數證明略去.這個公式的直觀意義為在X2=k2X_{2}=k_{2}X2?=k2?的條件下,剩下n?1n-1n?1個變量的聯合分布就變為n?k2n-k_2n?k2?個物品分成n?1n-1n?1堆,每個物品分到第iii堆的概率從pip_ipi?變成pi/(1?p2)p_i/(1-p_2)pi?/(1?p2?).那么X1X_1X1?的條件分布就變為M(N?k2;p1/(1?p2),p3/(1?p2),?,pn/(1?p2))M\left(N-k_2 ; p_{1}/(1-p_2), p_{3}/(1-p_2), \cdots,p_{n}/(1-p_2)\right)M(N?k2?;p1?/(1?p2?),p3?/(1?p2?),?,pn?/(1?p2?))的邊緣分布,即B(N?k2,p1/(1?p2))B\left(N-k_{2}, p_{1} /\left(1-p_{2}\right)\right)B(N?k2?,p1?/(1?p2?))
2.3.3 連續型隨機變量的條件分布
連續型隨機變量的條件分布函數如下
f1(x1∣a?X2?b)=∫abf(x1,t2)dt2/∫abf2(t2)dt2f_{1}\left(x_{1} \mid a \leqslant X_{2} \leqslant b\right)=\int_{a}^{b} f\left(x_{1}, t_{2}\right) \mathrmze8trgl8bvbq t_{2} / \int_{a}^{b} f_{2}\left(t_{2}\right) \mathrmze8trgl8bvbq t_{2}f1?(x1?∣a?X2??b)=∫ab?f(x1?,t2?)dt2?/∫ab?f2?(t2?)dt2?
f(x1∣x2)=f2(x2)f1(x1,x2)f\left(x_{1}\mid x_{2}\right)=f_{2}\left(x_{2}\right) f_{1}\left(x_{1} , x_{2}\right) f(x1?∣x2?)=f2?(x2?)f1?(x1?,x2?)
可以記為
f(x1,x2)=f2(x2)f1(x1∣x2)f\left(x_{1}, x_{2}\right)=f_{2}\left(x_{2}\right) f_{1}\left(x_{1} \mid x_{2}\right) f(x1?,x2?)=f2?(x2?)f1?(x1?∣x2?)
可以看出該公式對應于條件概率的公式P(AB)=P(B)P(A∣B)P(A B)=P(B) P(A \mid B)P(AB)=P(B)P(A∣B)
推廣到任意多變量的場合
f(x1,?,xn)=g(x1,?,xk)h(xk+1,?,xn∣x1,?,xk)f\left(x_{1}, \cdots, x_{n}\right)=g\left(x_{1}, \cdots, x_{k}\right) h\left(x_{k+1}, \cdots, x_{n} \mid x_{1}, \cdots, x_{k}\right)f(x1?,?,xn?)=g(x1?,?,xk?)h(xk+1?,?,xn?∣x1?,?,xk?)
下面給出連續型隨機變量的條件分布的例子
二維正態分布的條件分布
設(X1,X2)\left(X_{1}, X_{2}\right)(X1?,X2?)服從二維正態分布N(a,b,σ12,σ22,ρ)N\left(a, b, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho\right)N(a,b,σ12?,σ22?,ρ). 在給定X1=x1X_{1}=x_{1}X1?=x1?的條件下,X2X_{2}X2?的條件密度函數
f2(x2∣x1)=12πσ21?ρ2?exp?[?(x2?(b+ρσ2σ1?1(x1?a)))22(1?ρ2)σ22]\begin{aligned} f_{2}\left(x_{2} \mid x_{1}\right)=& \frac{1}{\sqrt{2 \pi} \sigma_{2} \sqrt{1-\rho^{2}}} \\ & \cdot \exp \left[-\frac{\left(x_{2}-\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right)\right)\right)^{2}}{2\left(1-\rho^{2}\right) \sigma_{2}^{2}}\right] \end{aligned} f2?(x2?∣x1?)=?2π?σ2?1?ρ2?1??exp[?2(1?ρ2)σ22?(x2??(b+ρσ2?σ1?1?(x1??a)))2?]?
這正是正態分布N(b+ρσ2σ1?1(x1?a),σ22(1?ρ2))N\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right), \sigma_{2}^{2}\left(1-\rho^{2}\right)\right)N(b+ρσ2?σ1?1?(x1??a),σ22?(1?ρ2))的概率密度函數.
由這里可以看出ρ\rhoρ刻畫了X1,X2X_{1}, X_{2}X1?,X2?之間的相依關系.解釋如下:
若ρ>0\rho>0ρ>0, 則隨著x1x_{1}x1?的增加,X2X_{2}X2?(在X1=x1X_{1}=x_{1}X1?=x1?之下) 的條件分布的中心點m(x1)m\left(x_{1}\right)m(x1?)隨x1x_{1}x1?的增加而增加. 可以看出: 這意味著當x1x_{1}x1?增加時,X2X_{2}X2?取大值的可能性增加, 即X2X_{2}X2?有隨著X1X_{1}X1?的增長而增長.若ρ<0\rho<0ρ<0則情況相反.若ρ=0\rho=0ρ=0則無關.這從中心點的角度刻畫了ρ\rhoρ對X1X_1X1?,X2X_2X2?相依關系的刻畫.
下圖展示了X1X1X1分布為N(25,64)N\left(25, 64\right)N(25,64)和X2X_2X2?分布為N(25,64)N\left(25, 64\right)N(25,64)時,不同ρ\rhoρ下二維正態分布的概率密度.
下圖展示了rho=0.5rho=0.5rho=0.5時,X1=15,25,35X_1=15,25,35X1?=15,25,35下X2X_2X2?的條件分布
若∣ρ∣=0|\rho|=0∣ρ∣=0,則σ=σ2\sigma=\sigma_2σ=σ2?,X2X_2X2?分布的集中程度不受X1X_1X1?影響.現在考慮極端情況,假如∣ρ∣=1|\rho|=1∣ρ∣=1,那么σ=0\sigma=0σ=0,由一維正態分布的性質可以知道X2X_2X2?的取值全部集中于m(X1)m(X_1)m(X1?).也就是說,X2X_2X2?的取值由X1X_1X1?完全決定.這從集中程度的角度刻畫了ρ\rhoρ對X1X_1X1?,X2X_2X2?相依關系的刻畫.
下圖為ρ=0.999\rho=0.999ρ=0.999時X2X_2X2?的條件分布
2.3.4 隨機變量的獨立性
定義3.13.13.1設nnn維隨機向量(X1,?,Xn)\left(X_{1}, \cdots, X_{n}\right)(X1?,?,Xn?)的聯合密度函數為f(x1,?,xn)f\left(x_{1}, \cdots, x_{n}\right)f(x1?,?,xn?), 而XiX_{i}Xi?的(邊緣)密度函數為fi(xi),i=1,?,nf_{i}\left(x_{i}\right), i=1, \cdots, nfi?(xi?),i=1,?,n. 如 果
f(x1,?,xn)=f1(x1)?fn(xn)f\left(x_{1}, \cdots, x_{n}\right)=f_{1}\left(x_{1}\right) \cdots f_{n}\left(x_{n}\right) f(x1?,?,xn?)=f1?(x1?)?fn?(xn?)
就稱隨機變量X1,?,XnX_{1}, \cdots, X_{n}X1?,?,Xn?相互獨立或簡稱獨立
定義 3.2 設X1,?,XnX_{1}, \cdots, X_{n}X1?,?,Xn?都是離散型隨機變量. 若對任何常 數a1,?,ana_{1}, \cdots, a_{n}a1?,?,an?, 都有
P(X1=a1,?,Xn=an)=P(X1=a1)?P(Xn=an)P\left(X_{1}=a_{1}, \cdots, X_{n}=a_{n}\right)=P\left(X_{1}=a_{1}\right) \cdots P\left(X_{n}=a_{n}\right) P(X1?=a1?,?,Xn?=an?)=P(X1?=a1?)?P(Xn?=an?)
則稱X1,?,XnX_{1}, \cdots, X_{n}X1?,?,Xn?相互獨立
定理3.13.13.1如果連續變量X1,?,XnX_{1}, \cdots, X_{n}X1?,?,Xn?獨立時, 則對任何ai<a_{i}<ai?<bi,i=1,?,nb_{i}, i=1, \cdots, nbi?,i=1,?,n, 由(3.14)(3.14)(3.14)定義的nnn個事件A1,?,AnA_{1}, \cdots, A_{n}A1?,?,An?也獨立.
定理3.23.23.2若連續型隨機向量(X1,?,Xn)\left(X_{1}, \cdots, X_{n}\right)(X1?,?,Xn?)的概率密度函數f(x1,?,xn)f\left(x_{1}, \cdots, x_{n}\right)f(x1?,?,xn?)可表為nnn個函數g1,?,gng_{1}, \cdots, g_{n}g1?,?,gn?之積, 其中gig_{i}gi?只依賴于xix_{i}xi?, 即
f(x1,?,xn)=g1(x1)?gn(xn)f\left(x_{1}, \cdots, x_{n}\right)=g_{1}\left(x_{1}\right) \cdots g_{n}\left(x_{n}\right) f(x1?,?,xn?)=g1?(x1?)?gn?(xn?)
則X1,?,XnX_{1}, \cdots, X_{n}X1?,?,Xn?相互獨立,且XiX_{i}Xi?的邊緣密度函數fi(xi)f_{i}\left(x_{i}\right)fi?(xi?)與gi(xi)g_{i}\left(x_{i}\right)gi?(xi?)只 相差一個黨數因子
定理3.33.33.3若X1,?,XnX_{1}, \cdots, X_{n}X1?,?,Xn?相互獨立,而
Y1=g1(X1,?,Xm),Y2=g2(Xm+1,?,Xn)Y_{1}=g_{1}\left(X_{1}, \cdots, X_{m}\right), Y_{2}=g_{2}\left(X_{m+1}, \cdots, X_{n}\right) Y1?=g1?(X1?,?,Xm?),Y2?=g2?(Xm+1?,?,Xn?)
則Y1Y_{1}Y1?和Y2Y_{2}Y2?獨立.
總結
以上是生活随笔為你收集整理的概率论于数理统计(陈希孺)笔记2.3的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《机器人学导论》克雷格 第3章
- 下一篇: html考勤表格模板,Excel员工考勤