统计基础:3.3_假设检验之t检验(Student‘s t test)
t檢驗三種形式
- 一、參數檢驗:T檢驗介紹
- 1.1、單樣本T檢驗(one sample t test)
- 1.2、獨立樣本T檢驗(independent sample t-test)
- 1.3、配對樣本T檢驗(paired t test)
- 1.4、兩獨立樣本T檢驗(two independent sample t-test)
一、參數檢驗:T檢驗介紹
??t檢驗,亦稱student t檢驗(Student’s t test),主要用于樣本含量較小(例如n < 30),總體標準差σ未知的正態分布。 [1] t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。
1.1、單樣本T檢驗(one sample t test)
??單樣本T檢驗又稱單樣本均數t檢驗,適用于樣本均數與已知總體均數μ0的比較,目的是檢驗樣本均數所代表的總體均數μ是否與已知總體均數μ0有差別。
前提條件:總體標準α未知的小樣本,且服從正態分布
??單樣本t檢驗統計量為:
t=Xˉ?uS/nt = \frac{\bar X-u}{S/\sqrt n}t=S/n?Xˉ?u?
??其中Xˉ\bar XXˉ 為樣本平均數, S=∑i=1n(xi?xˉ)2nS=\sqrt{\frac{\sum_{i=1}^n(x_i-\bar x)^2}{n}}S=n∑i=1n?(xi??xˉ)2??為樣本標準偏差,n為樣本數。該統計量t在零假說:μ=μ0為真的條件下服從自由度為n的t分布。
eg:大規模調查已知某地新生兒出生體重為3.30kg。從該地難產兒中隨機抽取35名新生兒,平均出生體重為3.42kg,標準差為0.40kg,問該地難產兒出生體重是否與一般新生兒體重不同?
step1:建立假設H0:u=u0,H1:u≠0
step2:計算統計量 t=Xˉ?u0S/n=3.42?3.300.40/35=1.77t = \frac{\bar X - u_0}{S/\sqrt n}=\frac{3.42-3.30}{0.40/\sqrt 35}=1.77t=S/n?Xˉ?u0??=0.40/3?53.42?3.30?=1.77
step3:在顯著性水平α=0.05\alpha = 0.05α=0.05,本例自由度v=n-1=34下,查表得t0.05/2(34)=2.032t_{0.05/2}(34)=2.032t0.05/2?(34)=2.032
step4:統計決策,因t < t0.05/2(34)t_{0.05/2}(34)t0.05/2?(34),故P>0.05,按 α=0.05水準,沒有發現充足的證據拒絕H0,故差別無統計學意義,尚不能認為該地難產兒與一般新生兒平均出生體重不同。
1.2、獨立樣本T檢驗(independent sample t-test)
??獨立樣本T檢驗是用于分析定類數據與定量數據之間的關系情況,適合對比兩組數據的差異性(如不同性別的兩類人群,他們網購滿意度是否有差異?),需要特別注意的是,該定類變量為二分類變量(三分類及以上使用方差分析),各分類頻數可以不相等。
前提條件:兩組數據來自正態分布的群體,數據的方差齊,滿足獨立性。
- 其統計量為:
t=Xˉ1?Xˉ2(n1?1)S12+(n2?1)S22n1+n2?2(1n1+1n2)t = \frac{\bar X_1-\bar X_2}{\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}(\frac{1}{n_1}+\frac{1}{n_2})}}t=n1?+n2??2(n1??1)S12?+(n2??1)S22??(n1?1?+n2?1?)?Xˉ1??Xˉ2??
其中S12S_1^2S12?和S22S_2^2S22?為兩樣本方差;
1.3、配對樣本T檢驗(paired t test)
??配對t檢驗,又稱非獨立兩樣本均數t檢驗, 用來看一組樣本在處理前后的平均值有無差異,同時要求配對變量差值呈現正態性分布。其基本步驟為:
- step1提出假設:兩種處理的效應相同H0:ud=0H_0:u_d=0H0?:ud?=0;
- step2:計算各對數據間的差值d,將d作為變量計算均數;
- step3:差值樣本均數與已知總體均數μd(μd = 0)比較的單樣本t檢驗,其檢驗統計量為:
t=dˉ?udSdˉ=dˉ?0Sdˉ=dˉSd/nt=\frac{\bar d-u_d}{S_{\bar d}}=\frac{\bar d-0}{S_{\bar d}}=\frac{\bar d}{S_d/ \sqrt n}t=Sdˉ?dˉ?ud??=Sdˉ?dˉ?0?=Sd?/n?dˉ?
其中Sd=∑d2?(∑d)2nn?1S_d = \sqrt \frac{\sum d^2-\frac{(\sum d)^2}{n}}{n-1}Sd?=n?1∑d2?n(∑d)2??? - step4:確定p值,作出推斷;
eg:有12名接種卡介苗的兒童,8周后用兩批不同的結核菌素,一批是標準結核菌素,一批是新制結核菌素,分別注射在兒童的前臂,兩種結核菌素的皮膚浸潤反應平均直徑(mm)如表所示,問兩種結核菌素的反應性有無差別
X1 = [12,14.5,15.5,12,13,12,10.5,7.5,9,15,13,10.5]
X2 = [10,10, 12.5,13,10,5.5,8.5,6.5,5.5,8,6.5,9.5]
d = [2,4,3,-1,3,6.5,2,1,3.5,7,6.5,1]=39
- step1:建立假設檢驗以及檢驗水準:H0:ud=0;H1:ud≠0。α=0.05H_0:u_d=0;H_1:u_d≠0 。\alpha =0.05H0?:ud?=0;H1?:ud??=0。α=0.05
- step2:計算統計量t:∑d=39、∑d2=195\sum d =39、\sum d^2 = 195∑d=39、∑d2=195
t=dˉSd/n=39/12195?(39)2/1212?1/12=3.252.4909/3.464=4.5195t=\frac{\bar d}{S_d/ \sqrt n}=\frac{39/12}{\sqrt{\frac{195-(39)^2/12}{12-1}}/\sqrt 12}=\frac{3.25}{2.4909/3.464}=4.5195t=Sd?/n?dˉ?=12?1195?(39)2/12??/1?239/12?=2.4909/3.4643.25?=4.5195 - step3:查表得t0.05/2,11=2.201t_{0.05/2,11}=2.201t0.05/2,11?=2.201,由于t>t0.05/2,11t_{0.05/2,11}t0.05/2,11?,拒絕H0,則認為結果有顯著性差異。
----------擴展------------
1.4、兩獨立樣本T檢驗(two independent sample t-test)
??兩獨立樣本t 檢驗,又稱成組 t 檢驗,適用于完全隨機設計的兩樣本均數的比較,其目的是檢驗兩樣本所來自總體的均數是否相等。
完全隨機設計是將受試對象隨機地分配到兩組中,每組患者分別接受不同的處理,分析比較處理的效應。
前提條件:兩獨立樣本t檢驗要求兩樣本所代表的總體服從正態分布N(μ1,σ12\sigma1^2σ12)和N(μ2,σ22\sigma2^2σ22),且兩總體方差σ12\sigma1^2σ12,σ22\sigma2^2σ22相等,即方差齊性。若兩總體方差不等需要先進行變換。
??兩獨立樣本t檢驗的檢驗假設是兩總體均數相等,即H0:μ1=μ2, 統計量計算公式為:
t(v=n1+n2?2)=∣Xˉ1?Xˉ2∣SXˉ1?Xˉ2t(v=n_1+n_2-2)=\frac{|\bar X_1-\bar X_2|}{S_{\bar X_1-\bar X_2}}t(v=n1?+n2??2)=SXˉ1??Xˉ2??∣Xˉ1??Xˉ2?∣?
SXˉ1?Xˉ2=Sc2(1n1+1n2)S_{\bar X_1-\bar X_2}=\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})}SXˉ1??Xˉ2??=Sc2?(n1?1?+n2?1?)?
Sc2=∑X12?(∑X1)2n1+∑X22?(∑X2)2n2n1+n2?2S_c^2=\frac{\sum X_1^2-\frac{(\sum X_1)^2}{n_1}+\sum X_2^2-\frac{(\sum X_2)^2}{n_2}}{n_1+n_2-2}Sc2?=n1?+n2??2∑X12??n1?(∑X1?)2?+∑X22??n2?(∑X2?)2??
Sc2S_c^2Sc2?稱為合并方差(combined/pooled variance)
eg:25例糖尿病患者隨機分成兩組,甲組X1單純用藥物治療,乙組X2采用藥物治療合并飲食療法,二個月后測空腹血糖(mmol/L)如表所示,問兩種療法治療后患者血糖值是否相同?
X1 = [8.4,10.5,12.12,13.9,15.3,16.7,18,18.7,20.7,21.1,15.2]
X2 = [5.4,6.4,6.4,7.5,7.6,8.1,11.6,12,13.4,13.5,14.8,15.6,18.7]
- step1建立假設:H0:u1=u2H_0:u_1=u_2H0?:u1?=u2? H1:u1≠u2H_1:u_1≠u_2H1?:u1??=u2?
- step2確定顯著性水平α=0.05\alpha=0.05α=0.05
- step3計算統計量:
??由原始數據得:n1=12,∑X1=182.5,∑X12=2953.43,n2=13,∑X2=141.0,∑X22=1743.16,Xˉ1=∑X1/n1=182.5/12=15.21,Xˉ2=∑X2/n2=141/13=10.85n_1 = 12,\sum X_1=182.5,\sum X_1^2 =2953.43,n_2=13,\sum X_2 = 141.0,\sum X_2^2=1743.16,\bar X_1=\sum X_1/n_1=182.5/12=15.21,\bar X_2=\sum X_2/n_2=141/13=10.85n1?=12,∑X1?=182.5,∑X12?=2953.43,n2?=13,∑X2?=141.0,∑X22?=1743.16,Xˉ1?=∑X1?/n1?=182.5/12=15.21,Xˉ2?=∑X2?/n2?=141/13=10.85
代入公式得:
Sc2=2953.43?(182.5)212+1743.16?(141.0)21312+13?2=17.03S_c^2=\frac{2953.43-\frac{(182.5)^2}{12}+1743.16-\frac{(141.0)^2}{13}}{12+13-2}=17.03Sc2?=12+13?22953.43?12(182.5)2?+1743.16?13(141.0)2??=17.03
SXˉ1?Xˉ2=17.03(1/12+1/13)=1.652S_{\bar X_1-\bar X_2}=\sqrt {17.03(1/12+1/13)}=1.652SXˉ1??Xˉ2??=17.03(1/12+1/13)?=1.652
t=15.21?10.851.652=2.639,v=n1+n2?2=23t = \frac{15.21-10.85}{1.652}=2.639,v=n_1+n_2-2=23t=1.65215.21?10.85?=2.639,v=n1?+n2??2=23
查t界值表,t0.05/2,23=2.069t_{0.05/2,23}=2.069t0.05/2,23?=2.069,由于t>t0.05/2,23t_{0.05/2,23}t0.05/2,23?,p<0.05,拒絕H0,故認為兩種療法效果不同。
總結
以上是生活随笔為你收集整理的统计基础:3.3_假设检验之t检验(Student‘s t test)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: win7下搭建外网svn服务器
- 下一篇: 共赴开源路,共筑新丰碑!2022云栖大会