r语言平均值显著性检验_8小时整理!t检验原理!R语言实现!一文彻底搞定t检验(上)...
因文章內容過長,所以分為上下兩篇
t檢驗(t test)亦稱
t檢驗,以t分布為基礎,是定量資料分析中最常用的假設檢驗方法。(顯著性檢驗的一種,以此來判定數據的差異是由于誤差導致的還是真的有差異)t檢驗的應用條件為:①在單樣本t檢驗中,總體標準差
未知且樣本含量較小(n < 30/50)時,要求樣本來自正態分布總體;②兩小樣本均數比較時.要求兩樣本均來自正態分布總體,且兩樣本總體方差相等若兩樣本總體方差不相等,則用 檢驗③對兩大樣本( 均大于30/50)的均數比較,可用Z檢驗。但在實際應用時,與上述條件略有偏差,只要其分布為單峰且近似對稱分布,一般影響不是太大。第一節:樣本均數與總體均數的比較
樣本與總體均數比較的檢驗亦稱為單樣本t檢驗,該種檢驗就是樣本均數代表的未知總體均數
已知總體均數 (一般為理論值或標準值)的比較。在
成立的條件下,檢驗統計量的計算公式如下: (8.1)注:實際上就是在做標準化和中心化,減去均值中心化,除以標準誤標準化(平均值的標準差=標準誤),這樣才能給符合標準t分布,才能進行查表。
例8.1 已知某地新生兒出生體重均數為3.36 kg 。從該地農村隨機抽取40名新生兒,測得其平均體重為3.27 kg,標準差為0.44kg,問該地農村新生兒出生體重是否與該地新生兒平均出生體重不同。
(1)建立檢驗假設,確定檢驗水準
,該地農村新生兒體重與該地新生兒平均出生體重相同 ,該地農村新生兒體重與該地新生兒平均出生體重不同注:
是原假設, 為備擇假設,如果差異不是由誤差引起的,那么就否定原假設,同意備擇假設。 是顯著性水平(2)計算統計量,由式(8.1),得
注:關于自由度
,因為平均值已知,所以只有39個值的取值可以是隨便取得,另外一個根據其余39個都可以知道。(3)確定P值,作出統計推斷 根據自由度39和t=-1.294的絕對值查t界值表,得0.2< P<0.4,則按
的檢驗水準,不拒絕 ,差別無統計學意義,尚不能認為該地農村新生兒體重與該地新生兒平均出生體重不同。t界值表R語言實現
這里我們任意構建6個數據作為演示
#構建數據集合 mydata<-c(24.3,20.6,25.6,20.4,21.5,22.7) #判斷樣本是否正態 shapiro.test(mydata)可以看到,p值為0.5009大于0.05的顯著性水平,但是我們不能證明樣本數據就是服從正態分布的,只能說不能拒絕樣本來自于正態總體的原假設。
舉個例子(取正整數1-10,明顯不符合正態分布)
data <- c(1:10) shapiro.test(data)在R中可以使用t.test()函數來進行單樣本t檢驗,讓我們看一下這個函數的參數
?t.test注:x為非空數值型向量;y是可選的數值型向量;alternative用于指定備擇假設方法,two.sided是雙尾檢驗,less是左側單尾檢驗,greater是右側單尾檢驗;mu是數據的真實均值;paired用于指定是否進行配對檢驗,默認為FALSE;var.equal用于指定兩個方差是否相等;conf.level指定置信水平,默認為0.95。
#單樣本t檢驗 mean(mydata) t.test(mydata, alternative = "two.sided", mu = 22.5)結果解讀:df=5(自由度為5),P=0.9852>0.05 不能拒絕原假設。
第二節:配對設計均數的比較
配對設計均數的比較亦稱為配對t檢驗。配對設計資料主要有以下三種情況①配對的兩個受試對象分別接受兩種不同處理之后的數據,如把同性別、年齡相近且相同病隋的病人配成一對;②同一樣品用兩種方法(或儀器)檢驗出的結果;③同一受試對象兩個部位的測定數據。配對t檢驗其目的是推斷兩種處理(或方法)的結果有無差別。
配對設計均數比較的原理是:設兩種處理的效應相同,即
,則 。于是檢驗可看成是差值的樣本均數 代表的未知總體均數 與已知總體均數 的比較,因此,其檢驗統計量可由式(8.1)導出: (8.2)例8.2 對24名兒童接種卡介苗,按同年齡、同性別配成12對,每對中的2名兒童分別接種兩種結核菌素,一種為標準品,另一種為新制品,分別注射在兒童的前臂,72h后記錄兩種結茵素的皮膚反應平均直徑,見表8.1,問兒童皮膚對兩種不同結核菌素的反應性有無差別?
(1)建立檢驗假設,確定檢驗水準
,兒童皮膚對不同結核菌素的反應性無差別 ,兒童皮膚對不同結核菌素的反應性有差別(2)計算檢驗統計量 首先計算差值
與 見表8.1,由此得到 , ,按式( 8.2)計算,得
(3)確定P值,作出統計推斷 查t界值表得
,而4. 520 > 4.437 ,故P<0.001。則按的檢驗水準,拒絕 ,接受 ,差別有統計學意義,可認為兒童皮膚對不同結核菌素的反應性有差別。注:比臨界t值還要大得一定是在兩端,兩端都是小概率事件,如果小概率事件發生了,我們就認為這就是有顯著性差異的,而不是誤差。
R語言實現
#構造數據集合,上下對應的為一組,求差值,一共6組 x1<-c(4.5,5.2,4.3,6.6,3.1,8.2) x2<-c(3.3,6.7,8.1,3.5,5.6,2.4) t.test(x1,x2,alternative = "two.sided",paired=T)結果解讀:P=0.8074>0.05 不能拒絕原假設
總結
以上是生活随笔為你收集整理的r语言平均值显著性检验_8小时整理!t检验原理!R语言实现!一文彻底搞定t检验(上)...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何在graphpad表示出正负误差_G
- 下一篇: cv2 orb 图像拼接_OpenCV