bartlett方差齐性检验_基于R实现统计中的检验方法方差分析
作者:徐濤,19年應(yīng)屆畢業(yè)生,專(zhuān)注于珊瑚礁研究,喜歡用R各種清洗數(shù)據(jù)。
知乎:
https://www.zhihu.com/people/parkson-19/posts
前言
方差分析(均數(shù)的顯著性檢驗(yàn))
方差分析(Analysis of Variance,簡(jiǎn)稱(chēng)ANOVA),又稱(chēng)“變異系數(shù)分析”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。
1.適用條件方差分析數(shù)據(jù)必須滿(mǎn)足3個(gè)條件即獨(dú)立、正態(tài),方差齊次性。
---------------------#正態(tài)性檢驗(yàn)#---------------------#Shapiro-Wilk檢驗(yàn)用來(lái)檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,類(lèi)似于線性回歸的方法一樣,是檢驗(yàn)其于回歸曲線的殘差。#該方法作者推薦在樣本量很小的時(shí)候使用,比如N<20。但是也有作者推薦在大數(shù)據(jù)集上使用。該作者將這種修改#后的方法運(yùn)用在R語(yǔ)言的stats包中的shapiro.test函數(shù)中。該檢驗(yàn)原假設(shè)為H0:數(shù)據(jù)集符合正態(tài)分布。#R語(yǔ)言中的Shapiro-Wilk檢驗(yàn)(W檢驗(yàn)),shapiro.test(x)該函數(shù)只有一個(gè)參數(shù)即數(shù)據(jù)集x。x可以是數(shù)值型向量,允許存在NA#但是非丟失數(shù)據(jù)需要在3-5000內(nèi)。##example###11個(gè)隨機(jī)抽取的樣本的體重(斤)數(shù)據(jù)為:148,154,158,160,161,162,166,170,182,195,236k148,2.分類(lèi)(按因素分)
單因素方差分析、二因素方差分析和多因素方差分析。(單因素方差分析主要對(duì)因素的主效應(yīng)進(jìn)行分析,而二因素及多因素方差分析除了多組效應(yīng)分析外,還可對(duì)因素間的交互作用進(jìn)行分析。分析交互作用時(shí),觀測(cè)值必須有重復(fù))
3.R實(shí)例R中的函數(shù)aov()用于方差分析的計(jì)算,其調(diào)用格式為:
aov(formula,data=NULL,projections=FALSE,qr=TRUE,contrasts=NULL,...)#其中的參數(shù)formula表示方差分析的公式,在單因素方差分析中即為X~A;data表示做方差分析的數(shù)據(jù)框;projections為邏輯值,表示是否返回預(yù)測(cè)結(jié)果;qr同樣是邏輯值,表示是否返回QR分解結(jié)果,默認(rèn)為T(mén)RUE;
contrasts是公式中的一些因子的對(duì)比列表。通過(guò)summary()可列出分析表的詳細(xì)結(jié)果。#詳情參見(jiàn)R語(yǔ)言實(shí)戰(zhàn)(第2版)page:201.
單因素方差分析
---------------------#單因素方差分析#---------------------#單因素方差分析比較的是分類(lèi)因子定義的兩個(gè)或多個(gè)組別中的因變量均值。以multcomp包中cholesterol數(shù)據(jù)集為例。##正態(tài)性檢驗(yàn)
library(multcomp)
head(cholesterol)
str(cholesterol)
shapiro.test(cholesterol$response)
??????Shapiro-Wilk?normality?test
data:??cholesterol$response
W?=?0.97722,?p-value?=?0.4417#結(jié)果表明,p=0.4417>0.05,接受原假設(shè),說(shuō)明數(shù)據(jù)在五個(gè)水平下都是正態(tài)分布的。
##方差齊性檢驗(yàn)
bartlett.test(response~trt,data=cholesterol)
?Bartlett?test?of?homogeneity?of?variances
data:??response?by?trt
Bartlett's?K-squared?=?0.57975,?df?=?4,?p-value?=?0.9653#結(jié)果表明,p=0.9653,接受原假設(shè),說(shuō)明數(shù)據(jù)在不同水平下是等方差的。
##單因素方差分析
fitsummary(fit)
????????????Df?Sum?Sq?Mean?Sq?F?value???Pr(>F)????
trt??????????4?1351.4???337.8???32.43?9.82e-13?***
Residuals???45??468.8????10.4?????????????????????
---
Signif.?codes:??0?‘***’?0.001?‘**’?0.01?‘*’?0.05?‘.’?0.1?‘?’?1#結(jié)果表明,5種治療方式間的效果差異非常顯著。
##多重比較(多重T檢驗(yàn))#以上單因素方差分析可以得出,五組之間治療效果有顯著差異,但是我們不知道哪種療法與其他療法的不同,多重比較可以解決這個(gè)問(wèn)題。#R語(yǔ)言中TukeyHSD()函數(shù)提供了對(duì)各組均值差異的成對(duì)檢驗(yàn)。
TukeyHSD(fit)
??Tukey?multiple?comparisons?of?means
????95%?family-wise?confidence?level
Fit:?aov(formula?=?response?~?trt,?data?=?cholesterol)
$trt
??????????????????diff????????lwr???????upr?????p?adj
2times-1time???3.44300?-0.6582817??7.544282?0.1380949
4times-1time???6.59281??2.4915283?10.694092?0.0003542
drugD-1time????9.57920??5.4779183?13.680482?0.0000003
drugE-1time???15.16555?11.0642683?19.266832?0.0000000
4times-2times??3.14981?-0.9514717??7.251092?0.2050382
drugD-2times???6.13620??2.0349183?10.237482?0.0009611
drugE-2times??11.72255??7.6212683?15.823832?0.0000000
drugD-4times???2.98639?-1.1148917??7.087672?0.2512446
drugE-4times???8.57274??4.4714583?12.674022?0.0000037
drugE-drugD????5.58635??1.4850683??9.687632?0.0030633#結(jié)果表明,1time和2times的均值差異不顯著(p=0.138),而1time和4times間的差異非常顯著(p<0.01)
一般圖像給的效果會(huì)更加直觀,R中multcomp包中的glht()函數(shù)提供了多重均值比較更為全面的方法。
par(mar=c(5,4,6,2))tuk"Tukey"))
備注:
1)在單因素方差分析前需要對(duì)數(shù)據(jù)進(jìn)行正態(tài)性和方差齊性檢驗(yàn)。除了以上提及的檢驗(yàn)方法,R中還可以使用Q-Q圖來(lái)檢驗(yàn)正態(tài)性假設(shè)。#詳情參見(jiàn)R語(yǔ)言實(shí)戰(zhàn)(第2版)page:206-207.
2)單因素方差分析的擴(kuò)展為單因素協(xié)方差分析,包含一個(gè)或多個(gè)定量的協(xié)變量。(詳情參見(jiàn)R語(yǔ)言實(shí)戰(zhàn)(第2版)page:208.)
二因素方差分析(雙因素方差分析)
---------------------#二因素方差分析#---------------------#以基礎(chǔ)安裝包中的ToothGrowth數(shù)據(jù)集為例,60只豚鼠,自變量包括兩種投喂方法(橙汁或VC),不同喂食方法中抗壞血酸含量有#三種水平,牙齒長(zhǎng)度為因變量,每種處理都被分配10只豚鼠。head(ToothGrowth)
???len?supp?dose1??4.2???VC??0.52?11.5???VC??0.53??7.3???VC??0.54??5.8???VC??0.55??6.4???VC??0.56?10.0???VC??0.5
ToothGrowth$doseas.factor(ToothGrowth$dose)
備注:
1)R仍然用函數(shù)aov()作雙因素方差分析,只需將formula改為x~A+B+A:B或x~A*B的形式即可。(且分析包含了交互作用的方差分析)
2)多因素方差分析和雙因素方差分析過(guò)程類(lèi)似。
此篇為學(xué)習(xí)筆記,參考網(wǎng)上和書(shū)本知識(shí),整理匯總,方便以后學(xué)習(xí)查找。
tips
1)T檢驗(yàn)和方差分析有何區(qū)別?
t檢驗(yàn)適用于兩個(gè)變量均數(shù)間的差異檢驗(yàn),多于兩個(gè)變量間的均數(shù)比較要用方差分析。
2)方差分析與獨(dú)立樣本T檢驗(yàn)的前提條件是相同的,即正態(tài)性和方差齊性。
參考[1]R語(yǔ)言方差分析的內(nèi)容全部在這里了 - 云+社區(qū) - 騰訊云
[2]T檢驗(yàn)與F檢驗(yàn)的區(qū)別_f檢驗(yàn)和t檢驗(yàn)的關(guān)系 - Little_Rookie - 博客園
[3]顧志峰,葉乃好,石耀華.實(shí)用生物統(tǒng)計(jì)學(xué)[M].北京:科學(xué)出版社,2012年.
[4]R語(yǔ)言 Shapiro-Wilk檢驗(yàn)
[5]【數(shù)據(jù)分析 R語(yǔ)言實(shí)戰(zhàn)】學(xué)習(xí)筆記 第八章 方差分析與R實(shí)現(xiàn)
[6]Robert I. Kabacoff.R語(yǔ)言實(shí)戰(zhàn)[M].北京:人民郵電出版社,2016年.
往期精彩:
R語(yǔ)言實(shí)現(xiàn)基本統(tǒng)計(jì)分析之t檢驗(yàn)
R中數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)的輸入
R語(yǔ)言:以多列標(biāo)準(zhǔn)篩選特定行
用R語(yǔ)言實(shí)現(xiàn)信息度量
公眾號(hào)后臺(tái)回復(fù)關(guān)鍵字即可學(xué)習(xí)
回復(fù)?爬蟲(chóng)????????????爬蟲(chóng)三大案例實(shí)戰(zhàn)回復(fù)?Python???????1小時(shí)破冰入門(mén)回復(fù)?數(shù)據(jù)挖掘?????R語(yǔ)言入門(mén)及數(shù)據(jù)挖掘回復(fù)?人工智能?????三個(gè)月入門(mén)人工智能回復(fù)?數(shù)據(jù)分析師??數(shù)據(jù)分析師成長(zhǎng)之路?回復(fù)?機(jī)器學(xué)習(xí)?????機(jī)器學(xué)習(xí)的商業(yè)應(yīng)用回復(fù)?數(shù)據(jù)科學(xué)?????數(shù)據(jù)科學(xué)實(shí)戰(zhàn)回復(fù)?常用算法? ? ?常用數(shù)據(jù)挖掘算法
給我【好看】
你也越好看!
總結(jié)
以上是生活随笔為你收集整理的bartlett方差齐性检验_基于R实现统计中的检验方法方差分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: jpg 神经网络 手势识别_在STM32
- 下一篇: moead算法流程步骤_数据聚类(一)常