UA MATH571B 试验设计 2k析因设计理论上
UA MATH571B 試驗(yàn)設(shè)計(jì) 2k析因設(shè)計(jì)理論上
- 2k2^k2k析因設(shè)計(jì)
- 因子效應(yīng)的計(jì)算
- ANOVA table
- Single-replicate 2k2^k2k析因設(shè)計(jì)
2k2^k2k析因設(shè)計(jì)(factorial design)在QE中幾乎是必考的內(nèi)容,但經(jīng)過(guò)上課作業(yè)考試以后感覺(jué)還是停留在入門的程度,不得已只能自學(xué)一下教材。2k2^k2k析因設(shè)計(jì)包括的內(nèi)容是2k2^k2k析因設(shè)計(jì)的基本原理、Confounding和fractional 2k2^k2k析因設(shè)計(jì),分上下兩篇博文介紹它們的概念和統(tǒng)計(jì)模型。
先澄清基本概念,2k2^k2k析因設(shè)計(jì)中的兩個(gè)關(guān)鍵詞,析因設(shè)計(jì)在UA MATH571B 試驗(yàn)設(shè)計(jì)V 析因設(shè)計(jì)簡(jiǎn)介中已經(jīng)介紹過(guò)了,它與之前的RCBD最大的不同在于析因設(shè)計(jì)分析的treatment factor不止一個(gè);2k2^k2k的含義是假設(shè)有kkk個(gè)treatment factor,那么每個(gè)factor我們只取兩個(gè)factor level來(lái)做試驗(yàn),一個(gè)level被稱為high level,另一個(gè)被稱為low level。
通常我們不會(huì)用2k2^k2k析因設(shè)計(jì)去做一個(gè)完整的試驗(yàn),而是把它作為一個(gè)研究的預(yù)試驗(yàn)。它的好處是能夠以較少的試驗(yàn)資源分析因子的重要性,幫助我們排除掉一些不重要的因子與效應(yīng),從而提高試驗(yàn)效率并構(gòu)建更準(zhǔn)確的統(tǒng)計(jì)模型。
2k2^k2k析因設(shè)計(jì)
先來(lái)學(xué)習(xí)一下2k2^k2k析因設(shè)計(jì)中的treatment effect的記號(hào)。假設(shè)我們想要研究四個(gè)treatment factor,那么只有一個(gè)factor為high level的effect我們記為:a,b,c,d;兩個(gè)factor為high level的效應(yīng)我們記為:ab, ac, ad, dc,db,cd;三個(gè)factor為high level的效應(yīng)記為:abc, abd, acd, bcd;四個(gè)factor為high level的效應(yīng)記為:abcd;比如a表示只有因素A為high level,BCD均為low level的effect;abd表示因素ABD均為high level,C為low level的effect,另外用(1)表示所有因素均為low level的effect。但通常我們不按照這個(gè)順序排列,我們按standard order來(lái)排列這些effect:
(1),a,b,ab,c,ac,bc,abc,d,ad,bd,abd,cd,acd,bcd,abcd(1), a, b, ab, c, ac, bc, abc, d, ad, bd, abd, cd, acd, bcd, abcd(1),a,b,ab,c,ac,bc,abc,d,ad,bd,abd,cd,acd,bcd,abcd
按字母順序排列,但新出現(xiàn)一個(gè)effect之后,要把它和以前的effect的組合也要寫(xiě)上去。
這張表給出了分析2k2^k2k析因設(shè)計(jì)試驗(yàn)結(jié)果的一般性步驟。首先計(jì)算treatment effect,然后用初始模型(full model,包含所有的effects和interactions)做一下統(tǒng)計(jì)分析,根據(jù)統(tǒng)計(jì)分析的結(jié)果,我們可以將不重要的factor或者interaction刪去,從而優(yōu)化統(tǒng)計(jì)模型,最后對(duì)優(yōu)化后的模型進(jìn)行分析,為后續(xù)試驗(yàn)提供指導(dǎo)。
因子效應(yīng)的計(jì)算
在上面介紹的因子效應(yīng)的表示方法使得每一個(gè)因子效應(yīng)都可以表示成一個(gè)contract,以上面介紹的242^424設(shè)計(jì)為例,因子效應(yīng)的一般表示為
(a±1)(b±1)(c±1)(d±1)(a \pm 1)(b \pm 1)(c \pm 1)(d \pm 1)(a±1)(b±1)(c±1)(d±1)
比如要計(jì)算因子AAA的效應(yīng)就可以用
ContractA=(a?1)(b+1)(c+1)(d+1)Contract_A = (a - 1)(b +1)(c +1)(d+ 1) ContractA?=(a?1)(b+1)(c+1)(d+1)
比如因子ACACAC的交叉效應(yīng)可以表示為
ContractAC=(a?1)(b+1)(c?1)(d+1)Contract_{AC} =(a - 1)(b + 1)(c - 1)(d+ 1) ContractAC?=(a?1)(b+1)(c?1)(d+1)
展開(kāi)后各項(xiàng)就是treatment effect,這種操作能夠?qū)⒁蜃有?yīng)用treatment effect表示出來(lái)(treatment effect是比較具體的,factor level combinations的effect)。根據(jù)Contract的性質(zhì)可以把因子的平方和也計(jì)算出來(lái),
SSAC=1n24ContractAC2SS_{AC} = \frac{1}{n2^4}Contract_{AC} ^2SSAC?=n241?ContractAC2?
其中nnn是獨(dú)立重復(fù)試驗(yàn)次數(shù)。這種計(jì)算表示方法可以推廣至任意多個(gè)factor。
ANOVA table
下面是2k2^k2k析因設(shè)計(jì)的ANOVA table,有nnn次獨(dú)立重復(fù)試驗(yàn),kkk個(gè)factor的兩個(gè)level共有2k2^k2k中組合方式,因此總的試驗(yàn)單位有n2kn2^kn2k。每種contract占一個(gè)自由度,因此所有的contract一種占2k2^k2k個(gè)自由度(就是上面contract的展開(kāi)式的個(gè)數(shù)),所以殘差的自由度為2k(n?1)2^k(n-1)2k(n?1)。當(dāng)只有一次重復(fù)試驗(yàn)時(shí),殘差沒(méi)有自由度,這時(shí)不能做ANOVA F檢驗(yàn);當(dāng)有兩個(gè)及兩個(gè)以上自由度時(shí),這時(shí)分析方法就是常規(guī)的ANOVA。
Single-replicate 2k2^k2k析因設(shè)計(jì)
畢竟2k2^k2k析因設(shè)計(jì)只是一個(gè)預(yù)實(shí)驗(yàn)步驟,所以試驗(yàn)資源能省則省,很多時(shí)候就只能做一個(gè)重復(fù)試驗(yàn),上面分析到只有一次重復(fù)試驗(yàn)時(shí),ANOVA是沒(méi)辦法用的,那我們又應(yīng)該用什么工具來(lái)分析試驗(yàn)結(jié)果呢?Daniel (1959)提出,我們可以用normal probability plot方法。根據(jù)上面已經(jīng)介紹的方法,我們可以計(jì)算出因子效應(yīng)的估計(jì)以及平方和。下圖是一個(gè)示例,第三行的percent contribution指的是因子的平方和相對(duì)總平方和的比值,其實(shí)從這個(gè)圖中我們已經(jīng)可以看出點(diǎn)名堂了,顯然因子B的contribution是非常小的,連帶著包含B的交互效應(yīng)也是比較小的。
下面我們假設(shè)因子的效應(yīng)(第一列)是正態(tài)(或者至少是位置-尺度參數(shù)族)的,記其分布函數(shù)為FFF,將其從上到下記為e1.?,e15e_1.\cdots,e_{15}e1?.?,e15?,將其按從小到大的順序排序,記順序統(tǒng)計(jì)量為e(1),?,e(15)e_{(1)},\cdots,e_{(15)}e(1)?,?,e(15)?,它們對(duì)應(yīng)理論概率估計(jì)值為(參考UA MATH571A 一元線性回歸IV 模型診斷介紹的正態(tài)概率估計(jì)值)
p^i=F(ei?μσ)=i+0.37515+0.25,i=1,?,15\hat p_i = F\left( \frac{e_{i}-\mu}{\sigma} \right) = \frac{i + 0.375}{15 + 0.25},i=1,\cdots,15p^?i?=F(σei??μ?)=15+0.25i+0.375?,i=1,?,15
作出(e(i),p^i)(e_{(i)},\hat p_i)(e(i)?,p^?i?)的圖像,這個(gè)就叫正態(tài)概率圖(normal probability plot),這個(gè)例子的正態(tài)概率圖如下圖所示
比較集中的那些因子效應(yīng)說(shuō)明都是不顯著的,我們可以把他們排除掉。位置比較偏的這幾個(gè)效應(yīng)是顯著的,我們要保留下來(lái),因此因子A,C,D,AC,AD被保留,我們優(yōu)化后的模型就是只包含這幾個(gè)效應(yīng)的模型。利用原來(lái)的數(shù)據(jù)集對(duì)這個(gè)新的模型進(jìn)行分析。因?yàn)橐蜃覤的影響非常小,所以它是high level還是low level沒(méi)有顯著區(qū)別,我們就可以把在因子B high level和low level下分別進(jìn)行的兩次試驗(yàn)看成是兩次獨(dú)立重復(fù)試驗(yàn),這樣nnn就等于2了,我們真正分析的試驗(yàn)變成了232^323試驗(yàn)。這時(shí)稱多出來(lái)的這個(gè)replicate叫做hidden replicate。
總結(jié)
以上是生活随笔為你收集整理的UA MATH571B 试验设计 2k析因设计理论上的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: UA MATH564 概率论 QE练习题
- 下一篇: UA MATH571B 试验设计 2k析