UA MATH571B 试验设计 2k析因设计理论下
UA MATH571B 試驗設計 2k析因設計理論下
- Confounding
- Blocking 222^222析因設計
- Blocking 232^323析因設計
- principal block
- Fractional 2k2^k2k Design
- 23?12^{3-1}23?1 Design
- Design Resolution
- 2k?p2^{k-p}2k?p Design
這一講介紹2k2^k2k析因設計中的blocking、confounding的概念以及分數2k2^k2k析因設計的基本原理。Blocking比較簡單,當2k2^k2k析因試驗有潛在的nuisance factor的時候就做blocking就可以了,在kkk個treatment factor之外再做blocking的話殘差自由度就不會為0,可以做ANOVA,分析方法比較常規。
Confounding
然而還是有上一講提到的問題,試驗資源不一定能保證2k2^k2k析因設計能做重復試驗,那么要保證每個block有2k2^k2k個試驗單元自然也是很困難的。這時就需要Confounding技術了。Confounding的好處是能夠讓Blocking 2k2^k2k析因試驗用2k2^k2k個試驗單元完成(但每個block包含的試驗單元是少于2k2^k2k的),缺點是會導致至少一個treatment effect與block effect混淆,也就是統計模型將無法識別出那個treatment effect。下面介紹對Blocking 2k2^k2k析因試驗做confounding的方法。
Blocking 222^222析因設計
我們先討論最簡單的情況,假設我們要對222^222設計做Blocking,假設Block數目為2,相當于就要把只有一次試驗的222^222設計的4個試驗單元隨機分入兩個Block,每個Block會有兩個試驗單元。一種分法如下圖所示,將effect (1),ab(1),ab(1),ab作為一個block,將a,ba,ba,b作為另一個block。
這時我們研究一下 交互項AB的效應,參考UA MATH571B 試驗設計V 2K析因設計簡介中介紹的,可以寫成
12[ab+(1)?a?b]\frac{1}{2}[ab + (1) - a - b]21?[ab+(1)?a?b]
這個正好是Block effect,因此我們稱AB confounded with blocks。
Blocking 232^323析因設計
假設我們要對232^323設計做Blocking,假設Block數目為2,相當于就要把只有一次試驗的232^323設計的8個試驗單元隨機分入兩個Block,每個Block會有四個試驗單元。如果ABC confounded with blocks,那么我們應該將effect (1),ab,ac,bc(1),ab,ac,bc(1),ab,ac,bc作為一個block,將a,b,a,abca,b,a,abca,b,a,abc作為另一個block。
下面推導為什么應該這樣分組。在UA MATH571B 試驗設計III 單因素試驗設計3中我們介紹了效應的線性組合與contract,在232^323析因設計中,我們可以用下面的contract表示各個treatment effect:
L=α1x1+α2x2+α3x3L = \alpha_1 x_1 + \alpha_2 x_2 + \alpha_3 x_3 L=α1?x1?+α2?x2?+α3?x3?
其中αi=0,1,xi=0,1,?i=1,2,3\alpha_i=0,1,\ x_i = 0,1,\forall i=1,2,3αi?=0,1,?xi?=0,1,?i=1,2,3,i=1,2,3i=1,2,3i=1,2,3分別代表因子A,B,C,αi\alpha_iαi?代表交叉相中是否加入這個因子,xi=0x_i=0xi?=0表示因子是low level,xi=1x_i=1xi?=1表示因子是high level。LLL是Galois域GF(2)GF(2)GF(2)上的多項式,關于Galois域的介紹可以參考UA MATH636 信息論9 有限域簡介。因為ABC confounded with blocks,所以α1=α2=α3=1\alpha_1 = \alpha_2 = \alpha_3 = 1α1?=α2?=α3?=1,因此
L=x1+x2+x3L = x_1 + x_2 + x_3L=x1?+x2?+x3?
Galois域GF(p)GF(p)GF(p)上加法a+ba+ba+b的定義是(a+b)modp(a+b) \mod p(a+b)modp,所以各項treatment effect表示為
(1):L=0+0+0=0mod2a:L=1+0+0=1mod2b:L=0+1+0=1mod2c:L=0+0+1=1mod2ab:L=1+1+0=0mod2ac:L=1+0+1=0mod2bc:L=0+1+1=0mod2abc:L=1+1+1=1mod2(1): L = 0 + 0 + 0 = 0 \mod 2 \\ a: L = 1 + 0 + 0 =1 \mod 2 \\ b: L = 0 + 1+ 0 = 1 \mod 2 \\ c: L = 0 + 0 + 1 = 1 \mod 2 \\ ab: L = 1 + 1 + 0 = 0 \mod 2 \\ ac: L = 1 + 0 +1 = 0 \mod 2 \\ bc: L = 0 +1 + 1 = 0 \mod 2 \\ abc: L = 1 + 1 +1= 1 \mod 2 \\ (1):L=0+0+0=0mod2a:L=1+0+0=1mod2b:L=0+1+0=1mod2c:L=0+0+1=1mod2ab:L=1+1+0=0mod2ac:L=1+0+1=0mod2bc:L=0+1+1=0mod2abc:L=1+1+1=1mod2
根據contract的不同,將上述treatment effect分為兩組,就是上圖所示的結果。稱包含(1)(1)(1)的block1為principal block。
principal block
之所以稱包含(1)(1)(1)的block1為principal block是因為其他block包含的treatment effect可以用principal block中的treatment effect生成。下面介紹一下treatment effect的運算規則。上面介紹的contract的方法實際上給了一種treatment effect的uniquely decodable code的編碼方式,比如(1)(1)(1)的是(0,0,0)(0,0,0)(0,0,0),abcabcabc的是(1,1,1)(1,1,1)(1,1,1)。首先確定aaa在另一個block,要生成bbb可以考慮碼的加法(GF(2)GF(2)GF(2)中的加法)
(1,0,0)+(1,1,0)=(0,1,0)(1,0,0)+(1,1,0) = (0,1,0)(1,0,0)+(1,1,0)=(0,1,0)
為了簡化記號,我們將這個關系記為
a?ab=a2b=(1)b=ba \cdot ab = a^2 b = (1)b = ba?ab=a2b=(1)b=b
類似的可以寫出另外兩個treatment
a?ac=a2c=ca?bc=abca \cdot ac = a^2c = c \\ a \cdot bc = abca?ac=a2c=ca?bc=abc
注意這里指的“生成”,并不是指的treatment effect可以這樣計算,而是說treatment effect的記號滿足這種運算規則。treatment effect的值還是需要基于試驗數據計算的。這種記號運算的規則以及編碼方式比較有用。
Confounding技術能保證殘差自由度不會為0,所以confounding主要是用在設計的步驟的,獲得試驗數據之后就按常規ANOVA的思路分析即可。
Fractional 2k2^k2k Design
這一部分討論更窮的情況,假設試驗資源甚至不夠做完一組2k2^k2k設計,那就只能做半組或者1/4組了,這種試驗設計叫Fractional 2k2^k2k Design。
23?12^{3-1}23?1 Design
假設我們要研究A、B、C三個factor,但我們沒那么多經費去做232^323試驗,只能用一般的試驗資源,做一個23?12^{3-1}23?1試驗。前面介紹confouding技術的時候就有這個性質,把2k2^k2k試驗單元分入兩個block,那么每個block中的treatment effect數目就是2k?12^{k-1}2k?1。基于confounding技術,我們可以進一步建立起把2k2^k2k設計變成2k?12^{k-1}2k?1設計的操作。前面的Blocking 232^323析因設計是把ABC confounded,這里是定義I=ABCI = ABCI=ABC,稱這個式子為defining relation,需要注意的是2k?12^{k-1}2k?1不可能做得出full model的識別,只能識別出full model的一半的效應,所以推導的結果是我們要研究哪些factor的effect。
現在,基于前面介紹的effect記號的規則,我們會發現:
A=A?I=A?ABC=A2BC=BCAB=AB?I=AB?ABC=A2B2C=CA = A \cdot I = A \cdot ABC = A^2BC = BC \\ AB = AB \cdot I= AB \cdot ABC = A^2B^2C = C A=A?I=A?ABC=A2BC=BCAB=AB?I=AB?ABC=A2B2C=C
也就是說在I=ABCI = ABCI=ABC這個defining relation下,AAA和BCBCBC的因子效應是相等的,ABABAB和CCC的因子效應是相等的,稱AAA和BCBCBC是alias,ABABAB和CCC是alias,當然不止這兩對alias,這里不一一列舉。
Design Resolution
我們稱上面這種I=ABCI = ABCI=ABC的23?12^{3-1}23?1設計為resolution III design,記為2III(3?1)2_{III}^{(3-1)}2III(3?1)? Design。最常用三種Design Resolution是III、IV、V的:
2k?p2^{k-p}2k?p Design
對于任意的這種分數設計,這里介紹幾個設計試驗的原則:
highest possible resolution的意思是能用resolution IV design,就不用resolution III design。教材有個例子挺好的,這里摘錄一下:對于26?22^{6-2}26?2,we used the generators E = ABC and
F = BCD, thereby producing a design of resolution IV. This is the maximum resolution
design. If we had selected E = ABC and F = ABCD, the complete defining relation would
have been I = ABCE = ABCDF = DEF, and the design would be of resolution III. 第二個原則可以參考教材的這個例子
Notice that the defining rela-tion for design C has only one four-letter word, whereas the other designs have two or three. Thus, design C minimizes the number of words in the defining relation that are of minimum length. We call such a design a minimum aberration design.
總結
以上是生活随笔為你收集整理的UA MATH571B 试验设计 2k析因设计理论下的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH571B 试验设计 2k析
- 下一篇: UA MATH 571B 回归 QE练习