方差分析中的“元”和“因素”是什么?
試驗中要考察的指標稱為試驗指標,影響試驗指標的條件稱為因素,因素所處的狀態(tài)稱為水平 (通常用于3個或更多水平時;如果只有2個水平考慮T-test);若試驗中只有一個因素改變則稱為單因素試驗,若有兩個因素改變則稱為雙因素試驗,若有多個因素改變則稱為多因素試驗。
方差分析就是對試驗數(shù)據(jù)進行分析,檢驗方差相等的多個正態(tài)總體 均值是否相等,進而判斷各因素對試驗指標的影響是否顯著;根據(jù)影響試驗指標條件的個數(shù)可以區(qū)分為單因素方差分析、雙因素方差分析和多因素方差分析。(來源于:百度百科)
方差分析中的因素
方差分析中的因素通常是人為選定或可控的影響條件,如對樣品的人為處理、樣品自身的標記屬性等。不可控因素如病人的心情、試驗操作人的心情等一般不視為因素或不作為關(guān)注的因素;(還有一些不可控因素或通常認為不會帶來很多影響的因素,如不同的取樣時間、不同的RNA提取時間、提取人、細胞所處的分裂周期等;在某些情況下,如果我們記錄了這些因素并且關(guān)心這些因素時,也會變?yōu)榉讲罘治鲋械囊蛩?。
舉個例子,比如病人服用不同濃度藥物后基因表達變化試驗中:
基因表達是試驗指標;
藥物濃度是因素,假設(shè)有3個水平低濃度、中濃度和高濃度。
這就是單因素方差分析 (one-way ANOVA),比較病人服用不同濃度藥物后基因表達的均值是否相等;
如果同時考慮病人的年齡的影響,則
年齡也是因素,有多個水平比如幼年、青年、成年、老年等。
這就是兩因素方差分析 (two-way ANOVA),比較用藥濃度和年齡對基因表達變化的影響,稱為“主效應(yīng)”影響;有時還需要同時比較濃度+年齡組成的新變量對基因表達變化的影響,稱為“交互效應(yīng)”影響。(如果只是比較濃度+年齡組成的新變量對基因表達變化的影響,就又是單因素方差分析了)
如果再考慮病人的籍貫、藥物種類、吃藥時間、病人Marker突變等的影響,就是多因素方差分析了。
方差分析中的試驗指標
試驗中要考察的指標稱為試驗指標。在上面的例子中基因表達是一個試驗指標,不過很籠統(tǒng),默認為是單個基因的表達,稱為一元方差分析。
那如果是關(guān)注兩個基因或所有基因的表達變化整體是否有差異呢?
這就是多元方差分析,每組樣本不是只包含一個試驗指標而是多個試驗指標。
表現(xiàn)在數(shù)據(jù)形式上:
(一元)方差分析是比較多組向量的均值是否存在顯著差異。
多元方差分析是比較多組矩陣的均值是否存在顯著差異。
因此,比較多組樣本整體基因表達的差異、多組樣本整體菌群構(gòu)成的差異,就需要多元方差分析了。
多元方差分析
在統(tǒng)計學(xué)中,多元方差分析 (MANOVA, multivariate analysis of variance) 是一種對多個分組中檢測了多個指標變量 (這里的變量等同于上面的指標;如每個樣本中每個物種的豐度信息、每個樣本中每個基因的表達信息)的樣本整體均值的檢驗方法 ?。作為一個多變量過程,它在有兩個或多個因變量時使用,并且通常會分別涉及各個因變量的顯著性檢驗。它有助于回答:
自變量 (因素)的變化是否對因變量 (試驗指標)有顯著影響?
因變量之間有什么關(guān)系?
自變量之間有什么關(guān)系?
注: 對應(yīng)上面 - 所有的因素都是自變量 (independent variable),而試驗指標是因變量 (dependent variable)。這在看英文文獻或不同教程時需要注意描述差異。
多元方差分析 (MANOVA, multivariate analysis of variance)的前提假設(shè)可類比于一元方差分析 (觀測指標值的獨立性、正態(tài)性、方差齊性)
數(shù)據(jù)獨立性。
每個分組內(nèi)的檢測指標符合多元正態(tài)分布。
每個分組內(nèi)的檢測指標的協(xié)方差矩陣一致。
但在很多生物、生態(tài)和環(huán)境數(shù)據(jù)集中,多元方差分析的前提假設(shè)通常難以滿足。
一些魯棒性更強、對數(shù)據(jù)分布依賴更少的檢驗方法被提出來并且獲得廣泛應(yīng)用,如ANOSIM (analysis of similarities), PERMANOVA (permutational multivariate analysis of variance) (也稱為NPMANOVA, non-parametric MNOAVA), 和Mantel test。這些方法都通過一個樣本間的距離矩陣或相似性矩陣構(gòu)建ANOVA分析類似的統(tǒng)計量,然后對每組的觀測結(jié)果進行隨機置換來計算顯著性P-value。對于單因素分析,對數(shù)據(jù)唯一的假設(shè)條件就是觀察指標數(shù)據(jù)存在可置換性 (exchangeability)。
下面我們再介紹如何應(yīng)用PERMANOVA來檢驗PcOA等的結(jié)果的顯著性。
往期精品(點擊圖片直達文字對應(yīng)教程)
機器學(xué)習(xí)
后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結(jié)
以上是生活随笔為你收集整理的方差分析中的“元”和“因素”是什么?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入理解内存(3):内存交换技术,虚拟内
- 下一篇: deb和rpm文件安装