差异基因的筛选是如何实现的?
生活随笔
收集整理的這篇文章主要介紹了
差异基因的筛选是如何实现的?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
針對微陣列數據篩選差異表達基因問題,國內外學者提出了多種方法,如:適用于不同研究設計和資料類型基因表達譜數據篩選差異表達基因的SAM ( significanceanalysis of microarrays)方法、兩樣本t檢驗、Bonferroni校正法、BH 方法等。方法比較Bonferroni校正法、Sidak 校正法和Hochberg 法可將FWER、FDR控制在很低的水平,但是篩選出的差異表達基因數比較少,不適用基因表達譜篩選差異表達基因的數據分析。相同樣本量和方差條件下, 成組t檢驗方法篩選的差異表達基因數最多,但是不能有效地控制FW ER、FDR 水平, 篩選出的差異表達基因假陽性數過多。通過模擬實驗發現, SAM 方法和BH 法篩選差異表達基因數、假陽性數、FWER 和FDR 均相差不大,均篩選出較多的差異表達基因,且控制了多重檢驗錯誤率。相同樣本量和方差條件下, SAM 方法篩選出的差異表達基因數、約登指數略高于BH法,假陽性數略低于BH法。因此, SAM 方法適用于基因表達譜數據篩選差異表達基因的數據分析。小樣本基因篩選:在小樣本和方差較大情況下,SAM 方法的診斷水平一般,約登指數較小。當樣本重負數量少于5個樣本時使用正態分布T檢驗、F檢驗和方差分析將大大增加差異基因篩選的假陽性率和假陰性率。(TwoclassDif,MultiClassDif,TwoFactorRVM)基于小樣本數據的隨即方差模型(RVM,2003發表于Bioinformatics)校正的T檢驗、F檢驗和方差分析方法,可準確地篩選出顯著性差異基因或者microRNA,篩選結果經擴大樣本檢測后仍為差異表達。小樣本差異表達基因篩選適用于每組樣本3-5次隨機重復的高通量監測數據。
篩選差異基因是指用統計學的方法對高通量的基因數據進行篩選,挑出樣本間有顯著性差異的基因。 微陣列技術和測序技術可同時獲得大量基因的數據,已廣泛應用于生物醫學研究。基因表達譜數據具有高維和樣本量小的特點,如何挖掘其中所蘊含的海量基因信息,深層次研究基因功能,已成為微陣列技術發展和應用的瓶頸。目前,基因表達譜數據分析方法的研究已成為生物與醫學統計學研究領域的重要任務和熱點問題。基因表達譜數據篩選差異表達基因的關鍵是控制多重檢驗錯誤率(假陽性率) ,同時要保證較高的篩選效率。針對微陣列數據篩選差異表達基因問題,國內外學者提出了多種方法,如:適用于不同研究設計和資料類型基因表達譜數據篩選差異表達基因的SAM ( significanceanalysis of microarrays)方法、兩樣本t檢驗、Bonferroni校正法、BH 方法等。
簡單的說,可以通過尋找蛋白差異,將該蛋白進行鑒定,那反向推測是哪個基因。即使沒有人報道過的一個新蛋白,直接測序,然后反向推測出RNA序列,直接blast好了。當然比對蛋白的工具同樣也很多。如果都能知道是哪個基因引起的了,那要定位就非常容易了。有些情況是不知道這種疾病是由什么基因,什么蛋白差異引起的。如果是遺傳性的,那這時候就要做基因定位了,至于方法又非常多,簡單列舉一下有系譜分析法、非整倍體測交法、四分體分析法、連鎖群法、利用染色體易位的基因定位、基因在染色體上的位置的測定、根據重組頻率的基因定位、根據所測基因在某一已知染色體區段中是否存在的基因定位、根據并發事件的基因定位、根據基因行為的定位測定絕對位置的基因定位、基因精細結構分析、 重組頻率定位法、缺失定位法、共轉導定位法、體細胞重組定位法、基因轉變的梯度定位法 。如果想通用一點的做法,可以做全基因組測序(部分測序,或重測序),或者CGH基因芯片,都可以檢測染色體上的差異,包括各種缺失,插入,重復,翻轉,等等。再進一步去篩選即可。
篩選差異基因是指用統計學的方法對高通量的基因數據進行篩選,挑出樣本間有顯著性差異的基因。 微陣列技術和測序技術可同時獲得大量基因的數據,已廣泛應用于生物醫學研究。基因表達譜數據具有高維和樣本量小的特點,如何挖掘其中所蘊含的海量基因信息,深層次研究基因功能,已成為微陣列技術發展和應用的瓶頸。目前,基因表達譜數據分析方法的研究已成為生物與醫學統計學研究領域的重要任務和熱點問題。基因表達譜數據篩選差異表達基因的關鍵是控制多重檢驗錯誤率(假陽性率) ,同時要保證較高的篩選效率。針對微陣列數據篩選差異表達基因問題,國內外學者提出了多種方法,如:適用于不同研究設計和資料類型基因表達譜數據篩選差異表達基因的SAM ( significanceanalysis of microarrays)方法、兩樣本t檢驗、Bonferroni校正法、BH 方法等。
簡單的說,可以通過尋找蛋白差異,將該蛋白進行鑒定,那反向推測是哪個基因。即使沒有人報道過的一個新蛋白,直接測序,然后反向推測出RNA序列,直接blast好了。當然比對蛋白的工具同樣也很多。如果都能知道是哪個基因引起的了,那要定位就非常容易了。有些情況是不知道這種疾病是由什么基因,什么蛋白差異引起的。如果是遺傳性的,那這時候就要做基因定位了,至于方法又非常多,簡單列舉一下有系譜分析法、非整倍體測交法、四分體分析法、連鎖群法、利用染色體易位的基因定位、基因在染色體上的位置的測定、根據重組頻率的基因定位、根據所測基因在某一已知染色體區段中是否存在的基因定位、根據并發事件的基因定位、根據基因行為的定位測定絕對位置的基因定位、基因精細結構分析、 重組頻率定位法、缺失定位法、共轉導定位法、體細胞重組定位法、基因轉變的梯度定位法 。如果想通用一點的做法,可以做全基因組測序(部分測序,或重測序),或者CGH基因芯片,都可以檢測染色體上的差異,包括各種缺失,插入,重復,翻轉,等等。再進一步去篩選即可。
總結
以上是生活随笔為你收集整理的差异基因的筛选是如何实现的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 科学家已经证实DNA中所谓的垃圾片段可以
- 下一篇: 洛克王国白羊宫伊芙利特怎么打?