生物信息大数据数据库(NCBI、EBI、UCSC、TCGA)
想系統的學習生信數據庫可以先看一下北大的公開課,有一章專門講的數據庫與軟件:
1-生物信息學:導論與方法 北大\10 生物信息數據庫及軟件資源
一個優秀的生信開發者能夠解決如下問題:
- 如何鑒定一個重要的且沒有被解決的生物學問題?
- 如何將該問題轉化為一個可計算的問題?
- 如何提出一個解決此問題的算法?
- 如何實現該算法?
- 如何評估算法?
生信工具使用者需要解決如下問題:
- 每個方法解決的是哪個生物學問題?
- 該方法有哪些基本的假設?
- 每個參數是什么意思,都是用來干什么的?
- 準確度評估,sensitivity and specificity,tradeoff,應該追求哪一個?
- 生物學問題和方法的局限性?
生信資源的分類:
- 集中資源&獨立資源
- 數據庫&軟件工具
- 原始數據庫&二級數據庫
- 命令行工具&網頁服務器工具
NCBI
EBI
UCSC Genome Browser:基因組瀏覽器,表達調控、變異數據,track,ENCODE 非編碼元件(計劃)
集中資源
| NCBI | EBI | UCSC | |
| 鏈接 | Database、Tools、Resource List(A-Z) | by topic  | Table Browser  | 
| Tools | BLAST | BLAST、Exonerate、ClustalW2 | BLAT、In-Silico PCR | 
| Data Repository | GenBank、GEO、SRA | ArrayExpress、ENA、PDBe | ENCODE | 
| DNA/Genome | Genome | Ensembl、Genomes | Ideogram、Recombination Rate、GC Content | 
| DNA/Gene | Gene | Ensembl | UCSC Genes、GENCODE、RefSeq Genes | 
| RNA | RefSeq | Ensembl | mRNAs、ESTs、UniGene | 
| Proteins | Protein, RefSeq、Conserved Domain | UniProt、InterPro、PRIDE | |
| Expression | UniGene | Expression、Atlas | Affy Exon Array、Caltech RNA-seq、Allen Brain | 
| Regulation | Transcription、TFBS、Epigenetics、DNaseI HS | ||
| Literature | PubMed | ||
| Ontology | Gene Ontology | ||
| Comparative Genomics | Taxonomy、HomoloGene | *Ensembl | Conservation、Neandertal | 
| Variation | dbSNP、dbVar | *Ensembl | SNPs、DGV、RepeatMasker | 
| Disease | OMIM、MeSH、dbGaP、ClinVar | GAD、COSMIC、ClinVar、GWAS Catalog、QTLs | 
獨立資源
?
癌癥
DNAnexus Reanalyzes Cancer Genome Atlas Data
DNAnexus完成世界上最大的泛癌癥數據的重分析(附數據下載) - 基因慧
DNANexus:DNANexus專注于建立一個云計算服務器中的DNA數據庫,然后以服務方式將該數據庫提供給研究者和科學家。DNAnexus和谷歌開展技術合作,提供最為全面的DNA數據庫,它可通過美國國家生物技術信息中心(NCBI)下SRA的網站訪問到這些DNA數據(2011年2月,NCBI曾宣布由于聯邦政府削減經費支持逐步淘汰SRA)。
Cancer Genome Atlas:泛癌癥基因組
The Cancer Genome Atlas:就是 TCGA 的全稱,Atlas 古希臘的一個神
TCGA 官網?? User Guides and Help
轉載于:https://www.cnblogs.com/leezx/p/6182161.html
總結
以上是生活随笔為你收集整理的生物信息大数据数据库(NCBI、EBI、UCSC、TCGA)的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 我想是我不够温柔是什么歌呢
- 下一篇: 个性签名八个字的简单
