数据库 | OMIM (在线人类孟德尔遗传)数据库简介
? OMIM,即在線人類孟德爾遺傳(Online Mendelian Inheritance in Man),是一個綜合的、權威的研究人類表型和基因型關系的數據庫,收錄了所有已知的孟德爾疾病,和超過16000個基因的信息(涵蓋一大半人類已知的基因)。
? OMIM并不是創(chuàng)造了這些數據,而是對已發(fā)表的研究結果的非常系統(tǒng)的整理與整合,并每日更新、免費獲取。OMIM中的一個常見的疾病的頁面,其內容類似一篇綜述,包含:表型與基因的關系、臨床簡介、疾病基本信息與描述、臨床特征、診斷、臨床管理、發(fā)病機制、分子遺傳、群體遺傳、動物模型、背景歷史、研究進展和參考文獻。
? 網站條目 (Entries)也包含了大量其他遺傳資源 (數據庫)的鏈接,可供與遺傳疾病有關的醫(yī)生、專業(yè)人員、遺傳學研究人員、相關學科和醫(yī)學的高年級學生使用。
? OMIM的發(fā)展歷史悠久,最早由維克多·A·麥考斯克 (Victor A. McKusick)博士在20世紀60年代早期創(chuàng)建,作為孟德爾性狀和疾病 (Mendelian traits and disorders)的目錄,命名為人類孟德爾遺傳 (Mendelian Inheritance in Man,MIM)。
? 在1966年到1998年間,MIM出版了12個版本。在線版的OMIM是1985年由美國國家醫(yī)學圖書館 (National Library of Medicine)和約翰·霍普金斯大學 (Johns Hopkins)威廉·H·韋爾奇醫(yī)學圖書館 (William H. Welch Medical Library)合作創(chuàng)建的。從1987年開始在互聯(lián)網上廣泛使用。1995年,美國國家生物技術信息中心 (NCBI)參與了OMIM的萬維網開發(fā)。
? 麥考斯克博士是繪制人類基因組圖譜的早期倡導者,并密切參與了人類基因組計劃的早期,并擔任了人類基因組組織 (HUGO)的創(chuàng)始主席。1997年,為了表彰他一生的貢獻,他獲得了拉斯克醫(yī)學科學特殊成就獎。
https://omim.org/about
以鐮刀型貧血癥為例介紹OMIM的使用
以一個比較熟知的鐮刀型貧血癥(Sickle Cell Anemia,SCA)為例。之前一篇推文介紹過SCA的致病機制、突變蛋白三維結構,見:正常與突變蛋白三維結構模型的繪制與分析。
SCA的致病基因為HBB(Hemoglobin Subunit Beta,血紅蛋白β亞基)基因,第6位氨基酸Glu轉位為Val(Glu6Val)。野生與突變蛋白三維結構模型如下(詳見推文):
??
表面電荷:左側野生,右側突變
野生來自AlphaFold,突變來自PyMOL的手動突變。
??
表面電荷:左側野生,右側突變
野生和突變模型均使用SWISS-MODEL從頭預測。
致病機制圖解:
OMIM疾病頁面的頭部信息
進入OMIM主頁(https://omim.org/)。在OMIM的檢索框中輸入:Sickle Cell Anemia。
OMIM的檢索框中可輸入:臨床特征、表型、基因等關鍵字進行檢索。
若要下載重要的后臺數據,以便批量分析,需要注冊學校或研究單位的正式郵箱(而非商業(yè)郵箱)。
檢索結果如下圖:
進入第一個檢索結果,頁面如下圖:
紅框:目錄。點擊之后在頁面內快速跳轉。包括:表型與基因的關系、臨床簡介、疾病基本信息與描述、臨床特征、診斷、臨床管理、發(fā)病機制、分子遺傳、群體遺傳、動物模型、背景歷史、研究進展和參考文獻。
綠框:是外部鏈接。Protein給出了SCA致病基因HBB蛋白的UniProt鏈接。另有其它臨床資源數據庫、動物模型、細胞系鏈接。
藍框:疾病和基因關系簡述。SCA的MIM編號'# 603903'中的#號表示描述性條目,通常指表型。
井號(#)表示描述性條目,通常是表型的;星號(*)表示一個基因;加號(+)表示該條目包含已知序列和表型的基因描述;百分號(%)表示該條目描述了一個確定的孟德爾表型或未知分子基礎的表型位點;插入符號(^)表示該條目不再存在。
黃框:表示表型與基因的關系。
?1-7分別表示:?
??1. 染色體高分辨率顯帶及命名體系。'11p15.4'表示11號染色體短臂1區(qū)5帶第4亞帶。
??2.?表型(Phenotype),或叫顯型,可指某種疾病。
表型:有特定基因型的個體,在一定環(huán)境條件下,生物體所表現出來的一組可觀察到的特征(characteristics)或性狀(traits)的總和。性狀(traits)指生物形態(tài)、結構和生理、生化等特性。
??3. 表型的MIM編號。是OMIM的一種編號系統(tǒng)(或條目,entry),6位數字。編號原則如下:
鐮刀型貧血癥的Phenotype MIM number為?'#?603903',說明是1994年之后被OMIM收錄并編號的常染色體疾病。
?4.?經典孟德爾遺傳模式。包括:常染色體隱性遺傳,Autosomal Recessive (AR);常染色體顯性遺傳,Autosomal Dominant (AD);X連鎖隱性遺傳,X-linked recessive (XR);X連鎖顯性遺傳,X-linked?dominant (XD);Y連鎖遺傳,Y-linked inheritance。
? 5. 表型映射關鍵詞。可將鼠標移動到數字上以顯示相關信息。
相關數字的含義:1表示該疾病是通過野生型基因定位的;2表示疾病表型本身被定位;3表示疾病的分子基礎是已知的;4表示該疾病是一種染色體缺失或復制綜合征。
??6.?相關的基因或染色體位點或位置。
? 7. 基因的MIM編碼。OMIM的MIM編碼不僅針對表型,也涵蓋基因,以及該基因的等位基因變異(SNV/SNP)。
一個疾病的、一個致病基因的多個不同的SNV/SNP(單核苷酸變異/等位基因變異),用MIM編號的后面跟著的一個小數點和一個唯一的4位數字來表示。
例如,Factor IX基因(即F9基因,血友病的一個致病基因)的MIM編號為300746,它的多個等位變異編號為300746.0001到300746.0101,可分別對應不同的SNV。
下圖是HBB基因等位基因變異(SNV)的MIM編號(https://omim.org/entry/141900):
點擊目錄中的Table?View:
疾病與基因詳情頁的其它信息
疾病的詳情頁。主要是對該疾病已有研究結果、臨床經驗的詳細匯總,具體包括:臨床特征、診斷、臨床管理、發(fā)病機制、分子遺傳、群體遺傳、動物模型、背景歷史、研究進展和參考文獻。
基因的詳情頁,如HBB(MIM編號:* 141900。https://omim.org/entry/141900),展示方式與疾病詳情頁不同,主要包括:所有與該基因有關的疾病(見下圖)、基因結構、基因組映射(Mapping)、基因功能、生化特性、分子遺傳學、動物模型、背景歷史、等位基因變異(這部分的具體內容見上文)。
可見HBB不僅僅與SCA有關(AR),也與地中海貧血等疾病相關(AD),且同一個基因在不同疾病的中的遺傳模式可能不同。
OMIM后臺數據的下載。在Download頁面?提供一些文件的下載鏈接。一般需要寫郵件申請,但某些商業(yè)郵箱如網易或qq郵箱可能無法申請。此外,數據不完全免費,有些數據對方可能會提出報價。
OMIM全部后臺數據的獲取,可能有助于外顯子數據分析中對候選基因的篩選。但這些基因一般是已知的、與該疾病有較強關聯(lián)的基因,由于個體的異質性,特定疾病中OMIM收錄的基因可能不全。
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的数据库 | OMIM (在线人类孟德尔遗传)数据库简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ubuntu 系统中如何截图
- 下一篇: 图像处理中的拉普拉斯算子