如何利用OMIM数据库获取肿瘤相关所有突变基因?
如何利用OMIM數據庫獲取腫瘤相關所有突變基因?
OMIM是人類孟德爾遺傳數據庫(線上版)(0nline Mendelian Inheritance in Man)的簡稱。這是一個持續更新的關于人類基因和遺傳紊亂的數據庫,主要著眼于遺傳性的基因疾病,包括文本信息和相關參考信息、序列紀錄、圖譜和相關其他數據庫(度娘有介紹,此處省略很多字)。
對于臨床工作者,通過體現病人臨床特征的關鍵詞,可以從OMIM數據庫中尋找最近的臨床檢測標準和發展趨勢。在教學研究方面,OMIM可以迅速、簡單地提供給學者們關于基因和遺傳病方面最關鍵的信息和綜評,并且實現表型到基因型的分析,而這些使聯機醫學檢索系統(Medline)無法比擬的。當然,OMIM最具魅力之處是它能夠提供給遺傳學家關于基因序列、圖譜、文獻等其它數據庫關于此類注釋的詳盡信息。下面就給大家示范下OMIM經常用到的搜索基因功能啦~~
Tips: 主要流程即是從OMIM數據庫下載疾病數據,選擇與腫瘤相關的疾病,并獲取關聯基因。
1獲取數據—從OMIM數據庫下載疾病數據,獲取關聯基因
1.1.打開http://omim.org/,在上方工具欄“downloads”選項卡中選擇“Register for Downloads”
1.2. 提交注冊信息,數秒內內即可收到相關郵件。(需要使用機構的郵箱)
1.3 在郵箱中打開FTP服務器地址,選擇“morbidmap”文件,右鍵另存為保存.txt文件,原始數據獲取完成。
2 處理數據
2.1.下載morbidmap數據集,使用excel打開(用Excel中Data菜單中的數據導入功能打開,注意分隔符是”|”,正確打開如下圖所示(完美變身)),包括4列,可提供如下信息。
2.2. 過濾疾病名稱(第一列),選擇與腫瘤相關的疾病(可以使用excel的篩選功能),共有34條記錄符合要求。
2.3.將篩選所得記錄中的基因選中,拷貝到新的工作表中。利用“數據”選項卡中“分列”工具,分隔符號為“,”,將所有基因名稱單獨分散到單元格中。隨后將其移動至A列中,再拷貝一列至B列,利用“數據”選項卡中“刪除重復項”工具處理B列,即可觀察與腫瘤疾病關聯的致病基因共有78個。
2.4. 統計基因出現頻率,在C1中輸入函數COUNTIF,參數一為A列數據A1:A109,參數二為B1,相當于統計B1在A列出現的頻率,隨后填充B列即可統計全部。隨后將BC兩列拷貝到新工作表中,以B列為基準降序排序,觀察各基因出現頻率。其中出現兩次的基因為:ADHR、HPDR2、PBT、PHPTC、FGF23、KIT,其余均只出現一次。
是不是超級簡單,小伙伴們動手試起來呀,當然也可以搜索其它相關疾病,只要你需要,OMIM數據集都能搜得到!!
其他疾病的致病基因也可以在此數據庫中查找到。
轉載自:https://cloud.tencent.com/developer/news/125239
2020年7月31日下載數據
鏈接:https://pan.baidu.com/s/1qy52cm_m3RtXsQpa7DI3mQ
提取碼:7y4f
復制這段內容后打開百度網盤手機App,操作更方便哦
總結
以上是生活随笔為你收集整理的如何利用OMIM数据库获取肿瘤相关所有突变基因?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一个人开发手游有多难
- 下一篇: 行人重识别(1)——行人检测综述