如何解析IMex和IntAct数据库
這期內容當中小編將會給大家帶來有關如何解析IMex和IntAct數據庫,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
蛋白質相互作用的數據庫非常的多,比如DIP, MINT, IntAct, BioGRID等,不同數據庫中的信息存在了大量的冗余,而且在不同數據庫之間進行檢索也非常的費力。
為了減少不同數據庫的冗余,最大化提升數據存儲和檢索的效率,由多個數據庫的開發團隊和維護者共同參與成立了一個委員會,名字叫做international molecular exchange consortium, 簡稱IMEx, 該委員會致力于將不同數據庫中的信息合并,減少冗余并提供了一個統一的查詢工具
該委員會的成員示意如下
該項目的地址如下
http://www.imexconsortium.org/
通過官網的檢索框,可以方便的檢索各個成員數據庫中的內容,示意如下
以tp53為例,檢索結果如下
點擊IMEx的鏈接,可以看到如下所示的表格
采用了MITAB格式來展示蛋白質相互作用信息,通過左上角的Download按鈕可以進行下載,通過IMEx的官網,我們可以方便的查詢某個蛋白的相關作用網絡信息的,但是下載數據并不是非常的方便,如果要下載數據,還是要借助IntAct數據庫。
IntAct數據庫是IMEx的成員數據庫之一,目前該數據也整合了IMEx的所有數據,網址如下
https://www.ebi.ac.uk/intact/
在線檢索功能肯定是有的,如下所示,支持多種查詢方式
在檢索結果的頁面,可以自定義展示的列信息,也可以選擇對應的格式進行下載,示意如下
通過Graph按鈕,還可以顯示查詢蛋白的相互作用網絡
和string數據庫相比,IntAct的檢索功能也有其局限性,只適用于查詢單個蛋白的相互作用網絡,無法查詢輸入的多個蛋白之間的相互作用網絡。如果要查詢多個蛋白之間的相互作用網絡,只能自己寫腳本從整個相互作用網絡中提取信息,官網提供了下載功能,示意如下
提供了多種格式的下載,主要有XML和TAB兩種格式, PSI-MI格式就是xml格式的文件,PSI-MI TAB就是\t分隔的文件,TAB格式的內容相對直觀,而XML格式適用于程序處理。
對于蛋白質相互作用網絡而言,String數據庫的使用更加簡單,更加的人性化,所以知名度更高,而IMEx和IntAct的使用有一定的技術門檻,但是可以作為String數據庫的一種補充,能夠得到更加豐富的信息。
總結
以上是生活随笔為你收集整理的如何解析IMex和IntAct数据库的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: App内测神器之蒲公英
- 下一篇: win10添加我的电脑到桌面如何操作
