挖掘PubMed数据库,获取报道的或推测新的基因调控关系
生信寶典之傻瓜式推出過基于Cytoscape的插件literature search進行文獻挖掘查找指定基因調控網絡的方。
近來發現一款神奇的在線工具 (Chilibot,?chip?literature robot,?http://chilibot.net/)可以完成同樣的分析,而且看上去功能還更強大。
結果展示
采用兩個關鍵詞cocaine和plasticity?(藍色節點)配對搜索獲得cocain治療對可塑性的影響相關的一系列基因。基因的顏色代表表達值(綠色是上調,紅色是下調)。連線上的數字代表這一關系的權重?(后面有計算方式)。點擊每個點,可以查看對應的文獻信息或針對該節點進行進一步分析。
配對搜索
如下做配對搜索,查看給定的基因、通路、疾病之間存在的互作。
提交后,展示搜索進程和語義分析
獲得互作結果,?左側是網絡圖,右側是圖例。圖中的數字代表支持兩個節點關系的權重。
每個節點可進一步點擊查看, 獲取包含此節點的文獻和文獻中的語句。每個邊也可以進一步點擊查看,獲取包含這個調控關系的文獻和對應的語句,不失為一個快讀讀文獻的工具。
雙列表搜索
第1個列表中的關鍵字會互相配對搜索它們之間的關系,然后每個再與第2個列表中的關鍵字配對搜索對應的關系。
List 1
BDNF TRKB TRKC CHRNA7 PSD95 CREB HPRT ARC NUR77List 2
APOPTOSIS (programed cell death; PCD) Hippocampus STEM CELLS結果如下,一個比較復雜的網絡。
點擊某個節點可繪制以該節點為中心的網絡,還可以根據網絡中的連通性推測出之前未被報道的調控關系,比如Apoptosis與ARC沒有文獻報道,但他們都與網絡中的6個基因有調控關系,那么他們之間可能也會有調控關系,就形成了一個新的假說。
如果網絡中的節點不能點擊,點一下sort nodes by number of relationships刷新下網絡就可以了。
展示表達值
輸入如下,基因名字后面跟上基因的表達倍數變化 (空格分開)
節點的顏色根據表達量標記了紅色(下調)和綠色(上調),與常規不太一致。
具體的上色方式見下 (數值為fold change?不能取對數):
權重計算
Words suggesting a conclusion, such as “suggest”, “found”, “show”, “data” etc weights as?+9?points. Starting the sentence with the query term and a verb weights as?+5?points. The presence of words suggesting a negative result such as “not”, “lack”, “fail”, “without” is weighted as?-3?points. Having more than 30 words also reduces the weight by?3?points. Lastly, having keywords specified by the user adds?5?points to the weight. The 15 sentences with the highest weights are displayed.
程序查詢
文中也提供了一個程序化獲取方式,以Perl語言為例,其他程序語言也可以,本質是網頁提交和抓取。
#!/usr/local/bin/perl use LWP::Simple qw(get);# Provide your email address so that you receive a notification when a query is done (if more than 6 terms are queried).my $email="me\@my.domain";#my $sessionName="testing"; # session name is optionalmy $terms="apoptosis\ncreb\nbdnf\n";&searchChilibot ($email, $sessionName, $terms);sub searchChilibot{my $email=shift;my $sessionName=shift;my $terms=shift;my $url="http://www.chilibot.net/cgi-bin/chilibot/chilibot.cgi?email=$email&IN=t&list=$terms&name=$sessionName";print "Waiting for Chilibot response (may take a while) ..\n";my $response=get ($url);if ( $response=~m|Done!.+?<a href=(.+index\.html)|){print "search is done: http://www.chilibot.net$1\n";}if ($response=~m|<div *class=\"warning\">(.*)</div>|){print "error:$1\n";} }總結
以上是生活随笔為你收集整理的挖掘PubMed数据库,获取报道的或推测新的基因调控关系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 北大出版社继续送书 | 附上周4位中奖的
- 下一篇: 单个基因集富集分析泡泡图绘制