【行业进展】AI:新药研发的新纪元
楊皓博
大學(xué)生,計算機(jī)視覺方向
作者 | 楊皓博(微信號Midlurker2017)
編輯 | 楊皓博
01
這個世界沒有藥神,但是有AI
口碑俱佳《我不是藥神》前段時間火熱上映,很多人懷著看喜劇的心情走進(jìn)了電影院,結(jié)果卻心情復(fù)雜地擦干眼淚出來。電影給我們帶來了很多感動、深思,同時讓更多人眼球投向了醫(yī)療、制藥領(lǐng)域。
電影中呂受益想活著,聽孩子叫聲"爸爸"。
老奶奶想活著,三年把房子"吃"沒了。
依然記得那幾句話...
"這世界有一種病沒藥,就是窮病。"
"你能保證永遠(yuǎn)不得病嗎?"
"他才二十歲"
"他只是想活著,犯了什么罪"
很多人觀影后認(rèn)為藥廠定"天價藥物",錯在藥廠可他們不知藥廠每款成功的藥品的研發(fā)成本,包括之前失敗品,平均一款的上市需要十來年和幾十上百億,如此巨額的研發(fā)成本,只能專賣20年,銷售峰期不過六七年,藥廠不僅要收回成本,還要賺出下一款藥品的費用,藥價不高不行啊。斯坦福大學(xué)醫(yī)學(xué)院院長米納教授說過:“今天一款新藥從關(guān)于它的第一批最重要的論文發(fā)表,到藥品上市,大約需要20年的時間,在這過程中全部的科研投入至少為20億美元。”所以藥物價格昂貴怪不了藥企,加上醫(yī)療資源不平衡,這是中國醫(yī)藥行業(yè)普遍的問題。
這個世界上本沒有藥神,但是有AI
AI可能是降低藥品價格的合理途徑之一,新藥研發(fā)普遍存在著效率低下、時間密集、不斷試錯的創(chuàng)新過程,AI能為其帶來顯著改觀。這正是許多人工智能專家所強(qiáng)調(diào)的價值。
02
AI藥品研發(fā)技術(shù)
AI在靶點的發(fā)現(xiàn)
?
?
新藥研發(fā)的目標(biāo)是找到可調(diào)控機(jī)體生物學(xué)功能的實體物質(zhì),如小分子、大分子或生物活體等。而實體物質(zhì)的發(fā)現(xiàn)首先要精準(zhǔn)的找到疾病相關(guān)的靶點[1],接著通過靶點進(jìn)行藥物研發(fā)設(shè)計,然而傳統(tǒng)的新藥研發(fā)缺乏優(yōu)質(zhì)靶點,一旦出現(xiàn)一個獲得臨床驗證的新靶點,疊羅漢式的前仆后繼并不鮮見,研發(fā)成本也是瘋狂增加。在制藥界這般尷尬的境遇下,志在尋找新靶點的人工智能的出現(xiàn),?綜合計算化學(xué)、物理學(xué)以及結(jié)構(gòu)生物學(xué)的相關(guān)知識,進(jìn)行有效的小分子(或者大分子)的篩選與設(shè)計,從這個角度人工智能的相關(guān)技術(shù)將大量應(yīng)用于疾病的靶點預(yù)測、高通量數(shù)據(jù)的分析以及系統(tǒng)生物學(xué)的建模過程中。
如Revolutionizing Precision Oncology through Collaborative Proteogenomics and Data Sharing[2]這篇論文中就提出使用了高通量組學(xué)數(shù)據(jù)的分析技術(shù)以及人工智能的相關(guān)建模方法,來挖掘和分析腫瘤相關(guān)的突變位點。
Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation[3]這篇論文中提出用機(jī)器學(xué)習(xí)的方法來評估致癌性去分化程度同時可以鑒定新靶點和相對可行的針對腫瘤分化的靶向療法。
大家感興趣可以看看上文中兩篇論文,里面詳細(xì)介紹了人工智能技術(shù)與復(fù)雜疾病靶點分析的方方面面研究。除了以上應(yīng)用之外人工智能中自然語言處理技術(shù)(NLP)可以常見的即利用人工智能分析海量的文獻(xiàn)、專利和臨床結(jié)果,找出潛在的、被忽視的通路、蛋白和機(jī)制等與疾病的相關(guān)性,從而提出新的可供測試的假說,以期望發(fā)現(xiàn)新機(jī)制和新靶點。
小樣本數(shù)據(jù)挖掘
?
?
由于近年來深度學(xué)習(xí)對藥物研究領(lǐng)域也做出了巨大的貢獻(xiàn),是因為深度學(xué)習(xí)這種layer-wise的學(xué)習(xí)模式,天然適合對圖像這種low-level feature的樣本進(jìn)行表征學(xué)習(xí)。通過逐層的網(wǎng)絡(luò)學(xué)習(xí),深度學(xué)習(xí)可自動學(xué)習(xí)圖像的High-level feature,一定程度上避免了人工進(jìn)行特征工程(Feature Engineering)的繁瑣過程。如近年來發(fā)展的弱監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)(one/few-shot learning)乃至零樣本學(xué)習(xí)(zero-shot learning)也逐漸在藥物研發(fā)領(lǐng)域應(yīng)用。
例如最近斯坦福大學(xué)的Vijay Pande教授嘗試用one-shot learning來進(jìn)行l(wèi)ow data drug discovery[4]
圖中為小分子編碼成一種適合于one-shot?prediction的形式的神經(jīng)網(wǎng)絡(luò)。
文章中介紹了用于藥物發(fā)現(xiàn)的低數(shù)據(jù)學(xué)習(xí)的任務(wù),并給出了一種學(xué)習(xí)此類模型的體系結(jié)構(gòu)。
上圖為每個模型訓(xùn)練的分?jǐn)?shù),報告的數(shù)字是均值和標(biāo)準(zhǔn)差。隨機(jī)度超過支持集的選擇,20個支持集重復(fù)實驗。附錄包含所有未執(zhí)行的Sider任務(wù)的結(jié)果。 s.每一行中平均值最高的結(jié)果將被高亮顯示。表示法10/10?表示支持10個正面的例子和10個負(fù)面的例子。
Tox21.Tox21包括與人類毒性相關(guān)的12個核受體測定。文中訓(xùn)練了Tox21數(shù)據(jù)集收集的模型,并對SIDER集合的預(yù)測精度進(jìn)行了評估。請注意,這些集合大致不同, Tox21檢測結(jié)果進(jìn)行核受體檢測,Sider測定真實患者的不良反應(yīng)。
上圖為其余測定結(jié)果。在表6, 7和8中報告了每一個毒性檢測的結(jié)果。
再如Molecular de-novo design through deep reinforcement learning[5]將強(qiáng)化學(xué)習(xí)用于小分子生成設(shè)計
如圖是使用SVM分類器通過在Scikit-learn中建立在訓(xùn)練集上作為DRD2活動的預(yù)測模型,來預(yù)測對生物靶標(biāo)具有活性的分子。
在最近6月份The rise of deep learning in drug discovery[6]這篇論文當(dāng)中詳細(xì)的介紹了當(dāng)前深度學(xué)習(xí)在新藥研發(fā)的主要應(yīng)用以及新藥研發(fā)未來發(fā)展,感興趣大家可以自行了解~這些論文當(dāng)中主要是藥物研發(fā)領(lǐng)域面向小樣本進(jìn)行的有益嘗試。
總的來說,人工智能在新藥研發(fā)當(dāng)中有很大的前景其原因如下:(1)人工智能在藥物靶點的發(fā)現(xiàn)有巨大突破(2)小樣本學(xué)習(xí)的發(fā)展是人工智能發(fā)展的重要方向。
03
制藥公司對AI的應(yīng)用
3.1羅氏基因泰克
?
?
羅氏基因泰克與醫(yī)療行業(yè)數(shù)據(jù)化分析公司GNS Healthcare達(dá)成協(xié)議,使用 GNS 的 AI 平臺分析已知療法在腫瘤學(xué)中的功效(主要利用貝葉斯概率推測腫瘤學(xué)中的療法功效)。GNS Healthcare能把大數(shù)據(jù)、機(jī)器學(xué)習(xí)和仿真技術(shù)結(jié)合起來判斷疾病預(yù)后效果,從而輔助醫(yī)療供應(yīng)商進(jìn)行市場決策。
3.2 強(qiáng)生
?
?
強(qiáng)生與英國AI技術(shù)開發(fā)和應(yīng)用公司BenevolentAI達(dá)成新藥研發(fā)合作。其核心技術(shù)是一個叫做JACS (Judgment Augmented Cognition System,判斷加強(qiáng)認(rèn)知系統(tǒng))的人工智能系統(tǒng)。JACS在運算中從論文、臨床試驗中提取大量的數(shù)據(jù),提取推動藥物研發(fā)的知識,提出新的可被驗證的假設(shè),加速新藥研發(fā)。強(qiáng)生把一些尚處于試驗中的小分子化合物轉(zhuǎn)交給了BenevolentAI,進(jìn)行新藥挖掘開發(fā)。
3.3?MSD
?
?
默沙東與美國的Atomwise合作共同構(gòu)建AtomNet技術(shù)平臺,它每天使用大量的深度學(xué)習(xí)算法和超級計算機(jī)工具分析數(shù)百萬的潛在療法,從而加快藥物研發(fā)進(jìn)程。主要針對的是新藥的有效性和安全性預(yù)測。
3.4 輝瑞
?
?
輝瑞通過IBM的Watson機(jī)器人來對大量的文本數(shù)據(jù)進(jìn)行快速分析,使用大量實驗室數(shù)據(jù)、臨床報告,用來尋找潛在藥物,也就是上文中提到的使用NLP分析海量文本數(shù)據(jù)發(fā)現(xiàn)疾病靶點。此外,輝瑞也將VR技術(shù)帶入新藥研發(fā)領(lǐng)域,探索VR技術(shù)在藥物研發(fā)的可能性。
3.5 GSK
?
?
GSK與指導(dǎo)藥物研發(fā)的初創(chuàng)公司Exscientia在藥物研發(fā)達(dá)成戰(zhàn)略合作,Exscientia 通過AI藥物研發(fā)平臺為GSK的10個疾病靶點開發(fā)創(chuàng)新小分子藥物,并且針對這些靶點藥物發(fā)現(xiàn)臨床候選藥物。
04
總結(jié)
AI技術(shù)可應(yīng)用于藥物研發(fā)的各個層面(這里特指靶點篩選,小分子篩選、設(shè)計、合成,成藥性評估等實驗驗證前階段。大分子藥物設(shè)計較為復(fù)雜,不在此次討論范疇),各個大型制藥公司也是積極使用AI應(yīng)用于新藥研發(fā)。
參考文獻(xiàn):
[1]https://en.wikipedia.org/wiki/Biological_target#Drug_targets
[2]Rodriguez H, Pennington S R. Revolutionizing Precision Oncology through Collaborative Proteogenomics and Data Sharing[J]. Cell, 2018, 173(3):535–539.
[3]Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation
[4]Altaetran H, Ramsundar B, Pappu A S, et al. Low Data Drug Discovery with One-Shot Learning.[J]. Acs Central Science, 2017, 3(4):283.
[5]Olivecrona M, Blaschke T, Engkvist O, et al. Molecular de-novo design through deep reinforcement learning[J]. Journal of Cheminformatics, 2017, 9(1):48.
[6]Chen H, Engkvist O, Wang Y, et al. The rise of deep learning in drug discovery[J]. Drug Discovery Today, 2018.
更多,歡迎到知乎專欄去投稿與交流。
打一個小廣告,我的計算機(jī)視覺公開課《AI 圖像識別項目從入門到上線》上線了,將講述從零基礎(chǔ)到完成一個實際的項目到微信小程序上線的整個流程,歡迎交流捧場。
如果想加入我們,后臺留言吧
微信
Longlongtogo
公眾號內(nèi)容
1 圖像基礎(chǔ)|2 深度學(xué)習(xí)|3 行業(yè)信息
往期開源框架
【開源框架】從Google百度到微博,優(yōu)酷騰訊到抖音,這些爬蟲你用過了嗎?
[caffe解讀] caffe從數(shù)學(xué)公式到代碼實現(xiàn)4-認(rèn)識caffe自帶的7大loss
【開源框架】一文道盡主流開源框架中的數(shù)據(jù)增強(qiáng)
往期綜述
【技術(shù)綜述】有三說GANs(上)
【技術(shù)綜述】深度學(xué)習(xí)自動構(gòu)圖研究報告
為了壓榨CNN模型,這幾年大家都干了什么
往期學(xué)員分享
【技術(shù)綜述】人臉顏值研究綜述
【技術(shù)綜述】人臉年齡估計研究現(xiàn)狀
【技術(shù)綜述】計算機(jī)審美,學(xué)的怎么樣了?
總結(jié)
以上是生活随笔為你收集整理的【行业进展】AI:新药研发的新纪元的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 28岁以后,我不抱大腿,我就是大腿
- 下一篇: 【行业进展】国内自动驾驶发展的怎么样了?