【量子位节选摘抄】张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划
1 前言
????????去年谷歌DeepMind推出的AlphaFold 2,無疑將當下的AI技術與尚在探索的生物技術完美結合起來。
去年張亞勤從百度離開加入清華大學,成立清華智能產業研究院AIR。如今,短短一年,已有多名世界頂級科學家加盟AIR。
????????在MEET2022智能未來大會上,張亞勤透露清華智能產業研究院在進行的重要科研項目之一,就是利用AI技術開發抗體、研究DNA序列、預測蛋白質結構等等。
????????張亞勤認為,AI在新冠疫苗的研發過程中發揮了重要作用,堪稱AI在生命科學實際應用中的重大事
2 演講要點
2.1 關于清華大學智能產業研究院(AIR)
????????清華大學智能產業研究院(AIR)使命是利用人工智能技術賦能產業升級,推動社會進步。
AIR的戰略目標有三個:
-
首先要培養人才,主要是具有國際視野的頂級架構師、未來的CTO;
-
第二是實現核心的技術突破;
-
第三是是希望AIR研發的技術能用到產業,給產業帶來重大的影響。
????????我們選擇了三個方向作為突破點:第一個是智慧交通,第二智慧物聯IoT,第三智慧醫療。重要的還是ABCD(AI、大數據、云計算、設備)四個橫向的技術領域作為基石。
2.2 AI帶來的生物數字化
-
我們首先是經歷內容數字化,后來到企業數字化,現在進入物理世界的數字化,和生物世界的數字化。我們的身體、大腦、器官、細胞、蛋白質和基因等都在數字化。
????????AI在極大加速生命健康和生物醫藥領域的快速發展。以新藥研發為例,目前要開發一種新藥需要投入超過十幾年的周期,花費數十億美元,周期很長、費用極高。這樣巨大的投入顯然會對醫藥行業帶來巨大瓶頸,AI正在改變這種狀況。
????????
- 首先在基因編輯方面,AI+CRISPR可以更精準,更快的找到靶點。
- 另外,在大分子、抗體,以及TCR個性化疫苗和藥物,還有最近AlphaFold在蛋白質三維結構解析方面的新進展,從序列到到結構功能,AI技術功不可沒。
? ? ? ? AIR最近在研究的課題之一,就是怎樣使高通量的生物實驗自動化,把干實驗和濕實驗無縫連接起來,形成閉環,真正地加速整個制藥和生命科學的發展。現在AI算法還是輔助,主要還是靠生物的濕實驗。未來會有一種新的模式是AI驅動的,完全自動化所有環節的濕實驗,里面沒有任何人的參與,這個是比較困難的,也是一種新的嘗試。
????????在這點上一個非常形象的例子就是新冠疫苗的開發周期大幅度縮減。中國科學家在新冠病毒出現之后的第一時間,2020年1月份就找到了病毒基因的序列,三個月之后,蛋白質的結構就被解析出來了,此后一個月,病毒和人的交互的方式也解析出來了,去年底疫苗進入臨床實驗,今年開始大規模使用,不管是滅活疫苗,還是mRNA疫苗,這可能是人類歷史上最快的一次用人工智能加速疫苗開發的例子。
?????????AIR彭健教授將遷移學習模型用做藥物臨床前的評估,和精準臨床實驗的設計。
????????我們知道人類很多疾病樣本數據很少,但卻積累了很多動物數據,用動物數據模型加上目前已有的人類腫瘤細胞系上的藥物數據,運用可解釋型的機器學習能很快遷移到人體內的藥效預測任務上。
????????從結果可以看到,彭健教授這種遷移學習方式對于三陰型乳腺癌患者設計的藥物醫藥可信度提高5倍左右。
????????彭健教授團隊還把幾何深度學習用到AI抗體的開發。???????
????????目前雖然蛋白質序列大幅度被解析出來了,但是其本身的形狀幾何結構還有很多的變化,他們想做的就是把蛋白質表面的幾何表征用深度學習方法去表示出來,然后做抗體親和力預測。?
????????彭健教授最近也取得了一些新的進展,他創建的Helixon公司與清華大學醫學院一起合作研發出全球首個AI設計的新冠抗體,這其實是一種新范式。病毒本身是一直在變化的,但通過綜合分析抗體與抗原的相互作用,有效設計抗體可變區氨基酸序列,這樣的抗體本身也是相對比較穩定,且對德爾塔、阿爾法、伽瑪等突變株具有高效和廣譜的病毒中和效果。
????????AIR蘭艷艷教授帶領的學生在基因測序方面做了很多新的工作,并在今年的創新工場Deecamp競賽中獲得了冠軍。
????????我們已知基因10%是編碼的,90%是未編碼的,他們利用基因里的未編碼部分,將這些數據用前沿的預訓練技術構造了一個全新的模態。
2.3 AI和生物的壁壘
-
人工智能和生命科學方面盡管有很多可以合作的地方,但是也有很多壁壘,兩個行業是兩類不同的語言體系,兩類不同的科學家,很重要的是怎么樣能把這兩個行業無縫連接起來。
2.3.1 AI賦能生命健康
????????AI賦能生命健康領域包括三個層次:AI基礎設施建設、數據平臺搭建,以及AI算法引擎設計。
????????最好的人工智能賦能生命科學的例子就是蛋白質預測模型AlphaFold2。AlphaFold2能夠成功滿足幾個條件:
-
第一點,它是一個well-defined problem,從蛋白質的氨基酸的序列到三維的結構的mapping;
-
第二點,30年前就開始的CASP競賽,每次競賽有標準的數據集,每次解析出的蛋白質序列,大家都可以公開上傳;
-
第三點,數據本身是well-structured,AI新算法可以直接使用。
3 總結
-
我們現在整個生物世界在走向數字化、自動化,也包括智能的科學計算,像分子動力學,薛定諤方程等,都會和AI相輔相成。
????????這些進展,我們整個生命科學的生物制藥會更加快速精準、更安全、更經濟、更加普惠。但很多的挑戰我們沒有講,比如算法的透明性、可解釋性、隱私安全、倫理等,這些事情都需要我們關注。我相信未來十年是整個生物制藥和人工智能融合的大好時機,也是行業發展的最大的機遇
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的【量子位节选摘抄】张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PYTORCH笔记 actor-crit
- 下一篇: python 笔记:csv 读写