【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...
近日,國際知名期刊《Nature Machine Intelligence》在線發表了上海交通大學生命科學技術學院魏冬青團隊的研究論文《A transformer-based model to predict peptide–HLA class I binding and optimize mutated peptides for vaccine design》。生命科學技術學院2017級博士研究生褚晏伊和香港大學深圳醫院的張艷博士為該論文的共同第一作者。生命科學技術學院魏冬青教授和熊毅副研究員為該論文的共同通訊作者。
人類白細胞抗原(HLA)和肽(pHLA)之間相互作用的計算預測可以加快表位篩選和疫苗。該研究開發了TransMut框架,包含了用于pHLA結合預測的TransPHLA和用于突變肽優化的AOMP程序,它可以推廣到生物分子的任何結合和突變任務(圖1)。
TransPHLA設計了Transformer衍生模型來預測pHLA的結合。在pHLA結合預測、新抗原鑒定和HPV疫苗鑒定方面,TransPHLA均優于現有的14種方法?;赥ransPHLA開發的AOMP程序可用于疫苗設計,它可以自動優化突變肽,以搜索對目標HLA具有更高親和力并與源肽具有高度同源性的突變肽。在3660個非結合pHLA中,有3630個源肽被成功突變。其中,94%通過IEDB的推薦方法得到驗證,88%與源肽的同源性高于80%。
圖1.TransMut框架在webserver上的輸入和輸出
1.數據集
該研究包含112種HLA,肽長度從8到14,共有366種HLA-肽長度組合。詳情見圖2和圖3。
圖2.不同數據集中每個HLA相關的可結合的pHLA樣本數
圖3.不同數據集中肽長度相關的可結合的pHLA樣本數
2.TransPHLA模型
TransPHLA的核心思想是自注意力機制的應用。TransPHLA由以下四個模塊組成(圖4):首先使用embedding block將positional embedding添加到amino acid embedding中,以生成sequence embedding,然后應用dropout技術來增強魯棒性。通過embedding block,TransPHLA分別生成肽和HLA的embedding。接下來,這些embedding將分別作為Encoder block的輸入。Encoder block包含masked multi-head self-attention mechanism和feature optimization block。Feature optimization block是先上升后下降的全連接層的組合,這個模塊使得注意力機制得到的特征表示更好。然后,將輸出的肽和HLA的特征表示連接,作為pHLA的embedding。在pHLA的embedding通過encoder block后,使用projection block預測pHLA的結合分數。
圖4.TransPHLA模型圖
論文鏈接:
https://www.nature.com/articles/s42256-022-00459-7
參考鏈接:
https://news.sjtu.edu.cn/jdzh/20220325/169006.html
總結
以上是生活随笔為你收集整理的【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [2020-07]百度广告搜索词获取最新
- 下一篇: python第二周day2