数据挖掘肿瘤预测_Nature Medicine封面文章:利用单核细胞数量预测及评估肿瘤免疫治疗效果...
免疫檢查點阻斷已經徹底改變了癌癥治療,臨床實驗數據表明PD-1、PD-L1抗體的免疫治療可以有效應對轉移性黑色素瘤和多種其他類型的癌癥。盡管無進展生存期顯著增加,臨床治療結果也呈現很大的個體差異,只有一小部分患者對藥物表現出持久的反應,大部分患者并未顯示持久的反應。因此,找到一些預測臨床預后的Bio-Marker,以便在開始治療之前區分應答者(Responder)與無應答者(Nonresponder)是十分緊迫的。
2018年年初,瑞士蘇黎世大學的研究人員在《Nature Medicine》雜志上發表了其在該領域的最新研究成果。他們發現,病人外周血PBMC中具有CD14+CD16?HLA-DRhi表型的經典單核細胞比例可以作為預測病人對PD-1藥物反應性的Bio-Marker。
在這項研究中,科研人員選擇了20個黑色素瘤病人在治療前后的PBMC樣本做為研究對象。為了對細胞的表型和功能進行系統深入的分析,他們利用質譜流式技術(Mass Cytometry)對樣本進行高維單細胞分析。
A Workflow of “Data Driven Research”
質譜流式技術是近年來興起的單細胞多參數分析技術,利用帶有金屬元素標簽的抗體對細胞進行標記,然后利用質譜對單細胞上的標簽元素進行檢測,從原理上避免了傳統流式技術所面臨的熒光串色、自發熒光等問題。
出于研究工作的需要,研究人員一共使用了三個不同的抗體組合(Panel)對樣本進行分析。第一個Panel包含30個白細胞Marker,可以識別外周血中所有主要免疫細胞亞群以及T細胞分化激活的各個階段;第二個Panel主要是對T細胞表型和功能的細致分析,包含了T細胞相關的表面Marker以及各種相關的Cytokine;第三個Panel則主要針對髓系細胞,用來對髓系細胞進行更深入的亞群分析。三個Panel的共同使用從不同角度全方位展示了外周血PBMC樣本中各類細胞亞群的表型和功能,以及其在不同分組(Responder和Nonresponder)或者治療前后的差異。
毫無疑問,質譜流式高維檢測的特性使其能夠從有限的樣本獲得規模龐大的數據,這種能力對于 Biomarker的尋找是非常有幫助的。而從這些數據中找出我們所需要的“Biomarker”,則需要一套行之有效的數據分析方法和流程。
這項研究的目的是尋找預測PD-1抗體治療預后的生物標志物,因此需要找出Responser 和 Nonresponder病人在治療前的樣本中的特征性差異。為了解決這個問題,作者采用了多種手段進行了數據挖掘。
在以往的質譜流式相關研究中,一個經典的數據分析流程被廣泛采用:先用手工Gate或者聚類的方法將樣本細分為若干亞群,然后利用統計學方法尋找和檢查這些細胞亞群在比例、Marker表達強度等方面在不同分組之間的差異。
作者通過FlowSOM對細胞進行的聚類分析結果
所有亞群展示在viSNE圖上
事實證明,這套流程行之有效。作者通過FlowSOM算法對樣本進行多輪聚類分析,然后對兩組樣本所包含的各個亞群比例進行對比統計分析。結果表明,具有CD14+CD16?HLA-DRhi表型的經典單核細胞亞群比例在Responder中明顯高于Nonresponder樣本。
除了這種經典的分析方法,隨著人工智能(Artificial Intelligent)時代的到來,一些新興的機器學習算法也正在越來越多的被應用于質譜流式數據的分析,Cellcnn就是一個例子。Cellcnn是一種基于卷積神經網絡的分析方法,通過機器學習自動獲得能夠顯著區分兩組樣本的Marker組合。這是一種Data driven research方式進行的數據分析,盡量減少數據分析過程中的人工干預,其所得出的Marker組合不需要和已知亞群的表型一致,這也排除了人為主觀因素對于數據分析結果的影響。
借助Cellcnn方法,研究人員對治療前的兩組樣本數據進行分析,發現了一個髓系亞群在Responder中的比例為4.8% ± 2.0%,而Nonreponder樣本中的比例為2.4% ± 1.5%,兩者在統計學上具有顯著差異。而這個髓系的亞群屬于單核細胞,其核心表型為:CD14+CD33+HLA-DRhi ICAM1+CD64+CD141+CD86 +CD11c+CD38+PD-L1+CD11b+,viSNE圖上的疊加對比表明,該亞群與前面經典方法篩到的亞群具有相當的一致性,這也顯示了Cellcnn這一方法的有效性。
圓圈標記的是通過Cellcnn機器學習算法找到的可以區分
Nonresponder組和Responder組的特征性亞群
當然, Cellcnn只是人工智能在質譜流式數據分析方面的牛刀小試,可以肯定,在未來更多基于人工智能的分析方法會應用于質譜流式數據的分析,成為深度數據挖掘、臨床Bio-Marker的尋找、甚至解決一些基礎科學問題的有力工具;另一方面,人工智能的廣泛和深度應用將進一步降低數據分析的門檻,這對于質譜流式技術的普及和對質譜流式數據的充分利用有著巨大的推動作用,可謂影響深遠。
利用傳統流式對新發現的BioMarker的臨床驗證
為了將質譜流式尋找到的Bio-Marker應用于臨床,研究人員減少較少原來Panel中的Marker數量以便使用傳統熒光流式進行驗證。通過對來自另外31名患有黑素瘤的患者治療前的PBMC進行了盲測。這組病人中包含15個應答者(Responder)和16個無應答者(Nonresponder),傳統流式結果確認了在兩組病人中CD14+CD16?HLA-DRhi的亞群比例存在顯著差異。根據模型研究人員確定了19.38%做為最佳的判斷閾值,即當這一亞群的比例大于19.38%時,推薦對病人使用抗體PD-1抗體治療方案。這些結果顯示出該研究光明的應用前景。
Reference:
1、High-dimensional single-cell analysis predicts response to anti-PD-1 immunotherapy. Krieg C etc., Nat Med. 2018 Feb;24(2):144-153.
2、CyTOF workflow: differential discovery in high-throughput high-dimensional cytometry datasets. Nowicka M ect., F1000research.11622.2. eCollection 2017.
總結
以上是生活随笔為你收集整理的数据挖掘肿瘤预测_Nature Medicine封面文章:利用单核细胞数量预测及评估肿瘤免疫治疗效果...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 江南百景图阿瓜的坑作用是什么
- 下一篇: 末路剧情介绍