Nature论文解读:深度学习助力毫秒之间识别癌细胞
論文動機
流式細胞儀作為一種生物醫學診斷技術,可以準確測量細胞特性。當前儀器已經實現了細胞的分類識別,但由于數據處理耗時的問題,尚不能對細胞進行實時分選。
基于之前的工作,本文作者提出采用深度學習來解決這一問題,在流式細胞儀的組成——激光信號上直接進行處理,省略了其他技術中費時的操作。該儀器可以在幾毫秒之內檢測出癌細胞,比之前的方法快數百倍。用這樣的速度,可以在細胞檢測后立刻將癌細胞從血液中分離出去,預防癌癥轉移。
技術方法
深度學習
深度學習屬于機器學習,是一種采用大量數據來訓練算法的人工智能。在深度學習中,神經網絡算法用來模擬人的大腦工作。與其他機器學習類型相比,深度學習被證明在識別和生成圖像、語音、音樂和影像上尤為有效。
論文采用基于 VGGNet 的卷積網絡模型來進行細胞檢測和識別。實驗所采用的目標細胞為 T 淋巴雜交瘤細胞(OT-II)和人的結直腸癌細胞(SW-480),數據的準備過程以及模型架構如下圖所示:
包含細胞信息的數據由高速 ADC 進行采集,每個波形數據先切割成 100 個小的波形片段,各片段之間的重疊率為 50%。?通過進一步處理,使得每個片段包含完整的脈沖。接著,將這些波形片段轉換為二維陣列,使得波形分析的過程類似于采用卷積網絡進行圖像識別。經過處理的波形片段分別是攜帶 SW-480 細胞、OT-II 細胞以及不攜帶細胞信息的空白片段。他們被隨機打亂后分成三個數據子集:訓練集(占比 80%),驗證集(占比 10%)和測試集(10%),并且三個子集之間沒有交集。每次訓練只有一部分數據(batch)參與。
深度神經網絡模型由 16 個卷積層組成,其步長為 1,kernal 大小為 3 × 3,生成的特征圖像深度從 16 增加到 64 個輸出通道。在各個卷積層之間,采用窗口大小為 2 × 2 的最大池化層來進行降采樣。?最后一個卷積層的輸出被平鋪為一維數據后進入三個全連接層:前兩個有 1024 個節點,第三個有 64 個節點。并且采用 dropout 進行正則化,以及用 Adam 優化器來更新參數。
時域拉伸
光時域拉伸技術是 UCLA 發明的超高速測量技術。它采用超短激光來實現 1Tbit / s 的數據采樣速度,比目前最快的微處理器速度還要快上 1000 倍。這個技術幫助科學家們發現了激光物理中的罕見現象,發明了新型的生物醫療儀器,如 3D 顯微鏡,光譜儀等。
論文中,采用時域拉伸成像系統快速捕獲高通量細胞的空間信息。首先通過光脈沖線性掃描目標細胞,并將細胞的特征編碼到這些光脈沖的光譜中,然后讓脈沖在色散光纖中拉伸,并將光譜映射到時域上,最后由光電探測器捕獲這些脈沖序列并轉換為數字波形后,直接通過神經網絡進行分析。
結果分析
在每個 epoch 中,對訓練集和驗證集的性能進行評估,結果如下圖所示。比較每個類別的分類性能,發現在第一個訓練 epoch 結束時就可以成功識別出 SW-480 細胞和 OT-II 細胞。訓練和驗證的 F1 score 不斷增大,在大約 60 個 epoch 處達到最大值。并且,模型的泛化性能好。
下圖分析了分類器的輸出性能,將模型用于測試集,得到的結果分別通過 ROC 曲線和 PR 曲線來呈現。從圖中可以看出,該分類器無論是從靈敏度/特異性,還是精確率/召回率上來看,均表現出良好的性能,且可靠性高。
應用:深度流式細胞儀
下圖展示了深度流式細胞儀的工作機制。首先,微流體通道采用流體動力學聚焦機制,使得目標細胞對準光學相機的視場中心。然后基于時域拉伸成像的光學相機捕獲高速流動的無標記的細胞信息,輸出波形直接傳遞到已經訓練好的深度神經網絡,進行在線實時細胞分析,在細胞到達分選器之前給出準確的分類結果。不同類型的細胞將被賦予不同的極性電荷,使得它們被分選到不同的收集管中。
除了時域拉伸成像信號外,深度流式細胞儀還可以應用于其他傳感器如 CMOS 或 CCD,PMTs 和光電二極管所捕獲的信號。
亮點
論文所提出的深度卷積網絡能夠直接對流式細胞儀中輸出的一維時間序列波形進行訓練,自動提取數據特征,省去了圖像合成和手動特征提取這些耗時的步驟,大幅縮短了細胞分析的整體用時。并且,直接對原始波形進行訓練,可以挖掘出數據中更多的隱藏信息,從而獲得更準確的細胞分類結果。
此外,由于采用了 NVidia 公司提供的 GPU,模型的處理時間(訓練好的模型推斷單個細胞樣本的時間)可以進一步縮短,采用不同處理器的耗時對比如下表所示:
總結
本文提出了一種深度卷積神經網絡,可以直接處理流式細胞儀的波形數據,從而快速識別細胞。這個系統在不到幾毫秒的時間內便可實現細胞的精確分類,為實時的無標記細胞分選打開了新的途徑。點擊以下標題查看更多往期內容:?
#投 稿 通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
??來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
? 投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 下載論文
總結
以上是生活随笔為你收集整理的Nature论文解读:深度学习助力毫秒之间识别癌细胞的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么在del里面设置u盘启动 &
- 下一篇: 如何构建行业知识图谱 (以医疗行业为例)