x光肺部分割数据集_吴恩达发布了大型X光数据集,斯坦福AI诊断部分超越人类 | AAAI 2019...
量子位 報道 | 公眾號 QbitAI
最近,吳恩達的斯坦福團隊發(fā)布了一個叫做CheXpert的大型數(shù)據(jù)集,論文中選了AAAI 2019。
它包含了224,316張標注好的胸部X光片,以及放射科醫(yī)師為每張胸片寫的病理報告。
雖然,像從前NIH發(fā)布的ChestX-ray14數(shù)據(jù)集那樣,CheXpert也是根據(jù)醫(yī)師的報告,自動標注肺水腫、心臟肥大等各種病癥的;
但團隊說,新的數(shù)據(jù)集更適合做Benchmark,因為測試集上的標簽,是經(jīng)過 (持證上崗的) 放射科醫(yī)師驗證的標簽。
團隊便是用這個數(shù)據(jù)集做Benchmark,舉行了一場5種疾病的識別比賽。
數(shù)據(jù)集是怎樣煉成的
這22萬張胸片,都是2002年10月到2017年7月之間,斯坦福醫(yī)院做過的X光檢查,來自65,240個就診的人類。
有哪些標簽
每張胸片有14個標簽要貼,其中12個,是表明患者是否存在心臟肥大 (Cardiomegaly) 、肺部病變 (Lung Lesion) 等12種疾病特征。
另外兩個標簽,一個是無發(fā)現(xiàn) (No Finding) ,另一個是輔助器具 (Support Devices) 。
14個標簽,都分為陰 (Negative) 、陽 (Positive) 以及不確定 (Uncertain) 這三種選項。
因為,并不是所有問題,都能從胸片上得到確定的答案。如果不能做出明確的判斷,就不可以貿(mào)然輸出陰或陽。
自動標注工具
有了14個標簽要貼,吳恩達團隊開發(fā)了一種自動貼標簽的算法:從醫(yī)師每張胸片做的報告文本里,找到和每個標簽相對應的信息。
算法分三步:
一是提取文中提及的信息 (Mention Extraction) ,得出一個列表;二是為提及的信息做分類 (Mention Classification) ,分成陰、陽、不確定這三類;
三是把提及的信息聚合起來 (Mention Aggregation) ,得出最終結論,標注完成。
團隊已經(jīng)把標注工具開源了:
stanfordmlgroup/chexpert-labeler?github.com人類醫(yī)師驗證一下
數(shù)據(jù)集要成為合格的Benchmark,測試集給的標準答案就要有說服力。
團隊找到8位持證的放射科醫(yī)師,讓他們獨立去標注500張胸片的測試集。然后,把5位醫(yī)師給出的主流答案作為Ground Truth;至于,另外3位醫(yī)師的答案,后面有其他用途。
這樣一來,各路診斷模型都可以在一個相對有效的標準之下接受評估。
對比一下,從前的ChestX-Ray14數(shù)據(jù)集里,測試集是自動標注,并沒有經(jīng)過人類醫(yī)師的鑒定。團隊認為,CheXpert更加適合做Benchmark。
你也來比賽吧
既然提供了新的Benchmark,就可以拿來比賽。
吳恩達老師發(fā)推宣布,一場疾病識別比賽已經(jīng)開始了,歡迎大家?guī)е约旱哪P腿⒓印?/p>
比賽內(nèi)容涉及5種疾病的識別:
· 肺不張 (Atelectasis)· 心臟肥大 (Cardiomegaly)
· 肺實變 (Consolidation)
· 肺水腫 (Edema)
· 胸腔積液 (Pleural Effusion)
為了鼓勵小伙伴們前去參與,團隊祭出了自家模型里成績最好的一只:
用500張胸片的測試集來比,這個模型在心臟肥大、肺水腫以及胸腔積液這三項上,超越了前面提到的“另外3位人類醫(yī)師”。
若以粗暴的五局三勝為規(guī)則,AI已經(jīng)贏了。
有興趣的同學,可以去試試看自己的模型能不能超越斯坦福的AI。數(shù)據(jù)集和參賽方法都在這里啦:
CheXpert數(shù)據(jù)集傳送門:https://stanfordmlgroup.github.io/competitions/chexpert/
(注冊一下,就會收到下載鏈接)
CheXpert論文 (AAAI 2019) 傳送門:https://arxiv.org/pdf/1901.07031.pdf
比賽參加方法傳送門:https://worksheets.codalab.org/worksheets/0x693b0063ee504702b21f94ffb2d99c6d/
— 完 —
量子位 · QbitAI
?'?' ? 追蹤AI技術和產(chǎn)品新動態(tài)
戳右上角「+關注」獲取最新資訊↗↗
如果喜歡,請分享or點贊吧~比心?
總結
以上是生活随笔為你收集整理的x光肺部分割数据集_吴恩达发布了大型X光数据集,斯坦福AI诊断部分超越人类 | AAAI 2019...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 双电阻差分电流采样_小小的采样电阻,还真
- 下一篇: mysql rpm 安装多实例_MySQ