图谱实战 | 医学知识图谱的价值与应用场景
轉載公眾號 | OMAHA聯盟
隨著技術的進步和市場的逐漸成熟,人工智能在醫療等領域的應用日益廣泛和深入。而知識圖譜技術作為一種從海量文本和圖像中抽取結構化知識的手段,正在成為推動人工智能發展的核心驅動力之一。
◆??◆??◆
知識圖譜概述
知識圖譜是一種用圖模型來描述知識和建模世界萬物之間的關聯關系的技術方法,由節點和邊組成,節點表示實體(entity)、概念(concept)或屬性值(value);邊表示實體的屬性(property)或實體間的關系(relation),三元組是知識圖譜的基本表示形式。在邏輯上可將知識圖譜分為模式層和數據層,模式層一般指Schema,是知識圖譜的概念模型和邏輯基礎,是數據層的規范約束;數據層主要由一系列的事實組成,主要基于模式層定義的模型構建數據,以三元組形式存儲。以二甲雙胍為例,其部分知識圖譜示例如圖1。
圖1?二甲雙胍部分知識圖譜示例
知識圖譜按領域可分為通用知識圖譜和領域知識圖譜,醫學知識圖譜是一種重要的領域知識圖譜,它在語義搜索、知識問答和臨床決策支持等智慧醫療領域都有很好的發展前景。
◆??◆??◆
醫學知識圖譜的應用場景
1. 語義搜索。語義搜索不拘泥于用戶所輸入請求語句的字面本身,而是透過現象看本質,準確地捕捉到用戶所輸入語句后面的真正搜索意圖,從而更準確地返回最符合用戶需求的搜索結果。將知識圖譜應用于搜索是當前實現語義搜索的有效解決方案,知識圖譜描述了事物的分類、屬性和關系,具有豐富的語義信息,可以為語義搜索提供極大的底層支持。基于醫學知識圖譜的語義搜索目前被用于醫學百科知識、臨床指南/文獻、醫學健康資訊、醫療保健信息等內容的推薦。
2. 知識問答。基于知識庫的問答(Knowledge-Based Question Answering,KBQA)也稱知識問答,主要依托于大型的知識庫,將用戶的自然語言問題轉化成結構化查詢語句,直接從知識庫中導出用戶所需的答案。KBQA已經成為各種智能問答系統的標準組件配置,知識圖譜由于具有知識豐富、結構化程度高和易于推理等特點,是KBQA的知識庫中最重要組成部分之一。
醫學知識較其他領域相比專業性更高,非專業人士很難通過自主理解一堆資源文檔,來精準地找到相關問題的答案。因此,基于醫學知識圖譜的KBQA可以幫助患者更加快捷、便利地獲得問題的答案,適用于醫學知識科普、智能導診、自診等領域。
3. 臨床決策支持。臨床決策支持(Clinical Decision Support,CDS)是指運用相關的、系統的臨床知識和患者基本信息及病情信息,向臨床醫務工作者提供加強醫療相關的決策和行動的信息,提高醫療質量和醫療服務水平。具有臨床決策支持功能的系統,稱為臨床決策支持系統(Clinical Decision Support System,CDSS),一般由知識庫、推理機和人機交互接口三個部分組成,其中知識庫是核心。
醫學知識圖譜中包含豐富的醫學基礎知識,可以作為CDSS知識庫中的重要組成部分,它為CDSS的推薦結果提供了可解釋的依據,能夠協助系統從輔助診斷、治療方案推薦、合理用藥檢測等方面為臨床醫務人員提供決策支持。
隨著技術和行業的發展,目前知識圖譜也被應用于輔助藥物研發、公共衛生事件的預警場景中。
1. 藥物研發。近年來,人工智能輔助藥物研發逐漸成為研究的熱點。知識圖譜可應用于藥物研發的知識的聚類分析,幫助提出新的可以被驗證的假說,從而加速藥物研發的過程,降低研發成本。
2. 公關衛生事件應對。在流行病學調查和疫情發生事件的分析和預警等公共衛生事件場景中,知識圖譜采用圖存儲數據的理念可以起到非常大的幫助。例如,利用知識圖譜的形式可以直觀地表示流行病調查中的人員分布、人員活動軌跡、發病時間等信息,基于圖展示出的信息可以更方便的用于病例之間相關性的分析,更快地分析和梳理出感染源頭。另外,對疫情發生事件的脈絡進行分析,通過找到多個事件存在的因果關系,構建疫情相關事件知識圖譜,幫助發現潛在的公共威脅,從源頭上預防和降低輿情風險。
◆??◆??◆
“匯知”醫學知識圖譜
“匯知”醫學知識圖譜(Wisdomed Medical Knowledge Graph,簡稱“匯知”圖譜)致力于建立符合中文環境下的規范、共享、易用、動態、系統的醫學知識圖譜。以滿足臨床智慧診療的知識應用需求為切入點,圍繞“診前-診中-診后”流程開展疾病、藥品、檢驗檢查、手術操作四大細分領域知識圖譜構建,為醫療領域提供廣泛的知識支撐。
1?|?“匯知”圖譜的構建
“匯知”圖譜基于臨床指南、臨床路徑、藥品說明書、醫學書籍和醫學文獻等高質量醫學資源,采用機器+人工方式進行構建,專家全流程參與,嚴格把關數據質量,真實還原醫學知識。同時,“匯知”圖譜與“七巧板”術語集建立映射關系,實現數據的標準化,從而促進知識更深度地應用。
圖2?“匯知”圖譜總體架構
2 |?“匯知”圖譜資源
“匯知”圖譜根據不同領域劃分,可分為疾病、藥品、手術操作和檢驗檢查四大知識圖譜。目前已發布疾病和藥品知識圖譜,共計11.7萬實體、91.4萬三元組,后續將發布手術操作和檢驗檢查知識圖譜。
■??疾病知識圖譜:以疾病為中心,鏈接超過3萬種疾病的臨床表現、科室、相關檢查、治療方式、癥狀等核心關系。共包含7.5萬實體,34.5萬三元組。為輔助診療、知識問答等系統的研發提供高質量、結構化知識庫基礎,助力疾病診療水平的提升。
■??藥品知識圖譜:以藥品為中心,鏈接超過2.3萬種藥品的適應證、適用人群、禁忌證、禁忌人群等核心關系,共包含4.8萬實體,59.0萬三元組。為助力臨床合理用藥等場景提供可靠的智能引擎。
圖3?“匯知”醫學知識圖譜示例3?|?“匯知”圖譜獲取方式
感興趣的讀者可以登錄HiTA知識服務平臺(hita.omaha.org.cn)下載知識圖譜樣例數據體驗,也可以加入OMAHA獲取全量“匯知”圖譜資源。
(“匯知”圖譜資源)
(樣例數據)
注:部分內容節選自《imit白皮書第二十二期發布:醫學知識圖譜:醫學人工智能的基石》
OpenKG
OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包,并促進知識圖譜算法、工具及平臺的開源開放。
點擊閱讀原文,進入 OpenKG 網站。
總結
以上是生活随笔為你收集整理的图谱实战 | 医学知识图谱的价值与应用场景的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 - AAAI2020 | 通过
- 下一篇: 论文浅尝 - WWW2020 | 通过对