领域应用 | HiTA知识图谱 “药品-适应证”图谱数据发布!
本文轉(zhuǎn)載自公眾號(hào):OMAHA聯(lián)盟。
? ? ? ? ? ? ??
2019年8月,OMAHA對(duì)HiTA知識(shí)圖譜服務(wù)平臺(tái)(kg.omaha.org.cn)進(jìn)行了更新,同步發(fā)布了醫(yī)學(xué)知識(shí)圖譜表達(dá)模型(schema)。2019年9月17日,首次發(fā)布了由OMAHA研發(fā)的知識(shí)圖譜數(shù)據(jù)資源。發(fā)布內(nèi)容主要圍繞“藥品-適應(yīng)證”展開(kāi),包括1.57萬(wàn)實(shí)體,9.87萬(wàn)關(guān)系,其中約0.5萬(wàn)藥品實(shí)體來(lái)源于“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”相關(guān)藥品概念,基本涵蓋國(guó)內(nèi)臨床常用藥品。
同時(shí),為了更好地促進(jìn)計(jì)算機(jī)對(duì)于知識(shí)體系的應(yīng)用,我們以O(shè)MAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集為基礎(chǔ),對(duì)藥品適應(yīng)證的內(nèi)容進(jìn)行了標(biāo)準(zhǔn)化和概念化,助力系統(tǒng)實(shí)現(xiàn)語(yǔ)義層面的互操作。
一、“藥品-適應(yīng)證”關(guān)系表達(dá)模型
基于中國(guó)藥典、藥品說(shuō)明書(shū)和標(biāo)簽管理規(guī)規(guī)范、藥品說(shuō)明等資料,總結(jié)并構(gòu)建了藥品適應(yīng)證的關(guān)系模型,主要包括三類關(guān)系:用藥目的、適用人群、適應(yīng)證,具體關(guān)系的解釋說(shuō)明見(jiàn)下表。
表1:“藥品-適應(yīng)證”關(guān)系表達(dá)模型
| 關(guān)系 | 定義 | 值域 |
| 用藥目的 | 指用藥的最終目標(biāo),是治療或緩解癥狀還是預(yù)防相關(guān)疾病等。 | 用藥目的 |
| 適用人群 | 指適宜用于具有一些相同特征的人群。 | 人群 |
| 適應(yīng)證 | 指藥物適用于某種疾病、癥狀、操作等情況。 | 臨床所見(jiàn) |
| 操作 | ||
| 事件 |
完整的OMAHA知識(shí)圖譜schema詳見(jiàn):
http://kg.omaha.org.cn/portal/index/Schema
以下為“氯達(dá)香豆素(藥品)”關(guān)系的舉例:
二、構(gòu)建方式的說(shuō)明
(一)數(shù)據(jù)來(lái)源
原始數(shù)據(jù)來(lái)源于各地藥品醫(yī)保目錄、藥品說(shuō)明書(shū)等開(kāi)放數(shù)據(jù),以及中國(guó)藥典、藥理學(xué)等高質(zhì)量醫(yī)學(xué)資源。
(二)構(gòu)建規(guī)則
1. ?通過(guò)自然語(yǔ)言處理與文本挖掘技術(shù),采用機(jī)器與人工相結(jié)合的方式進(jìn)行構(gòu)建;
2. ?為了藥品適應(yīng)證能夠更加精確的表達(dá),將用藥目的、適用人群、適應(yīng)證進(jìn)行成組表示:
(1)其中各關(guān)系數(shù)量為:x個(gè)用藥目的(x≥0)、y類適用人群(y≥0)、z個(gè)適應(yīng)證(z≥1);
(2)每個(gè)關(guān)系組內(nèi)用藥目的、適用人群、適應(yīng)證最多只會(huì)存在一條,且用藥目的、適用人群必須與適應(yīng)證成組存在,不可單獨(dú)存在;
(3)若相同適應(yīng)證存在多個(gè)用藥目的或多個(gè)適用人群,則以多條關(guān)系成組存在。
(三)數(shù)據(jù)標(biāo)準(zhǔn)化與概念化
1. ?基于“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”相關(guān)內(nèi)容,已對(duì)知識(shí)圖譜資源中藥品進(jìn)行了語(yǔ)義消歧和歸一,并建了相應(yīng)的映射關(guān)系;
2. ?所有適應(yīng)證屬性值的相關(guān)概念均通過(guò)“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”進(jìn)行映射,對(duì)“適應(yīng)證”的文本內(nèi)容進(jìn)行充分概念化,而非單純的適應(yīng)證文本;
3. ?最終所有數(shù)據(jù)都由專業(yè)人員進(jìn)行了審核,確保內(nèi)容的正確性。
三、屬性值的說(shuō)明
(一)適應(yīng)證
藥品適應(yīng)證的取值內(nèi)容已最大化映射至“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”中的“臨床所見(jiàn)”、 “操作”、 “事件”等領(lǐng)域的概念。
其中,對(duì)于目前無(wú)法映射到“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”的實(shí)體,我們都與“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”中的相關(guān)概念建立層級(jí)關(guān)系(is-a)或?qū)傩躁P(guān)系,盡可能豐富地表達(dá)適應(yīng)證的語(yǔ)義內(nèi)涵。
(二)用藥目的
OMAHA知識(shí)圖譜的限定詞中“用藥目的”類的術(shù)語(yǔ),為可枚舉的限定詞。部分舉例如下:
用藥目的
“用藥目的”屬性的屬性值為“用藥目的”類, “用藥目的”類下面劃分“治療用藥”、“輔助治療用藥”、“預(yù)防用藥”、“診斷用藥”、“操作用藥”,術(shù)語(yǔ)解釋如下:
1. ?治療用藥:是指一切以解除病痛為核心的用藥目的,包括一般意義上的治療、對(duì)癥治療和姑息治療等;
2. ?輔助治療用藥:是指藥品在治療行為過(guò)程中起輔助作用,包括消毒用藥、康復(fù)用藥、惡性腫瘤輔助用藥等;
3. ?預(yù)防用藥:是指藥品用于預(yù)防某種疾病的發(fā)生,如疫苗接種、健康危險(xiǎn)因素預(yù)防等;
4. ?診斷用藥:是指藥品用于某種疾病的診斷過(guò)程當(dāng)中,包括直接診斷、輔助診斷等;
5. ?操作用藥:是指藥品用于某項(xiàng)臨床操作過(guò)程中,如手術(shù)用藥、檢查用藥、麻醉用藥等。
(三)適用人群
OMAHA知識(shí)圖譜中 “人群”類的術(shù)語(yǔ),部分舉例如下:
適用人群
“適用人群”屬性的屬性值為“人群”類,主要?jiǎng)澐謽?biāo)準(zhǔn)為年齡、性別和臨床特征等。一些特殊的術(shù)語(yǔ)解釋和概念定義如下:
1. ?新生兒:指出生28天以內(nèi)的人群;
2. ?嬰兒:指1歲以內(nèi)的人群;
3. ?幼兒:指1歲至3歲之間的人群;
4. ?兒童:指14歲以下的人群;
5. ?青少年:指14歲至18歲之間的人群;
6. ?青年:指14歲至35歲之間的人群;
7. ?育齡女性:指15歲至49歲之間的女性人群;
8. ?中老年人:指45歲以上人群;
9. ?老年人:指60歲以上人群。
四、數(shù)據(jù)資源下載的說(shuō)明
HiTA知識(shí)圖譜服務(wù)平臺(tái)(hita.omaha.org.cn)向機(jī)構(gòu)用戶提供dump數(shù)據(jù)包下載,包含1.57萬(wàn)實(shí)體、9.87萬(wàn)關(guān)系,其中0.85萬(wàn)實(shí)體與OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集建立了直接的映射。具體數(shù)據(jù)表解釋說(shuō)明如下:
OMAHA知識(shí)圖譜數(shù)據(jù)文件為T(mén)XT格式,包括實(shí)體ID、語(yǔ)義標(biāo)簽、屬性名稱、屬性ID、值、值ID、關(guān)系組七個(gè)字段,其中每條數(shù)據(jù)即為一條關(guān)系。
實(shí)體ID:標(biāo)識(shí)本條關(guān)系中的主語(yǔ),并且為所有實(shí)體的唯一ID;
語(yǔ)義標(biāo)簽:標(biāo)識(shí)本條關(guān)系中實(shí)體的語(yǔ)義類型,具體對(duì)應(yīng)OMAHA知識(shí)圖譜Schema中語(yǔ)義類型的名稱;
屬性名稱與屬性ID:標(biāo)識(shí)本條關(guān)系中的屬性,具體分別對(duì)應(yīng)OMAHA知識(shí)圖譜Schema中屬性關(guān)系的名稱和ID;
值與值ID:標(biāo)識(shí)本條關(guān)系中的屬性值。若本條關(guān)系中的屬性為數(shù)據(jù)屬性時(shí),值為具體的數(shù)據(jù)內(nèi)容,值ID為空;若本條關(guān)系中的屬性為對(duì)象屬性時(shí),值為空,值ID為所對(duì)應(yīng)的實(shí)體ID;
關(guān)系組:標(biāo)識(shí)本條關(guān)系所在的關(guān)系組,是一個(gè)非負(fù)整數(shù)。當(dāng)group為0時(shí),則代表本條關(guān)系與其他關(guān)系均不成組,當(dāng)group不為0時(shí),則表示本條關(guān)系與其他相同group的關(guān)系成組存在。
*特殊屬性解釋:
其中OMAHA概念I(lǐng)D(R013)的屬性,指該實(shí)體所對(duì)應(yīng)的“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”中的概念I(lǐng)D標(biāo)識(shí)符。本條屬性的建立是為了方便機(jī)構(gòu)用戶能夠更好地將“OMAHA知識(shí)圖譜”與“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”結(jié)合起來(lái)應(yīng)用。若實(shí)體無(wú)該屬性,則代表該實(shí)體暫時(shí)無(wú)法映射到“OMAHA七巧板醫(yī)學(xué)術(shù)語(yǔ)集”。
數(shù)據(jù)文件示例如下:
本次發(fā)布數(shù)據(jù)的完整介紹詳見(jiàn):
http://wiki.omaha.org.cn/pages/viewpage.action?pageId=31424966
知識(shí)圖譜資源獲取方式:
第一步:登錄HiTA服務(wù)平臺(tái)(?hita.omaha.org.cn?);
第二步:進(jìn)入“知識(shí)圖譜”—“下載數(shù)據(jù)資源”板塊,點(diǎn)擊相應(yīng)數(shù)據(jù)包下載即可。
五、聯(lián)系我們
如您在使用資源過(guò)程中有任何問(wèn)題,可隨時(shí)通過(guò)郵箱或者電話的方式聯(lián)系我們,同時(shí)我們也十分希望得到您對(duì)于我們提供的知識(shí)圖譜服務(wù)的反饋和建議。
郵箱:hita@omaha.org.cn
電話:0571-88983625(聯(lián)系知識(shí)圖譜服務(wù)部,工作時(shí)間:9:30-17:30)
OpenKG
開(kāi)放知識(shí)圖譜(簡(jiǎn)稱 OpenKG)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開(kāi)放與互聯(lián),促進(jìn)知識(shí)圖譜和語(yǔ)義技術(shù)的普及和廣泛應(yīng)用。
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的领域应用 | HiTA知识图谱 “药品-适应证”图谱数据发布!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 论文浅尝 | 基于微量资源的神经网络跨语
- 下一篇: 论文浅尝 | 区分概念和实例的知识图谱嵌