开源开放 | 一个融合多元关系和事件表示的金融领域本体模型FTHO(CCKS2021)
OpenKG地址:http://openkg.cn/dataset/ftho
開放許可協議:GPL 3.0
貢獻者:武漢科技大學(高峰、鄭麗麗、顧進廣)
摘要
在此開放資源中,面對金融領域多元關系表示的困境和時序事件表示需求,我們以OWL語義為基礎,結合金融領域專業知識,融合超圖概念和事件5W(When,where,Why,What,WHo)定義構建了可通用化的金融時序超圖本體模型(Finanical Temporal Hypergraph Ontology,FTHO)。
1. 前言:超圖與事件表示
知識圖譜以<s,p,o>三元組的形勢存儲數據,使用Ontology對知識框架進行描述,因為知識圖譜靈活的圖結構,近年來,基于其在金融領域智能問答、語義搜索、輔助決策、智能分析等應用得到了關注。
但在傳統的圖結構中,兩點之間的連接只能表示一對節點之間的二元實體關聯,這種結構對現實金融領域中復雜多元關系表示能力較弱,例如,金融領域的(債券)共同擔保關系,若以普通圖表示這種關系,則多個擔保者之間的“共同”性被削弱。
同時,現有知識圖譜以靜態的實體為核心,世間萬物瞬息變化,現實世界中不斷在發生著各類事件,動態的事件為社會實踐提供參考并承載更深層次的信息。例如,投資者要參考公司以往發生的事件來評估公司的投資風險;股價的多次漲跌可能有相同規律性。因此,對時序事件的通用化表示也是金融領域的重要需求。
基于現有問題,本文提出了金融時序超圖表示模型,主要分為兩點:一是將現實世界復雜多元關系抽象為拓撲結構,根據超圖理論,結合OWL語義建立金融超圖表示模型;二是結合事件五元組5W(When,where,Why,What,Who)定義,提出一種通用化時序事件表示模型。接下來,將依次對這兩方面的相關工作進行介紹。
2. 資源構建及概況
金融時序超圖FTHO表示模型分為超邊模型、普通圖拓撲表示模型和事件時序表示三個部分,將現實世界中的復雜多元關系抽象為拓撲結構,不僅兼容金融領域多元關系,同時以超圖模式建立索引,提高檢索效率。
(1)超邊定義
超圖中的超邊是屬于該邊的普通任意數目節點的聚合,借鑒與RDF中容器的表示方法,根據超邊內節點特性,將超邊分為無序超邊、有序超邊和選擇超邊三類,分別基于rdf中的相應容器進行定義,如圖1。
圖1?金融時序超圖中的超邊定義
(2)構成超邊的普通圖拓撲結構
構成超圖的普通邊是具有傳遞性的邊和具有共指性的邊所形成的邊的集合(子圖),我們稱這些普通邊為“超邊成份邊”。超邊成份邊的傳遞性基于OWL提供的邊的傳遞性(owl:TranstiveProperty)提供,共指性通過多邊指向同一節點或來自同一節點得出。傳遞性邊可形成鏈狀子圖或環狀子圖(圖2a、2b),共指性邊可形成星型內向子圖或星型外向子圖(圖2c、2d)。同時,由于傳遞性邊具有方向,其形成的鏈狀或環狀子圖可能形成有序或無序超邊(圖3a、3b)。最后,根據傳遞性或共指性邊是否可以存在于多個子圖中,我們將構成超邊的成份邊分為融合成份邊和共享成份邊兩類,其中融合成份邊指其形成的鏈、環、星狀子圖中的任意一條成份邊與其形成的超邊之間不存在多對一關系(圖4a);而共享成份邊指其子圖中的成份邊與其形成的超邊之間存在多對一關系,即成份邊可為多個子圖共享,如圖4b中V2指向V7的成份邊可為E1、E2、E3超邊共享。
圖2?普通圖特殊拓撲結構
圖3?普通圖特殊拓撲結構構建超邊
圖4?融合超邊和共享超邊
根據構成超邊拓撲結構的普通邊特性,金融時序超圖的超邊成份邊定義如圖5所示
圖5?金融時序超圖的普通邊定義
(3)事件時序表示
本文依據事件5W(When,Where,Why,Who,What)概念,將事件知識概括為事件元數據(包含時間信息在內)和事件內容兩部分,其中事件元數據(包含事件概念本身)利用現有本體模型進行描述,包括使用GeoSparql來表示空間信息,使用OWL-Time來表示時間信息;而通過hasEventPayload用于描述事件內容,事件內容同樣表示為一個無序集合(rdf:Bag),其中包含一系列的rdf:Statement用于表述事件知識,每個rdf:Statement使用三元組形式存儲不可再分的事件原子內容。這樣,事件的內容可以是任何三元組知識。金融時序超圖事件時序表示模型如圖6所示。
圖6?金融時序超圖事件時序表示模型
(4)實驗驗證
為驗證FTHO模型的通用性和靈活性,我們記錄了三個現實場景通過普通邊方式和超邊方式SPARQL檢索所需要的時間,時間對比如圖7所示。
圖7?普通邊與超邊檢索時間對比
3. 資源用途
對于構建后的資源,我們可以從以下幾個方面進行利用:
(1)用于結合領域知識,標識金融領域中可以形成多元關系的各種二元關系;
(2)利用推理機,對標注為超邊成分邊的二元、時序關系進行推理,構建多元時序關系;
(3)結合金融領域風控等應用,實現基于多元時序金融知識的應用落地。
4.?總結
在本開放資源中,從金融領域實際應用場景出發,擴展現有知識圖譜表示機制,構建了金融時序超圖(FTHO)。將現實場景中復雜的多實體關聯關系抽象為拓撲結構,并根據其結構特性,建立拓撲子圖的二元構成邊節點映射超邊的規則集,其次,本文結合事件5W概念建立了通用化的金融時序事件表示模型。為金融領域多元、時序事件表示困境提供了解決方案,促進金融領域人工智能系統的進步。
OpenKG
OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包,并促進知識圖譜算法、工具及平臺的開源開放。
點擊閱讀原文,進入 OpenKG 網站。
總結
以上是生活随笔為你收集整理的开源开放 | 一个融合多元关系和事件表示的金融领域本体模型FTHO(CCKS2021)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 征稿 | 软件学报专刊征文:知识赋能的信
- 下一篇: 论文浅尝 | KGQR: 用于交互式推荐