论文浅尝 | 一种用于多关系问答的可解释推理网络
論文筆記整理:譚亦鳴,東南大學博士生,研究方向為跨語言知識圖譜問答。
來源:COLING?2018
鏈接:https://www.aclweb.org/anthology/C18-1171
?
問題背景與動機
多關系問答(multi-relationquestion answering)是知識問答的一個重要任務,“多關系”指的是問題中包含多個關系和實體信息,為了回答這類問題,需要對知識庫中多個事實三元組進行分析和推理。
?
現有的方法主要可以分為兩類:基于語義分析;基于embedding;
?
基于語義分析的方法主要依賴于人工特征與標注,但是泛化能力較弱。
基于embedding的方法一般利用弱監督機制訓練得到end-to-end問答模型,但是現有的方法主要依賴于相似度計算而在推理方面有所欠缺。
?
在這篇文章中,作者提出‘可解釋推理網絡(Interpretable Reason Network,IRN)模型’用于解決多關系問答。通過多跳推理的形式完成多關系問題的問答過程。
?
貢獻
1.????提出面向多關系問答的IRN模型,并在性能上取得了state-of-art
2.?? 相對于現有推理網絡,這篇文章提出的方法更具可解釋性,多跳推理的過程可以清晰的反映答案生成的過程
模型
IRN的整體框架如圖所示,其中包含三個子模型:Input Module; ReasoningModule; Answer Module,分別用于問句的embedding,三元組推理以及答案的生成。
以問題‘Howold is Obama’s daughter?’ 為例,問題的解析、推理和回答過程包含三跳(3 hops),每個hop包含的過程相同,描述如下:
1.????Input Module:輸入問題(僅初始),得到問題的embedding形式q
2.????Reasoning Module:輸入q,以及對問題NER得到的實體信息e1,找到對應的關系r1
3.????Input Module:將已識別關系信息r1從q中去除,得到更新的q’,用于下一步推理
4.????Answer Module:根據已得到的e1和r1從知識庫中找到對應的答案信息
5.????Reasoning Module:將已分析實體信息e1與關系信息r1融合,并用于下一步推理
?
其中,獲取關系r的計算過程如以下公式所示:
實驗
實驗數據
本文實驗所使用的數據基于WorldCup2014,數據集的統計信息由表1所示。
?
實驗結果
對比模型說明:
1.????Embed (Bordes et al., 2014b):利用embedding空間將問題和答案進行匹配的方法
2.????Subgraph (Bordes et al., 2014a):在Embed基礎上利用實體子圖加強答案實體的表達
3.?? Seq2Seq (Sutskever et al., 2014):使用基于LSTM的encoder-decoder實現的語義解析模型
4.?? MemN2N (Sukhbaatar et al., 2015):使用記憶網絡構建的end2end模型,其中記憶單元包含了相關的三元組信息
5.?? KVMemN2N (Miller et al., 2016):在MemN2N的基礎上,將記憶單元劃分為鍵-值兩個部分,鍵為頭實體及關系,值為尾實體
6.????IRN-weak (This paper)
?
可解釋性分析
表3反映了IRN在多跳過程中識別關系和實體的精準度,r1/e1 -> rn/en -> a
?
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | 一种用于多关系问答的可解释推理网络的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一篇文章搞懂架构师的核心技能
- 下一篇: 论文小综 | 文档级关系抽取方法(上)