论文浅尝 | 基于异质图交互模型进行篇章级事件抽取
筆記整理:婁東方,浙江大學 & 恒生電子股份有限公司博士后,研究方向為事件抽取
來源:ACL2021
鏈接:https://arxiv.org/abs/2105.14924
GitHub項目地址:https://github.com/RunxinXu/GIT
本文關注篇章事件抽取——建模篇章信息,從中發現事件,并抽取事件各角色對應屬性。現有方法主要關注句子事件抽取(假設事件屬性分布在同一句內/較小文本片段內),它們無法適用于事件屬性分散在篇章中多個句子的情形。如下圖所示,
篇章事件抽取問題的挑戰包括事件屬性分散(EO事件中,“Xiaoting Wu”出現在句子3和句子4中,“Nov 6, 2014”則出現在句子1和句子2中)和多事件(關聯性事件“股票增持”和“股票減持”)。現有方法DCFEE、Doc2EDAG等一般獨立地抽取事件,忽略它們之間內在關聯性。
本文提出的Graph-based Interaction Model with a Tracker (GIT)方法基于異質圖網絡完成篇章內句子、實體提及之間的交互,并引入tracker跟蹤預測事件記錄以及role對應抽取記錄。試驗證明它能增強實現篇章理解和事件關聯建模。
Motivation
針對篇章級事件抽取問題面臨的兩個挑戰,作者分別設計相應模塊予以解決。
1.同一事件屬性分散在篇章不同句子,需要對篇章信息充分理解。考慮構建句子和實體提及的異質圖,將實體之間、句子之間、實體與句子之間的信息建模起來,并應用GNN網絡進行編碼,增強實體提及和句子向量表示,篇章理解更細致;2.建模事件之間的依賴性。考慮將當前篇章中已抽取的事件記錄用memory存儲下來,在預測當前事件角色對應屬性過程中將memory中的信息考慮進來,從而使得事件關聯信息被捕捉到。
Model
上圖所示為本文提出GIT事件抽取框架。主要包括如下模塊:
1.句子編碼:將篇章的所有句子進行獨立編碼,模型為Transformer結構;
2.實體提及預測:基于句子編碼結果(每個token表示) + CRF解碼得到每個句子的實體提及預測結果;
3.構建異質圖:
?節點:句子、候選實體提及(上一步的結果);
?????邊:句-句關系(全連接)、句內屬性之間關系(句內屬性全連接)、屬性-句關系(屬性與所在句相連)、跨句同名屬性關系(篇章同名屬性全連接)
4.GNN編碼器:輸出所有句子和實體提及對應的向量表示,它們已捕捉到全篇章信息;
5.事件類型發現:基于多頭機制將所有句子信息整合起來,獲取每個事件類型對應的向量表示,
并采用多標簽分類方式學習事件類型,對應損失函數為,
6.多事件屬性抽取。如圖所示,抽取步驟及原則如下,
?按照給定事件類型逐個抽取事件(例如,先抽EquityFreeze類型,再抽EquityPledge類型),按照給定角色順序逐個抽取屬性(在EquityFreeze類型的事件中,角色抽取順序為EquityHolder、FrozeShares、StartDate…)?構建tracker實時記錄當前抽取情況,存入memory,并在當前角色的屬性預測過程中將memory中的信息考慮進來。具體而言,當前角色屬性抽取考慮的因素包括
??: 實體候選(融合角色信息),??
??: 每個句子的向量表示;
??: 第i個事件記錄屬性序列,記錄屬性向量表示??
??: memory中已完成、未完成事件記錄的LSTM編碼結果。
?基于Transformer更新候選實體在當前角色下的向量表示,
基于更新之后的候選實體表示 ?E ? ?進行二分類,確定每個實體是否能成為當前“事件+角色”對應的屬性。屬性抽取對應的損失函數為
最終總損失包括:實體提及損失、事件類型發現損失和屬性抽取損失之和。
Experiment
實驗在中文金融事件抽取數據ChFinAnn上進行,結果表明GIT方法在該數據上達到SOTA;在單事件和多事件情況下表現都能顯著提升,基于GNN的異質圖編碼對文檔理解充分、基于tracker的事件關聯建模能增強多事件表現等。
OpenKG
OpenKG(中文開放知識圖譜)旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包,并促進知識圖譜算法、工具及平臺的開源開放。
點擊閱讀原文,進入 OpenKG 網站。
總結
以上是生活随笔為你收集整理的论文浅尝 | 基于异质图交互模型进行篇章级事件抽取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 - TACL2020 | TY
- 下一篇: 论文浅尝 | 多标签分类中的元学习