當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | 基于异质图交互模型进行篇章级事件抽取

發布時間：2024/7/5 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了论文浅尝 | 基于异质图交互模型进行篇章级事件抽取小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

筆記整理：婁東方，浙江大學 & 恒生電子股份有限公司博士后，研究方向為事件抽取

來源：ACL2021

鏈接：https://arxiv.org/abs/2105.14924

GitHub項目地址：https://github.com/RunxinXu/GIT

本文關注篇章事件抽取——建模篇章信息，從中發現事件，并抽取事件各角色對應屬性。現有方法主要關注句子事件抽取（假設事件屬性分布在同一句內/較小文本片段內），它們無法適用于事件屬性分散在篇章中多個句子的情形。如下圖所示，

篇章事件抽取問題的挑戰包括事件屬性分散（EO事件中，“Xiaoting Wu”出現在句子3和句子4中，“Nov 6, 2014”則出現在句子1和句子2中）和多事件（關聯性事件“股票增持”和“股票減持”）。現有方法DCFEE、Doc2EDAG等一般獨立地抽取事件，忽略它們之間內在關聯性。

本文提出的Graph-based Interaction Model with a Tracker (GIT)方法基于異質圖網絡完成篇章內句子、實體提及之間的交互，并引入tracker跟蹤預測事件記錄以及role對應抽取記錄。試驗證明它能增強實現篇章理解和事件關聯建模。

Motivation

針對篇章級事件抽取問題面臨的兩個挑戰，作者分別設計相應模塊予以解決。

1.同一事件屬性分散在篇章不同句子，需要對篇章信息充分理解。考慮構建句子和實體提及的異質圖，將實體之間、句子之間、實體與句子之間的信息建模起來，并應用GNN網絡進行編碼，增強實體提及和句子向量表示，篇章理解更細致；2.建模事件之間的依賴性。考慮將當前篇章中已抽取的事件記錄用memory存儲下來，在預測當前事件角色對應屬性過程中將memory中的信息考慮進來，從而使得事件關聯信息被捕捉到。

Model

上圖所示為本文提出GIT事件抽取框架。主要包括如下模塊：

1.句子編碼：將篇章的所有句子進行獨立編碼，模型為Transformer結構；

2.實體提及預測：基于句子編碼結果（每個token表示） + CRF解碼得到每個句子的實體提及預測結果；

3.構建異質圖：

?節點：句子、候選實體提及（上一步的結果）；

?????邊：句-句關系（全連接）、句內屬性之間關系（句內屬性全連接）、屬性-句關系（屬性與所在句相連）、跨句同名屬性關系（篇章同名屬性全連接）

4.GNN編碼器：輸出所有句子和實體提及對應的向量表示，它們已捕捉到全篇章信息；

5.事件類型發現：基于多頭機制將所有句子信息整合起來，獲取每個事件類型對應的向量表示，

并采用多標簽分類方式學習事件類型，對應損失函數為，

6.多事件屬性抽取。如圖所示，抽取步驟及原則如下，

?按照給定事件類型逐個抽取事件（例如，先抽EquityFreeze類型，再抽EquityPledge類型），按照給定角色順序逐個抽取屬性（在EquityFreeze類型的事件中，角色抽取順序為EquityHolder、FrozeShares、StartDate…）?構建tracker實時記錄當前抽取情況，存入memory，并在當前角色的屬性預測過程中將memory中的信息考慮進來。具體而言，當前角色屬性抽取考慮的因素包括

??: 實體候選（融合角色信息），??

??: 每個句子的向量表示；

??: 第i個事件記錄屬性序列，記錄屬性向量表示??

??: memory中已完成、未完成事件記錄的LSTM編碼結果。

?基于Transformer更新候選實體在當前角色下的向量表示，

基于更新之后的候選實體表示 ?E ? ?進行二分類，確定每個實體是否能成為當前“事件+角色”對應的屬性。屬性抽取對應的損失函數為

最終總損失包括：實體提及損失、事件類型發現損失和屬性抽取損失之和。

Experiment

實驗在中文金融事件抽取數據ChFinAnn上進行，結果表明GIT方法在該數據上達到SOTA；在單事件和多事件情況下表現都能顯著提升，基于GNN的異質圖編碼對文檔理解充分、基于tracker的事件關聯建模能增強多事件表現等。

OpenKG

OpenKG（中文開放知識圖譜）旨在推動以中文為核心的知識圖譜數據的開放、互聯及眾包，并促進知識圖譜算法、工具及平臺的開源開放。

點擊閱讀原文，進入 OpenKG 網站。

創作挑戰賽新人創作獎勵來咯，堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的论文浅尝 | 基于异质图交互模型进行篇章级事件抽取的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：论文浅尝 - TACL2020 | TY
下一篇：论文浅尝 | 多标签分类中的元学习