论文浅尝 | Zero-Shot Transfer Learning for Event Extraction
事件抽取的目標是在非結構化的文本中確認事件的觸發詞(Eventtrigger)和參與者(Event argument),并判斷觸法詞的事件類型(Eventtype),判斷參與者在事件中的扮演的角色(Argument role)。有觸發詞和參與者的短語或文本稱為EventMention。如下圖的關于Transport-Person 事件的一條EventMention,dispatching是觸發詞,下劃線是參與者,其中China作為Agent參與事件。
目前大多數的事件抽取是基于已有的手動標記樣本進行訓練。常見的數據集ACE,總共有8個大類,33個小類,對每個類,有人為標記的訓練語料。但是對于沒有樣本的新事件類型,用上述語料訓練的模型會顯得無力。對此,一是可以用遠程監督的方法標記訓練樣本,二是用遷移學習方法。本文基于第二點的,提出在事件抽取任務中用零樣本遷移學習方法:將event mention 和event ontology聯合映射到共享的語義空間上,拉近兩者在語義空間上的距離。
具體來說:對于新的語料,可以用AMR得到具體事件mention的結構,同時提供已定義好的關于事件類型ontology的結構。如上圖所示,是對上述E1進行處理后得到mention的結構和一些已定義好的ontology結構。可以看到,事件觸發詞和事件類型名通常有一些共享含義,同時,兩者的結構也趨于相似。本文基于這兩點,將mention和ontology的結構表示聯合映射到同一語義空間,最小化mention和對應的ontology的語義距離,從而學習一個通用映射函數,將已有樣本訓練得到的模型遷移到沒有樣本的事件中,整體框架如下:
分為如下幾步:
1. 找出候選觸發詞和候選參與者,稱為Tiggerand Argument Identification
用WSD找出觸發詞候選項,并用FrameNet中的Lexical units匹配文本擴充觸發詞候選項;利用ARMparser找出參與者候選項。
2. 確定觸發詞對應的事件類型,稱為 Tigger Classification
觸發詞分類主要是用CNN模型,模型的輸入考慮了兩個部分 [V_t,V_(S_t)]:V_t 觸發詞本身的語義表示,可以用word2vec來訓練;觸發詞t的結構是 S_t,V_(S_t)是 S_t 的表示; ontology的 [V_y,V_(S_y)] 輸入同理。
對于 V_(S_t),分兩步進行:首先結構中的每條邊,可以表示為 u=<w_1,λ,w_2>,用 M_λ 表示關系,可以得到每個元組的表示 V_u,對應公式如下;之后將 t 的所有元組的表示 V_u 拼接起來,輸入到CNN網絡中,得到V_(S_t)。
對于 V_(S_y),ontology的每個元祖表示為?u^'=<y,r>, y 是事件類型,r 是參與者角色,?V_u' 的表示如下,之后也輸入到CNN中得到 V_(S_y)。
通過hinge loss來訓練模型,將mention和ontology的表示學習到同一語義空間:
3. 確定參與者在事件中扮演的角色,稱為ArgumentClassification
參與角色的分類是基于觸發詞到參與者路徑的相似度。仍以E1為例,通過將dispatch-01—>:ARG0—>China和Transport-Person—>Agent的路徑信息學習到同一語義空間,之后根據語義相似度判斷China在Transport-Person中的扮演的角色是Agent。
4. 預測新類別
測試時候,對于新的?t',用訓練好的模型得到 t' 的結構化表示和所有ontology的結構化表示,距離最近的就是預測的結果。
本文進行了比較豐富的實驗:
1. 在ACE數據集上進行實驗,實驗中可見類設置如下,N表示可見類的數量:
上述設置下得到的效果如下,WSD-Embedding沒有將結構信息考慮到遷移的過程中。可以在遷移學習過程中考慮更多的機構化信息,得到的效果更好;可見類越多,效果越好。
2. 用ACE的 Justice類的4個小類做訓練,用其余三個或用其他大類下隨機的一個小類作測試。可以看到,測試類跟訓練類的相似度越高,效果越好。
3. 使用LSTM在所有類上進行訓練和測試,和用ZSL進行訓練和測試的效果對比。可以看到用ZSL訓練得到的效果和用LSTM訓練近500條樣本得到的效果不相上下。
筆記整理:王若旭,浙江大學碩士,研究方向為知識圖譜,自然語言處理.
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
轉載須知:轉載需注明來源“OpenKG.CN”、作者及原文鏈接。如需修改標題,請注明原標題。
?
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | Zero-Shot Transfer Learning for Event Extraction的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | Interaction E
- 下一篇: 领域应用 | OMAHA联盟发布“疾病临