论文浅尝 | GNN with Generated Parameters for Relation Extraction
論文筆記整理:申時榮,東南大學博士生。
地址:https://arxiv.org/pdf/1902.00756.pdf
來源:ACL2019
在許多自然語言處理任務(例如關系提取)中,多跳關系推理是必不可少的,而圖神經網絡(GNN)是進行多跳關系推理的最有效方法之一。
但是,大多數現有的GNN只能在預定義圖上處理多跳關系推理,而不能直接應用于自然語言關系推理中。也就是說,如果對于圖中的節點和邊無法提前定義的話,傳統的圖模型方法就不適用。于是本文提出了一種通過自然語言來生成圖模型中邊的參數的方法,來定義新的圖模型結構。本質上是通過無結構數據構建實體間信息傳遞的參數矩陣,不局限于預定義的圖結構。其整體框架如下圖所示:
Graph Neural Network with Generated Parameters (GP-GNNs)實現細節:
1. 定義全連接的圖
其中節點對應所有的entities,邊對應語料中提取的特定的自然語言序列。
2. 編碼模塊,通過對邊對應的自然語言序列進行編碼(特征提取),將非結構化數據映射到一個轉移矩陣。其中自然語言的編碼過程和傳統方法一致,通過嵌入層和LSTM,GRU或CNN進行編碼。
在文章里使用了BiLSTM對句子進行編碼,之后使用帶有非線性激活函數的多層感知機將BiLSTM的輸出轉換成一高維向量,并將詞向量reshape 成為一個矩陣用來傳遞節點信息。
3. 傳遞模塊,這個模塊做的事情和傳統的GNN一致,輸入是節點(entities)的初始化嵌入,通過GNN的迭代,輸出經過再次編碼的節點嵌入,當然,這里用的傳遞矩陣不是可訓練的參數,而是來自編碼模塊輸出的矩陣。
4. 分類器,這里的分類器也和傳統分類器一致,輸入為label(relation)的表示向量,所有節點的嵌入,輸出每個類別的概率。
??????????? 本文中,用于兩個節點之間的關系推理使用了這兩個節點在每一層GNN的輸出信息構建了特征向量,使用多層感知機+softmax輸出分類概率,
5. 實驗及結果,
參數設置:
數據集:
Distantly labeled set Sorokin and Gurevych (2017)
Human annotated test set (Sorokin and Gurevych, 2017)
Dense distantly labeled testset
結果:
?
?
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | GNN with Generated Parameters for Relation Extraction的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 陈睿:架构设计之数据库拆分六大原则
- 下一篇: 论文浅尝 - WSDM2020 | QA