Translating Embedding for Modeling Multi-relational Data
研究意義:
1、學到了實體(entity)和關系(relation)的embedding表示
2、模型簡單而有效,容易訓練
3、啟發(fā)了整個Trans系列知識表示學習,代表性工作有transH,transR,transD
4、引用量較高
?
本文主要結構如下所示:
一、Abstract
? ? ? ? ? ?提出基于一對多關系數據的建模,將實體和關系映射到低維空間
? ? ? ? ? ?摘要主要說明以下幾個主要的關鍵點:
? ? ? ? ? ?1、使用低維向量表示三元組數據(知識圖譜)的實體和關系
? ? ? ? ? ?2、易于訓練、模型參數少、可以擴展到大的數據
? ? ? ? ? ?3、模型的損失函數是基于實體和關系向量的計算(translations)
? ? ? ? ? ?4、通過邊的預測等任務在兩個數據集驗證了模型的有效性
二、Introduction
? ? ? ? ? 多關系數據廣泛存在于社交網絡、推薦系統(tǒng)、知識圖譜,但是難點再于多類型的邊
三、TransE
? ? ? ? ? 基于embedding最大間隔負采樣,提出transE模型
?
目標函數構建
?
四、Related Work
? ? ? ? ? 與SE、SME、LFM模型比較TransE模型減少了參數,而且模型更有效
?
五、Experiment
? ? ? ? ? 實驗選取wordnet和freebase數據集,探究模型有效性,邊的預測,案例分析
? ? ? ? ? 邊預測效果:
? ? ? ?
? ? ? ? ? 三元組分多個類別效果統(tǒng)計:
?
? ? ? ? ?案例分析:
?
? ? ? ? 新關系預測:
?
六、Conclusion
? ? ? ? ?總結TransE的優(yōu)點、參數少、效果好、易擴展
? ? ? ? ?關鍵點: 1、三元組的表示方式? 2、負樣本構建? ?3、損失函數的構建??
? ? ? ? ?創(chuàng)新點: 1、transE基礎模型? 2、較多的論證實驗
?
七、Code
? ? ? ? ?開源代碼:?https://github.com/thunlp/OpenKE ? ? ??
?
八、Trans系列后期改進算法(附加)
?TransE存在的問題是: 一對多、多對一、多對多問題,導致實體向量表示相同
?TransH解決上述TransE存在的問題,主要思路是因為實體在不同關系上有不同的embedding,主要操作方式是映射到超平面上
? ? ? ? ? TransE和TransH算法存在的問題是: 實體和關系由于是不同類型的點,可能存在于不同的空間
? ? ? ? ? TransR解決思路是將實體映射到關系的空間上,主要通過矩陣的轉換映射
? ? ? ? ?TransR存在的問題是:同一個關系對應的實體是同樣的映射;映射只由關系決定;矩陣轉換操作復雜度較大
? ? ? ? ?TransD解決思路是: 將M用向量表示替代
? ? ? ? ? Trans系列算法對比:
?
?
總結
以上是生活随笔為你收集整理的Translating Embedding for Modeling Multi-relational Data的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: metapath2vec: Scalab
- 下一篇: 计算图与动态图