metapath2vec: Scalable Representation Learning for Heterogeneous Networks
研究意義:
1、將Random Walk + Skip2gram? 的框架擴展到異質圖,以及圖和在多種類型的節(jié)點之間定義節(jié)點的上下文,從而產生好的訓練語料
2、基于異質圖的隨機游走算法表達了不同節(jié)點之間的語義和結構關聯
3、早期研究異質圖學習的工作,擴展了更多類型的網絡圖表示學習研究
?
本文主要結構如下所示:
?一、Abstract
基于傳統(tǒng)圖的圖表征學習算法無法很好的應用到點和邊有多個類型的異質圖,提出本文的算法metapath2vec,具體如下:
1、強調前人研究的模型都是基于同質網絡,無法更好的表達點和邊的多樣性
2、基于異質圖上的meta-path涉及random walk等算法
3、基于skip2gram算法框架和負采樣算法完成異質圖的學習
4、通過節(jié)點分類、聚類、相似性等任務在Aminer和DBIS兩個數據集驗證了模型的有效性
二、Introduction
很多算法集中在同質網絡中,如DeepWalk、LINE、Node2vec等,引出異質圖中的多類型的點和邊所存在的廣泛應用
三、Related work
介紹了鄰接矩陣分解的網絡表征算法開銷大,并且效果不理想,同時介紹了DeepWalk、LINE、Node2vec算法
四、Problem Definition
定義異質圖上的網絡表征學習表示metapath
?
主要對問題進行了一下定義,例如,同質網絡點和邊的屬性都是一種,但是異質網絡是多種,邊的屬性個數與點的屬性個數加和大于2,以及對維度進行定義
?
五、Metapath2vec
論文算法的模型部分,異質圖上的skipgram算法以及基于metapath的隨機游走算法
首先介紹了同質網絡的目標函數(3.1),在(3.2)中先介紹了異質網絡的Skip-Gram 需要分節(jié)點的類型進行計算、softmax的定義以及損失函數,如下圖所示:
之后介紹了Meta-Path-Based Random Walk部分:
?
六、Metapath2vec++
異質圖上的負采樣算法,異質圖學習算法的完整框架
metapath2vec存在一個問題就是定義softmax時沒有分節(jié)點類型進行計算,metapath2vec++對這個問題進行改進,并且給出metapath2vec++的算法框架,如下圖所示
七、Dataset and Baselines
選取Aminer和DBIS數據集以及DeepWalk、LINE、PTE、鄰接表分解等baselines
八、Effectiveness
論文通過實驗探究了模型的有效性、節(jié)點分類、節(jié)點聚類、點相似性、可視化等
九、Conclusion
總結并提出了一種基于異質圖的神經網絡框架
啟發(fā)點:
1、對異質圖的理解多類型的點和邊
2、random walk + skip2gram經典框架
3、算法設計將同質圖經典框架通過修改損失函數softmax和負采樣適用于異質圖
關鍵點:
1、異質圖的理解
2、meta-path的概念
3、損失函數的表達
4、skip-gram多項分布
創(chuàng)新點:
1、基于meta-path的隨機游走
2、softmax的修改
3、負采樣的修改
4、異質圖的實驗論證
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的metapath2vec: Scalable Representation Learning for Heterogeneous Networks的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GraphSAGE: Inductive
- 下一篇: Translating Embeddin