社会网络分析(四) | 快速上手Gephi,绘制小说人物关系网络
本次是社會網絡分析專輯的第四篇文章,往期文章請查閱——
社會網絡分析(一) | python的Networkx庫基礎知識
社會網絡分析(二) | 論文閱讀:中國與國際媒體互引的社會網絡分析
社會網絡分析(三) | 社會網絡分析中的基本概念
?
如題,數據猿將展示如何快速使用Gephi的基本功能,完成社會網絡數據的可視化、
目錄如下——
?
Gephi簡介
Gephi 是一款轉為網絡分析為目的設計的一款數據可視化處理軟件,立志Like Photoshop? for graphs.,向PhotoShop看齊。
所以,整體來看,Gephi的功能非常簡潔方便,工具欄菜單欄都有那么一點兒PS的風格,是社會網絡可視化中最方便的工具(自認為沒有之一)。
?
演示環境:gephi 0.92
數據準備
本文使用《倚天屠龍記》人物的共現關系的矩陣數據,形成無向單圖。
數據大致結構如下所示——
以上矩陣數據的思想是,兩個名字在小說中的同一段落出現過,兩人在矩陣中的值就計為1,沒有同時出現就是空值。這樣就能匯聚互相聯系的名字形成網絡了。
導入數據
進入Gephi,點擊文件,點擊導入電子表格。
Gephi支持三種類型的excel數據導入,分別是——
其中,最通用的是矩陣和節點+邊表格
-
邊數據+節點表格;分別需要導入邊數據和節點數據,類似于networkx生成圖的原理。需要注意的是,邊數據是必不可少的,可以有Source和Target的點,分別表示連入和連出的點,需要一一對應,包括邊的權重。節點數據就有每一個點的屬性。
-
矩陣數據:兩個節點對應的屬性值組成的矩陣,可以看作是Source和Target再加上一個屬性的數據結構。我們本次演示就是矩陣類型的數據。
導入數據后,選擇分隔符和所導入數據的表格類型,有的時候需要指定字符集,有時Gephi并不能很好地識別csv或者Excel的編碼,就需要手動調整了。
后續只需要繼續下一步和完成即可,最后,我們得到這樣一個粗糙的原始圖——
布局
Gephi主要有布局、統計、外觀、過濾、概覽、預覽這6大功能。
因為最終的目的是可視化,作為最為可視化中最重要的布局部分就需要多次操作,已符合我們的可視化要求。
Gephi內置了七種布局方法,各有千秋,最常用的是Force Atlas、YIfan Hu和OpenOrd。可以快速實現較為美觀的圖形布局。
經過OpenOrd的初步布局,如下所示——
?
統計
統計功能中的概念,之前在 ?【社會網絡分析(三) | 社會網絡分析中的基本概念】 一文中有所涉及,相當于一個計算的過程,可以得到圖的每一行數據的算法結果。
這里,我將全部算法都運行一下——
?
外觀
外觀功能決定著可視化是否好看。
可以發現,外觀下方可以來調整節點和邊的顏色、大小、標簽顏色、標簽尺寸。可以分為統一顏色、分類和排序三個分類功能。
如下所示,依據度的結果,調整節點的大小排序——
依據模塊化的結果,給節點分類涂色——
?
布局(第二次)
經過以上操作,圖像已經有點顏色了,為了更清晰地顯示重點信息,我們再次布局。
這里,調整為了Force Atlas來布局。為了節點之間分布比較集中,增大了吸引強度參數。
可以清晰地看到,社區探測為同一“群體”的,都集中在一個位置。
?
概覽
為了便于觀察,需要給每個節點顯示標簽。在這里顯示的就是每一個角色名字。
注意,需要打開標簽顯示,然后設置節點顯示方式,再設置顯示字體(若要要顯示中文的話,必須是中文字體)
可以清晰地看到,少林寺的和尚都是橙色那一類,朱元璋一伙都是綠色一類,丐幫基本是黑色一類。
這些都是通過模塊化算法得來,當然可以使用其他來顯示,也能得到一些有意思的信息。
?
過濾
數據猿想要知道張無忌等主要角色的人物關系。所以就需要找到“度”較高的角色,在網絡中和很多人有關系的。
因此,這些找到過濾功能,在拓撲中選擇度范圍,將其拖拽到查詢中,拉動度范圍設置,這里的設置參數可以根據實際情況調整。點擊自動應用后,得到如下圖形——
布局(第三次)
為了使得過濾出的也好看一點,所以再次進行布局調整。
調整其吸引強度,使得網絡之間疏密比較合適,便于看清楚人物關系和相應的標簽。
預覽
經過以上步驟,我們發現,圖像已經像那么回事了。但如何導出圖形呢?就需要預覽功能了。
相對概覽來說,預覽中功能更全。預覽可以詳細調整節點和標簽、節點和邊的顯示。這里,數據猿調整了圖形的字體、顏色和邊的顯示。
本來希望看起來更好看,不過限于數據猿的審美水平,最后的效果貌似也不好看。
在預覽中得到合適的圖形,就可以點擊預覽視窗左下角,將其保存為PNG、JPG文件了。
?
小結
本文是軟件操作的教程文章,比較枯燥,耐心看到這里已經很不容易了。比心
emmm....廢話不說,直接上Gephi進階建議——
查閱劉勇老師的書籍《網絡數據可視化與分析利器:Gephi 中文教程(全彩)》。想要精通Gephi,閱讀英文的文檔比較難,而這本書門檻低,講解詳細全面,非常適合中文環境下的Gephi學習。
除了數據分析基本概念,還需要增加一些設計思想,保證可以從容地使用布局和外觀功能,得到漂亮的圖形。
?
本文寫作較倉促,部分操作過程沒有詳細呈現,如需要交流請直接在本文下方留言~
?
?
往期經典文章:
社會網絡分析(三) | 社會網絡分析中的基本概念
python辦公自動化(一) | chardet庫自動讀寫多編碼格式的文件
python辦公自動化(二) | 讀取.txt、.data、.doc和.docx文檔的部分內容
?
?
?
參考資料:
官方網站: https://gephi.org/
劉勇,杜一.網絡數據可視化與分析利器:Gephi 中文教程(全彩)[M]. 北京:電子工業出版社.2017
?
文字編輯:數據猿Riggle
首發平臺:文科數據員(vxID:HSS_data)
?
總結
以上是生活随笔為你收集整理的社会网络分析(四) | 快速上手Gephi,绘制小说人物关系网络的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 飞秋(FeiQ)爱好者 2013年6月,
- 下一篇: CAD中怎么修改导线线型?怎么连接导线?