Exploratory Social Network Analysis with Pajek(第三版)1-1
文章目錄
- 第一部分基礎
- 一、尋找社會結構
- 1.1 引言
- 1.2 社會計量學和社會學圖
- 1.3 探索性社會網絡分析
- 1.3.1 網絡定義
- 1.3.2 操作
第一部分基礎
社交網絡分析側重于例如人、人群、組織和國家之間的聯系。這些聯系結合起來形成網絡,我們將學習分析這些網絡。本書的第一部分介紹了社交網絡的概念。我們討論了幾種類型的網絡,以及我們使用計算機軟件程序 Pajek 對它們進行數字和可視化分析的方法,本書通篇使用該程序。學習完第 1 章和第 2 章后,您應該了解社交網絡的概念,并能夠使用本書中介紹的軟件創建、操作和可視化社交網絡。
一、尋找社會結構
1.1 引言
社會科學關注結構人類群體、社區、組織、市場、社會或世界體系的結構。在本書中,我們將社會結構概念化為社會關系網絡。社交網絡分析師假設人際關系很重要,組織或國家之間的關系也很重要,因為它們傳遞行為、態度、信息或商品。社會網絡分析提供了分析社會關系的方法;它告訴我們如何概念化社交網絡以及如何分析它們。
在本書中,我們介紹了探索社交網絡的最重要方法,強調視覺探索。從社交網絡分析一開始,網絡可視化就一直是研究人員的重要工具。本章介紹了社交網絡的基本要素,并展示了如何構建和繪制社交網絡。
1.2 社會計量學和社會學圖
社會網絡可視化的基礎是由自稱為社會計量學家的研究人員奠定的。他們的領袖 J. L. Moreno 創立了一門名為社會計量學的社會科學,專門研究人際關系。他們認為,社會并不是統計學家假設的個人及其特征的集合體,而是人際關系的結構。因此,個人不是社會的基本單位。社會原子由個人及其社會、經濟或文化關系組成。社會原子被連接成群體,最終,社會由相互關聯的群體組成。
從他們的角度來看,社會計量學家研究小群體的結構而不是整個社會的結構是可以理解的。特別是,他們調查了一個小組內的社會選擇。他們問人們諸如“你會選擇誰作為朋友[同事、顧問等]?”之類的問題。這種類型的數據后來被稱為社會計量選擇。在社會計量學中,社會選擇被認為是社會關系最重要的表現形式。
圖 2 展示了社會計量研究的一個例子。它描繪了住在紐約州一所培訓學校的一個“小屋”(宿舍)中的 26 個女孩的選擇。女孩們被要求選擇她們最喜歡的女孩作為她們的餐桌伙伴。僅選擇第一個和第二個選項。
圖 2 是社會圖的示例,它是群體結構的圖形表示。社會圖是起源于社會計量學的最重要的工具之一,它是社會網絡可視化的基礎。您很可能已經“閱讀”并理解了該圖,無需以下解釋,這說明了它的視覺吸引力和概念清晰度。在這張社會圖中,宿舍里的每個女孩都用一個圓圈表示。為了便于識別,女孩的名字寫在圓圈旁邊。每條弧線(箭頭)代表一個選擇。女孩向她選擇的作為餐桌伴侶的女孩發出弧線。例如,Irene(在圖的右下角)選擇 Hilda作為她最喜歡的餐桌搭檔,而Ellen是她第二選擇,如同每個箭頭上的數字所示。
社會圖描繪了一個群體內的聯系結構。這個例子不僅顯示了哪些女孩很受歡迎,如她們收到的選擇數所示,而且還顯示了這些選擇是來自受歡迎的女孩還是不受歡迎的女孩。例如,Hilda 從 Irene、Ruth、Hazel 和 Betty 那里得到了四個選擇,她回應了最后兩個選擇。然而,這四個女孩中沒有一個被其他女孩選中。因此,Hilda 位于社會圖的邊緣,而僅被選中兩次的 Frances 則更為中心,因為她被 Adele 和 Marion 這兩個“受歡迎的”女孩選中。對選擇的簡單計數并不能揭示這一點,而社會圖則可以。
社會圖已被證明是一種重要的分析工具,有助于揭示社會群體的幾個結構特征。在本書中,我們充分利用了它。
1.3 探索性社會網絡分析
社會計量學并不是社會科學中唯一關注社會關系的傳統。在不深入歷史細節的情況下,我們可能會注意到來自多個社會科學的科學家已經將網絡分析應用于不同類型的社會關系和社會單元。人類學家研究人與人之間的親屬關系、友誼和送禮,而不是社會計量學的選擇;社會心理學家關注情感;政治學家研究人、組織或國家之間的權力關系;經濟學家研究公司之間的貿易和組織關系。在本書中,參與者一詞是指參與社會關系的個人、組織或國家。可以說,社會網絡分析研究了參與者之間的社會關系。
- 社交網絡分析的主要目標是檢測和解釋參與者之間的社會關系模式。
本書只關注探索性社交網絡分析。這意味著我們事先沒有可以測試的關于網絡結構的具體假設。例如,關于餐桌伙伴網絡的假設可以預測特定的相互選擇率(例如,五種選擇中的一種將得到回報)。這一假設必須以社會理論和先前的研究經驗為基礎。如果有足夠的統計模型可用,則可以檢驗該假設。
我們在本書中沒有使用假設檢驗(最后一章除外),因為我們不能假設在介紹性課程書中有先前的研究經驗,而且因為統計模型是復雜的。因此,我們采用探索性方法,假設社交網絡中關系的結構或模式(structure or pattern)對網絡成員有意義,因此對研究人員也有意義。我們沒有測試預先指定的結構假設,而是探索社交網絡以尋找有意義的模式。
出于類似的原因,我們不關注從樣本中估計網絡特征。在網絡分析中,估計技術甚至比統計中的估計更復雜,因為隨機樣本的結構很少與整個網絡的結構相匹配。很容易證明這一點。例如,從餐桌伙伴網絡中隨機選擇五個女孩,并專注于她們之間的選擇。您會發現每個人的選擇少于整個網絡中的兩個選擇,原因很簡單,即指向樣本外女孩的選擇被忽略了。即使從這個簡單的方面,樣本也不能代表網絡。
我們分析整個網絡而不是樣本。但是,什么是全網?社會計量學假設社會由相互關聯的群體組成,因此網絡包含整個社會。對所謂的小世界問題的研究表明,熟人關系通過六到七個步驟(即通過五到六個中間人)將我們與地球上幾乎每個人聯系起來,因此我們的網絡最終覆蓋了整個世界人口,即顯然網絡太大而無法研究。因此,我們必須使用人為的標準來界定我們正在研究的網絡。例如,我們可能只研究一個宿舍的女孩。我們不知道他們對其他宿舍餐桌伙伴的偏好。也許Hilda 是一群肉食動物中唯一的素食主義者,她更喜歡和其他宿舍的女孩一起吃飯。如果是這樣,包括不同宿舍成員之間的選擇將極大地改變Hilda 在網絡中的地位。
因為邊界標準可能會嚴重影響網絡的結構,所以仔細考慮它是很重要的。使用實質性的論據來支持你決定將誰包含在網絡中以及排除誰。
探索性社交網絡分析由四個部分組成:網絡的定義、網絡操作、結構特征的確定和可視化檢驗。在后面的小節中,我們將概述這些技術。本概述旨在介紹網絡分析中的基本概念,并幫助您開始使用本書中使用的軟件。
1.3.1 網絡定義
要分析一個網絡,我們首先必須有一個網絡。什么是網絡?在這里和其他地方,我們使用數學的一個分支——圖論來定義概念。我們在本書中介紹的大多數網絡特征都源自圖論。雖然這不是圖論課程,但您應該仔細研究定義以了解您在應用網絡分析時所做的事情。
- 圖是一系列頂點和一系列頂點對之間的線。
什么是圖?一張圖代表了一個網絡的結構;它所需要的只是一系列頂點(也稱為點或節點)和一組線,每條線連接兩個頂點。
頂點是網絡中的最小單位。在社交網絡分析中,它代表一個參與者(例如,一個人,比如宿舍里的一個女孩;一個組織;或一個國家)。頂點通常由數字標識。
線是網絡中兩個頂點之間的鏈接。在社交網絡分析中,它可以是任何社會關系。一條線由它的兩個端點定義,端點是與該線相交的兩個頂點。
環是一種特殊的線,即連接頂點和自身的線。在餐桌伙伴網絡中,不會出現環,因為不允許女孩選擇自己作為餐桌伙伴。然而,環在某些類型的網絡中是有意義的。
一條線或者有向或者無向。有向線稱為弧(Arc),無向線稱為邊(Edge)。社會計量選擇最好用弧表示,因為一個女孩選擇另一個女孩,而選擇不需要互惠(例如,圖 2 中的 Ella 和 Ellen)。
有向圖(directed graph, or digraph)包含一個或多個弧。無向的社會關系(例如,學校項目上的合作)由一條邊表示,因為兩個人都平等地參與了這種關系。無向圖不包含弧:它的所有線都是邊。
形式上,弧是一對有序的頂點,其中第一個頂點是發送者(弧的尾部),第二個頂點是關系的接收者(弧的頭部)。弧從發送者指向接收者。相反,沒有方向的邊由無序對表示。在這對中哪個頂點是第一個或第二個并不重要。但是,我們應該注意,一條邊通常相當于一條雙向弧:如果 Ella 和 Ellen 合作(無向),我們可以說 Ella 與 Ellen 合作,Ellen 與 Ella 合作(有向)。重要的是要注意這一點,我們將在后面的章節中看到。
餐桌合作伙伴網絡沒有多重邊,因為不允許女孩提名同一個女孩作為第一和第二選擇。如果沒有研究人員施加的這種限制,可能會出現多重弧,并且它們實際上確實出現在其他社交網絡中。
在一個圖中,允許有重邊,但是當我們說一個圖是簡單圖時,我們指出它沒有多重邊。此外,簡單無向圖不包含環,而簡單有向圖中允許有環。記住這一點很重要。
- 一個簡單無向圖既不包含多重邊也不包含環。
- 一個簡單有向圖不包含多重弧。
既然我們已經詳細討論了圖的概念,那么定義網絡就很容易了。網絡由圖和關于圖的頂點或線的附加信息組成。我們應該注意,附加信息與網絡的結構無關,因為結構取決于關系(ties)的模式。
-網絡由圖和關于圖的頂點或線的附加信息組成。
在餐桌伙伴網絡中,女孩的名字代表了頂點的附加信息,這將圖(graph)變成網絡(network)。由于這些信息,我們可以在社會圖中看到哪個頂點標識了 Ella。印在弧和邊附近的數字提供了有關女孩之間聯系的附加信息:1 表示第一選擇,2 表示第二選擇。這些被稱為線值,通常表示關系的強度,它是一個數。
線也可以具有特定的特性;例如,它們可以是特定類型。餐桌合作伙伴網絡中的所有線都是同一類型,表達了座位偏好。我們可以說它們表達了座位偏好關系。然而,一個網絡可以包含多個關系。也許我們也知道哪些女孩在課堂項目上合作過。因為該信息涉及同一系列頂點(女孩),我們可以將此信息添加為第二組線,即作為與網絡的第二個關系。這創建了一個多重關系網絡,也稱為多重網絡( multiplex network)。
餐桌合作伙伴網絡顯然是一個網絡,而不是一個圖。它是一個有向簡單網絡,因為它包含弧(有向)但不包含多重弧(簡單)。此外,我們知道它只包含一種關系,沒有環。我們討論的幾種分析技術假設網絡中不存在環和多重線。但是,我們并不總是說明網絡的這些屬性,而是指出它是否簡單圖。小心!
應用
在本書中,我們通過實踐學習社交網絡分析。我們使用計算機程序 Pajek(斯洛文尼亞語中的蜘蛛)來分析和繪制社交網絡。本書專用網站 (http://mrvar.fdv.uni-lj.si/pajek/) 包含該軟件。我們建議您在您的計算機上下載并安裝 Pajek,以及本網站的所有示例數據集。按照網站上提供的指南將軟件和數據集存儲在計算機的硬盤上。完成后,執行我們在每章“應用程序”下討論的命令。這將使您熟悉結構概念和 Pajek。除非另有說明,否則通過逐步遵循“應用”下的說明,您將能夠生成理論部分中提供的數字和結果。有時,您計算機屏幕上的可視化效果會與書中的數字略有不同。但是,如果一般模式匹配,您就知道您走在正確的軌道上。
圖論中的一些概念是 Pajek 的構建單元或數據對象。當然,網絡是 Pajek 中最重要的數據對象,所以讓我們先描述一下。在 Pajek 中,網絡是根據圖論定義的:頂點列表以及弧和邊的列表,其中每條弧或邊都有一個值。看一下餐桌伙伴網絡數據文件的部分列表(圖 3;請注意,部分頂點和弧被替換為 […])。
首先,數據文件指明頂點的數量。然后,每個頂點標識在單獨的一行上,由序列號、文本標簽(用引號 [“ ”] 括起來)和 0 到 1 之間的三個實數組成,三個實數表示在繪制網絡時頂點在三維空間中的位置。我們將在第 2 章中更加關注這些坐標。現在,只要知道第一個數字指定頂點的水平位置(0 位于屏幕左側,1 位于右側),第二個數字給出頂點的垂直位置(0 是屏幕頂部,1 是底部)。文本標簽對于識別頂點至關重要,因為頂點的序列號可能在分析過程中發生變化。
頂點列表后面是弧列表。 ?Arcs 語句將關系編號 1(冒號后面的整數)分配給后續行中指定的弧,并且該關系被標記為“dining-table partner choice”。請注意,標簽應該用雙引號引起來。每行標識一條弧,通過發送頂點的序列號,后跟接收頂點的編號和弧的值來標記。就像在圖論中一樣,Pajek 將一條線定義為一對頂點。在圖 3 中,第一條弧線代表 Ada 的選擇(頂點 1)餐桌伙伴。 Louise是 Ada的第二選擇; 在第二個弧表示的選擇中,Cora 是Ada的第一選擇。邊列表類似于弧列表,除了在計算中忽略標識邊的兩個頂點的順序。在這個數據文件中,邊表示女孩之間的合作,這里將這個標簽編碼為2。邊以“cooperation"作為名稱。請注意,Pajek 網絡文件可以包含多個?Arcs 和?Edges 語句,并且關系編號和標簽不是強制性的。
有趣的是,我們可以區分結構數據或圖與網絡數據文件中頂點和線的附加信息。圖完全由頂點序列號列表和頂點對列表定義,頂點對列表定義了它的弧和邊。這部分數據在圖 3 中以常規字體打印,表示網絡的結構。頂點標簽和坐標、關系序列號和標簽、線值和標簽(斜體)指定了使這些數據成為網絡的頂點和線的附加屬性。盡管此信息非常有用,但不是必需的:如果它們未在數據文件中指定,Pajek 將使用頂點序列號作為默認標簽,并將關系序列號和線值設置為 1。此外,Pajek 可以使用其他幾種數據格式(例如,矩陣格式),我們在這里不討論。
通過以純文本格式導出相關數據,可以從電子表格和數據庫生成即用型網絡文件。對于中型或大型網絡,將數據用關系數據庫進行處理有助于數據清洗和編碼。
我們在 1.4 節解釋了如何創建一個新的網絡。讓我們先看看包含餐桌伙伴選擇和女生合作的宿舍網絡。首先,通過雙擊硬盤上的 Pajek.exe 文件啟動 Pajek。計算機將顯示 Pajek 的主屏幕(圖 4)。在此屏幕中,您可以使用文件菜單中的讀取命令或單擊Networks一詞下帶有文件夾圖標的按鈕來打開宿舍網絡。File> Network> Read 在這兩種情況下,都會出現通常的Windows 文件對話框,您可以在其中搜索并選擇硬盤上的文件 Dormitory.net,前提是您已經從本書的網站下載了示例數據集。
當 Pajek 讀取網絡時,它會在頂部的Networks下拉菜單中顯示其名稱。此菜單是 Pajek 可訪問的網絡列表。您可以通過左鍵單擊右側帶有三角形的按鈕來打開下拉菜單。您在列表中選擇的網絡會在列表關閉時顯示(例如,圖 2 中的網絡 Dormitory.net)。請注意,網絡中的頂點數顯示在名稱旁邊的括號中。所選網絡是活動網絡,這意味著您在網絡上執行的任何操作都將使用該特定網絡。例如,如果您現在使用 Draw 菜單,Pajek 會為您繪制宿舍網絡。
主屏幕在兩個Network下拉菜單下方顯示多個下拉菜單。這些菜單中的每一個都代表 Pajek 中的一個數據對象: partition(三個下拉菜單)、vectors(兩個下拉菜單)、permutations (兩個下拉菜單)、clusters和hierarchies。后面的章節將使您熟悉這些數據對象。請注意,可以從“文件”菜單或使用下拉菜單左側的四個圖標打開、保存或編輯每個對象(參見第 1.4 節)。
1.3.2 操作
在社交網絡分析中,修改網絡通常很有用。例如,大型網絡太大而無法繪制,因此我們提取了我們首先檢查的網絡的一個有意義的部分。與具有數千個頂點的大型網絡相比,可視化對于小型(幾十個頂點)到中型(幾百個頂點)網絡的效果要好得多。當社交網絡包含不同類型的關系時,我們可能只關注一種關系;例如,我們可能只想研究宿舍網絡中的餐桌伙伴選擇。最后,一些分析程序要求首先將具有循環或多條線的復雜網絡簡化為簡單的圖形。
應用
應用程序網絡操作是社交網絡分析中非常強大的工具。在本書中,我們遇到了幾種修改網絡或選擇子網的技術。網絡操作總是會產生一個新的網絡。通常,Pajek 中的許多命令會生成新的網絡或其他數據對象,它們存儲在下拉菜單中,而不是圖形或表格輸出。
操作網絡的命令可從主屏幕的菜單中訪問。主屏幕菜單具有清晰的邏輯。涉及一種類型數據對象的操作列在帶有對象名稱的菜單下;例如, Network菜單包含在一個網絡上運行的所有命令,而Networks菜單列出了在兩個網絡上的操作。Operations 菜單中列出了需要不同類型對象的操作。當您嘗試在 Pajek 中查找命令時,只需考慮要使用哪些數據對象。 Pajek 還對適用于特殊類型網絡的命令進行分組。例如,所有需要多重關系網絡的命令都在網絡菜單的多重關系網絡子菜單中可用。您將在接下來的章節中了解有關其他類型網絡的更多信息。[Main] Network> Multiple Relations Network> Extract Relation(s) into separate Network(s)
以下示例重點介紹 Pajek 中菜單的使用及其在本書中的表示法。如果我們想將分析限制在用餐伙伴關系(如圖 2 所示),我們必須創建一個僅包含屬于第一個關系的行的新網絡。因為這個操作只涉及一個網絡而不涉及其他數據對象,所以我們必須在 Network 菜單中查找它。如果我們左鍵單擊上方的Network一詞,在主屏幕中,會顯示一個下拉菜單。單擊下拉菜單中的“Multiple Relations Network”一詞。因此,我們達到了允許我們從當前活動的網絡中創建一個僅包含一個關系的新網絡的命令:Extract Relation(s) into separate Network(s)(參見圖 5)。
在后續對話框中,您可以輸入一個關系編號、幾個連續的編號(使用破折號)或幾個不連續的編號(用逗號分隔)。在我們的例子中,只需輸入 1 即可獲得一個僅包含餐桌伙伴關系的新網絡(圖 6)。來自 N1 (26) 的名為 Relation:1 [Dining-table pa] 的新網絡被添加到頂部網絡下拉菜單中,序列號為 2。原始網絡未更改;它仍在此下拉列表中的網絡列表中。
為了演示同時操縱兩個網絡,讓我們找出哪些女孩通過合作和用餐伙伴選擇聯系在一起。換句話說,哪條線出現在兩個關系上?我們已經有一個只有餐桌伙伴關系的網絡,但我們還需要一個合作關系的,可以用相同的方式提取:在頂部的網絡下拉菜單中選擇宿舍網絡,然后按照前面描述的步驟進行操作,這次提取關系號 2。如果你成功了,第三個網絡會出現在這個菜單中,名為 Relation:2 [Cooperation] from N1 (26)。
在我們比較這兩個網絡之前,我們必須認識到一個網絡包含弧(有向)而另一個包含邊(無向)。我們不能直接比較弧和邊,所以我們必須將弧改為邊,或反之。我們建議將合作網絡的邊更改為雙向弧,這可以通過 Network>Create New Network>Transform>Edges→Arcs 命令完成,前提是我們首先在頂部下拉菜單中選擇協作網絡。當執行將邊變為弧的命令時,會出現一個信息框,詢問是否必須建立新的網絡。如果答案是“是”,我們建議這樣做,就會創建一個新網絡。相反,對信息框中的問題回答“否”會導致 Pajek 更改原始網絡。
要比較兩個網絡,我們必須告訴 Pajek 我們要使用哪些網絡。網絡有兩個下拉菜單(如果沒有,請單擊左側的網絡按鈕),因此我們可以在每個中選擇一個網絡。我們建議在頂部下拉菜單中選擇餐飲合作伙伴網絡(對于 Pajek,這是第一個網絡),并在正下方的菜單中選擇邊變為弧的合作網絡(對于 Pajek,這是第二個網絡)。現在我們可以執行 Networks 菜單的命令,包括基本的集合論運算,例如兩組線的并、交、差等。我們需要Intersection,它收集出現在兩個網絡中的所有行:通過餐桌選擇和合作連接的一對女孩。 Pajek 包含此命令的兩個版本: Intersection of Multiple Relations Networks和Cross-Intersection。Intersection of Multiple Relations Networks命令僅選擇出現在兩個網絡中、并且具有相同關系號的線。 Cross-Intersection 命令忽略關系號,這是我們在這里需要的,因為我們的兩個網絡具有不同的關系號。
Cross-Intersection 子菜單包含幾個選項,用于組合出現在兩個網絡中的線的值。請注意,此集合操作將原始網絡中的兩條弧替換為新網絡中的一條弧線,因此它必須知道如何處理原始線值。在我們的例子中,所有的合作線都有單位數值,這是沒有信息的。因此,我們建議保留餐飲合作伙伴系列的數值。因為當我們創建交集時,餐飲伙伴網絡在頂部的網絡下拉菜單中,我們從Cross-Intersection子菜單中選擇命令 First 以保留餐飲伙伴網絡的線值,表示第一個和第二個餐飲伙伴的選擇。你想看看結果嗎?在Draw菜單中選擇Network命令。這個命令在 1.3.4 節中有詳細討論,但為什么要等呢?
剛剛描述的過程是使用 Pajek 處理網絡數據的特征。 Pajek 中有許多用于轉換和組合網絡的基本命令,通過組合這些命令可以獲得大量結果。但由用戶(即您)決定獲得所需結果所需的命令。
總結
以上是生活随笔為你收集整理的Exploratory Social Network Analysis with Pajek(第三版)1-1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KMSAuto Net 3.5.5 绿色
- 下一篇: 华南X99-F8D双路版主板华南金牌主板