以连边为中心的功能连接用于个体识别
組水平的研究不能從網絡結構上捕捉到個體差異,而網絡結構是理解行為塑造的神經基質和開發臨床干預措施的重要先決條件。最近的研究采用了功能連接的"指紋識別"分析來確定被試的特異性特征。在此,我們開發了一種以連邊為中心的功能連接模型的補充方法,該模型關注于連邊的共同波動。我們首先展示了相比于節點功能連接(nFC),全腦連邊功能連接(eFC)是一個穩健的特征,eFC在不同的數據集和分區中的識別能力更強。隨后,我們在不同空間尺度上,從單個節點到功能系統和集群水平(使用k-means聚類方法),描述了被試的識別能力(這里使用的k-means方法,是社區檢測的常用方法)。在不同的空間尺度上,我們發現多模態腦區比單模態、感覺運動和邊緣區域的腦區表現出一致更強的識別能力。最后,我們發現通過使用主成分的特定子集來重建eFC可以進一步提高識別能力。總之,我們的研究結果證明了以連邊為中心的網絡模型可用于捕捉有意義的個體特異性特征,并為今后使用eFC模型識別個體差異奠定了基礎。本文發表在Neuroimage雜志。
1 引言
在過去的幾十年里,神經影像學領域已經利用強大的計算方法開發出了針對大腦形態和功能的標準化的群體層面的指標(Toga, Evans, 1998),增強了我們對認知、大腦發育以及神經精神疾病(Fornito等人,2015)的功能和神經解剖學基礎的認識。然而,這些研究強調了組水平效應,而忽略了大腦組織的個性化和特異性。
最近,一些重要的研究已經開始將焦點從組水平分析轉移到個體上(Dubois, Adolphs, 2016)。這一研究方向的目的是建立個體的大腦圖譜(Joo, Boyd, et al, 2015),希望通過納入個性化的細節來明確大腦組織、大腦-行為關系(Betzel, Satterthwaite, Gold, Bassett, 2017),并通過幫助設計更有效和更有針對性的干預措施,為神經精神疾病的治療提供信息(Petersen, 2019)。
其中一個特別的研究方向是繪制大腦網絡的特征,這些特征對個人來說是特異性的。就像指紋一樣,這些特征能夠區分一個人的大腦和另一個人的大腦。大腦網絡指紋作為個體的可靠基礎,具有較好的時間穩定性,跨FC數據子集(Byrge和Kennedy, 2019),以及跨采集地點(Bari等人,2019)。此外,識別特征已經顯示出臨床診斷的潛力(Svaldi等人,2019年),并被證明可用于個體行為和認知狀態的分類(Salehi, Karbasi, Barron, Scheinost, Constable, 2020, Yoo, Rosenberg, Noble, Scheinost, Constable, Chun, 2019)。
迄今為止,大多數指紋分析都集中在來自大腦網絡的特征上,其中節點代表定位電極(Cox等人,2018)或腦區(Amico,Go?i,2018,Finn,Shen,Scheinost,Rosenberg,Huang,Chun,Papademetris, Constable,2015)。最近,我們提出了另一種代替性的大腦連通性模型,它關注于網絡連接(或連邊)之間的互動性。我們把這些模式稱為連邊功能連接(eFC,連邊功能連接關注的是兩個連邊之間的對話模式。可以分析對話模式的異同及其隨時間的變化方式。強連邊功能連接表明兩個連邊在時間上的共同波動具有很強的相似性,而弱連邊功能連接則代表相對獨立的共同波動模式)。采用以連邊為中心的理念在其他科學學科中已經取得了豐碩的成果,如揭示復雜生物和社會網絡的重疊社區結構(可以將社區理解為一類具有相同特性的節點的集合)(Ahn, Bagrow, Lehmann, 2010, Evans, Lambiotte, 2009)。最近的研究以"線圖"形式使用以連邊為中心的方法(Evans和Lambiotte,2009),用于區域間白質束的解剖學網絡(de Reus等人,2014)。類似的,eFC為研究大腦組織提供了一個新的窗口,包括重疊的社區結構(Faskowitz等人,2020年)以及功能系統的參與在不同社區之間如何變化(Jo等人,2020年)。然而,關于eFC與傳統的節點功能連接(nFC)在傳遞個體特定信息的能力方面如何,目前仍不清楚。
在此,我們應用一個新的以連邊為中心的框架來探究個體識別中的腦功能網絡。為了計算eFC,我們使用了一個和nFC類似的計算程序。首先對局部活動時間序列進行標準化(z-scoring)。nFC通常依據皮爾遜相關強度-兩個標準化時間序列的元素乘積的時間平均值。在這里,我們省略了平均步驟,得到“連邊時間序列”(Esfahlani, Jo, Faskowitz, Byrge, Kennedy, Sporns, Betzel, 2020, Sporns, Faskowitz, Teixera, Betzel, 2020)。連邊時間序列的元素表示大腦區域節點(連邊)對之間的瞬時共波動的幅度;當兩個區域的活動在同一時刻向同一方向偏轉時,共波動值為正,當活動在相反方向偏轉時為負(當活動接近基線時為零)。為了計算eFC,我們計算成對的連邊時間序列之間的相關性,從而形成一個逐邊矩陣。直觀地說,如果nFC反映了兩個腦區之間的交流,連邊時間序列代表了不同時間的交流模式,eFC代表了不同交流模式之間的相似性(Faskowitz, Esfahlani, Jo, Sporns, Betzel, 2020, Uddin, 2020)。
在本研究中,我們將基于功能連接的指紋識別擴展到以連邊為中心的網絡。利用來自兩個獨立獲取的數據集(Midnight Scan Club(Gordon等人,2017)和Human Connectome Project(Van Essen等人,2013);分別是MSC和HCP)的功能成像數據,我們比較了全腦nFC和eFC在個體識別上的表現,證明了在數據量充足的情況下,eFC比nFC具有更大、更穩健的識別能力。隨后,我們從系統和節點水平,探究了提高eFC識別能力的驅動因素,使用基于節點的留一法關注系統的特異性。我們發現與多模態腦區系統相關的節點和連邊是個體識別的主要驅動因素。最后,我們測試了是否有可能通過使用一組有限的主成分重建eFC和nFC來提高識別能力。我們發現在優化識別能力方面,重建后的eFC明顯優于重建后的nFC。未來的研究可以利用eFC開發基于網絡的生物標志物以追蹤個體間在行為、發育和疾病診斷上的差異,我們的工作為此奠定了基礎。
2 結果
在該研究中,我們系統地評估了eFC和nFC的差異識別能力,并討論了它們在局部水平(節點)和子系統水平(節點組)的相似性和差異。在這一部分,我們分析了來自兩個高質量的獨立獲取的數據集:the Midnight Scan Club(MSC;(Gordon, Laumann, Gilmore, Newbold, Greene, Berg, Ortega, Hoyt-Drazen, Gratton, Sun, et al, 2017, Gratton, Laumann, Nielsen, Greene, Gordon, Gilmore, Nelson, Coalson, Snyder, Schlaggar, et al.),其中包括10名參與者,每人掃描10次,以及來自Human Connectome Project(HCP)的100名無關的被試,每人掃描2次。
2.1 使用連邊功能連接計算識別能力
個體識別可以使用"差異識別能力"或Idiff進行量化,差異識別的計算方式為使用連接矩陣的平均個體內相似度減去平均個體間相似度(Amico和Go?i,2018b)。現有的個體識別應用依賴于來自nFC的連接模式,因此eFC的特異性特征仍然未知。在本節中,我們對比了大腦皮層nFC和eFC的識別能力及其對可用數據量的依賴性。
首先,我們比較了大腦皮層范圍內eFC和nFC的識別能力。簡而言之,這需要對MSC數據集中的100次靜息態fMRI掃描數據(10個被試;每人10次掃描)單獨估計nFC和eFC,并為每個連接模式生成相似性矩陣,作為被試nFC或eFC矩陣的上三角元素之間的皮爾遜相關性(圖1e)。然后我們從這些相似性矩陣中估計出不同的識別能力(圖1f)。
圖1.eFC差異識別能力計算示意圖。
此圖都是使用來自MSC數據集的數據生成的。
(a)為了說明節點和連邊FC(分別為nFC和eFC)的計算過程,考慮四個節點:i、j、u、v。nFC被定義為局部活動的成對相關性。對于節點i和j,nFC通常是通過標準化(z-scoring)來計算每個時間序列,執行時間序列對的點積并計算乘積時間序列的平均值(b和c)。同樣的操作可以應用到節點u和v。
eFC的計算過程為:首先計算z-scoring時間序列的點積,形成一組新的時間序列,其元素表示大腦區域對之間的瞬時共波動的幅度,但省略了平均步驟。
(b)。每個共波動時間序列即是一對節點定義的。eFC被計算為一對共波動時間序列的時間相似性(如相關性、余弦相似性等)
(c)。(d)為了計算差異識別能力,
(e)我們提取了被試eFC矩陣的上三角元素,并計算這些元素的空間相關性,從而得到逐個被試間的相似性矩陣。
(f)差異識別能力或Idiff的計算方法是將被試內平均相似度減去被試間平均相似度。
我們發現當使用來自整個大腦皮層的功能網絡時,eFC的表現優于nFC,出現了更大的Idiff(圖2a)。在使用不同的分區和同一個獨立數據集時也發現了類似的結果(圖S1)。為了使被試內和被試間的相似性可視化,我們使用多維尺度分析將被試和他們的掃描圖像投射到一個二維空間,該空間大致保留了nFC和eFC相似性矩陣中編碼的成對距離關系(圖2c-d)。因此,MDS圖上兩個掃描之間的距離代表著通過非線性降維測量的相似度。我們使用標準化的歐氏距離來計算每個掃描的被試標簽與k-近鄰的被試標簽的準確性。我們發現使用nFC和eFC計算的平均準確率沒有明顯差異(t – test, p = 0.9786)。被試標簽的準確性被計算為MDS空間中九個最近的點中與掃描的被試標簽相匹配的被試的百分比。
圖2.eFC和nFC的個體識別和掃描長度的影響。
 該圖使用來自MSC數據集的數據生成,包含有200個節點的Schaefer分區。
(a)單次掃描的(深色)和最大程度的聯合掃描(淺色)nFC和eFC的Idiff。
(b)按掃描長度計算的eFC和nFC的Idiff。黑色虛線(800個時間點)表示eFC明顯優于nFC的時間序列的長度。藍色和橙色的粗線是100次迭代的平均Idiff,細線表示按掃描長度每次迭代的Idiff。
(c)使用多維尺度分析繪制了被試的nFC掃描圖。
(d)使用多維尺度分析繪制了被試的eFC掃描圖。每個被試的掃描結果分別對應于c-d之間色帶上的一種顏色。
在前面的分析中,我們使用大約30分鐘的數據(MSC數據集中的session的持續時間)計算eFC和nFC。隨后,我們測試了個體識別能力是否受掃描長度的調節,即Idiff是否隨著可用數據量變化(Amico, Go?i, 2018, Bari, Amico, Vike, Talavage, Go?i, 2019)。為了測試這一點,我們創建了更短或更長的session,將現有的掃描分為更短且連續的片段,或者將多個掃描的數據連接起來以形成更長的session。我們以100個樣本的增量來改變人工掃描session的時間,從100開始到4000結束。整個取樣過程重復了100次。我們發現,在少于500個時間點(約20分鐘)時,nFC的Idiff比eFC大(p < 10-6,t - test);圖2a。然而,在800個時間點(約30分鐘)開始,eFC明顯優于nFC(p < 10-4;t - test);圖2b。我們使用不同的分區和數據集報告了類似的結果(圖S1)。我們使用eFC的結果與以前的研究是一致的,即使用傳統的nFC,識別能力隨著掃描長度的增加而增加(Amico, Go?i, 2018, Bari, Amico, Vike, Talavage, Go?i, 2019)。總的來說,我們的研究結果表明只要有足夠的數據量(大約30分鐘),即使在不同的session,eFC比nFC更穩健地識別不同被試。
2.2 大腦皮層eFC識別能力的局部驅動因素
在上一節中,我們發現在有足夠數量的樣本的情況下,eFC比nFC提高了整個大腦皮層的識別能力。本節我們想找出對這一改進作出貢獻的大腦區域。我們使用了節點留一法來衡量每個大腦區域對個體識別能力的相對影響。然后,為了對結果進行總結,我們根據典型的大腦系統對節點進行分組,并從統計學角度評估每個系統對整體識別能力的貢獻。eFC測量成對的連邊之間的相互作用,每個連邊都對應一對大腦區域。為了確定哪些腦區驅動了這些效應,我們迭代地刪除了200個腦區中的每一個腦區,并使用剩余的199個腦區重新計算eFC和Idiff。然后我們將這個Idiff值與使用完整大腦(所有200個區域)獲得的值進行比較。這里,腦區是根據功能圖譜(Schaefer等人,2017年)定義的。我們還用連邊代替節點進行了類似的分析,其結果見圖S2。我們發現當刪除位于控制和顳頂網絡區域的皮質區域導致了差異識別能力的降低,而刪除與軀體運動、邊緣和視覺網絡相關腦區則增加了識別能力(圖3a;為了可視化,我們將ΔIdiff的符號反轉)。根據系統對所有節點進行分組,可視化每個節點對個體識別能力的貢獻(圖3b)。每個節點的貢獻被衡量為沒有一個特定的節點的Idiff減去所有200個節點的Idiff值。例如,在圖3b中,在構建eFC之前,從控制A系統中刪除一個節點(用一個黃點表示),將導致Idiff減少,我們認為這對Idiff有正向影響。相比之下,從邊緣系統中移除一個節點會導致Idiff增加,因此我們認為這對Idiff有負面影響。
圖3.節點對eFC中識別能力的貢獻。
(a)為了評估腦區對Idiff的貢獻,我們計算了去除每個節點(N=200)上的所有連邊后Idiff的變化。這里顯示了投射到皮層表面的Idiff變化。
(b)我們根據大腦系統繪制了在計算eFC之前刪除每個節點對Idiff的相對影響。
(c)在構建eFC之前排除整個系統的節點,揭示了特定系統對Idiff的正面或負面影響,并且(d)與隨機去除匹配數量的節點相比,對Idiff有明顯不同的結果(Bonferroni校正的p值;* = p < 0.003, ** = p < 0.0006, *** = p < 0.00006)。為了直觀的展示結果,我們將ΔIdiff倒置為-ΔIdiff,它量化了一個節點的移除對整體Idiff的相對影響。如果一個節點的移除導致Idiff的降低,這個節點對識別能力的貢獻將被認為是"增加Idiff"。
接下來,我們測試了與隨機刪除匹配數量的節點相比,哪個系統的節點對識別能力有顯著影響(圖3c-d)。通過隨機排列系統標簽(10,000次迭代),節點被隨機地重新分配給系統。我們發現,當從控制A、控制B、背側注意A、突顯腹側網絡B和顳頂網絡中刪除節點時,識別能力比隨機刪除匹配數量的節點時明顯降低(因此,圖3d中這些系統的影響為正向的)。另外,我們發現與隨機刪除匹配數量的節點相比,刪除邊緣、軀體運動A和B、中樞和邊緣視覺網絡的節點會顯著提高識別能力(因此,這些網絡對Idiff相對負面的效應呈現在圖3d中)。
綜上所述,我們用節點留一法來揭示全腦識別能力的腦區驅動因素。我們發現包括額葉和顳上回有助于提高識別能力,而軀體運動、邊緣和視覺區域則導致識別能力的降低。這些關于系統水平識別能力的結果在很大程度上與之前使用傳統的、以節點為中心的功能連接的研究一致(Finn, Shen, Scheinost, Rosenberg, Huang, Chun, Papademetris, Constable, 2015, Mueller, Wang, Fox, Yeo, Sepulcre, Sabuncu, Shafee, Lu, Liu, 2013, Pe?a-Gómez, Avena-Koenigsberger, Sepulcre, Sporns, 2018),將大腦網絡組織的特質定位到一個特定的系統子集。
2.3 eFC中系統和集群的識別能力
在前面的部分,我們證明了在一個足夠長的fMRI掃描中,eFC的個體識別優于nFC,而且與單模態相比,多模態腦區有助于提高識別能力。在這里,我們繼續研究整個大腦皮層識別能力的驅動因素,重點關注于eFC中每個大腦功能系統對識別能力的貢獻。在本節中,我們旨在回答這些問題:來自單一系統的連邊對識別能力有何貢獻?集群連邊的識別能力表現如何?
為了解決上述問題,我們首先只使用與特定大腦系統相關的連接對Idiff進行估計。對于nFC,這意味著只使用其代理節點(構成一條連邊的兩個腦區)被分配到同一大腦系統的連邊來計算識別能力(Schaefer等人,2017)。我們使用eFC連邊對進行了類似的操作,但要求與構成eFC條目的兩條連邊相關的所有四個節點被分配到同一系統。一般來說,我們發現eFC和nFC的系統特異的Idiff是高度相關的(R = 0.9578, p < 10-8;圖4b)。我們報告了按Idiff排序的前五個和后五個系統。我們發現當節點都起源于顳頂、控制A、控制B、默認模式B和背側注意B網絡時,Idiff往往更大(圖4a)。相反,我們發現,當節點來自軀體運動B、突顯腹側注意A、控制C、邊緣視覺和邊緣網絡時,Idiff往往比較小(圖4a)。我們注意到這些單系統的連邊對(這里得單系統指的是兩個連邊涉及到的四個節點都來自一個系統)只代表eFC矩陣的一小部分(<1%),因此,這些結果只限于矩陣元素的子集。由于eFC包含了更廣泛的連邊對,其中一些涉及源自多達四個不同系統的節點,我們進一步分析了eFC在集群層面的情況。
圖4.連邊功能連接(eFC)在系統和集群水平的特征。
在MSC數據集中,eFC的被試內和被試間相似性顯示了不同系統識別能力的差異,并與使用FC系統的識別能力高度相關。
(a)顯示了10個被試的10次rsfMRI掃描的系統eFC的被試內減去被試間的相似性。
(b)系統eFC和nFC的識別能力之間的高度相關性。
(c)?Idiff與每個集群的eFC平均值不相關,但(d)每個集群的eFC值的標準差與Idiff明顯相關。灰色陰影顯示了95%的置信區間。
(e)16個典型的大腦系統Idiff與eFC集群的相關性。所有的分析都是使用MSC 200節點分區法進行的。
為了調查節點來自不同系統或集群的連邊對的Idiff,我們使用標準的k-means算法,利用歐氏距離對eFC矩陣進行了聚類,聚類的數量從k=2到20。為此,我們首先對組平均eFC矩陣(所有掃描和被試的平均值;圖S4a-b)進行了特征分解。我們保留前50個成分,然后將其作為k-means聚類算法的輸入(圖S4c)。對于一定數量的聚類k,我們重復了250次算法(圖S4d)。從這250次估計中,我們保留了一個有代表性(即平均來看與其他分區最相似)的分區(圖S4e)。這個程序的結果是將每一個k的連邊劃分為不重疊的社區。需要注意這個聚類程序是使用組平均eFC矩陣進行的,它可以與跨被試的集群相匹配。
然后我們將eFC矩陣的屬性與識別能力聯系起來。具體來說,我們使用組代表集群將連邊-連邊連接劃分為"區塊",(這里指的是集群內和集群間的連邊對)這些區塊位于成對的社區之間(圖S4f)。然后,對于每個區塊,我們通過將這些權重表達為向量來計算所有掃描中這些連接的平均值和方差。接下來,我們用這些權重計算出所有個體和掃描對之間的相似度,并從這些相似度值中計算出該區塊的識別能力。這些程序得到了每個區塊的三個指標:
1)每個掃描矩陣的連邊-連邊連接的平均權重;
2)每個掃描矩陣的連邊-連邊連接的標準偏差;
3)使用所有掃描的連邊-連邊連接的皮爾遜相關的矩陣的識別能力。最后,對每個k聚類,我們計算這三個值在該聚類參與的所有區塊上的平均值。然后,我們在圖4c-d中繪制了識別能力與平均值和標準偏差值的關系。對于每個k,我們計算了"區塊"的Idiff(圖4)。
涉及每個集群的所有區塊的Idiff的平均值和標準差被計算為每個集群的代表值。這個過程產生了圖4c-d中的209個點(k = 2-20)。具體來說,我們發現一個集群的平均eFC與它的Idiff(R = 0.0497,p = 0.4736;圖4c)不相關。此外,與某一聚類相關的eFC權重的平均變化率與Idiff(R = 0.4822,p < 10-12;圖4d)呈正相關。這些區塊指的是當eFC被集群標簽重新排序時,集群內的連邊-連邊權重(圖S4f)。
每個區塊都對應于分配給不同聚類的連邊之間的一組連邊-連邊連接(eFC)。對于每個區塊,我們計算了連邊-連邊連接的平均數和標準差,這代表了分布的中心趨勢和變化性。我們發現連邊-連邊連接的平均權重與識別能力沒有顯著關系。然而,一個區塊內的連邊-連邊連接的變異性與較高的個體識別能力顯著相關。我們還發現了nFC(k = 2-20)的聚類結果及其與Idiff的關系(圖S5)。與使用eFC得出的結果不同(平均值:R = 0.0497,p = 0.4736;標準差:R = 0.4822,p < 10-12),我們發現在nFC時只有較弱的相關模式(平均值:R = 0.1392, p = 0.0444;標準差:R = 0.1494,p = 0.0309)。
哪些系統可能導致了高水平的Idiff??為了解決這個問題,我們計算了每個系統在一個給定的集群中被代表的頻率,并為每個大腦系統分別計算了這個頻率與Idiff的相關性。我們發現,集群中的控制、默認模式A和B、背側注意、突顯腹側注意和顳頂網絡節點與集群的Idiff呈正相關。集群中的邊緣、默認模式C和感覺運動系統(軀體運動和視覺)與Idiff的減少有關(圖4e)。
總之,這些結果表明,在eFC中,高階的認知系統,如控制、注意和默認模式網絡,有助于提高個體識別能力,而感覺運動和邊緣網絡會降低個體識別能力。正如上一節所述,這些結果與之前使用nFC的分析相一致,都證明類似的系統和腦區促進了個體識別能力的增強(Finn, Shen, Scheinost, Rosenberg, Huang, Chun, Papademetris, Constable, 2015, Mueller, Wang, Fox, Yeo, Sepulcre, Sabuncu, Shafee, Lu, Liu, 2013)。此外,我們的結果表明,連接權重的內在異質性和可變性可能是解釋為什么某些系統與較高或較低的個體識別能力相關的一個基本原因。
2.4 使用PCA重構的eFC提高了個體識別能力
本研究中我們著重使用完整的eFC矩陣或其連邊-連邊連接的特定子集進行Idiff的計算。作為最后的分析,我們想測試是否可以通過使用相對較少的主成分優化重建eFC來提高差異識別能力。
以前的研究使用了nFC的主成分分析(PCA)來提高識別能力(Amico, Go?i, 2018, Bari, Amico, Vike, Talavage, Go?i, 2019)。簡而言之,該程序需要將所有被試和掃描的nFC(在本文是eFC)串聯成一個按元素掃描的單一矩陣,將該矩陣分解為其主成分(PC),并通過逐漸包括越來越多的PC(按其特征值的降序)來重建eFC。在每次矩陣重建之前和重建之后,我們都會計算每次增加PC到每次掃描的eFC的Idiff。在此,我們將這一技術應用于MSC數據集中的nFC和eFC。
使用這種重建方法,我們發現nFC和eFC的Idiff都可以被優化。在nFC和eFC中,Idiff在k=10的成分上達到了峰值(對應于被試數量),eFC在識別能力上優于nFC(與Idiff?= 21.17相比,峰值為Idiff?= 35.27;圖5b和e)。重測比較中也發現了這些結果(圖S8)。那么,為什么在對識別能力進行優化時,PC的數量會與被試的數量相匹配?我們首先測試了每個被試的掃描次數對最大識別能力的PC數量的影響。當從100個被試中測試每個被試的兩次掃描(圖S7c)和從10個被試中隨機選擇的兩次掃描(圖S7a)時,優化識別能力所需的PC數量與數據集被試數量相符。當我們對整個HCP數據集(N = 100,每個被試兩次掃描;圖S7e)和將HCP數據集的掃描長度(2400個時間點)與MSC數據集(800個時間點;圖S7f)相匹配時,這些結果可以重現。
圖5.使用eFC和nFC進行差異識別能力優化的PCA重建。
(a)在PCA(原始數據)之前eFC的掃描間相似性(皮爾遜相關)矩陣。
(b)當PC = 10時的最佳Idiff值;紅色虛線是Idiff的原始值。
(c)為了最大的Idiff,使用10個PC重建eFC輸出矩陣。
(d)PCA之前(原始數據)nFC的掃描間相似性(Pearson相關性)矩陣。
(e)當PC = 10時的最佳Idiff值,紅色虛線是Idiff的原始值。
(f)為了最大的Idiff,使用10個PC重建nFC輸出矩陣。
隨后,我們探究了可以提高(PC = 1-10)或降低(PC = 11-100)識別能力的PC系數。第一主成分(PC1),從數學角度解釋了eFC值跨掃描和跨被試的最大差異。PC1是唯一一個系數統一為正的成分(圖S9)。接下來的九個系數(PC = 2-10)表現出了對應于單個被試的團塊樣的模式(圖S9),而這種模式在PC = 11-100(圖S10,圖S11,圖S12)中沒有出現。
與之前的報告一致(Amico, Go?i, 2018, Rajapandian, Amico, Abbas, Ventresca, Go?i, 2020),我們的結果表明,通過有選擇地保留與數據集中的被試數量相匹配的成分子集,可以提高個體識別能力。我們發現與nFC相比,使用eFC的改進幅度要大得多,這表明與nFC相比,eFC可以更好地捕捉個性化和特異性特征(Svaldi, Go?i, Abbas, Amico, Clark, Muralidharan, Dzemidzic, West, Risacher, Saykin, et al., Svaldi, Go?i, Sanjay, Amico, Risacher, West, Dzemidzic, Saykin, Apostolova, 2018)。
3 討論
3.1 連邊功能連接增強了個體識別能力
本文的核心是觀察到相對于傳統的基于節點的連接nFC,eFC能提高個體識別能力。nFC測量兩個腦區之間活動的相似性-一階相關(Owen等人,2019),eFC測量連邊對之間共同波動的相似性-高階相關(Faskowitz等人,2020)。了解網絡的高階組織已在其他學科中被證明很有用(Ahn, Bagrow, Lehmann, 2010, Evans, Lambiotte, 2009, Nepusz, Vicsek, 2012, Trinh, Kwon, 2016)。本文從以連邊為中心的視角,使我們能夠將高階的大腦網絡組織與學科的具體特征聯系起來。
eFC作為一個高階的重建是否會導致個體識別的提高。即,如果我們要研究全腦nFC和eFC的識別能力,基于個體的連接數據,eFC是否能讓我們更準確地識別一個獨立個體?我們還好奇使用eFC的識別是否會受到掃描長度和數據量的影響。總的來說,我們發現如果有足夠的數據量(大約800個時間點或30分鐘),eFC在識別能力方面優于nFC。另外,我們注意到使用eFC計算的Idiff在使用串聯掃描的情況下會達到更大的Idiff。這一結果可能反映了eFC的高階性質。實際上,eFC測量的是相關性的相關性,比nFC需要更多的數據來獲得一個穩定的估計(Bourin和Bondon,1998)。我們的結果表明隨著這一估計的穩定,eFC可能比nFC在編碼個性化和特異性特征上有優勢。
接下來,差異識別能力(Amico和Go?i,2018b)是一個被試內掃描相似性與被試間掃描相似性相比的總結性指標,我們對其進行了測量。雖然其他自相似性指標如皮爾遜相關(Finn等人,2015)和I2C2(Shou等人,2013)已經穩健地識別了被試,Idiff也考慮到了被試間掃描相似性(Bridgeford等人,2020)。因此,一個高度可識別的掃描不僅是自相似的,而且還與其他被試的掃描不同。我們注意到,基于如何計算Idiff,相對于被試數量,每個被試的掃描次數可能會對Idiff造成偏差。這使得不同數據集的Idiff難以進行直接比較和解釋。我們還發現跨I2C2、Discriminability以及Idiff在MSC 100和HCP 100節點數據集的基準測試中Idiff顯示出最高的個體識別水平(圖S13)。
我們的結果在兩個數據集和兩個不同的分區中得到了重現。這些結果表明高階網絡結構承載著重要的個體特定信息,因此,以連邊為中心的方法可以更好的捕捉網絡的特異性特征。這些觀察結果既挑戰也擴展了當前關于個體識別和精確網絡映射的知識。我們的結果進一步倡導對深度表型的探究,這需要更多來自個體的數據。未來需要調查了解掃描長度(數據量)和高階大腦表征之間的關系,如eFC(Owen等人,2019)。
3.2 多模態腦區驅動個體識別
哪些大腦區域驅動了eFC的個體特異性?是否有特定的大腦區域使被試更容易或更難被識別?為了回答這些問題,我們在三個不同的尺度上分析了個體識別能力。首先,我們用節點留一法分析了每個節點對Idiff的貢獻。我們發現,當在構建eFC矩陣之前刪除某些節點時,會導致Idiff明顯減少或增加。特別是來自高階系統的節點和連邊導致Idiff明顯的減少,而那些與感覺運動和邊緣區域相關的節點和連邊在構建eFC前被移除時導致了更高的識別能力。這些發現支持了早期的nFC結果,相比于單模態和初級感官腦區,高階、多模態功能的腦區,包括額葉、頂葉和顳葉區域驅動了個體識別(Finn等人,2015)。
為什么多模態腦區可能有助于加強識別能力?一個可能的解釋是與它們的多功能性有關。控制和顳葉網絡中的區域被認為支持各種認知和心理過程,而這些過程是具有個體差異的。這些區域的功能連接模式方面在不同的被試之間有很大的差異(Mueller等人,2013年),是大腦皮層在進化過程中最晚擴展的部分(Sepulcre等人,2010年),屬于生命中最晚發展的部分,因此可能是由早期生活經驗形成的(Elston等人,2009年)。綜上所述,觀察到多模態腦區驅動個人的功能指紋特征,可能是認知、發育和進化過程的綜合影響。然而,這些過程的確切機制還不清楚,應該是未來調查的目標。
然后我們探究了較高和較低的Idiff是否是來自單一典型大腦系統的連邊對導致的(Schaefer等人,2017)。為了解決這個問題,我們從只使用16個大腦系統中的一個大腦系統構建的連邊對中,分別估計了被試的eFC矩陣。我們發現,來自單系統的eFC和nFC的識別能力是明顯正相關的,而且從多模態腦區形成存根的連邊往往具有較高的Idiff。換句話說,單一系統內的內聚連邊對不可能導致全腦范圍的eFC的提高。相反,它表明落在不同腦網絡之間的連邊可能是驅動eFC中Idiff高于nFC的原因。
來自節點留一法和單一系統Idiff的結果表明,特定的大腦區域,即那些參與高階大腦功能的區域,驅動著個體識別。在功能連接研究中發現這些高階關聯區域顯示出最高的被試間差異(Miranda-Dominguez, Mills, Carpenter, Grant, Kroenke, Nigg, Fair, 2014, Mueller, Wang, Fox, Yeo, Sepulcre, Sabuncu, Shafee, Lu, Liu, 2013)。相關聯腦區的功能連接已被發現在進化上是最新的(Zilles等人,1988),涉及智力(Choi, Shamosh, Cho, DeYoung, Lee, Lee, Kim, Cho, Kim, Gray, et al., 2008, Cole, Yarkoni, Repov?, Anticevic, Braver, 2012),一旦受到干擾,會導致神經精神障礙(Fornito, Harrison, 2012, Greicius, 2008)。另外,據報道,使用nFC對個體的高階腦區的進行識別,可以預測流體智力(Amico, Go?i, 2018, Finn, Shen, Scheinost, Rosenberg, Huang, Chun, Papademetris, Constable, 2015)。綜合來看,我們的結果顯示,個體識別能力和高階功能都源于多模態腦區,表明特異性的功能可能來自此類腦功能。
eFC和nFC矩陣中的頂點和連接數相差了幾個數量級。為了匹配它們的維度確保更公平的比較,我們將nFC和eFC矩陣聚類為相同數量的社區。我們發現,連邊-連邊連接的方差與個體識別呈正相關,而這些連接的平均權重則沒有。然而,我們發現使用組平均的nFC矩陣得到的關系相對較弱。因此,我們的結果進一步表明,eFC中連邊-連邊連接的差異性是個體識別能力的一個重要特征。我們還發現,與由與單模態大腦系統的連邊組成的集群相比,包含起源于多模態系統連邊的集群的識別能力水平更高。這些結果與nFC研究的結果(Finn, Shen, Scheinost, Rosenberg, Huang, Chun, Papademetris, Constable, 2015, Pe?a-Gómez, Avena-Koenigsberger, Sepulcre, Sporns, 2018)以及最近涉及eFC集群的研究(Jo等人,2020)一致。我們的研究結果表明,系統和集群內連接權重的變化可能是驅動連接組指紋和識別能力的一個重要特征。
在我們的分析中,我們使用了來自100和200個節點的Schaefer分區(Schaefer等人,2017)的Yeo17功能腦網絡(Thomas Yeo等人,2011)。雖然Schaefer圖集提供了一個從100到1000個節點的遞增可擴展的分區,但由于計算上的限制,沒有對Schaefer進行更細的分區以進行差異識別能力和后續分析。根據圖S1的結果,在MSC和HCP數據集中,eFC比nFC在100和200節點分區中更容易識別。然而,隨著節點數從100個增加到200個,識別能力的絕對差異減少了。需要進一步的分析來測試更細的分區中的個體識別能力,這最終可能導致eFC和nFC的Idiff達到一個峰值。包括兩種模式的大腦功能網絡表征的多模式方法可能被用來計算最大的個體識別能力。需要進一步的研究以確定在測量識別能力方面的分區和元素數量的影響。
總的來說,我們的研究結果表明個體識別是由來自高階大腦系統的多模態腦區驅動的。這些觀察結果對生成具有被試特定信息的穩健的網絡生物標志物有明顯的影響,同時將所需的數據量減少到其子集。更重要的是,我們的研究結果表明,具有高方差的eFC集群,也許在組水平的分析中被削弱,但可能用于確定被試的特定信息或個性化醫療。另外,這項研究為未來關于任務的生物標志物提供了線索,該研究可用于進一步明確在fMRI采集過程中任務對識別能力的影響,并且在不要求掃描長度的情況下最大限度地提高被試的特異性,特別是對于脆弱和臨床人群(Laumann等人,2015年)。最后,eFC矩陣的聚類在不同的被試中的結果是穩健的,顯示出作為一種降維方法的潛力。未來的工作有必要明確對組水平和個體水平大腦網絡具有魯棒性的集群或連邊子集,并解釋被試間特異性和大腦的eFC是否受任務狀態的調節。
3.3 主成分分析突出了eFC的特殊性
在這里,我們遵循最新的nFC研究,將PCA應用于eFC數據,有效地將eFC還原為一組小的主成分(Amico, Go?i, 2018, Bari, Amico, Vike, Talavage, Go?i, 2019)。我們發現,只用那些能解釋最大方差的成分選擇性地重建eFC,可以提高被試的識別能力,優化的程度遠遠超過對nFC數據采用相同程序時的表現。這表明,基于完全相同的fMRI BOLD數據,eFC數據具有更強的個體水平的指紋識別能力。我們注意到,其他方法,如跨被試的相關矩陣的z-score歸一化,也增加了被試內與被試間掃描相似性的絕對差異(Finn等人,2015)。未來還需要進一步研究,以從給定的數據集中最大限度地獲得特定被試信息。
有趣的是,用于優化eFC的個體識別能力所需的PC數量與兩個獨立數據集中的被試數量相匹配。這些結果與之前使用nFC進行個體識別的研究相符(Amico和Go?i,2018b)。我們的結果還顯示盡管一個被試有超過一對重測的rsfMRI掃描,但這是穩健的。那么,為什么在對識別能力進行優化時,PC的數量與被試的數量相匹配?為了解決這個問題,我們分析了增加(PC = 1-10)或降低(PC = 11-100)識別能力的PC的系數。從數學角度解釋了eFC值跨掃描和跨被試的最大差異。這是100個主成分中唯一具有持續正值的PC。另外,只有PC從2到10對特定被試的掃描顯示出明顯的區塊樣模式。一種可能性是,第一個PC解釋了組水平的eFC變異,即潛在的組水平的eFC特征,而PC2到10傾向于解釋個體級eFC變異。我們推測,PC的數量是N-1(N=被試的數量),因為每個被試都可以通過消除的過程來確定N-1個PC。這些結果進一步證明,在用線性轉換算法(如PCA)研究和改善個體識別能力時,eFC可以是一個有價值的方法。然而,未來的工作有必要宣傳PC的精確特征,并應探索其他降維方法如因子分析或CCA(Child, 1990, Thompson, 1984)來優化Idiff。
3.4 展望
我們的結果為未來的研究提供了令人興奮的可能性。在這里,我們使用了一個以前定義的識別能力。然而,這個衡量標準在某些情況下可能會產生誤導。例如,如果大多數被試表現出高水平的自我相似性,即使其余的被試表現出較差的自我相似性,Idiff仍然可以取得高值(Abbas, Amico, Svaldi, Tipnis, Duong-Tran, Liu, Rajapandian, Harezlak, Ances, Go?i, Abbas, Liu, Venkatesh, Amico, Harezlak, Kaplan, Ventresca, Pessoa, Amico, Go?i, 2018, Jalbrzikowski, Liu, Foran, Klei, Calabro, Roeder, Devlin, Luna, 2020)。未來的工作應該研究量化個體識別程序性能的替代方法,包括組內相關系數(I2C2)(Shou等人,2013)和Discriminability(Bridgeford等人,2020)。此外,未來的工作應該探索個體識別的多變量方法(Yoo等人,2019)。
還應通過跟蹤識別能力在整個發展和系統發育過程中的變化來發現關于識別能力的起源問題。具有高水平識別能力的區域表現出明顯的跨物種差異(Xu等人,2020年),在人類的一生中始終具有特異性(Jalbrzikowski等人,2020b),受遺傳影響(Demeter等人,2020年),并在大鼠動物模型中具有高度識別能力(Bergmann等人,2020年)。了解識別能力和基于連接的特異性的起源,可以幫助我們了解心理病理學、大腦進化以及發育和衰老過程。
機器學習技術的應用(Demeter等人,2020年),結合各種成像模式(Kumar等人,2018年),以及增加fMRI分區的顆粒度(Tipnis等人,2020年)已被發現能有效改善個體識別能力。只關注那些最大限度地提高被試特異性的神經元素(Sripada等人,2020年)或選擇性地使用高振幅的"事件"時間框架重建eFC,這在以前的工作中改善了nFC的識別能力(Esfahlani等人,2020年),這些方法可能有助于減少提高eFC識別能力所需的數據量和計算資源。未來的研究需要最大限度地利用eFC從有限的fMRI掃描時間和計算資源中發現特異性特征。
3.5 局限性
與eFC相關的一個限制是將其與個別腦區聯系起來。eFC矩陣中的每個連接總是涉及四個節點(兩個連邊-連邊連接),在大多數情況下,將其分配給任何一個腦區或認知系統是不可能的。在此,我們避免了這一復雜問題,從所產生的eFC的識別能力中測量了一個節點的移除(相當于200個節點分區中的199條邊)的影響,并且只考慮了來自單一系統的連邊對。雖然這些方法試圖將連邊定位到大腦區域,但未來的工作有必要確定一個強大的方法,將eFC元素追溯到大腦的特定位置。
第二個限制是關于"差異識別能力"的測量方法,它同時考慮了被試內和被試間的相似性。然而,我們承認識別能力的其他指標,如計算FC-FC相關性的個體識別精度(Finn等人,2015年),ROC(受試者工作特征)曲線精度(Jalbrzikowski等人,2020a),以及在圖形嵌入表示中對每個被試使用最鄰質心分類模型(Abbas等人,2020a)。盡管如此,我們還是使用Idiff進行分析,因為這種方法擴展了一種流行的識別方法(Finn等人,2015),同時考慮到了不同被試之間共享的"共同特征"(Amico和Go?i,2018b)。然而,其他測量識別能力和比較fMRI數據的方法也應該被調查和開發,以進一步了解以連邊為中心的FC的特異性。
最后一個限制是關于估計連邊聚類和利用其結果的程序。在這里,我們使用k-means算法,根據eFC的相似度將連邊劃分為一組固定數量的集群。這種估計連邊集群方法的好處是計算效率高,可以用距離度量來計算。基于聚類的替代方法有很多(Fortunato,2010,Porter,Onnela,Mucha,2009,Sporns,Betzel,2016),必須開發其他算法來檢測連邊集群。另外,集群之間的連邊可能作為功能系統之間的橋梁,以進一步解釋特異功能和行為之間的關聯(Jo等人,2020)。然而,我們的分析排除了集群之間的連邊,而專注于集群內的連邊。未來的研究應該調查不同聚類算法的影響,并研究聚類內連邊與聚類間連邊對個體差異的影響。
4 材料和方法
4.1 數據集
The Midnight Scan Club(MSC)數據集(Gordon等人,2017年)包括10名成年人(女性占50%,年齡=29.1±3.3)的rsfMRI數據。該研究得到了華盛頓大學醫學院人類研究委員會和機構審查委員會的批準,并得到了所有被試的知情同意書。每個被試的12次掃描是在不同時間獲取的。對于每個被試,使用梯度回波EPI序列(運行時間=30 min,TR=2200 ms,TE=27 ms,翻轉角=90°),進行10次rsfMRI掃描,同時對被試進行眼球追蹤以監測長時間閉眼的情況(用于評估嗜睡情況)。圖像是在3T西門子Trio機器上收集的。
The Human Connectome Project(HCP)數據集(Van Essen等人,2012年)包括 來自100名無關聯的成年被試(女性占54%,平均年齡=29.11±3.67,年齡范圍=22-36)的靜息態功能數據。這些被試是由人類連接組計劃發布的“100 Unrelated Subjects(U100)”中選出的。該研究得到了華盛頓大學機構審查委員會的批準,并獲得了所有被試的知情同意書。被試在兩天的時間里接受了四次15分鐘的rsfMRI掃描。關于成像參數和圖像預處理流程的完整描述可以在Glasser等人發表的文獻(2013)中找到。使用梯度回波EPI序列采集rsfMRI數據(運行時間=14:33 min,TR=720 ms,TE=33.1 ms,翻轉角=52°,各向同性體素分辨率為2 mm,多頻帶因子=8),被試睜眼并固定在一個十字架上。圖像是在帶有32通道頭部線圈的3T西門子Connectome Skyra機器上收集的。
4.2 圖像預處理
4.2.1 MSC功能數據預處理
使用基于Nipype 1.1.9(Gorgolewski等人,2011)的fMRIPrep 1.3.2(Esteban等人,2017)對MSC數據集中的功能圖像進行預處理(fMRIPrep是融合了FSL, AFNI, freesurfer,ants的pipeline)。以下對fMRIPrep預處理的描述是基于隨軟件分發的模板,該軟件由"不保留權利"(CCO)許可證覆蓋。fMRIPrep的內部操作包括Nilearn 0.5.0(Abraham等人,2014)、ANTs 2.2.0、FreeSurfer 6.0.1、FSL 5.0.9和AFNI v16.2.07。關于該pipeline的更多細節,見fMRIPrep文檔中與工作流程對應的部分。
每個被試的T1加權(T1w)圖像使用N4BiasFieldCorrection (ANTS)(Avants, Epstein, Grossman, Gee, 2008, Tustison, Avants, Cook, Zheng, Egan, Yushkevich, Gee, 2010)進行強度不均勻性校正,并在整個處理流程中用作T1w參考。然后使用antsBrainExtraction.sh工作流的Nipype實現顱骨剝離,使用NKI作為目標模板。使用recon-all(Dale等人,1999年)重建大腦表面,并使用Mindboggle(Klein等人,2017年)來完善之前估計的大腦掩模,以調和ANTs和FreeSurfer衍生的皮層灰質分割。使用T1w體積和模板提取的大腦進行非線性配準(antsRegistration),空間標準化到ICBM 152非線性非對稱模板(2009c)。使用FSL fast對提取的T1w進行腦脊液(CSF)、白質(WM)和灰質(GM)的腦組織分割(Zhang等人,2001)。
使用AFNI的3d Tshift對功能數據進行時間層校正,使用FSL的mcflirt進行頭動校正。通過對同一被試的功能圖像進行共配準,進行無場圖失真校正。基于antsRegistration,使用平均場圖模板限制強度翻轉的T1w圖像。然后采用基于邊界的共配準方法(9個自由度)對相應的T1w進行配準。將運動校正變換、場失真校正扭曲、BOLD-T1w變換和T1w-MNI模板扭曲統一在antsApplyTransforms的Lanczos插值步驟中應用。根據上述預處理過程產生的BOLD逐幀位移(FD)、DVARS和三個區域性全局信號,計算出幾個混雜的時間序列。FD和DVARS是為每個功能運行計算的,都是通過Nipype實現。三個全局信號是在CSF、WM和全腦掩模中提取的。本研究中使用的每個MSC被試的NIFTI結果文件遵循文件命名模式:*_spaceT1w_descpreproc_bold.nii.gz。
4.2.2 HCP功能數據預處理
根據Glasser等人(2013)的描述,對HCP數據集中的功能圖像進行了最小化的預處理。簡而言之,這些數據被校正了梯度失真和運動失真,然后通過一個樣條插值步驟與相應的T1加權(T1w)圖像對齊。這個容積被進一步校正了強度偏差,并歸一化為10,000的平均值。然后將該容積投射到32k_fs_LR網格,排除異常值,并使用多模態表面配準(Robinson等人,2014)對準一個公共空間。本研究中使用的每個HCP被試的結果CIFTI文件遵循文件命名模式:*_REST{1,2}_{LR,RL}_Atlas_MSMAll.dtseries.nii。
4.2.3 圖像質量控制
所有來自MSC和HCP數據集的功能圖像都被保留。使用fMRIPrep的視覺報告和MRIQC 0.15.1(Esteban等人,2017)評估MSC中功能圖像的質量。通過肉眼檢查MSC數據的全腦視野覆蓋、信號偽影、以及與相應的解剖圖像的正確對齊情況。所有的時間序列數據也進行了驗視。
4.3 功能網絡預處理
4.3.1 分區預處理
一個旨在優化fMRI信號的局部梯度和全局相似性測量的功能分區方法(Schaefer等人,2017)(Schaefer200)被用來定義大腦皮層上的200個區域。這些節點也被映射到Yeo典型功能網絡(Thomas Yeo等人,2011)。對于HCP數據集,Schaefer200在32k_fs_LR空間以CIFTI文件的形式公開提供。對于MSC數據集,使用高斯分類器表面圖集(Fischl等人,2004)(在100個不相關的HCP被試上訓練)和FreeSurfer的mris_ca_label函數,每個被試都有一個Schaefer200分區。這些工具利用在recon-all pipeline中計算的表面配準,根據個體表面曲率和溝回模式,將群體平均圖譜轉移到個體空間。這種方法為每個被試呈現了一個T1w空間體積。為了與功能數據一起使用,分區的部分被重新取樣到2 mm的T1w空間。這個過程可以重復用于其他分辨率的分區(如Schaefer100)。
4.3.2 功能網絡預處理
每個預處理的BOLD圖像都使用Nilearn的signal.clean,進行線性去趨勢、帶通濾波(0.008-0.08Hz)(Parkes等,2018)、混淆去除和標準化,去除與時間濾波正交的混雜(Lindquist等,2019)。采用的混淆回歸(Satterthwaite等,2013)包括6個運動估計值、平均CSF、平均WF和平均全腦信號的時間序列,這9個回歸因子的導數,以及這18項的平方。此外,對于每幀超過運動閾值的fMRI圖像(MSC=0.5 mm的幀間位移,HCP=0.25 mm的均方根位移),加入一個峰值回歸因子。這種混淆策略已被證明是減少運動相關偽影的一個相對有效的選擇(Parkes等人,2018)。經過預處理和回歸噪聲協變量,恢復了每個節點的殘差平均BOLD時間序列。
4.3.3 連邊圖論構建
通過獲取局部時間序列數據和它們的z-scores來計算eFC(就是對每個時間點的值做z變化,即標準化)。然后,對于所有成對的腦區,我們計算它們的z-scores時間序列的兩個矩陣對應位置元素的乘積。這將得到"連邊時間序列",其元素表示大腦區域對之間的瞬時共波動的幅度,它的整個時間序列的平均計算結果是完全等于Pearson相關系數。最后,對連邊時間序列對之間進行計算,獲得這兩條連邊時間序列的共變關系。當在所有對的邊上重復時,結果就會是一個逐邊矩陣,其元素被歸一化到區間[-1,1]。
4.3.4 差異識別能力
功能連接組的識別能力或指紋分析是基于以下假設,相比于不同被試之間,單個被試的連接情況應該與該被試的不同掃描和模塊中更為相似。之前的研究使用傳統功能連接組(Finn等人,2015年)表明,使用皮爾遜相關分析,從一組被試的FC中使用sample FC找到被試的"目標"FC,就可以對個體進行強有力的識別。之前關于量化功能連接的個體差異的研究包括計算測地距離(Venkatesh等人,2020)和個體掃描間的皮爾遜相關(Amico和Go?i,2018b)。雖然測地距離方法也提供了掃描間差異的總結性措施,但我們采用Amico和Go?i(2018b)的量化指標,該指標考慮了eFC和FC矩陣的協方差和標準偏差。這個度量被稱為差異識別能力(Idiff),來源于"識別能力矩陣",即被試FC之間的相關性(Pearson)矩陣。通過量化自我識別能力或Iself并且減去被試之間的相似性或Iothers來計算Idiff,表示為識別能力矩陣的對角線和非對角線元素(圖1b)。一組被試的差異識別能力(Idiff)可以總結為以下幾點:
代表平均被試內相似度和平均被試間相似度在FCs上的差異。數據集中的較高的Idiff將有更高的個體識別能力,識別能力的優化被簡化為最大化Idiff。
為了測試重復性和分區的影響,我們用HCP數據集的100個無關聯的被試重復進行了分析(Van Essen等人,2012)。HCP數據集包括每個被試在不同日期的兩個掃描時段的四次掃描。對于每個時段,我們將兩個掃描(從左到右和從右到左的相位編碼)串聯成一個具有代表性的時間序列。隨后我們用這兩個時間序列來測量被試內相似度Iself。通過測量100個和200個節點數據集的差異識別能力,測試了分區數量的影響(圖S1)。
4.3.5 通過節點留一法追蹤大腦區域的識別能力
在上一節中,我們描述了計算Idiff的流程,這是一個已知的量化被試內與被試間掃描的相對相似性的方法(Amico和Go?i,2018a)。在本節中,與使用整個eFC矩陣計算相比,我們測試了從eFC的計算中移除哪些腦區會減少個體識別的Idiff。此外,我們還測試了與使用全腦eFC相比,去除特定的大腦系統是否會明顯減少Idiff。
eFC連邊對的共同強度和腦區之間的直接聯系在某種程度上可以是一個任意的程序,因為在eFC中一個連邊對中最多可以有個腦區的組合。為了避免做出連邊對的權重與連邊對強度呈線性關系的假設,我們在構建eFC矩陣之前采用了節點留一法。在構建eFC之前去除一個節點的效果是通過從全腦Idiff中減去去除一個節點的eFC的Idiff來計算的(圖3a-b)。
隨后,我們檢查了每個大腦功能系統的影響,以及如果去除該系統,從eFC測得的Idiff差異。類似于前面的單個節點去除方法,我們去除了單個系統(即單個系統的所有節點),并通過從全腦中Idiff減去這一結果來測量其對Idiff的影響(圖3c-d)。我們沒有控制節點數量的差異(即整個大腦是200個節點,單個系統去除的大約為190個節點),因為節點總數對Idiff的影響還不清楚。
4.3.6 單一系統連邊對的識別能力
節點留一法的好處和注意事項是,由于eFC的重疊特性,它刪除了所有涉及特定節點或系統的連邊對(Faskowitz等人,2020)。因此,由于這一特點,我們仍不清楚純粹的單一系統的影響。為了確定單一系統的Idiff,我們提取了只包括來自特定系統的節點的連邊對并測量了Idiff。類似的方法被應用于nFC,其中包括來自nFC的節點對,這些節點包括來自單一系統的節點。單一系統的節點對與eFC的連邊對進行了比較(Pearson相關性)。此外,使用來自單一系統的連邊對的被試相似性矩陣包括見圖S3。
4.3.7 識別能力的K-means聚類算法
與傳統的nFC矩陣相比,這里使用的eFC矩陣具有成分維數的平方。雖然eFC的高維數可能有助于展示FC矩陣中無法直接顯示的其成分之間的關系(連邊之間的關聯),但這對eFC矩陣的成分進行聚類是一個計算上的挑戰。如果矩陣的分區數量未知,留待探索的話,情況就更嚴重了。為了解決這個問題并對eFC進行聚類,我們應用了一個簡單的兩步聚類程序,對eFC矩陣的低維形式進行操作。
首先,按照Faskowitz等人的研究(Faskowitz等,2020年),我們對平均eFC矩陣(19900 × 19900)進行了特征分解,該平均eFC矩陣由所有掃描的eFC矩陣的平均值創建,保留了與最大特征值相關的前50個特征向量。通過將每個特征向量除以其最大的幅度元素,這些特征向量被重新調整為[-1,1]區間內。然后,我們用標準的k-means算法和歐幾里得距離對重新縮放的特征向量進行聚類。我們改變了社區的數量k,從k=2到20,在每個值下重復聚類算法250次。我們保留了與所有其他分區具有最大整體相似性的分區作為代表性分區。
我們使用k-means將連邊劃分為集群,數目從k=2到k=20(共209個不同的集群)。將eFC劃分為k集群可以用來將相應的eFC矩陣劃分為k個集群內和k(k-1)/2個集群間連邊-連邊相連的組塊。我們的目的是利用這些組塊的特征來更好地理解不同的集群和系統是如何與Idiff相關聯的。這些步驟已在圖S4中進一步闡述。
為此,我們進行了以下幾項分析。首先,對于每個區塊,我們提取每個被試和每次掃描的元素,并計算成對的相似性矩陣。如果該區塊內的連邊-連邊連接的權重是相關的,就可以認為兩次掃描是彼此相似的。然后,我們為每個區塊計算其他幾個特征。這些特征包括每個區塊的連邊-連邊連接的平均數和標準差,以及每個大腦系統在分配給該區塊的連邊中的代表程度。簡而言之,區塊是從組平均eFC矩陣的集群中得出的。每個區塊代表了成對的集群之間的連邊-連邊連接的集合。來自所有掃描和被試的每個區塊的eFC元素被用來計算這個區塊的eFC值的平均值和標準差。然后,對于每一個k集群,我們計算該集群的所有區塊的平均數和標準差。最后,我們通過系統標簽來計算每個區塊的元素,我們發現這些系統標簽與區塊的Idiff有關。
在數學上,這些集群代表了不重疊的連邊集群。我們發現也可以使用一些其他社區發現算法(社區發現算法用來發現網絡中的社區結構,可以視為一種廣義的聚類算法),如模塊度最大化(Newman and Girvan, 2004)和Infomap(Rosvall and Bergstrom, 2008)。然而,在此考慮到實用性(即快速的運行時間),我們使用了k-means算法。
4.3.8 主成分分析
主成分分析(PCA)是一種廣泛使用的可用于探索數據基本結構的統計方法(Jolliffe,2014)。PCA將一組具有潛在相關變量的觀察數據轉化為一組稱為主成分的線性不相關變量。然后將這些主成分按照解釋數據方差從大到小的順序進行排序。我們采用主成分分析來直接對比eFC與nFC的識別能力表現,這點Amico和Go?i(2018b)已經進行了探索。
首先,主成分的數量與數據集中的功能連接組的數量進行匹配。根據定義,分解PCA可以解釋數據中100%的方差。對從PC=2到20的PC按其解釋的方差進行降序排列。個體的nFC和eFC隨后被重建為所包含的成分數量的函數,其理由是組水平的信息在高方差成分中進行,而個體水平的信息則在較低方差成分中傳達。在這個重建過程中,我們按照解釋方差的遞減順序對PC進行了加和。在每次加法重建時,每個個體的連接矩陣都是根據PC=1到N的平均數和線性重組的PC來重建的。
接下來,我們控制了被試掃描次數的影響,它可以影響被試的總掃描時間或數據量(圖2a,b)。從MSC數據集中,我們從每個被試的十次掃描中隨機選擇兩次作為PCA衍生的Idiff最大值進行測試性掃描,進行100次迭代。在eFC和nFC中,用與數據集中的被試數量相匹配的10個PC優化Idiff。同時,我們從100個被試中隨機抽出10個被試來測試是否Idiff可以優化被試數量,而不考慮被試本身。在HCP數據集中,我們從100個被試中隨機選擇了10個被試,每個被試有兩次掃描。在100次迭代中的每一次,為每個PC的Idiff繪制了可視化的圖(圖S7c-d)。我們還通過匹配HCP數據集的時間點(2400個時間點)和MSC數據集的時間點(800個時間點;圖S7f)的數量來測試掃描時間的影響。對于每個被試,我們只將從左到右和從右到左的掃描中的400個時間點連接來創建一個800個時間點的掃描。換句話說,兩個掃描的中間部分被連接起來,為每個被試創造一個800個時間點的單一掃描數據。通過連接的掃描,我們進行了類似于圖S7c的分析。最后,我們用整個HCP數據集(100個被試;每個被試兩個掃描;圖S7e)計算了PC重建后的Idiff。
在MSC和HCP數據集中,我們發現被試的數量與主成分的數量相匹配,主成分的Idiff在重建的eFC和nFC矩陣中是最大的。為了確定這一結果的潛在驅動因素,我們對每次掃描的每個PC系數進行了分解,圖S9、圖S10、圖S11、圖S12。對于PC從2到10,每個被試的系數與其他被試的系數進行了測試(t – test with Bonferroni-correction)。
總結
以上是生活随笔為你收集整理的以连边为中心的功能连接用于个体识别的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 【genius_platform软件平台
- 下一篇: docker-compose部署Redi
