主成分与因子分析异同_主成分分析与因子分析在SPSS中的区别
主成分分析 基本思想:
實質上是將多個指標綜合成少數幾個指標的方法。
主成分分析是利用降維的方法,在確保數據信息損失最小的原則下,把多個指標轉化為少數幾個綜合指標的一種對多變量數據進行最佳綜合簡化的多元統計方法。
主成分是原始變量之間的線性組合,且主成分之間互不相關。
主成份分析的主要目的是壓縮指標個數、簡化數據,但常常與回歸分析、因子分析、聚類分析、判別分析等等套用。
基本步驟 計算相關系數陣,檢驗待分析的變量是否適合做主成份分析。 根據所研究問題的初始變量的特征判斷由協方差陣求主成分,還是由相關陣求主成分。
一般來說,分析中選擇的變量具有不同的計量單位,或變量水平差異較大時,應選擇基于相關系數矩陣的主成分分析。否則還是選擇協方差陣做主成份分析效果更好。(實際情況可以都嘗試一下~) 求協方差陣或相關系數陣的特征根及對應標準化特征向量。 確定主成分個數。 寫出主成分的表達式。 SPSS應用
步驟:分析->降維->因子分析,選入變量后單擊描述,如圖:
因子分析及描述對話框
單擊抽取后選擇“碎石圖”,保持默認的相關系數陣不變,如圖:
抽取對話框
單擊得分中的“顯示因子得分系數矩陣”,如圖:
得分對話框
輸出的主要結果:
累計貢獻率
由表可知,3個主成分可以解釋80%左右的總變異。因此選擇3個主成分是比較合適的。
碎石圖
碎石圖的作用和上表相似。在第3個特征根處趨勢變的比較平緩,因此選擇三個主成份是合適的。
得分系數矩陣
根據得分系數矩陣可以寫出標準化的原始變量表示的主成分的表達式。
因子分析 基本思想:
因子分析是主成分分析的推廣。
同是在確保數據信息丟失的原則下,因子分析研究變量之間的內部依賴關系,從原始變量的相關矩陣出發,將相關性較強的變量歸于一類,最終形成幾類假想型變量。每類變量代表了一個“公共因子”(本質因子、基本特征)。
因子分析主要功能是簡化數據、探測數據的基本結構。還可以與回歸分析、聚類分析、判別分析等套用。
基本步驟選擇分析變量,檢驗待分析的原始變量是否適合做因子分析。
SPSS提供了3種檢驗方法判斷數據是否適合做因子分析:巴特利特球形檢驗、反映像相關矩陣檢驗、KMO檢驗 提取公因子(默認是主成分分析法)。 選擇合適公因子的數量(累計貢獻率70%以上)。 旋轉因子使公因子具有可解釋性。
SPSS提供了多種旋轉方法,之所以有這么多方法,是因為沒有一種方法令人完全滿意。所以在不知道該用哪種方法旋轉時,采用默認的方差最大法即可。 進行因子命名。
需要研究者主觀分析。可以根據因子載荷較大對應的幾個原始變量的含義嘗試對因子進行命名。 計算因子得分,進行結果解釋。 SPSS應用
步驟:分析->降維->因子分析,選入變量后單擊描述,選擇KMO和巴特利特球形檢驗,如圖:
描述對話框
輸出結果:
檢驗結果
KMO的值=0.687>0.05勉強可以進行因子分析。巴特利特球形檢驗的p=0.009<0.05,認為合適進行因子分析。
接下來,重復上節的主成分步驟,得到3個主成分,其累計貢獻率為80%左右。
為了更好地解釋公因子含義,點擊旋轉,如圖:
旋轉對話框
輸出的主要結果:
旋轉后的成分矩陣
由表可知,因子1在X2、X5、X4上有較大載荷,可命名為資產因子;因子2在X7上有較大載荷,可命名為銷售率因子;因子3在X1上有較大載荷,可命名為增加值率因子。
主成分分析 VS 因子分析 基本思想
兩者都是處理多變量數據的一種統計方法,都可以達到對數據簡化的目的。
但二者又有很大不同。主成分分析僅僅是變量變換,強調解釋數據變異的能力,適合做數據簡化,模型中沒有誤差項,主成分沒有實際意義;而因子分析是要尋找變量內部的相關性及潛在的公共因子,強調變量之間的相關性,適合檢測數據結構,模型中有誤差項,公因子一般有實際意義。
基本步驟
因子分析實際上是建立在主成分分析上的,可以看作是主成分的推廣和擴展。主成分又可以看作是因子分析的一個特例,是因子分析中因子載荷估計的一種方法。
比較
主成分分析
因子分析
思想
通過變量變換把注意力集中在具有較大變差的那些主成分上,而舍棄那些變差小的主成分。
因子分析把注意力集中在少數不可觀測的潛在變量(即公共因子)上,而舍棄特殊因子。
系數
主成分的各系數,是唯一確定的、正交的。
因子分析的系數矩陣是不唯一的、可以進行旋轉的。
核心
主成分是各成分之間的線性變換。
因子分析的各因子具有確定的解釋意義。
總結
以上是生活随笔為你收集整理的主成分与因子分析异同_主成分分析与因子分析在SPSS中的区别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 有刷/无刷动力电调与马达知识
- 下一篇: C语言编程题:完美的素数