主成分与因子分析异同_因子分析
1 導(dǎo)言
因子分析是將多個(gè)實(shí)測(cè)變量簡(jiǎn)化為較少變量的方法。
利用因子分析能簡(jiǎn)化分析,更能反映事物本質(zhì)。
學(xué)習(xí)因子分析能確定哪些變量應(yīng)該保留,哪些應(yīng)該剔除,并得到主要成分的表達(dá)式,這些表達(dá)式是原有變量的線性組合,而用這些主要成分便能代替原來(lái)眾多的實(shí)測(cè)變量。
2 因子分析的功能與應(yīng)用
由于在實(shí)際工作中,指標(biāo)間經(jīng)常具備一定的相關(guān)性,故人們希望用較少的指標(biāo)代替原來(lái)較多的指標(biāo),但依然能反映原有的全部信息,于是就產(chǎn)生了主成分分析、對(duì)應(yīng)分析、典型相關(guān)分析和因子分析等方法。
3 因子分析實(shí)例
例:表12-1 是25名健康人的7項(xiàng)生化檢驗(yàn)結(jié)果,7項(xiàng)生化檢驗(yàn)指標(biāo)一次命名為X1-X7,請(qǐng)對(duì)該資料進(jìn)行因子分析。
建立數(shù)據(jù)文件,定義變量名:分別為X1、X2、X3、X4、X5、X6、X7,按順序輸入相應(yīng)數(shù)值,如圖12-1所示。
從Analyze----Data Reduction----Factor,彈出Factor Analysis對(duì)話框。在對(duì)話框左側(cè)變量列表中選變量X1-X7,點(diǎn)擊向右的箭頭按鈕使之進(jìn)入Variables框,如圖12-2所示。
點(diǎn)擊Descriptives按鈕,彈出Factor Analysis: Descriptives對(duì)話框,在Statistics 中選Univariate descriptives 項(xiàng)要求輸出各變量的均數(shù)與標(biāo)準(zhǔn)差,在Correlation Matrix欄中選Coefficients 項(xiàng)要求計(jì)算相關(guān)系數(shù)矩陣,并選KMO and Bartlett’s test of sphericity 項(xiàng),要求對(duì)相關(guān)系數(shù)矩陣進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn),如圖12-3所示。點(diǎn)擊Continue 按鈕返回Factor Analysis對(duì)話框。
點(diǎn)擊Extraction 按鈕,彈出Factor Analysis: Extraction對(duì)話框,本例選用Principal components 方法,如圖12-5所示。之后點(diǎn)擊Continue 按鈕返回Factor Analysis 對(duì)話框。
點(diǎn)擊Scores 按鈕,彈出Factor Analysis: Scores 對(duì)話框,系統(tǒng)提供3種估計(jì)因子得分系數(shù)的方法,本例選用Regression(回歸因子得分),如圖12-6所示。之后點(diǎn)擊Continue 按鈕返回Factor Analysis 對(duì)話框,再點(diǎn)擊OK按鈕即完成分析。
得到結(jié)果如下表12-2 到表12-9 和圖12-7 所示。
結(jié)果分析:
表12-2、12-3、12-4 顯示,系統(tǒng)首先輸出各變量的均數(shù)(Mean)與標(biāo)準(zhǔn)差(Std Dev),并顯示共有25例觀察單位進(jìn)入分析:接著輸出相關(guān)系數(shù)矩陣(Correlation Matrix),經(jīng)過(guò)Bartlett檢驗(yàn)表明:Bartlett值=326.285,P小于0.0001,即相關(guān)矩陣不是一個(gè)單位矩陣,故考慮進(jìn)行因子分析;Kaiser-Meyer-Olkin Measure of Sampling Adequacy 是用于比較觀測(cè)相關(guān)系數(shù)值與偏相關(guān)系數(shù)值的一個(gè)指標(biāo),其值越逼近1,表明這些變量進(jìn)行因子分析效果越好,今KMO值=0.321,偏小,意味著因子分析的結(jié)果可能不能接受。
表12-5、12-6 、12-7顯示,使用主成分分析法得到2個(gè)因子,因子矩陣(Factor Matrix)如下,變量與某一因子的聯(lián)系系數(shù)絕對(duì)值越大,則該因子與變量關(guān)系越近。如本例變量X7與第一因子的值為-0.886,與第二因子的值為0.219,可見(jiàn)其與第一因子更近,與第二因子更遠(yuǎn),或者因子矩陣也可以作為因子貢獻(xiàn)大小的度量,其絕對(duì)值越大,貢獻(xiàn)也越大。在Final Statistics 一欄中顯示了各因子解釋掉方差的比例,也稱變量的共同度(Communality)。共同度從0到1,0為因子且不解釋任何方差,1 為所有方差均被因子解釋掉。一個(gè)因子解釋掉變量的方差越大,說(shuō)明因子包含原有變量信息的量越多。
表12-8和表12-9 顯示,經(jīng)正交旋轉(zhuǎn)后的因子負(fù)荷矩陣(Rotated Factor Matrix)和因子轉(zhuǎn)換矩陣(Factor Transformation Matrix)。旋轉(zhuǎn)的目的是使復(fù)雜的矩陣變得簡(jiǎn)潔,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。
圖12-7顯示,將第一因子的因子分用變量名fac-1、第二以你這的因子分用變量名fac-2存入原始數(shù)據(jù)庫(kù)中。這些值既可用于模型診斷,又可用于進(jìn)一步分析。
如果有幫助到你,請(qǐng)關(guān)注公眾號(hào)“藥小姐呀”更多關(guān)于數(shù)據(jù)分析的內(nèi)容分享給你,謝謝你這么可愛(ài)還關(guān)注我。
總結(jié)
以上是生活随笔為你收集整理的主成分与因子分析异同_因子分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: webstorm配置环境变量_webst
- 下一篇: 攻防世界php2_攻防世界-php2