SPSS案例分析3:因子分析
http://hi.baidu.com/datasoldier/item/6689c4a50ec250dc5af1914c
因子分析在各行各業(yè)的應(yīng)用非常廣泛,尤其是科研論文中因子分析更是頻頻出現(xiàn)。小兵也湊個(gè)熱鬧,參考《SPSS統(tǒng)計(jì)分析》書中的案例,運(yùn)用SPSS進(jìn)行因子分析,作為我博客?SPSS案例分析系列??的第三篇文章。
【一、概念】
探討具有相關(guān)關(guān)系的變量之間,是否存在不能直接觀察到的,但對可觀測變量的變化其支配作用的潛在因素的分析方法就是因子分析,也叫因素分析。通俗點(diǎn):因子分析是尋找潛在的、起支配作用因子的方法。
【二、簡單實(shí)例】
現(xiàn)在有?12?個(gè)地區(qū)的?5?個(gè)經(jīng)濟(jì)指標(biāo)調(diào)查數(shù)據(jù)(總?cè)丝凇W(xué)校校齡、總雇員、專業(yè)服務(wù)、中等房價(jià)),為對這?12?個(gè)地區(qū)進(jìn)行綜合評價(jià),請確定出這?12?個(gè)地區(qū)的綜合評價(jià)指標(biāo)。點(diǎn)擊下載
【三、解決方案】
1、spss因子分析
同一指標(biāo)在不同地區(qū)是不同的,用單一某一個(gè)指標(biāo)難以對12個(gè)地區(qū)進(jìn)行準(zhǔn)確的評價(jià),單一指標(biāo)智能反映地區(qū)的某一方面。所以,有必要確定綜合評價(jià)指標(biāo),便于對比。因子分析是一個(gè)不錯(cuò)的選擇,5?個(gè)指標(biāo)即為我們分析的對象,我們希望從這5個(gè)可觀測指標(biāo)中尋找出潛在的因素,用這些具有綜合信息的因素對各地區(qū)進(jìn)行評價(jià)。下圖是spss因子分析的操作界面,主要包括5方面的選項(xiàng),變量區(qū)只能選擇數(shù)值型變量,分類型變量不能進(jìn)入該模型。另外,spss軟件為了消除不同變量間量綱和數(shù)量級對結(jié)果的影響,在該過程中默認(rèn)自動(dòng)進(jìn)行標(biāo)準(zhǔn)化處理,因此不需要對這些變量提前進(jìn)行標(biāo)準(zhǔn)化處理。
?
?
2、描述統(tǒng)計(jì)選項(xiàng)卡
我們希望看到各變量的描述統(tǒng)計(jì)信息,要對比因子提取前后的方差變化,所以選定“單變量描述性”和“原始分析結(jié)果”;現(xiàn)在是基于相關(guān)矩陣提取因子,所以,選定相關(guān)矩陣的“系數(shù)和顯著性水平“,比較重要的還有?KMO?和球形檢驗(yàn),通過KMO值,我們可以初步判斷該數(shù)據(jù)集是否適合采用因子分析方法。比較糟糕的是,kmo結(jié)果有時(shí)并不會(huì)出現(xiàn),這主要與變量個(gè)數(shù)和樣本量大小有關(guān)。
?
?
3、抽取選項(xiàng)卡
在該選項(xiàng)卡中設(shè)置如何提取因子,提取因子的方法有很多,最常用的就是主成分法。因?yàn)閰⑴c分析的變量測度單位不同,所以選擇“相關(guān)矩陣”,如果參與分析的變量測度單位相同,則考慮選用協(xié)方差矩陣。經(jīng)常用到碎石圖對于判斷因子的個(gè)數(shù)很有幫助,一般都會(huì)選擇該項(xiàng)。關(guān)于特征值,不想解釋太多,這和顯著性水平一樣,都是統(tǒng)計(jì)學(xué)的一個(gè)基本概念。一般spss默認(rèn)只提取特征值大于1的因子,但,我還可以通過自定義設(shè)置需要提取的因子個(gè)數(shù)。另外,收斂次數(shù)比較重要,可以從首次結(jié)果反饋的信息進(jìn)行調(diào)整。
?
?
4、因子旋轉(zhuǎn)選項(xiàng)卡
因子分析要求對因子給予命名和解釋,對因子旋轉(zhuǎn)與否取決于因子的解釋。如果不經(jīng)旋轉(zhuǎn)因子已經(jīng)很好解釋,那么沒有必要旋轉(zhuǎn),否則,應(yīng)該旋轉(zhuǎn)。這里直接旋轉(zhuǎn),便于解釋。至于旋轉(zhuǎn)就是坐標(biāo)變換,使得因子系數(shù)向1?和?0?靠近,對公因子的命名和解釋更加容易。旋轉(zhuǎn)方法一般采用”最大方差法“即可,輸出旋轉(zhuǎn)后的因子矩陣和載荷圖,對于結(jié)果的解釋非常有幫助。
?
?
5、保存因子得分
要計(jì)算因子得分,就必須先寫出因子的表達(dá)式。而因子是不能直接觀察到的,是潛在的。但是可以通過可觀測到的變量獲得。前面說到,因子分析模型是原始變量為因子的線性組合,現(xiàn)在我們可以根據(jù)回歸的方法將模型倒過來,用原始變量也就是參與分析的變量來表示因子。從而得到因子得分。因子得分作為變量保存,對于以后深入分析很有用處。
?
?
【四、結(jié)果解釋】
1、驗(yàn)證數(shù)據(jù)是否適合做因子分析
主要參考kmo結(jié)果,一般認(rèn)為大于0.5,即可接受。同時(shí)還可以參考相關(guān)系數(shù),一般認(rèn)為分析變量的相關(guān)系數(shù)多數(shù)大于?0.3,則適合做因子分析;從?KMO=0.575?檢驗(yàn)來看,不是特別適合因子分析,基本可以通過。這里主要是為了簡單介紹因子分析,所以,不看重這一結(jié)果。
?
?
2、因子方差表
提取因子后因子方差的值均很高,表明提取的因子能很好的描述這?5?個(gè)指標(biāo)。方差分解表也表明,默認(rèn)提取的前兩個(gè)因子能夠解釋?5?個(gè)指標(biāo)的?93.4%。碎石圖表明,從第三個(gè)因子開始,特征值差異很小。綜合以上,提取前兩個(gè)因子。
?
?
?
?
3、因子矩陣
由旋轉(zhuǎn)因子矩陣可以看出,經(jīng)旋轉(zhuǎn)后,因子便于命名和解釋。因子?1主要解釋的是中等房價(jià)、專業(yè)服務(wù)項(xiàng)目、中等校平均校齡,可以命名為社會(huì)福利因子;而因子?2?主要解釋的是其余兩個(gè)指標(biāo),總?cè)丝诤涂偣蛦T。可以命名為人口因子。因子分析要求,最后得到的因子之間相互獨(dú)立,沒有相關(guān)性,而因子轉(zhuǎn)換矩陣顯示,兩個(gè)因子相關(guān)性較低。可見,對因子進(jìn)行旋轉(zhuǎn)是完全有必要的。
?
?????????????
?
4、因子系數(shù)
因子得分就是根據(jù)這個(gè)系數(shù)和標(biāo)準(zhǔn)化后的分析變量得到的。其次,在數(shù)據(jù)視圖中可以看到因子得分變量。
5、結(jié)論
經(jīng)過因子分析,我們的目的實(shí)現(xiàn)了,找到了兩個(gè)綜合評價(jià)指標(biāo),即人口因子和福利因子。從原來的?5?個(gè)指標(biāo)挖掘出?2?個(gè)潛在的綜合因子。可以對12?個(gè)地區(qū)給出客觀評價(jià)。
?
?
?
我們可以根據(jù)因子1或者因子2得分,對這12個(gè)地區(qū)進(jìn)行從大到小排序,得分高者被認(rèn)為在這個(gè)維度上有較好表現(xiàn)。一般上因子分析到此就已經(jīng)結(jié)束了,如果想再進(jìn)一步展開分析,一般可以采取兩種方式,第一是進(jìn)行因子綜合得分的計(jì)算,用一個(gè)總得分對樣本進(jìn)行大小排序,得分高者為佳;第二,將得到的若干因子作為新的變量,進(jìn)行聚類分析,這兩種方式,均單獨(dú)有文字介紹。見以下鏈接:1綜合得分;2用于聚類分析
?
總結(jié)
以上是生活随笔為你收集整理的SPSS案例分析3:因子分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux7.4 yum配置,redha
- 下一篇: [知乎]关于WindowsXPx64SP