spss相关性分析_关公配赤兔——因子分析和SPSS
一、準備
第1步:把“全班成績”復制到SPSS的【數據視圖】,如下圖左側:5列分別對應所有五門考試成績,26行分別代表全班26位同學。還記得學霸A和學渣B嗎?就在第1行和第2行。第2步:在【變量視圖】的【標簽】列輸入五門考試名稱,如上圖右側。二、分析
第3步:選擇【分析】-【降維】-【因子】,打開因子分析主對話框,將【語文】、【數學】、【英語】、【歷史】、【物理】移入右側的“變量”區,以便進行分析:主對話框是“本劇的女主角”,后面我們會“分手”四次,也會“重逢”四次,并最終在她這里say I do(按下【確認】鍵),因此請你牢牢記住她。四次“離合”(第4、5、6、7步)將分別打開和關閉描述對話框、提取對話框、旋轉對話框和因子得分對話框,如下圖:劇情開始……第4步:在主對話框單擊【描述】,出現描述對話框:勾選【單變量描述】,輸出觀察變量x(每門考試成績)的均值、標準差和樣本量;
默認【初始解】,輸出觀察變量x(每門考試成績)的公因子方差、與觀察變量數目相同的公因子(主成分)、各公因子的特征值及其所占總方差的百分比和累計百分比;
勾選【系數】和【顯著性水平】,輸出觀察變量x(每門考試成績)的相關系數矩陣及其檢驗的P值;
勾選【KMO和Bartlett的球形檢驗】,將會輸出KMO值和Bartlett球形檢驗的P值;
點擊【繼續】返回主對話框。
“方法”默認【主成分】;
“分析”區默認【相關性矩陣】;
“顯示”區默認【未旋轉的因子解】,可以同時勾選【碎石圖】;
“提取”區默認【基于特征值】且特征值大于【1】;
點擊【繼續】返回主對話框。
“方法”區選擇【最大方差法】;
“輸出”區會自動勾選【旋轉后的解】;
點擊【繼續】返回主對話框。
勾選【保存為變量】,將會把提取出的因子得分f值保存為新的變量,自動列在前面的【數據視圖】和【變量視圖】里;
“方法”區默認【回歸】;
勾選【顯示因子得分系數矩陣】;
點擊【繼續】返回主對話框。
三、解讀
奇跡發生了!!!出來一堆孩子,哦不,一堆表格……
from描述對話框
描述統計 | |||
平均值 | 標準偏差 | 分析個案數 | |
語文 | 77.6154 | 20.91521 | 26 |
數學 | 72.6538 | 22.31760 | 26 |
英語 | 75.0000 | 22.09072 | 26 |
歷史 | 80.5000 | 21.85452 | 26 |
物理 | 70.5000 | 23.88347 | 26 |
平均值和標準差,我們太熟悉了。如果還有問題,請重溫此公眾號2017年5月16日文章《數據的“身材”與“三圍”》。
相關性矩陣 | ||||||
語文 | 數學 | 英語 | 歷史 | 物理 | ||
相關性 | 語文 | 1.000 | .275 | .966 | .983 | .221 |
數學 | .275 | 1.000 | .200 | .215 | .974 | |
英語 | .966 | .200 | 1.000 | .963 | .158 | |
歷史 | .983 | .215 | .963 | 1.000 | .162 | |
物理 | .221 | .974 | .158 | .162 | 1.000 | |
顯著性 (單尾) | 語文 | .087 | .000 | .000 | .139 | |
數學 | .087 | .164 | .146 | .000 | ||
英語 | .000 | .164 | .000 | .221 | ||
歷史 | .000 | .146 | .000 | .215 | ||
物理 | .139 | .000 | .221 | .215 | ||
相關系數也很熟悉,如果有問題,請參考2017年9月23日文章《變量關系大揭秘(一)》。此處僅舉個例子,從結果可以看出,語文和數學的相關系數是0.275,線性關系比較弱。
KMO 和巴特利特檢驗 | ||
KMO 取樣適切性量數。 | .681 | |
巴特利特球形度檢驗 | 近似卡方 | 211.896 |
自由度 | 10 | |
顯著性 | .000 | |
觀察變量(五門考試成績)是否存在相關性,是我們能否提取公因子(文科能力和理科能力)的前提;
(1)KMO值用于檢驗各科成績之間相關性強弱,取值在0-1之間,越大越好,當KMO<0.5,一般不宜做因子分析;(2)Bartlett球形檢驗的P值,也是用于檢驗五門考試成績的獨立性(不相關),P值越小越好,當P>0.05,一般不宜做因子分析;(3)從輸出結果看,兩個指標分別是0.681和0.000,Very Good!
公因子方差 | ||
初始 | 提取 | |
語文 | 1.000 | .988 |
數學 | 1.000 | .987 |
英語 | 1.000 | .973 |
歷史 | 1.000 | .984 |
物理 | 1.000 | .987 |
提取方法:主成分分析法。 | ||
公因子方差也叫變量共同度,或者公共方差,反映全部公因子能夠解釋某個觀察變量變化的比例,比如對于語文成績的變化,文科能力和理科能力聯合起來可以解釋98.8%(好厲害!)。實際操作中,盡量不要低于0.5。
總方差解釋 | |||||||||
成分 | 初始特征值 | 提取載荷平方和 | 旋轉載荷平方和 | ||||||
總計 | 方差百分比 | 累積 % | 總計 | 方差百分比 | 累積 % | 總計 | 方差百分比 | 累積 % | |
1 | 3.156 | 63.124 | 63.124 | 3.156 | 63.124 | 63.124 | 2.931 | 58.630 | 58.630 |
2 | 1.763 | 35.255 | 98.379 | 1.763 | 35.255 | 98.379 | 1.987 | 39.749 | 98.379 |
3 | .043 | .868 | 99.247 | ||||||
4 | .023 | .461 | 99.708 | ||||||
5 | .015 | .292 | 100.000 | ||||||
提取方法:主成分分析法。 | |||||||||
每個公共因子對應一個特征值,特征值能反映這個公因子的重要性,即它“抵得上”幾個觀察變量。從輸出結果看,第一個公因子很厲害,以1當3.156;第二個也不賴,能以1當1.763;第三個公因子就差點勁了,以1當0.043,往后越來越差。我們一般只留下特征值大于1的公因子,此例中留前兩個。
每個公因子對應一個方差百分比,代表這個公因子的貢獻,即它單獨能解釋所有觀察變量變化的比重。如果把兩個公因子的方差百分比累加起來,就得到累積百分比,能夠代表這兩個公因子聯合起來能解釋所有觀察變量變化的百分比。此例中,我們看到,前兩個公因子的累積百分比高達99.379%。
from提取對話框
豎軸是特征值,橫軸是按特征值從大到小排列的公因子。此圖可以更形象的反映出特征值的變化,方便我們決定保留到第幾個公因子。
成分矩陣a | ||
成分 | ||
1 | 2 | |
語文 | .960 | -.259 |
數學 | .514 | .850 |
英語 | .931 | -.324 |
歷史 | .940 | -.317 |
物理 | .469 | .876 |
提取方法:主成分分析法。 | ||
a. 提取了 2 個成分。 | ||
成分矩陣也叫因子載荷矩陣,就是我們關心的系數a。舉個例子,從輸出結果可知:
這兩個公因子真是文科能力和理科能力嗎?
根據原始數據(五門成績x),SPSS其實可以“湊”出無數組a,當然也就有無數組公因子f。上面只是其中一組a,它對應的兩個公因子f1和f2,跟我們心目中的文科能力和理科能力,顯然還有些距離。別著急,SPSS還會“整容”——坐標系旋轉。保證在你轉暈之前,自動給出你最滿意的公因子。from旋轉對話框
旋轉后的成分矩陣a | ||
成分 | ||
1 | 2 | |
語文 | .983 | .148 |
數學 | .130 | .985 |
英語 | .983 | .077 |
歷史 | .988 | .087 |
物理 | .078 | .991 |
提取方法:主成分分析法。? ?旋轉方法:凱撒正態化最大方差法。 | ||
a. 旋轉在 3 次迭代后已收斂。 | ||
看到了吧,這回行了。每門考試x對應的兩個因子載荷a(方程系數)都是一大一小。還記得a代表公因子f的重要性嗎?這才是文科能力和理科能力啊!翻譯出來就是:
from因子得分對話框
成分得分系數矩陣 | ||
成分 | ||
1 | 2 | |
語文 | .337 | -.012 |
數學 | -.044 | .507 |
英語 | .344 | -.050 |
歷史 | .345 | -.045 |
物理 | -.063 | .515 |
提取方法:主成分分析法。? ?旋轉方法:凱撒正態化最大方差法。 ?組件得分。 | ||
我們(哦不,是SPSS)從觀察變量x值出發,歷盡千辛萬苦,終于求得一套滿意的因子載荷a值。但別忘了,還有因子得分f值呢。因此SPSS貼心的給出另外一組系數,方便我們計算f值。上面輸出結果可以翻譯為:
根據這個公式,SPSS還附送了每一位同學的文科能力和理科能力得分,并自動放入第1步中的【數據視圖】(多了兩列分數)和【變量視圖】(多了兩個變量)。
最后,需要聲明的是,為了剔除量綱影響和計算方便,SPSS處理所有變量的數值都采取了標準化的形式。題外話
講完了,我也累壞了。要知道,實際操作過程其實特簡單,我算了一下,只需要你點25下鼠標。驚不驚喜意不意外!總結
以上是生活随笔為你收集整理的spss相关性分析_关公配赤兔——因子分析和SPSS的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Windows 生成ffmpeg安卓全平
- 下一篇: 二、【List、Set、数据结构、Col