r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验
前面幾期我們介紹了參數檢驗,t檢驗和方差分析:
臨度科研:數據統計的理解和運用(三)方差分析?zhuanlan.zhihu.com臨度科研:數據統計的理解和運用(二)t檢驗的應用?zhuanlan.zhihu.com今天我們來介紹非參數檢驗——迷人的卡方檢驗(Chi-square test/Chi-Square Goodness-of-Fit Test)。
卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬于非參數檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在于比較理論頻數和實際頻數的吻合程度或擬合優度問題。
卡方檢驗是以 χ2 分布為基礎的一種常用假設檢驗方法,它的假設檢驗為:
H0:觀察頻數與期望頻數沒有差別。H1:觀察頻數與期望頻數有差別。
卡方檢驗的基本思想是:首先假設 H0 成立,基于此前提計算出 χ2 值,它表示觀察值與理論值之間的偏離程度。根據 χ2 分布及自由度可以確定在H0 假設成立的情況下獲得當前統計量及更極端情況的概率P。
如果 P 值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異;否則就不能拒絕無效假設,尚不能認為樣本所代表的實際情況和理論假設有差別。
適用于四格表應用條件:
兩個獨立樣本比較可以分以下3種情況:(1) 所有的理論數 T≥5 并且總樣本量 n≥40,用 Pearson 卡方進行檢驗。(2) 如果理論數 T<5 但 T≥1,并且 n≥40,用連續性校正的卡方進行檢驗。(3) 如果有理論數 T<1 或 n<40,則用 Fisher’s 檢驗。
R×C表卡方檢驗應用條件:
(1) R×C表中理論數小于5的格子不能超過1/5;(2) 不能有小于1的理論數;不滿足 (1) 或 (2) 時,均采用 Fisher’s 檢驗。如果實驗中有不符合R×C表的卡方檢驗,可以通過增加樣本數、列合并來實現。
列聯表的資料大致分為以下 10 類:
由于篇幅限制,因此本次僅講解兩條(感興趣的讀者可以先關注我們,我們后續推出精彩講解),也是常見的兩類:
· 成組設計橫斷面研究四格表資料統計分析
· 單因素多水平設計雙向無序RXC表資料統計分析
例1. 某研究隨機抽取了某大學四年級學生124人,調查大學英語六級通過情況,結果見下表。問該大學男生和女生英語六級通過率有無差別?
表1: 大學英語六級通過情況對數據結構的分析
該資料設計上屬于結果變量為二值的成組設計定性資料,列聯表分類上屬于橫斷面研究設計四格表資料。
該目的是比較兩個性別組英語六級通過率是否相等,可采用一般 χ2 檢驗或 Fisher 精確檢驗來處理。
軟件操作:SAS
圖1:頻數分布圖2:統計結果結果解答:第一步,先看期望頻數,從上圖得知,四個頻數分別為:49.453、23.548、34.548和16.452,均>5,故采用 Pearson 卡方檢驗,結果 χ2=10.887,P=0.001,拒絕H0 假設,認為女生的通過率高于男生(χ2=10.887,P=0.001),差異有統計學意義。
軟件操作:R語言
圖3:數據矩陣圖4:卡方檢驗結果結果只有統計量,并沒有出現期望頻數,因此我們需要再次敲入代碼:
圖5:期望頻數從結果得知,所有頻數均>5,與SAS結果一致,結果,χ2=9.637,P=0.001,拒絕 H0 假設,認為女生的通過率高于男生(χ2=9.637,P=0.001),差異有統計學意義。
軟件操作:SPSS
1、建立數據庫
圖6:卡方檢驗數據庫2、對數據進行加權
數據 → 加權個案 → 對需要加權的變量進行加權 → 確定
分析 → 描述統計 → 交叉表 → 選擇行變量和列變量 → 統計量選擇卡方 → 單元格選擇期望 → 勾選列百分比
圖8:卡方檢驗圖9:結果從結果得知,所有頻數均>5,與SAS和R結果一致,結果,χ2=10.887,P=0.001,拒絕 H0 假設,認為女生的通過率高于男生(χ2=10.887,P=0.001),差異有統計學意義。
例2.某大學對計算機專業、金融專業、傳媒專業各50名學生進行心理測試,并判斷每個學生屬于哪一類典型氣質類型,所得結果整理成下表,請進行合理的統計分析。
表2:心理測試結果對數據結構的分析
本例屬于原因變量和結果變量均為多值名義變量單因素多水平設計定型資料,從列聯表的分類上來看屬于雙向無序R×C表。
比較原因變量各水平的頻數分布情況,可以用一般χ2檢驗。
圖10:頻數分布圖11:統計結果結果解答:第一步,先看期望頻數,從上圖10得知,頻數均>5,故采用Pearson卡方檢驗,結果,χ2=3.434,P=0.753,不能拒絕 H0假設,因此尚不能認為不同人格的專業分布不同(χ2=3.434,P=0.753)。差異無統計學意義。
軟件操作:R語言
圖12:建立矩陣圖13:卡方檢驗結果圖14:輸出期望頻數結果解答:第一步,先看期望頻數,從上圖14得知,頻數均>5,故采用Pearson卡方檢驗,結果,χ2=3.434,P=0.753,不能拒絕 H0假設,因此尚不能認為不同人格的專業分布不同(χ2=3.434,P=0.753)。差異無統計學意義。
軟件操作:SPSS
1、建立數據庫
圖15:建立數據庫2、對數據進行加權
數據 → 加權個案 → 對需要加權的變量進行加權 → 確定
圖16:數據加權圖17:進行卡方檢驗圖18:卡方檢驗結果結果解答:第一步,先看期望頻數,從上圖18得知,頻數均>5,故采用Pearson卡方檢驗,結果,χ2=3.434,P=0.753,不能拒絕H0假設,因此尚不能認為不同人格的專業分布不同(χ2=3.434,P=0.753)。差異無統計學意義。
好啦,本期講解到此結束,更多類型的列聯表分析,下次再分享!
歡迎大家在評論區提出自己的問題~
總結
以上是生活随笔為你收集整理的r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: halcon旋转后坐标_基于FPGA的图
- 下一篇: android 结束if循环_Andro