400-050-6600

SPSS單樣本非參數檢驗——卡方檢驗

來源:CPDA數據分析師網 / 作者:CPDA數據分析師 曾洲 / 時間:2020-07-14

今天我們聊聊非參數檢驗,之前給大家介紹到過單樣本非參數檢驗,今天我們一起來看一下單樣本非參數檢驗中的其中一種——卡方檢驗。
卡方檢驗一般是用來對樣本總體分布進行檢驗的非參數檢驗方法。比如說人的血型和性格是否有關系,如今的人口結構和很多年前是否還是一樣等等情況都可以使用卡方檢驗進行分析。

我們先來看一下卡方檢驗的原假設,也就是H0是什么:
H0:樣本總體的分布與假設的分布(也稱期望分布或者理論分布)無顯著性差異。
了解了卡方檢驗的原假設,我們再來看一下卡方檢驗的基本思想以及理論依據:如果一個隨機變量X所在的樣本總體中隨機抽取任意數量的檢驗樣本,這些抽取出來的檢驗樣本落在X的k個互不相交的子集中的觀測頻數服從一個多項分布,這個多項分布在k趨于無窮時近似服從卡方分布。所以,我們在這個理論下,就可以對變量X的總體分布的檢驗從對各個觀測頻數的分析入手。

在分析的時候我們一般是需要得出Pearson卡方統計量。如果卡方值較大,說明期望頻數與觀測頻數分布差距較大,這時候就需要拒絕原假設;反之,我們就需要接受原假設。

現在我們來看一下本次分析需要用到的數據:


上圖中的數據是某個醫院的人流量相關數據,我們需要對一周內的日均人流量進行分析,了解是否一周中每天的病人流量是相同的。
在進行分析時,我們首先要對日均人流量數值進行加權處理:




然后我們選擇非參數檢驗中的單樣本:




我們在字段選項中將日期選入檢驗字段中,設置選項中選擇卡方檢驗。最后我們點擊運行即可得出本次分析的結果:


在結果中我們可以看到本次檢驗的原假設、檢驗方法、顯著性水平P值以及最后的決策。本次分析中顯著性P值為0.000,小于顯著性水平0.05,說明一周中每天的人流量是不一致的。
我們雙擊結果圖,可以進入到模型中看更加詳細的分析結果:


從上圖可以看到,卡方統計量為29.389,顯著性P值為0.000,小于顯著性水平0.05,說明通過了顯著性檢驗,也就是說一周中每天的人流量有顯著差異。同時我們還可以看出在周五的時候人流量最多,周日的時候人流量最少(周末醫院門診較少,人流也會降低),其余幾天的人流量差別不是特別大。

還有一點需要大家注意的是當我們進入到模型中以后,我們還可以通過把鼠標放在聚類條形圖上來了解各個字段具體的頻率及差別(殘差)。

Prev article

CPDA教你三步輕松建模

Next article

鐘南山院士團隊新論文方法的啟發

課程服務

認證服務

在線咨詢

色惰日本视频网站