一文帶你全方位理解卡方檢驗

天天見聞 天天見聞 2024-10-11 時事 閱讀: 31
摘要: 一、基本概念:卡方檢驗SPSSAU系統中,卡方檢驗分為【通用方法】中的交叉卡方,以及【醫學/研究】模塊中的卡方檢驗、配對卡方、卡方拟合優度、分層卡方五類。卡方檢驗主要用來研究定類與定類數據間差異關系的;(1)定量數據可以轉化為定類數據(可以進行卡方檢驗)

一、基本概念:卡方檢驗

(一)定義

卡方檢驗主要用于研究定類與定類數據之間的差異關系。一般使用卡方檢驗進行分析的目的是比較差異性。例如研究人員想知道兩組學生對于手機品牌的偏好差異情況。

(二)卡方值

卡方值表示觀察值與理論值之間的偏離程度。

卡方值的大小與樣本量(自由度)有關。一般來說,卡方值越大越好,但并不準确。比如5000和5010的差異為10;40和50的差異為10,明顯後者差異更大。

最終查看卡方值對應的p值更準确。

二、卡方檢驗分類

(一)方法分類

SPSSAU系統中,卡方檢驗分為【通用方法】中的交叉卡方,以及【醫學/研究】模塊中的卡方檢驗、配對卡方、卡方拟合優度、分層卡方五類。

(二)方法對比

(1)交叉卡方

适用于大部分場景之中,滿足大部分用戶需求,使用頻率高,僅使用Pearson卡方,不支持加權數據。

交叉卡方僅輸出一個交叉卡方分析結果如下圖:

可以看到卡方值為16.667,p=0.000顯著性差異。

(2)卡方檢驗

适用于實驗醫學研究方向,專業性更強,使用頻率高。

從上表可知,利用卡方檢驗(交叉分析)去研究減肥方式對于膽固醇水平共1項的差異關系【獨立性】,不同減肥方式樣本對于膽固醇水平共1項呈現出顯著性(p

總結可知:不同減肥方式樣本對于膽固醇水平全部均呈現出顯著性差異。

①Pearson卡方、yates校正卡方、Fisher卡方三類卡方,具體選擇标準如下圖

上表格為卡方檢驗的中間過程值,由于本案例數據為3*2格式,且10.05),意味着接受原假設(原假設:實際分布比例與預期比例一緻),即數據分布與預期一緻。

(5)分層卡方

分層卡方研究X與Y之間的差異時,進一步研究是否存在擾動因素項Factor項。

針對分層卡方,其涉及的理論知識内容,如下表格:

通常情況下,首先查看"比值比齊性檢驗",如果其呈現出顯著性(p< 0.05),則說明具有混雜因素,即需要考慮分層項,分别查看不同分層項下的數據結果。反之如果沒有通過"比值比齊性檢驗",即說明沒有混雜因素不需要考慮分層項,報告整體的結果即可(包括卡方檢驗,以及OR值)。

三、卡方檢驗應用

(一)分析步驟

(1)分析X分别與Y之間是否呈現出顯著性(p值小于0.05或0.01);

(2)如果呈現出顯著性,具體對比選擇百分比(括号内值),描述具體差異所在;未呈現出顯著性則停止分析;

(3)對分析進行總結。

(二)多選題分析中的應用

(1)卡方拟合優度:多選題,檢驗各選項選擇比例是否有顯著性差異

從上表可以看出,各選項選擇沒有顯著差異,百分比選擇分布較均勻(chi=5.947,p=0.203>0.05)。

(2)Pearson卡方:單選-多選,交叉差異檢驗

從上表可以看出,性别對于共五項表示的多選題并不會呈現出顯著差異性(chi=1.208,p=0.877>0.05)。

(3)Pearson卡方:多選-多選,交叉差異檢驗

從上表可以看出,兩個多選題之間并沒有明顯的關聯關系,百分比選擇分布較均勻(chi=0.732,p=1.000>0.05)。

四、數據格式

卡方檢驗數據格式可分為常規格式與加權格式兩類。

上述五類卡方檢驗方法,除交叉卡方外,其餘四類卡方檢驗均支持加權數據格式。

(1)常規格式

一行代表一個樣本,如果有100個樣本即為100行;一列代表一個屬性;這類格式最為常見,而且此類數據格式可以做任何的分析。因為其攜帶着所有最原始的數據信息。

(2)加權格式

例如:膽固醇水平有2項,減肥方式有3項,因而為3*2共6種組合,則一定需要有6行,并且一定為3列,最後一列叫‘加權項’,這樣的數據格式上傳到SPSSAU後進行分析即可。

五、差異幅度

六、定量數據做卡方檢驗

卡方檢驗主要用來研究定類與定類數據間差異關系的;

那麼定量數據能否進行卡方檢驗呢?此時可以分為以下三種情況讨論:

(1)定量數據可以轉化為定類數據(可以進行卡方檢驗)

① 自動按分位數分組

例如:想讓樣本數據按五分位數進行分樣本處理;第一步将數據按照指定變量從小到大排列;第二步分别找到20%分位點、40%分位點、60%分位點、和80%分位點;第三步将小于20%分位點的全部取值為1,20%-40%取值為2,60%-80%取值為3,80%以上取值為4。

② 按實際意義分組

例如:本科以下、本科以上兩組;20歲以下、20-30歲、30歲以上。

(2)定量和定類模糊(視研究偏好而定)

例如:量表數據,比如非常不滿意,不滿意,一般,滿意和非常滿意

(3)定量不可轉化為定類數據(不可以進行卡方檢驗)

如果研究定類與定量數據之間的關系,此時應該使用方差或者T檢驗。

差異關系研究方法選擇見下表:

你可能想看:

其他相關
知道“太歲”、“肉靈芝”真相的我,終于離科學近了一步

知道“太歲”、“肉靈芝”真相的我,終于離科學近了一步

作者: 天天見聞 時間:2024-10-13 閱讀: 18
有着濃濃走近科學風的“太歲”,到底是什麼?可能是最出名的一個“太歲”樣本。不過如此一來,在沒有高分子材料制造技術的古代,人們發現的“太歲”又是什麼呢?...
譯文|預訓練語言模型的“運氣”提示:一種無參數無梯度構建高效prompt的方法

譯文|預訓練語言模型的“運氣”提示:一種無參數無梯度構建高效prompt的方法

作者: 天天見聞 時間:2024-10-13 閱讀: 26
對于大型預訓練語言模型,更多步驟進行預訓練的語言模型,搜索成功率更高,搜索成本也更低,這表明“運氣”提示是模型容量擴展的獨特結果,而不僅僅是運氣。...
一文學會t檢驗的3種常用方法

一文學會t檢驗的3種常用方法

作者: 天天見聞 時間:2024-10-13 閱讀: 21
本文及後面的幾篇文章中,我們将會分别對幾種常用的組間比較方法及其JMP軟件的實現逐一進行詳細介紹。本文我們先從最常用的t檢驗講起。獨立樣本t檢驗操作——方法選擇單樣本t檢驗——方法選擇圖14配對t檢驗——菜單選擇圖15配對t檢驗——變量選擇配對t檢驗結果見圖16。...
想多賺錢應該怎麼做?——丁火對話高老師(3)

想多賺錢應該怎麼做?——丁火對話高老師(3)

作者: 天天見聞 時間:2024-10-12 閱讀: 20
丁火:那具體應該怎麼做呢?高老師:第一步是了解AI可以在你的領域中承擔哪些任務。丁火:AI似乎需要很多技術知識,對普通人來說,這是一個挑戰嗎?丁火:高老師,對于那些在創意行業工作的人,人工智能似乎既是機遇也是挑戰。丁火:在AI日益普及的時代,您認為技能更新有多重要?...
中成藥應用大全

中成藥應用大全

作者: 天天見聞 時間:2024-10-02 閱讀: 56
8、肝郁發熱:加味逍遙丸瘀血發熱——大黃蟄蟲丸、血府逐瘀口服液62、中氣不足,氣不攝血——補中益氣丸、人參歸脾丸63、感冒——冒感冒軟膠囊、感冒清熱沖劑、防風通聖丸、桂枝合劑、通宣理肺丸(片)94、月經過少:血虛:内補養榮丸、人參養榮丸、八珍丸...
八字從弱格斷富貴層次

八字從弱格斷富貴層次

作者: 天天見聞 時間:2024-10-02 閱讀: 69
在生辰八字論命有很多的格局,格局的高低決定了八字層次的高低,八字格局有很多的種類,身弱、身旺、從弱、從旺等就是八字格局。單獨的格局沒有好壞之分,要結合八字原局及大運流年來綜合評判,那麼從弱格八字的富貴層次有哪些那?三)從弱格八字的富貴層次...
我來說兩句

年度爆文