一文學會t檢驗的3種常用方法
在往期的文章中,我們已經從總體思路上介紹了組間比較的基本操作。本文及後面的幾篇文章中,我們将會分别對幾種常用的組間比較方法及其JMP軟件的實現逐一進行詳細介紹。
為了幫助更多的臨床醫師學習如何運用JMP高效地開展數據分析,提高日常工作和發表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統計學家馮國雙博士及其團隊将在JMP數據分析平台為大家分享一系列統計及數據分析、JMP實戰操作、JMP分析報表解讀等幹貨内容,每期一個經典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫師,對所有運用JMP軟件開展數據分析的小夥伴都适用。
本文我們先從最常用的t檢驗講起。t檢驗主要用于檢驗某一樣本統計量是否與總體參數相等,在實際應用中,最常見的有三種場景:獨立樣本t檢驗、配對樣本t檢驗和單樣本t檢驗。
本文主要用到兩個數據,一個是軀體健康評分的數據(圖1),另一個是皮膚含水量的數據(圖2)。
圖1 軀體健康評分數
圖2 皮膚含水量數據
01獨立樣本t檢驗
所謂獨立樣本,是指樣本所來源的總體之間是相互獨立的,如兩組軀體健康評分的比較,張三的評分與李四的評分并無關系,是相互獨立的。
例1:在軀體健康評分數據中,我們拟比較吸煙人群與不吸煙人群間的軀體健康評分是否存在差異。
首先通過點選JMP菜單“分析”→“以X拟合Y”,調出組間差異比較的界面(圖3)。“以X拟合Y”我們在《一個神奇的菜單,實現數據之間的所有組間比較》中已有詳細介紹。
圖3 獨立樣本t檢驗操作——菜單選擇
本例中軀體健康評分為結果,吸煙為分組,所以在對話框中将軀體健康評分放入“Y,響應”,将吸煙放入“X,因子”(圖4)。
圖4 獨立樣本t檢驗操作——變量選擇
結果如圖5所示。如果大家看過上一期的文章,應該知道,雖然圖5并無任何統計學結果,但我們可以通過點擊左上方的紅色小三角按鈕,顯示我們所需的統計分析結果,這些結果的選擇需要結合數據的正态性和方差齊性來定。
在上一篇文章中已經向大家介紹了如何進行這兩種檢驗,本文不再進行贅述。檢驗結果顯示該數據呈正态分布且方差齊,因此可以考慮采用獨立樣本t檢驗。
圖5 輸出結果
點擊“吸煙-軀體健康評分”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“均值/方差分析/合并的t(圖6)”。
圖6 獨立樣本t檢驗操作——方法選擇
結果如圖7所示, t值(即結果中的t比)為0.696,同時結果給出了3個P值,分别為:概率>|t|、概率>t和概率|t|表示雙側P值,這也是我們最常報道的,概率>t和概率
結果提示,吸煙人群與不吸煙人群間的軀體健康評分差異無統計學意義。
圖7 獨立樣本t檢驗結果
如果本例數據滿足正态性但兩組方差不齊,則可使用校正t檢驗(Satterthwaite t檢驗)。點擊“吸煙-軀體健康評分”單因子分析左側的紅色三角形按鈕(圖8),在下拉菜單中選擇“t檢驗”,即可獲得校正t檢驗的結果。其結果顯示形式和解讀同圖7的t檢驗。
圖8 校正t檢驗的選擇
這裡大家需要注意:在JMP的選項中,“t檢驗”輸出的是校正t檢驗的結果,而“均值/方差分析/合并的t”選擇輸出的才是t檢驗的結果。大家在做分析時注意不要勾選錯誤。
02單樣本t檢驗
單樣本t檢驗通常用于檢驗一組數據的均值與指定的目标值之間是否存在統計學差異。如想了解某特定職業運動員的紅細胞均值與标準的紅細胞值是否有統計學差異。
例2:在軀體健康評分數據中,假定軀體健康評分的正常值為60,拟了解患者的軀體健康評分值與健康人群的正常值是否存在差異。
本研究數據為正态分布,可以考慮采用單樣本t檢驗。由于單樣本t檢驗并沒有組别因素,因此不在“以X拟合Y”菜單中完成,而是在“分布”菜單中進行實現。
選擇“分析→分布”(圖9)。在圖10的界面中,将軀體健康評分放入“Y,列”。點擊确定後進入到結果界面(圖11)。
圖9 單樣本t檢驗——菜單選擇
圖10 單樣本t檢驗——變量選擇
點擊軀體健康評分左側的紅色三角形按鈕,在下拉菜單中選擇“檢驗均值”(圖11),這裡的“均值”即我們需要指定的目标值。
圖11 單樣本t檢驗——方法選擇
在彈出的對話框中的指定假設均值中填寫60(圖12),即檢驗樣本人群軀體健康評分的均值與目标值60是否存在統計學差異。如果已知标準差,也可在圖12中輸入标準差,如果未知,則基于樣本數據估計。
圖12 單樣本t檢驗——指定目标
結果如下圖13所示,提示差異有統計學意義(t=-5.7130,p
圖13 單樣本t檢驗結果
03兩組配對資料的比較
與獨立樣本的概念相對的是配對樣本,即樣本不是獨立的,如某高血壓人群治療前後的血壓值,對于張三該人而言,其治療前和治療後的血壓值會有一定關系,如果治療前為180,通常治療後不大可能突然降為120,很可能比180會稍低。
例3:在含水量數據中,拟探索患者幹預前與幹預後皮膚含水量是否有差異。由于本研究探索的是同一批患者不同時間點檢查結果是否有差異,屬于配對資料,若資料服從正态分布,則使用配對t檢驗。若不滿足正态分布,則采用做非參數配對檢驗,非參數檢驗将在後續的章節為大家詳細介紹。
配對t檢驗的統計分析思路為,計算幹預前後差值,将差值的均值與0比較,從而獲得幹預前後的差異是否有統計學意義。
因此在JMP中錄入配對數據時,應注意錄入格式需如圖2所示,每一個患者的兩次測量值在同一行的兩列上,這樣才能求出每個患者測量值的差值。
配對t檢驗的實現不是在“以X拟合Y”菜單中,而是在“專業建模”這一菜單下。選擇“分析→專業建模→配對”(圖14)。
圖14配對t檢驗——菜單選擇
這裡需要提醒一下:本文是以JMP 15為例介紹,在不同的JMP版本中,配對菜單的位置可能不一樣,在早期的JMP軟件中可從“分析”選項下直接找到“配對”模塊。
在配對t檢驗中,至少需要兩個結局變量,本例分别為皮膚含水量(幹預前)和皮膚含水量(幹預後),将這兩個變量放入“Y,配對響應”(圖15)。
JMP進行配對t檢驗的計算時,默認放入的第2行變量減去第1行變量,在操作時需注意放入變量的先後順序。
如圖15中,幹預前在第1行,幹預後在第2行,因此結果是基于幹預後-幹預前。本案例中想要了解幹預後皮膚含水量是否上升,因此先放皮膚含水量(幹預前),再放皮膚含水量(幹預後)。
圖15配對t檢驗——變量選擇
配對t檢驗結果見圖16。結果首先給出差值的計算方式為皮膚含水量(幹預後)-皮膚含水量(幹預前),結果部分給出了幹預前和幹預後分别的均值,以及均值差為6.32,說明幹預後的皮膚含水量高于幹預前,皮膚含水量平均升高了6.32。患者幹預前後皮膚含水量差異有統計學意義(t=12.595,p。
圖16 配對t檢驗結果
以上就是本期為大家帶來的基于JMP的三種常見的t檢驗應用場景、應用思路及一些分析注意事項。在後續的文章中,我們将陸續為大家帶來方差分析及兩兩比較、秩和檢驗及其兩兩比較、卡方檢驗和趨勢檢驗的JMP實現等。如果你也想體驗運用JMP開展t檢驗,下載JMP試用,跟着文章練起來吧!
我來說兩句