加載中........
×

卡方檢驗及其錯誤應用——有“率”未必“卡方”

2019-6-13 作者:馮國雙   來源:小白學統計 我要評論1
Tags: 卡方檢驗  

有不少臨床工作者,提“率”必“卡方”,似乎卡方檢驗是分析“率”指標的萬能工具,也有的人只要看到分類資料,一律用卡方檢驗。事實上,不同的研究目的、資料類型所采用的方法是各不相同的。卡方只是其中之一,但絕不是全部。換句話說,卡方檢驗可以比較兩組或多組的分類資料,但分類資料的比較不一定非要用卡方檢驗。

本文主要針對目前論文撰寫中常見的一些卡方檢驗的錯誤應用進行分析,并給出正確的分析思路。

一定要區分“分組”和“結局”

以前有的統計學書中,經常這么說:行變量是無序、列變量是有序的情形用某某方法,行變量是有序、列變量無序用某某方法,等等之類的。很容易讓人糊涂,什么行和列?我的行列跟你的行列一樣嗎?作為初學者,經常暈暈乎乎的搞不懂。

其實,比較簡單的方法是這樣:分清楚哪個是分組變量,哪個是分析變量(結局)就行了。這個比較好區分,根據你的研究目的就行了。比如你要比較兩種藥物的療效,那很明顯,療效是結局,藥物是分組。再比如,比較男女間某病發病率,那么性別就是分組,是否發病就是結局。

只要你能分清分組和結局,就很容易選擇方法。其實在分類資料的比較重,分組是什么資料并沒有關系,重要的是結局資料的類型。且看下面的圖形。

分類結局組間比較的方法選擇

首先一定要明確,分類資料主要有三種類型:二分類、無序多分類和有序多分類。對于不同的類型,組間比較方法是不同的,絕不是卡方檢驗一家獨大,更需要結合實際情況來判斷。下圖是常見的分類資料組間比較的方法。



不難看出,對于分類資料的組間比較,統計方法的選擇主要跟結局指標類型和研究設計有關,跟分組變量的類型沒什么關系。你的分組變量是無序也好,有序也好,都無所謂。只跟你的結局變量的類型有關,你的結局變量是有序或無序,那就有影響了。

如果結局是二分類或無序多分類變量,一般直接用χ2檢驗即可,隨機設計用普通χ2檢驗,配對設計用McNemar配對χ2檢驗。

對于有序多分類結局,通常采用秩和檢驗,以比較各組不同程度上的等級差異。如果采用χ2檢驗的話,只能說明組間構成比是否有差異,體現不出“有序”變量的價值所在。

即使對于二分類資料和無序分類資料,χ2檢驗也并非唯一選擇。當兩組或多組的分類資料比較時,只有在總例數大于40且理論頻數均大于5時,才選擇χ2檢驗;如果總例數大于40但有理論頻數小于5且大于等于1時,最好選擇校正的χ2檢驗;如果總例數小于40或理論頻數小于1,建議采用Fisher確切檢驗,此時如果用χ2檢驗容易出現假陽性。

事實上,也有一些統計學家建議,保險起見,你可以所有的情形都用Fisher確切檢驗。

更多內容,可查看醫咖會系列教程:

1、SPSS教程:兩個率的比較(卡方檢驗)及Fisher精確檢驗

2、Stata教程第13期:卡方檢驗/Fisher精確檢驗

3、SPSS教程:多個組比較(Fisher精確檢驗)及組間兩兩比較

有“率”未必卡方

先看一個例子:某研究調查了4所高中,測量了男生和女生的脂肪比例情況,比較男女的脂肪比例差異。該研究在統計學方法部分寫道:“比例的比較采用χ2檢驗”。

不少人可能會說,沒問題啊。比例嘛,當然采用卡方了。對此,我只能用陸游的一首詞來回答:錯!錯!錯!

通常我們所說的比例,是指總人群中,具有某種特征的人所占的百分比,如調查了某高中男生和女生的飲酒比例分別為10%和6%,這里的結局指標并不是比例,而是分類資料(飲酒和不飲酒),比例只是作為每類中的頻數,這種情況下,性別間的比較可以考慮χ2檢驗。

而在這一例子中,觀察的結局指標就是比例值,每個人都有一個比例值,這一比例值并不能作為分類資料看待,而是連續資料,其單位是%。對于每組人群(男和女),可以計算平均的脂肪比例,因此其比較應該采用定量資料的比較方法(如t檢驗、秩和檢驗等)。

率的兩兩比較

另一個在實際應用中需要注意的問題是,對于多組率或比例的比較,當卡方檢驗結果顯示P<0.05時,僅表示多組之間總的有差異,即多組中至少兩組有差異,但無法說明具體哪兩組之間有差異。如果要了解具體哪兩組間不同,此時可進行兩兩比較。

常用的兩兩比較方法是Bonferroni法,該法主要思想是校正檢驗水準,即根據比較次數的多少將將檢驗水準改為 0.05/比較次數,計算的P值與校正的檢驗水準進行比較,做出統計學結論。例如,對4組進行兩兩比較,共需比較6次,此時需要將檢驗水準調整為0.05/6=0.0083,兩兩比較時,當P值小于0.0083才認為組間差異有統計學意義。

注意配對卡方結果的選擇

配對卡方和兩組獨立資料的卡方,結果是不同的。在很多軟件中,不少人往往會選擇錯誤,誤把獨立資料的卡方結果作為配對卡方的結果來展示。

對于配對的分類資料,一般軟件給出的是McNemar配對χ2檢驗,所以,當你看到McNemar字眼,這是配對卡方的結果,即指標前后差異的結果。但是要注意,一般軟件也會同時給出普通χ2檢驗的結果,但此時普通卡方檢驗的結果給出的是相關性檢驗結果,即配對前后指標是否有關聯。這兩個結果不可混淆,否則容易給出相反的結論,因為這兩個結果經常不一致。

注意等級資料的結局

如果結局是等級資料,一般都會建議不要用卡方檢驗,而是用秩和檢驗。這并不是說等級資料結局不能用卡方,等級資料也可以用卡方檢驗,但是,這時候等級資料就失去了等級的意味了。也就是說,你可以對等級資料結局采用卡方檢驗,但是說明的問題就不同了。

用秩和檢驗,說明的問題是,兩組或多組之間有等級或程度上的差異;而如果用卡方檢驗,只能說明,兩組或多組的構成比有無差異,注意構成比是沒有等級或順序的,體現不出等級資料的特點。

我想,既然你的結局考慮用等級資料,肯定是想體現出等級的特點,否則那為什么要設等級資料呢?所以,我們一般都建議,等級資料的結局,組間比較最好采用秩和檢驗,而不是卡方檢驗。



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

只有APP中用戶,且經認證才能發表評論!馬上下載

敢心

其中的區別很大,怎么用好。課題設計是關鍵。

(來自:梅斯醫學APP)

2019-6-20 16:43:57 回復

web對話
江西快三投注