軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計咨詢中心???? 胡良平
?
???????? 很多人盲目運用一般χ2檢驗處理各種R×C表資料,這樣很不妥當(dāng)。應(yīng)根據(jù)列聯(lián)表的類型、統(tǒng)計分析目的和資料所具備的前提條件,有針對性地選擇統(tǒng)計分析方法。本文擬通過臨床實例分析介紹R×C表的4種具體表現(xiàn)形式、對應(yīng)的統(tǒng)計分析方法及其合理選用時所需要的前提條件。
????????? 臨床實例分析
??????? 【例1】某醫(yī)師用一般χ2檢驗處理表1和表2資料。
??????? 【差錯辨析與釋疑】表1和表2都叫做雙向無序的R×C列聯(lián)表資料,簡稱R×C表,顧名思義,就是表中兩個定性變量都是名義變量。通常對于這種資料,統(tǒng)計分析的目的是“考察表中兩個定性變量之間是否獨立”。對表1而言,具體地說,4種甲狀腺病在4個季節(jié)內(nèi)發(fā)病的人數(shù)構(gòu)成是否相同,即表中各列(或各行)上頻數(shù)分布規(guī)律是否相同;對表2而言,具體地說,4種緩慢心律失常疾病在4個部位上發(fā)病的人數(shù)構(gòu)成是否相同,即表中各列(或各行)上頻數(shù)分布規(guī)律是否相同。也就是說,表1和表2資料屬于同一種類型的列聯(lián)表資料,分析目的也相同,通常情況下可以選擇一般χ2檢驗予以處理。但仔細檢查資料所具備的前提條件時,不難發(fā)現(xiàn),表1資料具備而表2資料卻不具備一般χ2檢驗所要求的前提條件。
????????那么,一般χ2檢驗所要求的前提條件是什么?就是表格中小于5的理論頻數(shù)的個數(shù)不應(yīng)超過總格子數(shù)的1/5。表格中現(xiàn)有的頻數(shù)被稱為觀察頻數(shù),與每個觀察頻數(shù)對應(yīng)著一個理論頻數(shù),各理論頻數(shù)的計算方法為:“(該觀察頻數(shù)的行合計數(shù)×該觀察頻數(shù)的列合計數(shù))/總頻數(shù)?!彼?可以選用一般χ2檢驗處理表1中的資料,而應(yīng)當(dāng)選用Fisher的精確檢驗處理表2中的資料。
????? ? 【例2】某醫(yī)師用一般χ2檢驗處理表3和表4資料。
??????? 【差錯辨析與釋疑】表3和表4中都有一個定性變量是有序的,故可籠統(tǒng)地稱它們?yōu)椤皢蜗蛴行虻腞×C表資料”。但在進行統(tǒng)計分析時,要特別強調(diào)結(jié)果變量是否為有序的,因為這一點與統(tǒng)計分析的目的和對應(yīng)的統(tǒng)計分析方法的合理選擇有直接關(guān)系。
??????? 若僅原因變量是有序的單向有序的R×C表資料,此時,原因變量的有序性對統(tǒng)計分析沒有什么參考價值,故仍應(yīng)將其視為“雙向無序的R×C表資料”,見表3;只有當(dāng)結(jié)果變量是有序的而原因變量是名義的二維列聯(lián)表資料,才稱其為“單向有序的R×C表資料”。為了不引起誤解,寧愿繁瑣一些,常將此類列聯(lián)表稱為“結(jié)果變量為有序變量的單向有序的R×C表”。
??????? 若用一般χ2檢驗處理表3資料,其目的是希望回答3行上的頻數(shù)分布是否相同,換句話說,是希望回答不同食管癌TNM分期的患者,其CAM-1的表達率是否相同。這是符合臨床醫(yī)師需要的。但這并不意味方法一定選對了,還應(yīng)檢查資料是否滿足此方法所要求的前提條件。表3中原始頻數(shù)共占用了6個格,其中竟有3個格上的理論頻數(shù)小于5,說明需要改用Fisher的精確檢驗處理,而不適合直接選用一般χ2檢驗。
???????? 表4應(yīng)叫做“結(jié)果變量為有序變量的單向有序R×C列聯(lián)表”,若用一般χ2檢驗處理該資料也可以,只不過其結(jié)論是“3種藥物醫(yī)治的患者在4個療效等級上的頻數(shù)分布規(guī)律是否相同”,而臨床醫(yī)師關(guān)心的是“3種藥物醫(yī)治該病患者的療效之間的差別是否具有統(tǒng)計學(xué)意義”,即此統(tǒng)計分析方法(即一般χ2檢驗)所能達到的分析目的與臨床醫(yī)師希望達到的分析目的不吻合。要想有針對性地回答這個問題,所選用的統(tǒng)計分析方法應(yīng)當(dāng)是能對“療效”的等級進行評分后再計算,其對應(yīng)的統(tǒng)計分析方法有:秩和檢驗、Ridit分析和有序變量的logistic回歸分析。
???
?????? 【例3】某醫(yī)師用一般χ2檢驗處理表5和表6資料。
?????? 【差錯辨析與釋疑】表5和表6中兩個定性變量都是有序變量,但其屬性是不同的,故它們被稱為“雙向有序且屬性不同的R×C表資料”。若用一般χ2檢驗處理此類資料,其結(jié)論只是各行(或各列)上的頻數(shù)分布規(guī)律是否相同,這個結(jié)論并不是臨床醫(yī)師最關(guān)心的。臨床醫(yī)師關(guān)心的可能是下列問題:
??????? 其一,各行上“療效之間的差別是否具有統(tǒng)計學(xué)意義”。此時,應(yīng)將此表視為“結(jié)果變量為有序變量的單向有序的R×C表”,其對應(yīng)的統(tǒng)計分析方法有:秩和檢驗、Ridit分析和有序變量的logistic回歸分析。
????????其二,表中“兩有序變量之間存在的相關(guān)關(guān)系是否具有統(tǒng)計學(xué)意義”。此時,應(yīng)選用定性資料的相關(guān)分析方法,對應(yīng)的統(tǒng)計分析方法有:Spearman秩相關(guān)分析、Kendall秩相關(guān)分析和典型相關(guān)分析。
?????? ?其三,若表中兩個有序變量之間的相關(guān)關(guān)系存在且具有統(tǒng)計學(xué)意義,希望進一步弄清它們之間的關(guān)系是否為單純的“線性”關(guān)系,此時,應(yīng)選用線性趨勢檢驗。
???
?????? 【例4】某醫(yī)師用一般χ2檢驗處理表7和表8資料。
?????? 【差錯辨析與釋疑】當(dāng)R×C列聯(lián)表中的兩個定性變量都是有序變量,且它們的屬性相同且水平數(shù)也相同,此時,稱這樣的列聯(lián)表資料為“雙向有序且屬性相同的方表資料”,見表7和表8。這兩張表在本質(zhì)上是相同的,但稍有點區(qū)別。表7中兩個有序變量對應(yīng)著“時間”上先與后產(chǎn)生的診斷結(jié)果,而表8中是兩種診斷方法同時診斷的結(jié)果。
??????? 若選用一般χ2檢驗處理此類資料,其結(jié)論仍然是各行(或列)上的頻數(shù)分布規(guī)律是否相同。若最終的結(jié)論為“各行(或列)上的頻數(shù)分布規(guī)律相同”,說明兩種診斷方法互相獨立,即兩種診斷方法所產(chǎn)生的結(jié)果之間互不相干,換句話說,兩種診斷方法不可互相替代;若最終的結(jié)論為“各行(或列)上的頻數(shù)分布規(guī)律不相同”,說明兩種診斷方法不互相獨立,但它們之間的關(guān)系是怎樣的,卻解釋不清楚了。
?????? 臨床醫(yī)師更關(guān)心的是“兩種方法診斷結(jié)果(或前后診斷結(jié)果)之間的一致性是否具有統(tǒng)計學(xué)意義”。對表7而言,研究者希望回答前、后兩個不同時間點上診斷的結(jié)果是否具有一致性;而對表8而言,研究者希望回答兩種方法診斷的結(jié)果是否具有一致性。它們要回答的問題在本質(zhì)是相同的。這樣的資料實際上就是配對設(shè)計2×2列聯(lián)表資料的“擴大”,只不過在處理配對設(shè)計2×2列聯(lián)表資料時,人們更關(guān)心的是兩種檢測方法檢測的結(jié)果不一致部分的數(shù)量之間的差別是否具有統(tǒng)計學(xué)意義,而在處理“方表”資料時,人們更關(guān)心的是兩種檢測方法檢測的結(jié)果之間的一致性是否統(tǒng)計學(xué)意義,故常用的統(tǒng)計分析方法叫做一致性檢驗或稱為Kappa檢驗。
?(轉(zhuǎn)自中國醫(yī)學(xué)論壇報)