TEL:04-22078539 本中心網址:http://www2.cmu.edu.tw/~biostat/

 

過去演講回顧
活動訊息
  諮詢師及種子教師訓練第八次訓練課程
 
生物統計教室
 量表信度的測量: kappa統計量之簡介

 

過去演講回顧

  • 2007/06/27 ()
    邱博煌 博士
    (Director, Biostatistics, Biomedical Informatics Research Center, Marshfield Clinic Research Foundation, Marshfield Clinic, Marshfield, WI. )
    Patterns of Bias due to Differential Misclassification by Case-Control Status in a Case-Control Study.
                                                        (
    檔案下載

  • 2007/06/28 ()
    謝復興博士
    (Professor, Department of Statistics, University of California, Davis.)
    Computations on coupled affective processing of dyadic dynamics.

TOP


活動訊息

活動名稱:第二期諮詢師及種子教師訓練第八次課程

活動時間:96612日下午130~下午300

活動地點立夫教學大樓15樓電腦教室

第二期諮詢師及種子教師訓練第八次活動時間:96612

由林保萱生統分析師介紹存活分析實務

      圖一 林保萱 生統諮詢師 課程介紹

圖二 參與的老師與同學

訓練內容概述

存活分析實務:

1.    Kaplan-Meier 估計式

2.    log rank檢定

3.    Cox's proportional hazards model

4.    調整後的存活曲線

5.    SAS實例演練

TOP


生物統計教室

量表信度的測量: kappa統計量之簡介(download)

~生物統計中心 崔懷芝統計分析師

社會科學研究中,很常使用重複測量的方法。臨床上,若有新的檢驗或診斷方法,也常會新舊方法同時進行檢測。無論如何,最終目的都是想知道『前後』或『新舊』測量信度的好壞。然而信度的測量方式有很多種,一般常見的包含Cronbach α係數、庫李(Kuder-Richardson)信度係數、折半信度(split-half reliability)、複本法(alternate form reliability)等方法。這次要介紹的kappa統計量,也是測量信度的眾多方法之一,是在表現重覆測量間之一致性(以百分比表示),其公式如下:

  κ計算的結果為-1~1,但通常κ是落在0~1間,可分為五組來表示不同等級的吻合度:0.0~0.20極低的吻合度(slight)0.21~0.40一般的吻合度(fair)0.41~0.60中等的吻合度(moderate)0.61~0.80高度的吻合度(substantial)0.81~1幾乎完全吻合(almost perfect)kappa值只適用於類別尺度(nominal scale)和序位尺度(ordinal scale)的資料。在臨床上常用來確立不同的檢驗或診斷方法之一致性,通常包含下列兩種情況:(1)人際信度(inter-rater reliability):評估兩位以上的醫護人員(或檢驗方法)診斷結果是否吻合,(2) 人內信度(intra-rater reliability):評估同一位醫護人員(或檢驗方法)重覆診斷的結果是否一致。

以人際信度(inter-rater reliability)而言,我們以肌肉和骨骼的研究為例子來說明kappa值的計算方式。表一是兩位臨床醫師依據麥根斯腰頸療法(McKenzie Method)評估病患下背部疼楚程度,將39位病患的診斷分為側邊移位(relevant)和非側邊移位(not relevant)兩種。

表一、兩位醫師診斷側邊位移的結果

 

醫師2

 

側邊移位

非側邊移位

總數

醫師1

側邊移位

 a  22

 b  2

 g1  24

非側邊移位

 c  4

 d  11

 g2  15

 

總數

 f1  26

 f2  13

 n  39  

格子ad的個數表示兩位醫師的診斷是相同的結果,而bc則表示兩位醫師對同一位病患的診斷結果並不相同。把ad兩個格子的個數相加除以總數(n),則為觀察值一致性的百分比(P0)

假設兩位醫師的診斷是獨立的,理論上診斷為一致的期望次數百分比(Pc)為:

P0Pc帶入計算kappa值的公式:

κ結果可知,兩位臨床醫師的診斷結果具有高度的一致性。

kappa係數不只能應用於2×2表,也能用於配對的表格(3×34×45×5…),但只能表現一致性的百分比,本身無法表示臨床醫師的「不一致性」是隨機還是具系統性的,因此還需對資料作進一步的檢驗。

上述的未加權作法,是將所有不一致的程度都視為相等。然而有些診斷結果是序位性的資料(3×3以上的列聯表),它的不一致性程度所提供的訊息並不相等,這時未加權的kappa值就不太適合。因此,爲了反映出不一致的程度對信度的影響,我們可以使用加權的kappa(weighted kappa)kappa值有好幾種加權的方式,SAS所提供的是平方加權(quadratic weighting),其計算公式如下:

表二為一個運動相關疼痛的評估研究,由一位臨床醫師在不同的時間做重覆的評估(假設疼痛不會隨時間改變)。將疼痛分為「不痛」、「輕微」、「一般」、「嚴重」四個等級。

表二、一位臨床醫師在不同的時間做重覆的運動相關疼痛評估

 

 

評估二

總數

 

 

不痛(1)

輕微(2)

一般(3)

嚴重(4)

評估一

不痛

(1)

15

3

1

1

20

[1]

[0.89]

[0.56]

[0]

 

輕微

(2)

4

18

3

2

27

[0.89]

[1]

[0.89]

[0.56]

 

一般

(3)

4

5

16

4

29

[0.56]

[0.89]

[1]

[0.89]

 

嚴重

(4)

1

2

4

17

24

[0]

[0.56]

[0.89]

[1]

 

 

總數

24

28

24

24

100

將疼痛程度分為四個序位等級:i (評估一)、j (評估二)、κ=4

括號內表示平方加權(w)

在這個例子裡,多數的人重複測量的結果都是集中於由左上到右下方向的個子中,若使用未加權的kappa值計算其信度,會發現這個研究是屬於中等的一致性(κ=0.55)。但如果考慮不痛到一般疼痛比起不痛到輕微疼痛的差異是不相同的,而使用平方加權,則會發現此研究的吻合度提升至高度的一致性(κ=0.67)

因此,在做兩種檢驗或重複測量的吻合度時,需要適時的考慮層級間的改變貢獻是否相同,以選擇適合的加權kappa值來表現較佳的一致性。

 

参考文獻:

Sim J, Wright CC.The kappa statistic in reliability studies: use, interpretation, and sample size requirements. Phys Ther. 2005;85:257–268.

 

TOP

本刊由中國醫藥大學 生物統計中心發行  網頁維護:林立偉