APP下载

基于Kappa系数的一致性检验及其软件实现*

2016-12-27第二军医大学卫生统计学教研室200433

中国卫生统计 2016年1期
关键词:尿样语句一致性

第二军医大学卫生统计学教研室(200433)

郭轶斌 郭 威 秦宇辰 何 倩 张新佶 吴 骋△

·计算机应用·

基于Kappa系数的一致性检验及其软件实现*

第二军医大学卫生统计学教研室(200433)

郭轶斌 郭 威 秦宇辰 何 倩 张新佶 吴 骋△

在医学检验学、影像医学和临床医学的研究工作中,经常会遇到一致性评价问题:如评估两种检测方法或两名检验人员的检测结果是否一致,评价某种新的诊断试验方法与金标准之间的一致性,或者同一种方法进行多次测定的结果是否一致等。根据检测指标的类型不同,可采用的一致性检验方法也不相同,常用的一致性检验方法有配对χ2检验、回归系数、组内相关系数(ICC)[1]、Kendall秩相关系数、Bland-Altman法[2]、Kappa系数等[3]。其中,适用于无序分类资料和等级资料一致性检验的Kappa系数已成为目前应用非常广泛的评价指标。该方法由Cohen等在1960年提出,可根据Kappa系数的取值大小来衡量两种诊断结果的一致程度,Kappa系数的值越大说明两种结果的一致性越高[4-5]。Kappa统计量与配对χ2检验皆可用于分类变量的一致性检验。前者不仅能检验两种方法或两次调查间是否有一致性,而且能给出一个反映一致性大小的量化值——Kappa系数[6]。但在实际应用中,如何合理地估计Kappa系数及其对应的P值常困扰着科研人员。针对上述问题,本文在回顾简单Kappa系数及加权Kappa系数计算方法的基础上,详细介绍了如何采用常用统计软件SAS和SPSS进行实现以及处理“行列数不相等”等特殊问题,并对两类软件的输出结果进行比较,提供了SAS程序,可输出需报告的主要结果,为科研人员正确应用Kappa系数解决诊断试验中一致性检验的问题提供了简单实用的操作方法。

Kappa系数

Kappa系数是从比较两个观测者对同一事物的观测结果或同一观测者对同一事物的两次观测结果是否一致出发,用由于机遇造成的一致性和实际观测的一致性之间的差别大小作为评价基础所提出的统计指标[7-8]。针对资料类型的不同,常用的Kappa系数包括针对无序分类资料(含二分类和多分类)的简单Kappa系数(simple Kappa)和针对等级资料的加权Kappa系数(weighted Kappa)。简单Kappa系数的算法比较简单,在这里不再赘述。在此仅介绍加权Kappa系数的原理和算法。

加权Kappa系数是简单Kappa系数的推广,是用加权的方法对两个评价结果进行量化,主要用于等级资料。对于四格表来说,简单Kappa系数与加权Kappa系数是相等的,对于行×列的列联表资料,加权Kappa系数的计算公式为:

式(2)中N为总例数;Aij为方法1第i个水平,方法2第j个水平对应的频数;wij为方法1第i个水平,方法2第j个水平对应频数的权重,0≤wij=wji<1,i≠j,wii=1;Ai.为方法 1的第 i个水平的所有频数(第 i行合计);A.j为方法2的第 j个水平的所有频数(第j列合计)。

确定wij主要有两种方法:Cicchetti-Allison法(线性权重)和 Fleiss-Cohen法(平方权重)[3,9],估计方法分别为:

其中,Ci表示第i个水平的评价分值,k表示列数[9],C1为最小的评价分值,Ck为最大分值。

权重计算与等级的评价分值有关,研究者要用专业知识来确定。通过计算公式不难看出CA法计算的权重值小于FC法,即计算出的Kappa值CA法会小于FC法,由此可知,在对无效假设H0∶κ=0的假设检验中,PCA<PFC,说明FC法比CA法更保守,即更不容易拒绝无效假设H0。

Kappa系数的值介于-1到1之间,如果κ<0,说明Pa<Pe,即两观测结果不一致;如果κ=-1,说明完全不一致;如果κ=0,则Pa=Pe,即观察的一致率完全是由随机因素造成的;如果κ>0,则Pa>Pe,即两种观察结果较大可能存在一致性,由于随机因素引起的可能性较小。κ值越大说明两种结果越一致,当 κ≥0.75时,说明结果一致性较好,若κ<0.4,说明缺乏一致性[7]。

Kappa系数的软件实现

常用的统计软件均能计算Kappa系数。其中,SPSS软件仅能计算简单Kappa系数,而SAS软件既可以计算简单Kappa系数,也可以计算加权Kappa系数。由于SAS计算简单Kappa系数的过程与计算加权Kappa系数的相同,只是参数设置上有所区别,文中不再赘述,仅以SAS介绍加权Kappa系数的实现,并介绍行列数不等这一特殊情况下的Kappa值软件实现过程。

1.加权Kappa系数的软件实现

加权Kappa系数的计算可采用SAS软件实现,本文使用SAS9.4。本例数据来源于谢竞芳等发表的《晨尿与任意时间尿样尿碘值的一致性检验》一文[10],采取74名产前检查的孕妇同天晨尿样和任意时间尿样各1份,用碘催化砷铈反应快速定量检测的方法同时测定两种尿样尿碘值,数据见表1。由于原文中数据分类过多,笔者将其进行了合并。

表1 晨尿与任意时间尿样尿碘含量(μg/L)

其SAS程序如下:

data kappa;

do r=1 to 4;do c=1 to 4;input f@@;output;end;end;

cards;

16 6 2 2 14 6 2 0 8 8 2 0 4 2 0 2

proc freq data=kappa;tables r*c/agree;weight f;test wtkap;exact wtkap;output out=result wtkappa;proc print data=result;run;

程序说明:本例用do-end语句来创建数据集。在FREQ过程中,tables语句表示以变量r为行变量,以变量c为列变量的列联表,其中使用了agree选项,表示在结果中输出Kappa一致性检验的结果。用weight语句定义f变量为列联表中的实际频数。test wtkap语句表示计算加权kappa系数渐近P值,exact wtkap语句表示计算加权kappa系数确切P值。output语句表示将计算的结果输出到名为“result”的数据集中,然后使用PRINT过程将“result”数据集打印到输出窗口。

结果及解释如下:

在输出窗口中可以看到加权Kappa系数的结果,_WTKAP_为加权Kappa值等于0.0839,E_WTKAP为渐近标准误等于0.0873,L_WTKAP为加权Kappa值95%置信区间的下限,U_WTKAP为加权Kappa值95%置信区间的上限,95%置信区间为(-0.0872,0.2550)。P2_WTKAP为渐近双侧检验的P值等于0.2590,XP2_WTKA为确切双侧检验的 P值等于0.3078。因此,尚不能认为晨尿与任意时间尿样尿碘含量存在一致性。

读者也可以打开逻辑库中的名为“result”的数据集来查看以上的结果。

在SAS软件中可以对Kappa系数进行渐近和确切假设检验,只需在PROC部中添加表2中的语句即可,Kappa系数确切检验的具体方法参见文献[11]。值得注意的,确切概率计算量很大,对于大于4×4的方阵资料,SAS计算时间会很长,请读者慎用此方法。

表2 SAS程序中Kappa系数假设检验的语句

在SAS软件中,加权Kappa系数的权重计算方法默认为Cicchetti-Allison法,如读者需要使用 Fleiss-Cohen法,可以在agree语句后加上选项(WT=FC)。

2.行列数不相等资料的Kappa系数的软件实现

常规的Kappa一致性检验要求资料为方阵,即两个观察者(方法)的结果分类相同且数目一致,体现在列联表中为行数与列数相等。但在实际研究中,有时会出现两个观察者(方法)的结果分类水平数不一致的情况,即行数与列数不相等。例如:两医师对病人病情严重程度的诊断如表3。

表3 甲乙两医师对患者某病病情严重程度的诊断

此时,甲医师诊断病情较轻的患者数为0,而乙医师诊断病情较轻的患者数不为0。

由于相应的检验方法及置信区间无法定义,所以SPSS和SAS均无法直接输出Kappa系数。此时可以通过以下方法解决:(1)如果需要计算的是简单Kappa系数,可以采用SPSS软件,在数据集中将取值为0的一行(或列)观测值都赋以一个很小的值,如0.001,而原有观测相对来说具有较大的取值,这样处理并不会影响到Kappa系数的计算[4,12]。

(2)如果要计算的是加权Kappa系数,如表3。可以采用 SAS软件,此时由于有空行存在,需要在weight语句中加上 zeros选项,即 weight变量名/zeros;如果读者想要了解计算加权Kappa系数时的权重值,可在agree后加上选项printkwt。对于表3资料,对应的SAS程序如下(数据录入的方法与计算加权Kappa系数中的一致,在此不再赘述):

proc freq data=kappa;tables r*c/agree;weight f/zeros;test wtkap;exact wtkap;output out=result wtkappa;proc print data=result;run;

输出的主要结果及其解释同本部分第1节。

小 结

本文介绍了Kappa系数的用途、分类和适用条件,对应的软件实现的方法和实现中应注意的问题以及行列数不相等资料的软件实现方法。

Kappa系数广泛应用于各种计数资料的一致性检验,在使用过程中要注意尽量减少不必要的分类,以避免出现行列数不一致的情况。

[1]余红梅.组内相关系数及其软件实现.中国卫生统计,2011,28(5):497-500.

[2]刘玉秀.定量方法对比研究重复测量设计Bland-Altman一致限LoA的可信区间估计.中国卫生统计,2014,31(2):224-229.

[3]夏邦世.Kappa一致性检验在检验医学研究中的应用.中华检验医学杂志,2006,29(1):83-84.

[4]华琳.关于对诊断一致性Kappa系统的探讨.数理医药学杂志,2006,19(5):518-520.

[5]Cyr L,Francis K.Measures of clinical agreement for nominal and categorical data:the kappa coefficient.Computers in biology and medicine,1992,22(4):239-246.

[6]王洁贞.Kappa统计量在一致性和重现性检验中的应用.山东医科大学学报,1996,34(3):209-212.

[7]王伟.介绍一种评价临床检查结果一致性的新指标—Kappa值.天津医药,1991,19(10):639-640.

[8]文万青.关于kappa系数的进一步评价和校正.中国卫生统计,1994,11(6):4-7.

[9]闫岩.对诊断一致性kappa系数及评价指标的探讨.中国卫生统计,2007,24(3):313-315.

[10]谢竟芳.晨尿与任意时间尿样尿碘值的一致性检验.中国地方病防治杂志,2010,25(5):359-360.

[11]苏炳华.Kappa检验的确切概率计算法.上海第二医科大学学报,1993,13(1):12-15.

[12]Gross ST.The kappa coefficient of agreement for multiple observers when the number of subjects is small.Biometrics,1986,42(4):883-893.

*:上海市软科学研究重点项目(14692101700);总后优秀青年科技人才扶持对象资助项目;上海市卫生和计划生育委员会科研课题(20154Y0074)

△通信作者:吴骋,E-mail:wucheng_wu@hotmail.com

郭海强)

猜你喜欢

尿样语句一致性
关注减污降碳协同的一致性和整体性
尿检时如何取中段尿
注重教、学、评一致性 提高一轮复习效率
IOl-master 700和Pentacam测量Kappa角一致性分析
重点:语句衔接
31人奥运尿样未过关
基于事件触发的多智能体输入饱和一致性控制
江浙沪样本儿童过半晨尿检出抗生素滥用抗生素伤不起
我喜欢
出色的推销员