基于灵敏度和特异度任意赋权的广义标准化诊断符合率*
2012-12-04南方医科大学公共卫生与热带医学学院生物统计学系510515李丹玲陈平雁
南方医科大学公共卫生与热带医学学院生物统计学系(510515) 李丹玲 陈平雁
自 Yerushalmy(1947)〔1〕提出灵敏度(SEN)和特异度(SPE)以来,它们一直是评价诊断试验最基本和最重要的两项指标。由于灵敏度和特异度是一对互为矛盾的指标,即对于某一诊断方法,一者的增大必定以另一者的减小为代价,反之亦然;所以在不同诊断方法进行比较时,一者的灵敏度较高而另一者的特异度较高时,难以对其做出综合评价。于是结合灵敏度和特异度的综合评价指标由此产生,如标准化诊断准确率或标准化诊断符合率。然而,此类综合评价指标又产生了新的问题,当灵敏度和特异度的重要性不同时,它们就不能反映诊断的真实价值〔2〕。为此,我们将在基于灵敏度和特异度特意赋权的基础上建立一种新的诊断试验评价指标-广义标准化诊断符合率。
广义标准化诊断符合率的构建
两种试验诊断某种疾病的结果用表1和表2表达,纵标目是以“金标准”或称参照标准确诊的受试个体是“患者”(D+)或“非患者”(D-);横标目为诊断方法所判定的结果“阳性”(T+)或“阴性”(T-)。
表1 甲试验诊断某疾病的结果
笔者曾提出,两样本病例组构成不同时,不宜用诊断符合率检验,而应该用标准化诊断符合率检验〔3〕。为便于应用,我们将两样本的合并人群定义为标准人群。下面导出合并两样本为标准人群的标准化诊断符合率检验公式。由表3可知,病例组的合计为n1+m1,甲灵敏度为SEN1,预期的真阳性数为(n1+m1)·SEN1,乙灵敏度为SEN2,预期的真阳性数为(n1+m1)·SEN2。对照组的合计为n2+m2,甲的特异度为SPE1,预期的真阴性数位(n2+m2)·SPE1,乙的特异度为SPE2,预期的真阴性数位(n2+m2)·SPE2。由直接法求得标准化诊断符合率:
表2 乙试验诊断某疾病的结果
表3 标准化诊断符合率计算表
从上,我们得知,标准化诊断符合率其实质是灵敏度与特异度的一个线性组合,我们在基于灵敏度和特异度任意赋权的基础上建立广义标准化诊断符合率。
广义标准化诊断符合率的构建遵循如下两原则:
(1)灵敏度、特异度的权重之和为1,即灵敏度的权重为w,特异度的权重为1-w;
(2)满足特殊性。当灵敏度和特异度同等重要时,即权重均为0.5时,广义标准化诊断符合率e'等于标准化诊断符合率e。
因此我们构造出来的广义标准化诊断符合率有如下形式:
其中0≤w≤1。
广义标准化诊断符合率的统计推断
根据中心极限定理,当样本量较大时,检验统计量
其中Se1'-e2'是两种诊断试验的广义标准化诊断符合率之差的标准误。为求之,我们先计算其近似方差,由于两诊断试验相互独立,因而有:
至此,两个独立诊断试验的广义标准化诊断符合率比较的统计推断方法得以建立:
这里,Z~N(0,1)。
检验统计量Z为权重w的单调函数
笔者通过理论证明得知权重w对Z的影响如下:
(1)若 SEN1≤SEN2,SPE1≥SPE2,则随着 w 的增大,Z减小(当且仅当 SEN1=SEN2,SPE1=SPE2时,Z≡0);
(2)若 SEN1<SEN2,SPE1<SPE2,则随着 w 的增大,Z先减小后增大,最小值点为
假想的两独立诊断试验的结果分别列于表4,试比较之。
分析结果见表4,若灵敏度的权重取0.4(特异度的权重为0.6),两法的e'分别为0.577和0.661,两法的诊断价值无统计学差异(Z=-1.445,P=0.148);当灵敏度和特异度取相同权重时,即w=0.5时,此时广义标准化诊断符合率等于标准化诊断符合率(e),乙法的诊断价值高于甲法(Z=-2.722,P=0.006)。若灵敏度的权重取0.6(特异度的权重为0.4),两种检验方法的e'分别为0.519和0.745,乙的诊断价值高于甲法(Z= -3.909,P <0.001)。
(3)若 SEN1≥SEN2,SPE1≤SPE2,则随着 w 的增大,Z增大;
(4)若 SEN1>SEN2,SPE1>SPE2,则随着 w 的增大,Z先增大后减小,最大值点w0同上。我们通过举例来演示上述四种不同情况下Z如何随w的变化而变化(见图1)。
〔实例〕
讨 论
表4显示,乙法的灵敏度高于甲法,但其特异度低于后者。此类资料若分别比较灵敏度或特异度显然难以做出一个完整的判断,需要用类似标准化诊断符合率这样的综合指标进行评价,这正是标准化诊断符合率的优势所在。
图1 检验统计量Z为权重w的单调函数
表4 三种不同权重时广义标准化诊断符合率检验的结果
关于灵敏度和特异度的相对重要性,Galen和Gambino曾有论述〔4〕:(1)对病情严重但治疗有积极意义,漏诊会造成不可挽回的损害而误诊不治带来严重后果的疾病,如嗜铬细胞瘤,以灵敏度较为重要;(2)对病情重又属于不治之症,误诊会产生严重后果的疾病,如多发性硬化症,以特异度较为重要;(3)对病情较重但治疗有积极意义,漏诊和误诊造成危害相当的疾病,如心肌梗塞、糖尿病、某些血液病等,灵敏度和特异度大致同等重要。Galen和Gambino提出的上述概念可看作临床应用的一般原则,尚不具备技术上的可操作性。本研究所建立的方法可以量化地体现两者的相对重要性,而且其意义更为直观。
灵敏度和特异度权重的确定是广义标准化诊断符合率应用的一个核心问题,应该由相关研究领域的专家根据其专业知识、临床经验、同行共识给出答案。当广义标准化诊断符合率的应用更为广泛的时候,meta分析等数据处理手段也可提供辅助手段。
相对于标准化诊断符合率,广义标准化诊断符合率不仅允许灵敏度和特异度任意赋权,而且更满足特殊性,当灵敏度和特异度等权时(均为0.5),广义标准化诊断符合率等价于标准化诊断符合率,当SEN1=SEN2=1或SPE1=SPE2=1时,Z恒为常数。
试验样本中的病例组构成是诊断试验推断方法面临的一个普遍问题,本研究结果将对于其他评价方法产生很好的启示作用。
1.Yerushalmy J.Statistical problems in assessing methods of medical diagnosis,with special reference to x-ray techniques.Public Health Reports,1947,62:1432-1449.
2.陈平雁.诊断试验的评价指标及其应用.中国卫生统计,1991,8(5):53-57.
3.陈平雁,郭祖超,胡琳.比较两种诊断试验的统计方法.中国卫生统计,1990,7(2):22-26.
4.Galen RS,Gambino SR.Beyond normality:the predictive value and efficiency of medical diagnosis.New York:Jonewiley,1975,50-53.
5.Christensen E.Methodology of diagnostic tests in hepatology.Ann Hepatol,2009,8(3):177-183.
6.Reitsma JB,Glas AS,Rutjes AW,et al.Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews.J Clin Epidemiol,2005,58(10):982-990.
7.Van den Bruel A,Cleemput I,Aertgeerts B,et al.The evaluation of diagnostic tests:evidence on technical and diagnostic accuracy,impact on patient outcome and cost-effectiveness is needed.J Clin Epidemiol,2007,60(11):1116-1122.