应用R软件Metatron程序包实现诊断准确性试验Meta分析及程序包汇总比较
2016-08-18何倩孙艳玲陶圆吴君怡桂裕亮张超牛玉明
何倩,孙艳玲,陶圆,吴君怡,桂裕亮,张超,牛玉明,4
• 循证理论与实践 •
应用R软件Metatron程序包实现诊断准确性试验Meta分析及程序包汇总比较
何倩1,孙艳玲2,陶圆3,吴君怡1,桂裕亮1,张超1,牛玉明1,4
诊断准确性试验(diagnostic test accuracy,DTA)的灵敏度与特异度之间存在固有的负相关性,为避免二者间负相关性对诊断试验结果的评价产生影响,很多学者提出了双变量模型,因其保留了原始数据的二维结构特性,双变量模型通过参数拟合可以得到灵敏度和特异度的综合估计量值及二者之间负相关的值,从而对诊断试验的准确性进行综合性分析。当前最具代表的是由Reitsma等提出的线性混合双变量模型,Metatron程序包正是基于此模型所研发的用于DTA Meta分析的程序包,同时本文将对R软件中专用于DTA Meta分析的程序包做出比较,便于使用者选择。
DTA Meta分析;Metatron程序包;R软件;双变量模型
诊断准确性试验(diagnostic test accuracy,DTA)[1]是以分类变量为结局指标的一类研究,因其灵敏度与特异度之间所固有的负相关性,且所选取的参考标准不同,使得DTA Meta分析与其他研究的Meta分析相比有一定的特殊性。随着DTA Meta分析的方法学不断进步,诊断准确性试验的Meta分析模型得到优化,对灵敏度和特异度之间负相关性的分析与处理也更为准确和灵活,如双变量模型。R语言作为强大的统计分析软件,也在不断的更新其程序包来融入更多更新的方法学。如meta4diag程序包、bamdit程序包、metamisc程序包、CopulaREMADA程序包以及Metatron程序包。本文将以Walusimbi等[2]发表的文章中的GeneXpert组的数据为例,来演示R软件Metatron程序包实例操作,并对R软件中专用于诊断试验Meta分析的程序包做出相关总结,比较不同双变量模型的差异,以便操作者选取合适的程序包使用。
1 Metatron程序包实例操作演示
1.1程序包的简介及安装加载 Metatron程序包的最新更新时间为:2015-02-19,最新版本:V-0.0.1。该程序包通过功能函数拟合由Reitsma等提出的双变量模型[3],从而对该诊断试验的精度进行系统性评价。另外,该程序包还可以建立多项式树模型[4]对诊断准确性试验的原始研究进行统计分析,当所选取的参考诊断阈值不是金标准时,程序包内部能够检测出误差并进行矫正。Metatron程序包的安装及加载命令如下:install.packages('Metatron')library(Metatron)
该程序包的运算过程需调用lme4程序包,Matrix程序包,mpt程序包的相关功能,在执行上述加载命令后,R语言会同时加载这三个程序包而无需另外输入命令语句。
1.2数据的导入 首先,在数据加载之前,需要对数据进行格式排列,具体数据排列格式详见表1,应注意此处Mark可作为协变量加入模型,因此Mark应为字符型而不能为数值型。数据排列完成后,储存在桌面的Rwork文件中的data.txt文本中。随后,开始进行数据的导入,具体命令如下:
data《-read.table("C:/Users/Administrator/ Desktop/Rwork/data.txt",header=TRUE,sep="",na. strings="NA", dec=".", strip.white=TRUE)
表1 示例数据排列表
1.3数据分析 程序包中的fit.bivar函数可以拟合Reitsma的双变量模型,SROC方法是对诊断试验的灵敏度和特异度进行评价的经典的Meta分析方法,这种方法将诊断OR值作为效应量,消除了研究间不同阈值影响,但也不可避免的丢失了有关试验性能的临床信息。而由Reitsma等提出的双变量模型保留了二维的原始数据,对敏感度和特异度共同分析,并使用随机效应方法合并其相关性。在双变量模型中添加解释变量,使灵敏度和特异度所受到的干扰能够被独立分析,避免了因忽略其间负相关性而造成对诊断试验准确性的低估。
其基本方法学过程是,首先直接建立模型的二项误差和正态分布随机效应结构[3],函数内部可调用lme4程序包中的glmer函数,指定这个模型为一般的线性混合模型。
fit《-fit.bivar(TP=TP,FN=FN,TN=TN,FP=FP,stud y=Study,data=data )
summary(fit)
建立的模型对象为fit,并通过summary( ) 函数获取汇总结果(表2)。接着将一个单一的协变量加入模型中,用户可通过参数covarying来定义这个协变量对灵敏度和特异度是同时影响还是独立影响。可选值为"both", "only sensitivity", "only specificity",其中"both"为默认值。
fitMark《-fit.bivar(TP=TP,FN=FN,TN=T N,FP=FP,study=Study,data=data,mods=Mark covarying="both")
summary(fitMark)
此处mods=Mark表示将Mark作为单一协变量加入模型,执行上述命令可得到汇总结果(表3)。
2 基于双变量模型DTA
Meta的程序包功能汇总与比较 当前通过建立双变量模型进行DTA Meta的常用程序包有meta4diag程序包[5]、bamdit程序包[6]、metamisc程序包[7]、CopulaREMADA程序包[7]以及Metatron程序包(表4)。
表2 命令summary(fit)执行后的结果
表3 命令summary(fitMark)执行后的结果
在方法学上,其中前两者为基于贝叶斯方法的双变量模型,后三者则为基于经典频率学派的统计学方法。贝叶斯方法的参数估计较经典频率学派更为准确,但因贝叶斯理论的复杂性及计算的难度较大,使其运用较为局限[8]。
在图形上,meta4diag程序包的图形绘制功能较为突出,包括SROC曲线图,十字交叉图,森林图及后验密度分布图,尤其是SROC曲线图的绘制十分灵活,包括五种SROC曲线计算方法,丰富的线条类型及颜色使图形更加美观,且携带信息更加直观。而森林图显示的是单个指标的合并,在DTA Meta分析中没有太大意义。bamdit程序包所绘制的图形设置了网格坐标底,更凸显了其侧重于SROC曲线下面积计算的特点。metamis程序包所绘制的曲线图对于显示结局指标的置信区间较为直观。CopulaREMADA程序包所绘制的曲线图是以灵敏度和特异度为横纵坐标,显示了两者之间的负相关性。
在使用操作上,五个程序包的内部功能都十分强大,命令代码较为简单,只需将数据导入,再根据参数拟合模型,程序包内部即可完成复杂的迭代运算过程。其中bamdit程序包的参数设置较为灵活,可设置相应的链数目、迭代次数、退火次数及步长,这要求操作者对贝叶斯统计方法有一定的了解。CopulaREMADA程序包使用高斯求积的方法计算MEI,需先产生一个概率矩阵,然后将样本数据导入概率矩阵中,这就要求操作者对概率分布有相关的了解,从而选择合适的概率分布类型。
3 小结
双变量模型的提出为DTA Meta分析提供了坚实的方法学理论基础,在此基础上,R语言运用其灵活的编程及程序包开发和更新功能,跟进不断完善的统计学方法学,产生了一些功能强大的程序包。meta4diag程序包所建立的双变量分层模型主要考虑了各个层次间变异,而非仅仅是界定为不同分界值上的变异。bamdit程序包中贝叶斯计算的参数设置十分灵活,可产生较多的结局指标以供选择。metamis程序包由于考虑了研究间相关性并给出了置信区间,其结果更为准确。CopulaREMADA程序包运用了高斯求积的方法,由于进行多次反复的迭代运算,其结果更为精确。而本文所讲解的Metatron程序包更侧重于对灵敏度和特异度之间负相关性的分析。使用者可根据程序包不同的功能及DTA数据的特点,选择所需要的程序包执行DTA Meta分析。
表4 各程序包功能对照表
[1] Kim KW,Lee J,Choi SH,et al. Systematic Review and Meta-Analysis of Studies Evaluating Diagnostic Test Accuracy: A Practical Review for Clinical Researchers-Part I. General Guidance and Tips[J]. Korean J Radiol,2015,16(6):1175-87.
[2] Walusimbi S,Bwanga F,de Costa A,et al. Meta-analysis to compare the accuracy of Gene Xpert, MODS and the WHO 2007 algorithm for diagnosis smear-negative pulmonary tuberculosis[J]. BMC Infect Dis,2013,13:507.
[3] Reitsma JB,Glas AS,Rutjes AW,et al. Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews[J]. J Clin Epidemiol,2005,58(10):982-90.
[4] Botella J,Huang H,Suero M. Multinomial tree models for assessing the status of the reference in studies of the accuracy of tools for binary classification[J]. Front Psychol,2013,4:694.
[5] 何倩,王晓娜,喻亚宇,等. 应用R软件meta4diag程序包实现诊断准确性试验的Meta分析[J]. 中国循证心血管医学杂志,2016,8(2):138-41.
[6] 王权,何倩,吴君怡,等. 应用R软件bamdit程序包实现诊断准确性试验的Meta分析[J]. 中国循证心血管医学杂志,2016,8(3):260-2.
[7] 王权,杨廉洁,何倩,等. 应用R软件metamisc程序包及CopulaREMADA程序包实现诊断准确性试验的Meta分[J]. 中国循证心血管医学杂志,2016, In Press.
[8] Menten J,Lesaffre E. A general framework for comparative Bayesian meta-analysis of diagnostic studies[J]. BMC Med Res Methodol,2015,15:70.
[9] Leeflang MM. Systematic reviews and meta-analyses of diagnostic test accuracy[J]. Clin Microbiol Infect,2014,20(2):105-13.
[10] Verde PE. Meta-analysis of diagnostic test data: a bivariate Bayesian modeling approach[J]. Stat Med,2010,29(30):3088-102.
[11] Riley RD,Thompson JR,Abrams KR. An alternative model for bivariate random-effects meta-analysis when the within-study correlations are unknown[J]. Biostatistics,2008,9(1):172-86.
[12] Nikoloulopoulos AK. A mixed effect model for bivariate meta-analysis of diagnostic test accuracy studies using a copula representation of the random effects distribution[J]. Stat Med,2015,34(29):3842-65.
本文编辑:姚雪莉
A Meta-analysis on implementation of diagnostic test accuracy with Metatron package in R software and comparison of pooled packages
HE Qian*, SUN Yan-ling, TAO Yuan, WU Jun-yi, GUI Yu-liang, ZHANG Chao, NIU Yu-ming.*Center for Evidence-Based Medicine and Clinical Research, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China.
NIU Yu-ming, E-mail: niuyuming@yeah.net
There is a connatural negative correlation between sensitivity and specificity of diagnostic test accuracy (DTA). For avoiding the influence of this negative correlation on DTA review results, many scholars propose bivariate model. The bivariate model keeps the two-dimensional nature of original data, so it can produce summary estimated value of the sensitivity and specificity and negative correlation value through parameter fitting for analyzing the accuracy of DTA. At present, the most representative bivariate model is linear mixed bivariate model proposed by Reitsma et al. Metatron package is a package developed based on above mentioned model for implementing DTA Meta-analysis. The specialized packages for DTA Meta-analysis in R software were compared in this paper for users to choose.
Meta-analysis on diagnostic test accuracy; Metatron package; R software; Bivariate model
R4
A
1674-4055(2016)05-0517-03
湖北省教育厅重点项目(D20142102)
1442000 十堰,十堰市太和医院(湖北医药学院附属医院)循证医学中心;2442000 十堰,十堰市太和医院(湖北医药学院附属医院)麻醉科;3442000 十堰,湖北医药学院影像医学院12级;4442000 十堰,十堰市太和医院(湖北医药学院附属医院)口腔科
共同第一作者:孙艳玲
牛玉明,E-mail:niuyuming@yeah.net
10.3969/j.issn.1674-4055.2016.05.02