Logistic回归在多指标联合诊断肺癌中的应用
2017-01-10江苏省连云港市中医院检验科222004仲崇明
江苏省连云港市中医院检验科(222004) 仲崇明
Logistic回归在多指标联合诊断肺癌中的应用
江苏省连云港市中医院检验科(222004) 仲崇明
ROC曲线是实验室检测指标临床诊断性能评价的主要手段。临床在某些疾病诊断过程中往往不满足单个检测指标的应用,有时需要几个检测项目的联合应用即联合检测,目的是为了提高诊断敏感性,例如:在肺癌诊断实验室检查过程中,需要癌胚抗原(CEA)、神经特异性烯醇化酶(NSE)、细胞角蛋白19片段21-1(CYFRA21-1)、糖类抗原-125(CA-125)的联合检测,而不是其中单一项目的检测。联合检测并非是指标越多越好,联合检测临床诊断性能评价是联合检测得以合理应用的前提。本文将logistic回归引入ROC曲线作联合检测临床诊断性能评价。
理论和方法
1.ROC曲线
ROC曲线对检测项目临床诊断性能评价目前公认且实用。ROC曲线是以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的ROC曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的ROC曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的AUC最大,则哪一种试验的诊断价值最佳。
2.联合检测
为了提高临床灵敏度或特异度,采用多个指标联合诊断的方法对调查对象检查,这种方式称为联合试验。指标之间的联合诊断可分为系列诊断实验(串联)和平行诊断实验(并联),具体用什么联合方法,依据专业而定。有的疾病需要早期诊断,早诊断对预后影响巨大,可采用并联。有的疾病强调特异性,可以采用串联提高特异性。简单来说:串联就是所有指标阳性才算阳性,并联就是只要有一个指标阳性就算阳性。联合检测并非项目指标越多越好,项目指标的选用需要评价,评价一个新的实验指标的选用,能否增强已有实验指标的诊断效率。另外,多个指标的联合应用增加了患者的经济负担。
3.联合检测ROC曲线的生成
联合检测项目指标为自变量,病变状况为应变量(有病、无病),行logistic回归产生回归方程。将各病例检测指标值代入logistic回归方程,计算相应应变量值(概率值)。以各相应应变量值输入ROC曲线统计软件(SPSS 13.0)生成ROC曲线。
实例应用
1.研究对象
(1)肺癌患者114例(均经病理检查确诊),男80例,女34例,年龄41~82岁。其中小细胞肺癌19例,非小细胞肺癌95例(鳞癌45例,腺癌50例)。临床分期Ⅰ期7例,Ⅱ期52例,Ⅲ期40例,Ⅳ15例。(2)肺部良性疾病61例,经临床、影像、实验室检查并经治疗证实而排除肿瘤,男36例,女25例,年龄35~80岁,其中支气管炎17例,肺炎29例,哮喘15例。(3)正常人30例,均为成年人健康体检者,并未发现明显疾病,男19例,女11例,年龄30~60岁。肺部良性疾病与正常体检未发现疾病归为对照组。
2.检测指标
癌胚抗原(CEA)、神经特异性烯醇化酶(NSE)、细胞角蛋白19片21-1(CYFRA21-1)、糖类抗原-125(CA-125)。各指标采用化学发光检测方法,其试剂临床参考值分别为CEA>5 ng/m l为阳性,NSE>13.6 ng/m l为阳性,CYFRA21-1>3.30 ng/m l为阳性,CA-125>41 U/m l为阳性。
3.方法
(1)应变量为疾病状态(是否患肺癌),肺癌组设为1,对照组设为0;自变量为CEA、NSE、CYFRA21-1、CA-125,产生logistic方程,即产生各自变量回归系数;(2)再将各自变量值代入回归方程,计算疾病发生概率,根据各病例的疾病发生概率作ROC曲线。(3)联合检测ROC曲线生成:将各自变量值代入回归方程,计算疾病发生概率,根据各病例的疾病发生概率作ROC曲线。
结 果
(1)logistic回归结果显示自变量CEA、NSE、CYFRA21-1、CA-125均对应变量的发生有显著影响,其P值分别为0.03、0.000、0.000、0.005,回归系数分别为0.465、0.327、0.872、0.044。
(2)联合检测ROC曲线的生成。各单项指标及联合检测ROC曲线结果如图1。
表1 CEA、CA-125、NSE、CYFRA21-1回归系数
图1 CEA、NSE、CYFRA21-1、CA-125、联合检测ROC曲线
(3)效能评价
各指标ROC曲线下面积大小即为临床诊断效能大小。CEA、NSE、CYFRA21-1、CA-125及联合检测(logistic)ROC曲线下面积分别为0.836、0.909、0.894、0.795、0.984。以联合检测曲线下面积最大,显示联合检测对肺癌诊断效能最好。
讨 论
联合检测的目的是为了提高诊断疾病或排除疾病的效能,即提高敏感性或特异性。但提高敏感性必然降低特异性,提高特异性必降低敏感性。ROC曲线是综合敏感性与特异性对临床诊断效能评价的良好方法[1-3]。利用logistic回归将联合检测引入ROC曲线可对联合检测临床诊断效能进行评价[4]。本文实例应用的结果也表明了多指标联合检测的ROC曲线比单项指标具有更大的AUC,对临床诊断的价值更大。
logistic回归属于概率型非线性回归,是研究一个或多个水平的结果变量与其影响因素之间关系的多变量分析方法。logistic回归中应变量为分类变量(如二分类变量,发病与未发病、死亡与存活、阳性与阴性、治疗有效与无效等)或多分类无序结果变量和多分类有序结果变量。研究一个应变量与多个影响因素之间的关系是logistic回归的主要应用,这也包括了自变量的筛选,分析哪些因素对应变量有影响哪些自变量对对应变量无影响。在使用过程中必须注意临床要求及logistic回归条件[5]。
ROC曲线是评价检测指标对临床诊断效能的有效方法,但多数情况是针对单个检测指标进行临床效能评价。利用logistic回归把联合检测引入ROC曲线,对联合检测的临床效能进行ROC曲线分析,对临床是有较好帮助且有重要价值。logistic回归分析及ROC曲线绘制有多种统计软件可以完成[5],基本满足使用者需求,使用者选择相对熟悉的软件即可。
[1]仲崇明,孙咏梅.相关肿瘤标志物检测在肺癌诊断性能中的评价.肿瘤防治研究,2008,35(11):827-828.
[2]张莉娜.含截尾数据的时间依依的ROC曲线分析.中国卫生统计,2014,31(5):867-869.
[3]潘静静,康锴,王彥霞,等.Logistic回归及ROC曲线综合评价危重手足病的预测指标.中国卫生统计,2014,31(5):809-811.
[4]秦正积,沈毅,崔晓莉,等.Logistic回归在疾病多指标联合诊断中的应用.中国卫生统计,2014,31(1):116-117.
[5]郭秀花主编.医学统计学与SPSS软件实现方法.第1版.北京:科学出版社,2012,206-216.
(责任编辑:张 悦)