倾向指数匹配法在肺癌化疗效果评价中的应用*
2014-03-10潍坊医学院公共卫生学院卫生统计学教研室261053吕军城王素珍
潍坊医学院公共卫生学院卫生统计学教研室(261053) 吕军城 王素珍
倾向指数匹配法在肺癌化疗效果评价中的应用*
潍坊医学院公共卫生学院卫生统计学教研室(261053) 吕军城 王素珍△
目的收集临床肺癌病人观测资料,按照临床化疗方法不同将肺癌病人分为NP方案(长春瑞滨+顺铂)和TP方案(紫杉醇+顺铂)两组,用倾向指数匹配法均衡两组间的混杂因素,比较匹配前后差异,评价两种治疗方案的效果。方法采用logistic回归计算肺癌病人的倾向指数,按照倾向指数进行组间卡钳匹配,采用Kaplan-Meier法对匹配后的数据进行分析,用log-rank检验比较两组生存差异。结果匹配前协变量在两组中不均衡,NP方案组和TP方案组的中位生存期分别为2.360年和2.100年,两组生存率无统计学差异(P=0.0516),匹配后协变量在两组中得到很好均衡,NP方案组和TP方案组的中位生存时间分别变为2.560年和2.180年,生存率间有统计学差异(P=0.0134)。结论倾向指数法能够弥补临床观测数据的不足,通过匹配可有效降低组间混杂偏倚,有利于对肺癌患者不同治疗方案疗效做出更准确评价。
倾向指数 匹配法 肺癌 生存分析
评价药物或者治疗方法的最佳方案是随机对照的临床试验(random ized controlled trial,RCT),然而在实际临床中,受伦理学和病人病情等因素的限制,不可能在治疗之前规定患者严格按照随机化临床试验方案进行治疗,也就是说随机化的实施往往面临较大困难[1-3]。当随机化试验在临床上难以实现时,混杂因素在组间的不平衡性就会影响疗效的评价,导致对不同治疗方案的效果评价出现偏倚。为了对组间差异做出正确的评价,需首先将组间混杂因素平衡,然后再进行统计分析评价,倾向指数法(propensity score)是解决此问题的一种实用方法[4-5]。近年来得到越来越多的关注。
资料与方法
1.资料来源
本研究肺癌患者临床观测数据来自2007-2012年山东省内多家医院和肿瘤科室。收集的指标有性别、年龄、职业、吸烟史、结核病史、癌胚抗原(CEA)、家族史、神经特异性希酸化酶(NSE)、病灶数目、是否转移、病理类型、临床分期(cTNM)以及治疗方式。其中,化疗方式分为NP方案(长春瑞滨+顺铂)和TP方案(紫杉醇+顺铂)两种。共收集肺癌患者386例,排除信息不全或逻辑错误病例36例,最后NP方案患者159例,TP方案患者191例。在医院随访科室的配合下,根据患者病历登记的电话和地址,采用电话随访或书信随访方式获得患者生存结局及生存时间。
2.分析方法
由于临床获得的患者观测数据并非由随机化临床试验得到,多个协变量在两组间的分布不均衡。为了减少协变量分布不平衡对生存分析结果的影响,采用倾向指数匹配法均衡协变量,达到近似随机化目的。
倾向指数匹配法是在通过模型估计倾向指数后,从对照组中选出与暴露组倾向指数相同或相近的个体进行配对,达到均衡组间协变量的目的[6]。匹配时如果将暴露组与对照组个体倾向指数差值设定在某个范围内,即为卡钳匹配[7]。倾向指数匹配及所有的统计分析均采用SAS9.2编程完成[8-9]。
结 果
1.匹配前两组协变量比较
原始资料中入选的协变量有:性别、年龄、职业、吸烟史、结核病史、癌胚抗原(CEA)、家族史、神经特异性希酸化酶(NSE)、病灶数目、是否转移、病理类型、临床分期(cTNM)。倾向指数匹配前,对两组间的协变量进行统计分析,其中定量指标根据方差是否齐,采用两组独立样本t检验和t′检验;采用χ2或其校正公式对定性指标进行统计分析。检验结果如表1所示。
专业考虑协变量中吸烟史、结核病史、家族史、神经特异性希酸化酶(NSE)、是否转移、临床分期(cTNM)六个协变量在两个组中分配均衡性有统计学意义。若不对这些协变量进行有效统计学均衡处理,必将影响统计分析结果的准确性。
2.匹配后两组协变量比较
以治疗方案为因变量,以可能的混杂因素为自变量,采用logistic回归计算每个患者的倾向指数。likelihood ratio结果显示logistic回归方程有统计学意义,拟合优度指标显示方程拟合度较好。计算的倾向指数的均数和标准差为0.454±0.011。采用SAS9.2编程法对两组数据进行卡钳匹配,共有127对匹配成功。两组肺癌病人协变量的均衡性比较显示,匹配前不均衡的吸烟史、结核病史、家族史、神经特异性希酸化酶(NSE)、是否转移、临床分期(cTNM)六个协变量,统计分析结果P均大于0.05,无统计学差异,表明经匹配后在两组的分配达到很好平衡,结果见表1。
表1 倾向指数匹配前、后两组肺癌患者协变量分布
3.匹配前、后生存率比较
对倾向指数匹配前、后的两组临床观测数据资料进行生存分析,结果如表2所示。
表2 倾向指数匹配前、后两组肺癌病人生存率比较
由表2可知,未作匹配之前的原始资料中,NP方案组和TP方案组的中位生存期分别为2.360年和2.100年;95%置信区间分别为2.170~2.780年和1.833~2.470年,log-rank检验结果表明两组生存率间无统计学差异(P=0.0516>0.05)。
用倾向指数卡钳法对匹配之后的127对新样本进行生存分析,结果见表2。两化疗组间协变量被均衡后,NP方案组和TP方案组的中位生存时间分别变为2.560年和2.180年;95%置信区间分别为2.167~3.040年和1.958~2.550年;log-rank检验结果表明两组生存率之间差别有统计学意义(P=0.0134<0.05)。说明在治疗肺癌病人的实际临床过程中,NP方案的疗效好于TP方案。经倾向指数匹配前后两组肺癌病人的生存曲线见图1,图2。由生存曲线图可以看出,在没有进行倾向指数匹配前两种方法生存曲线存在多次相交现象,而采用倾向指数匹配后除开始之后两生存曲线没有出现再次相交现象,也表明倾向指数匹配法对两组进行了较好的匹配。
图1 匹配前两组化疗肺癌病人的生存曲线图
图2 匹配后两组化疗肺癌病人的生存曲线图
讨 论
当随机化试验在临床上难以实现或仅获得临床观测性数据时,混杂因素在组间的不平衡性导致难以对不同治疗方案效果做出准确的评价,倾向指数法是平衡组间协变量不均衡的一种有效方法[10-11]。本研究采用卡钳匹配法对肺癌化疗病人的临床观测数据进行匹配研究,比较不同化疗方式肺癌病人预后情况,为医生及病人选择合适的临床治疗方案提供智力支持和理论依据;同时也为以后正确应用倾向指数法处理非随机化临床试验数据提供实践经验。倾向指数方法在处理非随机临床观测数据方面体现出它的明显优势。
倾向指数法尽管有其特有优势,但亦有不足之处,如需较全面的临床专业知识,在分析之前找准、找全混杂因素;受配对条件的限制,需较大样本量观测数据等特点;在实际应用过程中应加以注意。
1.Hong S,Youn YN,YiG,et al.Long Term Results of ST-Segment Elevation Myocardial Infarction versus Non-ST-Segment Elevation Myocardial Infarction after Off-Pump Coronary Artery Bypass Grafting:Propensity Score Matching Analysis.JKorean Med Sci,2012,27(2):153-159.
2.Berger JS,Herout PM,Harshaw Q.Bleeding-associated outcomes w ith preoperative clopidogrel use in on-and off-pump coronary artery bypass.Thromb Thrombolysis,2012,34(1):56-64.
3.Choi AH,Barnholtz-Sloan JS,Kim JA.Effect of radiation therapy on survival in surgically resected retroperitoneal sarcoma:a propensity score-adjusted SEER analysis.Ann Oncol,2012,23(9):2449-2457.
4.W isnivesky JP,Halm EA,Bonom i M,et al.Postoperative radiotherapy for elderly patientswith stage III lung cancer.Cancer,2012,118(18):4478-4485.
5.Oh KH,Hwang YH,Cho JH,etal.Outcome of early initiation of peritoneal dialysis in patientswith end-stage renal failure.JKorean Med Sci,2012,27(2):170-176.
6.王永吉,蔡宏伟,夏结来,等.第二讲倾向指数常用研究方法.中华流行病学杂志,2010,31(5):584-585.
7.王永吉,蔡宏伟,夏结来,等.第一讲倾向指数的基本概念和研究步骤.中华流行病学杂志,2010,31(3):99-100.
8.SAS 9.2 Macro Language Reference,SAS Institute Inc,2008.
9.Art Carpenter.Carpenter′s Complete Guide to the SASMacro Language(2nd Edition)SASPublishing,2004.
10.Walsh P,Shanholtzer L,Loewen M,et al.A matched case control study w ith propensity score balancing exam ining the protective effect of paracetamol against parentally reported apnoea in infants.Resuscitation,2010,83(4):440-446.
11.Apolone G,Deandrea S,MontanariM,etal.Evaluation of the comparative analgesic effectivenessof transdermal and oral opioids in cancer patients:A propensity score analysis.Eur JPain,2012,16(2):229-238.
(责任编辑:刘 壮)
The Application of Propensity Score M atching in Evaluating Chemotherapeutic Effect of Lung Carcinoma
Lyu Juncheng,Wang Suzhen.(Health Statistics Department,School of Public Health,Weifang Medical University)
ObjectiveThe clinical observation data of lung Carcinoma patient were divided into two groups:NP group and TP group according to clinical chemotherapymethod.Compared and evaluate treatmenteffectof two chemotherapy after using propensity score matching method to balance the confounding factors between groups.MethodsCalculated each patient′s propensity score by logistic regressionmodel,and made calipermatching according to the propensity score.The Kaplan-Meiermethod was applied tomake the survival analysis.ResultsThe survival ratewas not statistically significantbetween groups beforematching(P=0.0516),and themedian survival time of two groups were 2.360Y and 2.100Y.The survival rate was statistically significant after matched by the Propensity Score(P=0.0134),and themedian survival time of two groupswere 2.560 Y and 2.180 Y.ConclusionPropensity scorematchingmethod can effectively reduce the confounding bias of non-random ized clinical observational data,and help us evaluate the therapeutic effect of Lung Carcinoma patients correctly.
Propensity Score;Matching Method;Lung Carcinoma;Survival Analysis
*国家自然科学基金资助项目(81141112);山东省自然科学基金资助项目(ZR2013HM045)。
△通信作者,王素珍,E-mail:wangsz@w fmc.edu.cn。