基于COX回归的血液透析死亡风险模型研究
2018-09-04郑培豪李智綦小蓉
郑培豪 李智 綦小蓉
摘 要:血液透析技术是针对终末期腎病最常用的治疗手段。为了对患者死亡风险作出预测,便于医生更有针对性地治疗,很多学者提出了各式各样的死亡风险预测模型,但是这些模型大多是基于欧美人群建立的。为此提出新的适用于我国血液透析患者的死亡风险预测模型,并引入哈佛癌症指数法,对血液透析死亡风险进行等级量化,让医生更加直观地了解患者风险,更好地对不同风险的患者进行管理。经过ROC曲线验证,该预测模型的预测能力和准确率较高。
关键词:血液透析;死亡风险预测模型;哈佛癌症指数法;等级量化
DOI:10.11907/rjdk.173303
中图分类号:TP319
文献标识码:A 文章编号:1672-7800(2018)006-0142-04
Abstract:The hemodialysis (HD) technique is the most commonly used treatment for end-stage renal disease. Various risk prediction models for death have been built to help doctors make more effective treatment, but most of these models are based on European and American population.Therefore, this paper proposes a new prediction model of hemodialysis death risk for Chinese patients, which employs the Harvard Cancer Index to quantify the risk of death from hemodialysis and make doctors more intuitively understand the patients risks so as to treat patients of different risk levels more effectively. Through the ROC curve validation, it proves that the predictive model has high prediction and accuracy rate.
Key Words:hemodialysis; prediction model of death risk; Harvard Cancer Index; rank quantification
0 引言
血液透析技术是针对终末期肾病的主要治疗手段,其技术已有很大进步,HD患者死亡率也逐渐降低,并且有学者提出一种基于K均值和关联规则的慢性肾病透析时机预测方法。该方法克服了过拟合局限,得到了透析时机预测规则,并实现了精准预测[1],但是患者的死亡风险仍不容小觑[2-4]。在美国已经接受透析治疗的患者中,2003-2012年的年死亡率非常高,达到160‰人年,远超过美国平均死亡率(8.45‰人年)[5]。在欧洲接受透析治疗的患者中,每年的死亡率也非常高,达到192‰人年,高出普通人群16倍[6]。北京市2006-2010年的数据显示,血液透析患者死亡率在47.8‰~76.8‰人年[7],而北京市总死亡率为4.31‰人年[8]。心血管合并症、感染、猝死等都是HD患者的主要死亡原因[9-10]。风险预测模型作为一种数学模型用来预测终点事件发生几率,目前已广泛应用于医学领域,如查尔森合并症指数(Charlson Comorbidity Index,CCI)[11]、系统性红斑狼疮活动度评分(SLEDAI)[12]、EuroSCORE II心脏手术风险预测模型[13]等。Mauri等[14]利用Logistic回归确定透析一年后死亡风险因素,并设计、验证了预后模型量化每个血液透析患者死亡风险,结果表明,一年后死亡率占总研究人数的16.5%。Floege J等[15]利用Cox回归建立风险预测模型,再利用马尔科夫链处理缺失数据,从而建立欧洲某地区血液透析患者1年和2年后死亡风险得分预测模型。Wagner等[16]利用Cox回归风险模型,预测英国血液透析患者3年后的死亡风险。
本文提出针对中国血液透析患者死亡风险预测模型,并且引入哈佛癌症指数法,以便医生通过该模型对处于不同风险等级的患者作出更有针对性的治疗。
1 基本原理与方法
1.1 实验数据
本文数据集选取自成都某医院肾内科2013-2015年275例血液透析患者的实验室检查数据(将275名血液透析患者随机分成训练组200例,占总体72.7%和验证组75例,占总体27.3%),包括患者性别(Sex)、年龄(Age)、平均动脉压(BP)、白蛋白(Alb)、血红蛋白(Hb)、甘油三酯(TG)、血总钙(Ca)、磷(P)、甲状旁腺素(PTH)、总胆固醇(TC)、低密度脂蛋白胆固醇(LDL_C)、高密度脂蛋白胆固醇(HDL_C)、肾小球滤过率(GFR)总共13个指标。各研究变量定义及取值见表1。
1.2 基本原理
1.2.1 Cox回归
Cox回归是一个用于生存分析的半参数模型,目的是找出影响生存的危险因素,在医学中常用于肿瘤和其它疾病的预后分析。
当不存在其它因素影响时,h-0(t)表示t时刻风险率。当存在其它因素影响时,h(t)表示t时刻风险率。将Logistic回归模型中的p/(1-p)用死亡风险率比h(t)/h-0(t)代替即可得到Cox回归模型。
1.2.2 受试者工作特征曲线(receiver operating characteristic,ROC)
利用验证组数据验证得到风险预测模型,繪制ROC曲线。ROC下面的面积大于0.8为优秀,0.7~0.8为中等,0.6~0.7为差,小于0.5无意义。同时通过截断点计算模型的灵敏度和特异性。
1.2.3 哈佛癌症风险指数法
哈佛癌症风险指数法是哈佛大学根据美国流行病学资料开发的一种评估方法,该方法起初主要用于肿瘤风险预测[17]。该方法主要基于流行病学数据及研究资料,量化各个风险因素与疾病发病率之间的关系,最终将患者按照疾病发病风险大小划分成7个等级,即从“很低”到“非常高”。哈佛癌症指数法设计的目的在于鼓励个人改变影响危险因素发生的行为,从而达到疾病预防目的。如今,以哈佛癌症指数法为基础构建的疾病发病风险预测模型已被用于临床实践,且在实际应用中对于鼓励个人改变影响某些风险因素出现的行为起了关键作用[11]。
1.3 模型建立流程
在Cox回归模型构建前需要考虑因素之间的共线性问题,当多重共线性问题存在于各因素之间时,需将上述指标进行共线性诊断,如表2所示。
从表2可以看出,各临床变量方差膨胀因子(VIF)均小于5,容差(Tolerance,Tol)均大于0.2,说明上述临床变量之间不存在明显共线性关系,可对各临床变量作Cox回归分析。
1.3.1 单因素分析
以血液透析患者存活时间和结局为分析变量,以数据集中性别、年龄、平均动脉压等13个因素为自变量,对275例样本进行单因素Cox回归分析,检验水准为0.10,规定P<0.10有统计学意义,P>0.10则没有统计学意义。结果如表3所示。结果表明:有统计学意义的自变量包括性别、年龄、血总钙、甲状旁腺素、低密度脂蛋白胆固醇。
1.3.2 多因素分析
根据1.3.1的结果,将具有统计学意义的临床变量引入多因素Cox回归模型进行多因素分析,进入多因素分析最低标准为0.10,排除标准为0.15,结果如表4所示。
由结果可以看出,表中5个临床变量都不同程度地影响血液透析患者死亡事件的发生,其中性别的相对危险度为0.776,说明女性患者死亡风险是男性患者死亡风险的0.776倍,年龄的相对危险度为1.521,说明高龄患者死亡风险是中、青年患者死亡风险的1.521倍。钙的相对危险度为0.814,说明钙正常患者死亡风险是钙异常患者死亡风险的0.814倍。甲状旁腺素的相对危险度为0.831,说明正常甲状旁腺素患者死亡风险是甲状旁腺素非正常患者死亡风险的0.831倍。低密度脂蛋白胆固醇的相对危险度为1.326,说明低密度脂蛋白胆固醇异常患者死亡风险是低密度脂蛋白胆固醇正常患者死亡风险的1.326倍。
1.4 血液透析患者死亡风险等级量化研究
哈佛癌症风险指数法,是将影响疾病发病的风险因素相对危险度值转换成危险分数,并根据危险分数对疾病进行等级划分的一种方法。引入哈佛癌症风险指数法对血液透析患者死亡风险等级进行量化,以血液透析患者死亡为结局变量,以上述与死亡风险有关的风险因素包括性别、年龄、血总钙异常、低密度脂蛋白胆固醇异常、甲状旁腺素异常为影响变量,构建血液透析患者死亡风险等级指数。各研究变量定义及赋值如表5所示。
1.4.1 哈佛癌症风险指数法
基于哈佛癌症风险指数法,建立血液透析死亡风险等级指数步骤如下:
①基于1.3节得出的血液透析患者风险因素,确定其相对危险度(RR)值大小;②将各危险因素的相对危险度值根据危险分数转换为危险分数;③确定影响疾病发生的风险因素在总人群中出现的概率;④根据公式计算血液透析患者平均风险分数,其公式定义为:平均风险分数=∑(每个风险因素出现率×每个风险因素的危险分数)⑤根据表5和表6计算每个血液透析患者死亡风险得分值;⑥计算每个血液透析患者危险分数与人群平均危险分数的比值R;⑦根据表5和表7将每个血液透析患者根据死亡风险水平进行等级划分,从表7可知,患者死亡风险水平可从很低到很高划分为7个等级。
1.4.2 血液透析患者死亡风险指数构建
(1)主要风险因素及其相对风险大小。基于1.3节研究结果,确定与血液透析患者死亡风险有关的风险因素相对危险度大小如表8所示。根据表5和表6将血液透析患者各个死亡风险因素转换成具体的危险分数。转换结果表明,性别、年龄、血总钙、甲状旁腺素、低密度脂蛋白胆固醇对应的危险分数分别为5分、10分、5分、5分和5分。
(2)计算血液透析人群平均风险分数。根据实验数据集及文献资料,计算影响血液透析患者死亡的各危险因素在人群中平均暴露率,取值如表5和表8所示。根据平均风险分数计算公式:
平均风险分数=∑(每个风险因素出现率×每个风险因素的危险分数),经过计算可得血液透析患者平均风险分数为10.62,取整值为11。
(3)血液透析患者死亡风险等级划分。首先计算每个血液透析患者死亡风险分数与平均风险分数的比值R,然后根据表5和表7将血液透析患者按照死亡风险水平划分成相应的等级。
2 实验分析
2.1 实验结果
将构建的风险预测模型应用于验证组进行检验,绘制ROC曲线,如图1所示。ROC曲线下的面积为0.734,95%CI(0.618~0.850),灵敏度为0.860,特异度为0.652,说明这个预测模型的预测能力和准确率比较好。
根据数据集,计算血液透析患者死亡人数与风险等级之间的关系,从而对基于哈佛癌症风险指数法构建的血液透析患者死亡风险等级指数进行检验。不同风险等级血液透析患者分布情况如表9所示,根据哈佛癌症风险指数法将患者按照死亡风险等级分成4个等级:较低风险、一般风险、高风险、较高风险。不同血液透析死亡风险等级中评估对象的死亡情况如图2所示,从图中可以看出,血液透析患者死亡风险等级指数越高,血液透析患者死亡人数越多。由此可知,血液透析患者死亡风险等级指数具有一定的准确性,并且在血液透析患者死亡风险等级评估中具有一定的应用价值。
3 结语
本文针对血液透析患者死亡率一直保持较高水平的问题,提出新的死亡风险预测模型,并对血液透析患者死亡风险等级进行了量化研究。首先说明数据来源,然后对血液透析患者进行了死亡风险预测,并用ROC曲线验证。结果表明,该预测模型的预测能力和准确率较高,最后引入哈佛癌症风险指数法对血液透析患者死亡风险等级量化,按照不同风险等级对患者进行等级划分。为了评估血液透析患者死亡风险指数的预测能力,对275例样本进行验证。结果表明,死亡风险等级指数越高,血液透析患者死亡人数越多。由此可见,本文设计的血液透析患者死亡风险等级指数具有一定的准确性,并在血液透析患者死亡风险等级评估中具有一定的应用价值。
参考文献:
[1] 费海波,童玲,李智.关联规则及关键特征挖掘在临床透析时机选择中的应用[J].软件导刊,2017,16(3):118-121.
[2] BETHESDA M, NATIONAL H. USRDS 2013 Annual Data Report: Atlas of Chronic Kidney Disease and End-Stage Renal Disease in the United States[EB/OL].http://www.usrds.org/atlas.aspx.
[3] LIU Z H.Nephrology in China[J]. Nature Review Nephrology,2013,9:523-528.
[4] NORDIO M, LIMIDO A, MAGGIORE U,et al. Survival in patients treated by long-term dialysis compared with the general population[J]. American Journal of Kidney Diseases,2012,59:819-828.
[5] The united states renal data system.usrds 2014 annual data report[EB/OL]. https://www.usrds.org/2014/appx/ADR_Appendices_14.pdf?zoom_highlight=usrds+2014+annual+data+reportJHJsearch=%22usrds 2014 annual data report%22.
[6] JAGER D J, GROOTENDORST D C, JAGER K J, et al. Cardiovascular and noncardiovascular mortality among patients starting dialysis[J]. JAMA,2009,302(16):1782-1789.
[7] CHENG X, NAYYAR S, WANG M, et al. Mortality rates among prevalent hemodialysis patients in beijing: a comparison with usrds data[J].NDT,2013,28(3):724-732.
[8] 國家统计局北京调查总队. 出生率、死亡率、自然增长率[EB/OL]. http://tjj.beijing.gov.cn/zt/rkjd/zbjs/201603/t20160322_340750.html
[9] MCDOLD S P, MARSHALL M R, JOHNSON D W, et al. Relationship between dialysis modality and mortality[J]. Journal of the American Society of Nephrology,2009(20):155-163.
[10] SAMAK M J. Cardiovascular complications in chronic kidney disease[J]. American Journal of Kidney Diseases,2003(41):11-17
[11] Charlson M E, Pompei P, Ales K L,et al. A new method of classifying prognostic comorbidity in longitudinal studies: Development and validation[J]. Journal of Chronic Disease,1987,40(5):373-383.
[12] BOMBARDIER C, GLADMAN D D,UROWITZ M B,et al. Derivation of the sledai. A disease activity index for lupus patients[J].Arthritis & Rheumatology,1992,35(6):630.
[13] NASHEF S A, ROQUES F, SHARPLES L D,et al. EuroSCORE II[J]. European Journal of Cardio-thoracic Surgery,2012,41(4):734-744.
[14] MAURI J M,CLERIC M,VELA E. Design and validation of a model to predict early mortality in haemodialysis patients[J]. NDT,2008,23(5):1690-1696.
[15] FLOEGE J, GILLESPIE I A, KRONENBERG F, et al. Development and validation of a predictive mortality risk score from a european hemodialysis cohort[J]. Kidney International,2015,87(5):996-1008.
[16] WAGNER M, ANSELL D, KENT D M,et al. Predicting mortality in incident dialysis patients: an analysis of the United Kingdom renal registry[J]. American Journal of Kidney Disease,2011,57(6):894-902.
[17] COLDITZ G A, ATWOOD K A, EMMONS K, et al. Harvard report on cancer prevention volume 4:Harvard Cancer Risk Index[J]. Cancer Causes & Control,2000,11(6):477-488.
(责任编辑:江 艳)