心力衰竭患者冠状动脉旁路移植术围术期死亡风险评分系统的建立与对比研究
2019-06-04林宏远侯剑峰唐汉韡陈凯郭少先柳枫王立清孙寒松郑哲胡盛寿
林宏远,侯剑峰,唐汉韡,陈凯,郭少先,柳枫,王立清,孙寒松,郑哲,胡盛寿
冠心病多支血管病变合并心力衰竭是冠状动脉旁路移植术(CABG)的重要指征[1-2]。但由于围术期处理的复杂性以及手术技术的高要求性,此类患者的围术期死亡率居高不下[3]。手术风险预测模型是术前风险评估的重要工具,通过风险预测评分系统进行危险因素分层,识别高危患者,控制围术期危险因素, 继而达到降低死亡率,提高医疗质量的目的。目前,国内外已建立了多种心脏手术风险预测模型[4],比较通用的包括美国胸外科学会(STS)评分[5],美国美国心脏病学学会/美国心脏学会 (ACC/AHA)评分[6]、欧洲EuroSCORE评分[7]及其改良版EuroSCOREⅡ评分[8],还有针对中国人群的SinoSCORE评分[9]。然而这些模型主要针对所有接受心脏手术的患者人群设计,而且大多是基于10年前的临床数据,对如今接受CABG尤其是心力衰竭的患者评估可能存在偏差[10]。因此,建立一种兼顾人群特异性和准确性的风险评估模型具有重要的临床意义。本研究应用最新国人数据初步建立适合中国心力衰竭患者CABG术前风险评估系统,用以评价我国心力衰竭CABG患者的手术风险。
1 资料与方法
连续选择阜外医院2012年至2017年1 978例术前心力衰竭[左心室射血分数(LVEF)<50%]接受CABG的患者,对临床资料进行筛选,排除临床资料缺失2例,共1 976例患者纳入研究 ,收集其人口学资料、术前危险因素、术中危险因素和术后住院期间死亡率信息(表1)。入选患者以3:1的比例随机分为2组:建模组(n=1 479)用于建立模型,验证组(n=497)用于检测模型的可用性。
综合以往的研究和临床经验,本研究纳入了22个危险因素(18个术前危险因素和4个术中危险因素),经过单因素和多因素Logistic回归分析,确定了7个与术后院内死亡相关的独立危险因素,获取不同变量在模型方程中的回归系数β(表2),通过回归方程计算院内死亡率。构建中国心力衰竭人群的CABG风险评估系统(PGLANCE)。
统计学方法:(1)建立模型:在建模组中,首先针对所有可能的危险因素进行单因素分析,检验过程中排除出现率<1%和P>0.2的变量。对剩余变量进行逐步多因素Logistic回归分析,采用后退法,每次去除最不显著的1个变量(纳入和排除标准分别是P<0.05和P>0.1)。剔除所有不显著变量后,获取Logistic回归方程中每个显著变量的偏回归系数βi及回归方程中的常数β0,通过回归方程计算院内死亡率(P):
得出相应的死亡率预测值,从而建立预测模型。采用Hosmer-Lemeshow(HL)拟合优度检验考察最终模型的校准度,建立最终模型后,在验证组样本中检验模型的校准度并使用受试者工作特征(ROC)曲线下面积(AUC)衡量最终模型的区分度。
(2)模型的检验和应用:应用PGLANCE对心力衰竭行CABG患者院内死亡率的预测功能。应用HL拟合优度检验考察模型的校准度,并使用AUC衡量模型的区分度,对比预测死亡率与实际观察死亡率,考察不同评估模型(PGLANCE与EuroSCORE、EuroSCOREⅡ和SinoSCORE的对比)的预测作用。所用统计分析采用SPSS 20.0完成。图表由graphpad prism 6.0绘制。
表1 1 976例患者基线资料[例数(%)]
表2 独立危险因素和权重
2 结果
PGLANCE预测心力衰竭患者CABG后院内死亡率:如表1所示,建模组与验证组的基线资料是一致的,各危险因素的发生率差异无统计学意义。HL拟合优度检验P=0.311(>0.05), 建模组 AUC=0.890(图 1A),验 证 组 AUC=0.847( 图 1B)。 通 过 与 EuroSCORE、EuroSCOREⅡ和SinoSCORE的对比,可以看出在验证组中PGLANCE对死亡率的预测效果(AUC:0.847)优于EuroSCORE(AUC:0.775)、SinoSCORE(AUC:0.698),接近于EuroSCOREⅡ(AUC:0.878)。
各系统预测死亡率与实际观察死亡率(表3)。可见仅PGLANCE的预计值95%可信区间[1.39(1.05~1073)]包含观察值,其他评分系统的预测值均明显高于观察值。
图1 PGLANCE预测CABG院内死亡率ROC曲线
表3 各评分系统预测死亡率与实际观察死亡率对比
3 讨论
建立该评分系统的必要性:目前我国心力衰竭患病率高,2016年心血管疾病普查估计心力衰竭患病人数达到450万[11],冠心病是导致成人心力衰竭的首要病因,随着人口老龄化的加剧和心肌梗死救治水平的不断提高,具有外科手术指征的心力衰竭患者数量持续增长[12]。目前国内外主要心脏手术风险评分模型对于心力衰竭患者行CABG的风险评估针对性不强,本研究发现EuroSCORE、EuroSCORE Ⅱ以及针对中国人群的SinoSCORE对于心力衰竭患者行CABG的院内死亡率不能准确预测,均明显高估死亡率。其原因有:(1)建立这些模型的数据年代较为久远(大多是10年前的数据),现如今手术技术的进步和围术期处理水平的提高已显著地降低了CABG后死亡率。(2)大多数模型是基于欧美人群的数据建立的,人群特异性不强,例如EuroSCORE Ⅱ作为各模型中区分度最高(AUC=0.878)的评分模型,其覆盖人群主要是欧洲人群,冠心病合并心力衰竭发病特点与我国人群不尽相同,故其对于国人心力衰竭行CABG住院期间死亡率有明显的高估。(3)几乎所有现有模型都是针对普通冠心患者群,而非心力衰竭人群,例如SinoSCORE作为基于国人的数据建立的评估模型,其对于LVEF<50%的心力衰竭人群没有进一步的区分,所以对于该人群死亡率的预测不够准确。
PGLANCE的特点:PGLANCE模型纳入7个变量(表2),大部分变量都与既往研究认为的心脏手术的独立危险因素相符[8],与其他模型不同,本模型有如下特点:(1)LVEF分组方式:EuroSCORE Ⅱ将小于50%的LVEF值分为三个亚组:31≤ LVEF<50%,21%~30% 和 20% 以下,其临床运用效果尚佳。但在我国冠心患者群中,术前LVEF值小于30%的患者很少接受CABG,本研究中只有67例(3%)的CABG患者术前LVEF值小于30%,仅3例患者术前LVEF值小于20%。如果采用EuroSCORE Ⅱ的分组方式,组间样本量差距过于悬殊。因此,我们重新将LVEF值分为3个亚组:LVEF≤ 35%(n=226),36% ≤ LVEF<45%(n=940)和45%≤LVEF<50%(n=810),如此进行分组既参考了既往大规模研究[13-14]的纳入标准(LVEF<35%),也根据入组患者的发病特点,均衡各亚组的样本量。发现不同亚组的术后院内死亡率差异有统计学意义(P<0.01)。说明心力衰竭患者LVEF值越低,术后院内死亡率越高。相比之下,PGLANCE对于心力衰竭患者的LVEF值分组方式更加适应中国人群的发病特点,更有利于区分心力衰竭人群的危险度。结果亦表明PGLANCE在验证组中的预测区分度(AUC值)要优于EuroSCORE及SinoSCORE,与EuroSCORE Ⅱ相似。PGLANCE对于死亡率的估计更加准确(表3)。(2)使用方便:虽然EuroSCORE Ⅱ具有较强的区分度(AUC=0.878),但其纳入21个变量,运用较为繁琐,便利度不够。PGLANCE纳入变量少,使用便捷性明显优于EuroSCORE Ⅱ,更适合临床推广。
PGLANCE的局限性:(1)本研究为单中心研究,人群覆盖有限,手术技术及术后围术期管理水平也不一定能代表全国各地区的水平,样本量有待进一步扩充,模型仍需进一步完善。该模型目前缺乏外部数据验证,将在以后的研究中进行完善。(2)PGLANCE主要是基于中国人群,对于其他人群不一定适合。(3)本研究未采用术后30天死亡作为终点事件,代之以院内死亡,其原因主要是中国患者出院以后随访较为困难,院外数据较难获得。复习文献发现亦有不少研究[15-16]将院内死亡作为终点事件。(4)本研究未纳入射血分数保留(LVEF>50%)心力衰竭人群的资料。
总之,PGLANCE的提出是我国目前针对心力衰竭患者CABG风险评估的大样本量研究,对于心力衰竭患者行CABG的个体化精准诊疗有一定的指导作用。