6种妊娠期高血压疾病不良结局预测模型在中国东西部地区人群中的验证

2022-09-26孙芳璨沈敏红陈友国

协和医学杂志 2022年5期

孙芳璨，韩冰，高岩，沈敏红，陈友国，钟文

1苏州大学附属第一医院妇产科，江苏苏州 215006 2四川省妇幼保健院产科，成都 610045

妊娠期高血压疾病(hypertensive disorders of pregnancy,HDP)是以妊娠期血压异常升高为主要特征的一组疾病，是全世界范围内造成孕产妇和胎儿死亡的主要原因之一[1-2]。HDP病因复杂，详细机制尚不明确，早识别高危患者并及时予以恰当干预是改善预后的关键环节。目前国内外多个临床中心研发了HDP不良结局的预测模型[3-4]，但新模型在应用于临床实践前须对其有效性及普适性进行验证，且要求其预测因子最好为临床常规筛查指标，以增强模型在临床应用的可及性。本研究基于苏州大学附属第一医院及四川省妇幼保健院两所医疗机构连续8年HDP患者的临床数据，对国内外文献报道的6种HDP预测模型在中国不同地区人群中应用的临床价值进行分析，以期为进一步建立适合中国国情的预测模型提供参考依据。

1 资料与方法

1.1 研究对象

本研究为回顾性分析。研究对象为2011年5月1日至2019年4月30日于苏州大学附属第一医院、四川省妇幼保健院分娩(孕周≥28周)且入院诊断为HDP的所有患者。HDP的诊断标准符合中华医学会制定的《妊娠期高血压疾病诊治指南(2020)》[5]。排除标准：病史资料不完善以及预测指标数据收集前已出现临床结局的病例。

本研究已通过苏州大学附属第一医院(审批号：2020-099)、四川省妇幼保健院(审批号：2020-1113-123)伦理审查委员会审批，并豁免患者知情同意。

1.2 方法

1.2.1 文献检索及模型介绍

以“hypertensive disorders of pregnancy”“pree-clampsia”“prediction model”“prognosis”“adverse outcomes”“妊娠期高血压疾病模型”“子痫前期模型”“不良结局”“预后”等关键词相组合的方式，检索PubMed、Medline、Embase等英文数据库以及中国知网、万方数据知识服务平台等中文数据库，共获取14种HDP预后相关预测模型[6-19]。鉴于回顾性研究数据收集的局限性，要求模型的预测参数为临床常规检测指标，经筛选后保留其中6种预测模型[8-9,11-12,15,17],详见表1。

表1 本研究选取待验证的6种HDP不良结局预测模型

HDP:妊娠期高血压疾病；AUC：曲线下面积(原文献中)；Cr：肌酐；PLT：血小板计数；AST：谷草转氨酶；ALT：谷丙转氨酶；SpO2：脉搏血氧饱和度；LDH：乳酸脱氢酶；PCR：尿蛋白肌酐比；Hb：血红蛋白；Ure：尿素；PE：子痫前期

1.2.2 资料收集及不良结局定义

基于病案室的病历数据系统收集6种预测模型涉及的患者临床资料。本研究中的“入院”是指终止妊娠时的入院。孕产妇特征及临床表现相关资料均源于首次病程记录，除24 h尿蛋白定量为入院48 h内的检验结果外，其余检验指标均为入院24 h内的结果。若患者该期间存在多次测量记录，以首次检验结果为准。

HDP患者不良结局的定义参照既往文献基于Delphi法达成的共识[8,12]，包括孕产妇不良结局和围产儿不良结局。(1)孕产妇不良结局：死亡、中枢神经系统疾病(子痫、格拉斯哥昏迷评分<13分、卒中或可逆性缺血性神经系统障碍、皮质盲或视网膜剥离、一过性缺血和迟发型可逆性脑病等)，心血管和呼吸系统疾病[接受强心治疗、心肌缺血或梗死、SpO2<90%、需高浓度吸氧(氧浓度≥50%)超过1 h、除剖宫产外的插管、肺水肿和不能控制的严重高血压等]，血液系统疾病(输注血制品、输血前血小板计数<50 ×109/L)，肝脏疾病(肝血肿或破裂)，肾脏疾病(急性肾功能不全：既往无肾病史者肌酐>150 μmol/L、既往有肾病者肌酐>200 μmol/L或进行透析)，弥散性血管内凝血，胎盘早剥，产后出血需输血或栓塞或子宫切除，HELLP综合征等。(2)围产儿不良结局：孕<34周早产、死胎等。本研究规定上述不良结局事件中，发生任意一项即认为发生了不良结局。本研究以入院48 h为研究的时间窗，主要基于以下考虑：该时间段内对于治疗方案的制订具有重要临床意义，可为注射糖皮质激素促进胎儿成熟、转诊等措施的采取争取时间。

1.3 统计学处理

采用SPSS 24.0软件进行统计学分析。年龄、孕前体质量指数符合正态分布，以均数±标准差表示。不良结局为计数资料，以频数(百分数)表示。从区分度和校准度两个方面对模型的预测能力进行评估。其中区分度以受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)表示(AUC>0.7表示区分度良好)，并采用Delong检验对不同模型的AUC进行比较。基于约登指数获取预测模型的最佳临界值，并计算灵敏度、特异度、阳性似然比和阴性似然比。采用Hosmer-Lemeshow拟合优度检验评估模型的校准度，若该检验的P>0.05，表示拟合值与观测值的吻合程度较一致，模型的拟合性较好。以P<0.05为差异具有统计学意义。

2 结果

2.1 一般临床资料

共入选符合纳入和排除标准的HDP患者2978例，包括苏州大学附属第一医院1492例、四川省妇幼保健院1486例。研究对象入选流程见图1。

图1 研究对象入选流程图

2978例HDP患者，平均年龄(30.1±5.0)岁，平均孕前体质量指数(22.7±3.7)kg/m2，入院孕周为37.1周(范围：35.6～39.0周)。初次妊娠1096例(36.8%)，多胎妊娠185例(6.2%)，有流产史1553例(52.1%)，有生育史1084例(36.4%)。合并慢性高血压342例(11.5%)，免疫性疾病37例(1.2%)，慢性肾病39例(1.3%)，孕前糖尿病37例(1.2%)，妊娠期糖尿病714例(24.0%)。有HDP史153例(5.1%)，有子痫前期史65例(2.2%)。

2.2 不良结局

2978例HDP患者，住院期间共655例(22.0%)发生不良结局事件，其中405例(13.6%)发生于入院48内。孕<34周分娩(49.4%,200/405)、需输血治疗(43.5%,176/405)、胎盘早剥(23.5%,95/405)是入院48 h内最常见的不良结局事件。

2.3 预测模型性能评估

基于病历系统获取的数据，根据表1中的公式计算不良结局发生风险，并对6种模型的预测能力进行验证。ROC曲线显示，6种模型(PREP模型包括PREP-L与PREP-S)预测HDP患者入院48 h内/住院期间发生不良结局的AUC分别为0.711、0.723、0.739、0.897(PREP-L)与0.745(PREP-S)、0.600、0.729。Delong检验显示，fullPIERS与mini-PIERS模型的AUC差异无统计学意义(P=0.552)，Ngwenya模型的AUC低于马国珺模型(P<0.001)。鉴于PREP模型的验证人群较少，故未对该模型进行校准度评估。Hosmer-Lemeshow检验显示，余5种模型的P值均小于0.05，提示模型的拟合性较差。结合区分度和校准度评估结果可知，除Ngwenya模型外，余5种模型对HDP患者不良结局均具有一定预测效果，但模型的拟合性欠佳，整体预测性能不高(表2，图2)。

图2 6种模型预测HDP患者不良结局的受试者操作特征曲线HDP：同表1

表2 6种模型预测HDP患者不良结局的预测价值

HDP、PE、AUC：同表1；†住院期间发生不良结局的患者数及其所占比例；§住院期间发生不良结局的AUC(95%CI)；*鉴于PREP模型的验证人数较少，未检验其灵敏度、特异度、阳性似然比、阴性似然比

3 讨论

HDP可导致多种不良结局事件，严重危害母婴安全。鉴于HDP病因涉及多方面因素，多个通路和多种机制参与其发病，目前尚缺乏有效的干预措施，及时预测不良结局发生风险并提前干预，对预防HDP不良结局发生具有重要意义。目前，国内外学者已针对HDP不良结局研发了相应预测模型，且随着研究的深入，预测参数也从传统的单一指标逐渐向多指标、多元化转化。鉴于不同模型适用的人群不同，且HDP发病受多种因素的影响，预测模型在不同地区人群中应用时仍需进行外部验证。本研究对国内外研发的6种预测模型在中国不同地区人群的适用性进行了分析，结果显示6种模型预测HDP患者入院48 h内/住院期间发生不良结局的AUC分布于0.600～0.897，除Ngwenya模型外，其余模型的区分度均良好(AUC>0.7)，但模型的拟合性差，整体预测性能不高。

2011年von Dadelszen等[8]在一项前瞻性研究中纳入了2023例子痫前期(preeclampsia，PE)患者，并建立白种人群不良结局的预测模型(fullPIERS)，该模型综合了孕周、临床症状、肝肾功能以及其他血液学指标的影响，预测PE患者入院48 h内出现不良结局的AUC高达0.88。基于该模型可将患者分为低风险(风险值<2.5%)、高风险(风险值≥30%)人群，从而更有效地对患者进行管理。国内外其他学者针对该模型已进行了外部验证，总体预测价值较好[3]。本研究对该模型在中国东西部地区HDP人群应用情况进行了性能评价，发现其预测HDP患者入院48 h内发生不良结局的AUC仅为0.711；低风险人群中不良结局发生率为8.2%(172/2099)，略高于原始研究(1%)，而高风险人群中有94.4%(17/18)发生了不良结局，远高于原始研究(59%)。不同研究之间该模型的预测效果差异显著，可能与该模型是基于白色人种建立，黄色人种在人口学特征上可能与白色人种存在差异，且HDP不良结局发生率受该地区经济和医疗水平等因素影响有关。von Dadelszen等[8]指出，该模型仅适用于有良好医疗体系、可及时正确处理该类孕产妇的高收入国家/地区或医疗机构，而在中低收入国家使用时可能受限。本研究的两所医疗机构虽均位于经济相对发达地区，且均为危重症孕产妇转诊中心，但相对于发达国家而言，医疗保障体系欠完善，收治的转院患者尤其病情危重者多数未经正规产检和规范化治疗，可能在一定程度上解释了相同的风险值在本研究数据中显示出不良结局发生风险明显增高的现象。此外，本研究团队既往已针对PE患者对该模型进行了验证，结果表明其预测价值较好[20]。本研究纳入了更广泛的HDP患者，且包含多中心数据，虽然其预测不良结局的AUC有所降低，但预测性能仍良好。需注意的是，不管原文报道还是本研究结果均提示该模型的预测参数SpO2易缺失。临床并未将该指标纳入常规检测，仅出现胸闷等不适时才进行监测。根据文献中的意见，该项因子缺失时以97%作为替代值进行预测，因此该模型的准确性和适用性尚有待评估。

目前，孕产妇和围产儿死亡大多发生于中低收入国家[21]。miniPIERS是基于5个中低收入国家共2081例HDP患者临床数据建立的模型[9]，该模型预测入院48 h母婴预后不良的AUC为0.768，识别的高风险孕产妇可从硫酸镁、抗高血压药物、糖皮质激素或转诊等干预措施中获益。本研究该模型预测HDP患者入院48 h内出现不良结局的AUC为0.723，与原始文献报道结果较接近。虽然该模型建立者Payne等[9]建议预测风险值>15%时应引起临床重视，但本研究未观察到风险值>15%的病例，可能是由于miniPIERS模型主要基于患者基本信息及临床症状相关资料所建立，而本研究病例来源于国内经济较发达地区的医疗机构，产前保健系统相对完善，许多患者在未出现明显临床症状前已收治入院并予以干预，以致未发现风险值>15%的人群。因此，很难单独将母体信息及临床表现作为早期预警方式，其临床适用性不高。

Ngwenya亦是基于中低收入国家(津巴布韦)人群(n=549)建立的预测模型[15]，该模型由年龄、孕周、上腹部疼痛、阴道出血伴腹痛、血红蛋白、血小板计数6个参数构成，经ROC曲线验证其预测重度PE患者预后不良的性能良好(AUC：0.796)。与miniPIERS模型不同，该模型纳入了血液学指标(血红蛋白和血小板计数)，这是考虑到妊娠期贫血是大多数发展中国家孕产妇发生重度PE、死亡以及新生儿预后不良的主要原因之一[22]。本研究结果显示，该模型预测HDP患者入院48 h内发生不良结局的AUC不足0.7，提示该模型在中国东西部地区HDP人群中的适用性较低。

Zwertbroek模型源于HYPITAT-Ⅱ试验中的519例HDP患者二次数据分析，是对终止妊娠风险进行的预测，包括进展为严重并发症、HELLP综合征、肺水肿及子痫抽搐等[11]，该模型可将孕34～37周罹患严重疾病高风险与低风险孕妇相区分(AUC：0.760)。根据模型预测结果，Zwertbroek模型将风险值≤22%人群定义为低风险组，仅常规监测即可；风险值在22.1%～44.4%为中风险组，考虑频繁监测或促子宫颈成熟；风险值≥45%者为高风险组，可考虑立即终止妊娠。本研究中该模型预测HDP患者入院48 h内发生不良结局的AUC为0.739；低风险人群中，8.9%(27/303)发生不良结局；高风险人群中，40.9%(45/110)发生不良结局，提示可根据模型识别结果及早发现终止妊娠高风险个体。国际上亦有随机对照试验探讨了该时段孕周期待管理与有计划早期分娩人群母婴结局的差异性，试图寻找孕产妇最佳分娩时机。Chappell等[23]研究发现，相较于期待管理，早期分娩可显著降低孕产妇的不良结局发生风险，且未见新生儿发病率有明显提高。因此，针对高风险孕妇终止妊娠时需充分权衡母婴获益与风险。此外，该模型提示合并慢性高血压是不良结局的危险因素，临床需增加对此类孕妇的关注度，可于早孕期使用阿司匹林，以预防或延缓高危人群发生PE及相关并发症[24-26]。

鉴于早发型和晚发型PE的病因和发病机制不同,Thangaratinam等[12]在一项纳入946例早发型PE患者的前瞻性研究中建立了PREP模型，该模型从PREP-L和PREP-S两个方面对早发型PE患者的预后进行预测，前者是对从诊断早发型PE至产后出院整体不良结局的风险评估，后者是从诊断早发型PE至孕34周不同时间点生存率的评估。经外部数据集验证，在当前护理条件下PREP模型可用于早发型PE患者早期早产、入院48 h前和入院期间不良结局风险的预测。本研究结果显示，PREP-L和PREP-S预测孕<34周PE患者住院期间预后不良的AUC均达到良好水平，尤其PREP-L模型，AUC(0.897)远高于其他模型。但由于该模型仅针对早发型PE患者，且本研究选取的医疗机构在此研究期间并未将尿蛋白肌酐比作为常规筛查指标，以致大量病例被排除，最终导致样本量不足(仅21例)，因此该模型的预测价值仍需验证。

马国珺等[17]基于2015年1月至2018年12月全国4家医院817例重度PE患者的临床资料建立了此类人群母胎不良结局的预测模型(AUC：0.754)，并提出临床可重点监测蛋白尿、肝功能、血小板水平，以有效识别高危患者。本研究亦表明，该模型对重度PE患者入院48 h内不良结局具有良好的预测效能(AUC：0.729)。但该模型涉及的预测因子中，24 h尿蛋白定量(≥300 mg)在许多医疗机构并非常规检测项目，且该指标的收集较为繁琐，患者依从性差，导致测定结果不准确。本研究约18.8%(234/1 248)重度PE患者缺乏24 h尿蛋白定量数据(模型验证时以随机尿蛋白阳性为蛋白尿阳性)，故该模型大范围开展的可行性有待商榷。

本研究为目前在中国地区对HDP患者预后模型进行外部验证样本量最大的双中心研究。纳入的两所医疗机构分别位于中国东、西部地区，兼顾了病例来源的地域差异，以更好地评估模型的普适性。本研究局限性：(1)回顾性分析难以避免信息偏倚。某些预测因子如尿蛋白肌酐比并非常规筛查指标，以致对PREP模型[12]验证时样本量较少。(2)鉴于一些预测因素在回顾性研究中不易获得，如胎盘生长因子、可溶性fms样酪氨酸激酶1等[18-19,27]需专门的实验室检测，临床可及性差，本研究仅对预测参数相对易获得的6种模型性能进行了比较。(3)为增加研究结果的临床意义，验证人群未全部采用与原始研究相同的定义和数据采集方法进行纳入，而采取了广义的外部验证模式，纳入更广泛的患者。如在fullPIERS模型中，原始研究的验证人群为PE患者，本研究为HDP患者。

综上，6种模型对中国东西部地区HDP患者不良结局均具有一定预测能力，其中以fullPIERS、miniPIERS、Zwertbroek、PREP及马国珺模型的应用价值相对较高，但部分模型的预测指标非常规检查项目，实际应用时需结合本地经济状况、医疗水平以及模型预测参数的可行性综合考虑。此外，由于本研究验证模型的校准度均较差，可能与多数模型是基于国外人群所建立，国内外人群在种族、数据分布特征以及经济水平等方面存在差异有关。在大数据时代下，通过多中心协作，建立适合我国国情甚至局部地区的HDP患者不良结局预后模型具有必要性，以更有效地指导临床工作，对孕产妇进行管理，这将为降低我国孕产妇及围产儿死亡率奠定重要基础。

作者贡献：孙芳璨负责研究设计、数据收集与整理、统计分析、论文撰写；韩冰负责研究设计、研究指导、数据分析、论文修订；高岩负责研究设计、研究指导、论文修订；沈敏红负责数据收集与整理；陈友国负责研究指导、数据分析；钟文负责数据收集。

利益冲突：所有作者均声明不存在利益冲突