子痫前期预测模型的研究进展*
2023-08-02张洋洋顾珣可王永清贾珂珂北京大学第三医院检验科妇产科北京100191
张洋洋,顾珣可,王永清,贾珂珂(北京大学第三医院.检验科,.妇产科,北京100191)
子痫前期(preeclampsia,PE)是一种与新发高血压相关的妊娠疾病,发生在妊娠20周后,通常是在近足月妊娠。其最主要症状是高血压,部分可出现蛋白尿[1],严重者可并发肾脏、心脏、肺、肝和神经功能障碍,血液系统异常改变,胎儿生长受限,死产和孕产妇死亡[2]。PE是一种进行性疾病,全世界发病率为2%~4%,每年会造成大约46 000例孕产妇死亡和大约500 000例胎儿和新生儿死亡。除终止妊娠外,无有效治疗方法[3]。其病理生理表现分为2个阶段[4]:(1)妊娠早期:胎盘异常阶段;(2)妊娠中期和晚期:以抗血管生成因子过量释放为特征的“母体综合征”阶段。已经有证据表明第1阶段的胎盘异常是导致第2阶段母体循环中可溶性毒性因子释放的原因,继而引起炎症,内皮功能障碍和母体全身性疾病等[4]。此外,研究者们还提出了包括氧化应激,母体-胎儿界面处的异常自然杀伤细胞作用,免疫失衡、遗传和环境因素等其他可能的机制[4]。
妊娠期高血压疾病诊治指南(2020)指出:妊娠早中期(妊娠12~16周)开始每天服用小剂量阿司匹林(50~150 mg),依据个体因素决定用药时间,预防性应用可维持到妊娠26~28周[5]。另有研究表明,在妊娠16周前开始每日服用≥100 mg阿司匹林可显著降低早产PE(在妊娠<37周时因PE终止妊娠)的发病率[6]。因此,在妊娠16周前对PE进行预测至关重要。本文综述了在孕早期对PE进行预测的较有代表性的模型,将从纳入指标、预测模型种类、模型应用阶段、外部验证和中国现状5个方面进行讨论。
1 PE预测模型纳入指标的选择
随着对PE病因、发病机制和临床表现的深入研究,其预测模型也渐渐纳入了更为全面的指标,包括:危险因素、生物标志物、生物物理参数等。
2013年,Scazzocchio等[7]基于Logistic回归建立了早发型PE(PE发生在妊娠<34周时)和晚发型PE(PE发生在妊娠≥34周时)的预测模型,该模型纳入了母体特征(如病史和产科史、年龄、种族、吸烟状况、胎次、身高和体重),8~12周的血清妊娠相关血浆蛋白-A(serum pregnancy associated plasma protein-A,PAPP-A)和游离人绒毛膜促性腺激素(free β-human chorionic gonadotropin,fβ-HCG),11~13+6周的血压和子宫动脉搏动指数(uterine artery pulsatility index,UtA-PI)。母体特征、生物标志物和生物物理指标的联合应用使该模型成为了较早的具有不错表现的预测模型之一。而之后于2016年建立的胎儿医学基金会(Fetal Medicine Foundation,FMF)的孕早期预测模型(三联检验)[8]表现更为突出,它纳入的指标包括:母体因素、平均动脉压(mean arterial pressure,MAP)、UtA-PI和母体血清或血浆胎盘生长因子(placental growth factor,PLGF),这一模型已经通过了多个国家的研究者进行的内部和外部验证,其纳入的指标对其他预测模型的构建具有一定的参考价值。
在纳入指标的选择上,Chen等[9]发现将血清D-二聚体(D-dimer,DD)与PAPP-A、fβ-HCG、胎儿颈后透明层厚度(fetal nuchal translucency,NT)中任意的大于等于一项指标相结合,均会提高该生物标志物组合对妊娠期高血压疾病(hypertensive disorders of pregnancy,HDP)的预测性能,尤其是在重症PE(severe preeclampsia,SPE)组中敏感性和特异性最佳,这提示孕早期孕妇血清DD水平对HDP或具有一定的诊断价值。
美国妇产科学院(The American College of Obstetricians and Gynecologists,ACOG)和英国国家健康与护理卓越研究所(National Institute for Health and Care Excellence,NICE)提议根据孕产妇风险因素对PE进行筛查,是PE较为传统的预测方法。ACOG[1]纳入的风险因素是从患者的病史中获得的,包括高风险因素、中风险因素和低风险因素,见表1。NICE[10]最新指南建议的常规筛查风险因素与ACOG相似,两者的主要差异在中风险因素里的身体质量指数(BMI)和年龄上,2020年ACOG把年龄限定为≥35岁,与高龄产妇定义相同,而NICE则将其限定为≥40岁,其限定的BMI界值也较ACOG大5 kg/m2,较少用做行业标准,见表1。此外,还有研究指出,在使用ACOG和NICE预测PE时,先前怀孕期间接受了阿司匹林的妇女可等视为初产妇,这是因为如果忽略先前怀孕时阿司匹林的服用,可能导致PE总检出率降低5%~10%,筛查阳性率降低约1%[11]。
表1 ACOG和NICE中列出的PE的母体危险因素
此外,2022年的一项研究表明[12],妊娠11~13周时眼动脉流速波形的第二峰值与第一峰值收缩速度(peak systolic velocity,PSV)比值是预测早产PE的潜在生物标志物,但需要更大规模的研究来验证这一发现。可溶性酪氨酸激酶-1(solute fms-like tyrosine kinase-1,sFlt-1)作为PE预测模型常见的纳入指标受到研究者们的关注,有研究显示发展为PE的妇女和未发生PE的妇女在妊娠11~13周时的母体血清sFlt-1水平差异无统计学意义[13],而sFlt-1与PLGF比值更有意义,当其比值≤38时可很好地预测临床上怀疑PE的女性短期内不会发展为PE[14],当其比值>38时有助于提高对PE不良妊娠结局的检测[15]。
2 PE预测模型的种类和预测效果
目前,PE的预测模型以Logistic回归,竞争风险模型居多,随着人工智能的应用越来越广泛,一些基于机器学习的算法也被应用于模型的建立。
迄今为止,已有非常多的模型被建立。其中,胎儿医学基金会(FMF)孕早期预测模型(即三联检验)表现最为突出,除了母体因素,这一模型纳入了MAP、UtA-PI和PLGF,基于贝叶斯理论进行建模,FMF三联试验在10%的假阳性率(false-positive rate,FPR)下对早产PE和足月PE(在妊娠≥37周时因PE终止妊娠)的预测检出率(detection rates,DR)分别为75%(70%~80%)和47%(44%~51%)[8]。
Manoochehri等[16]使用数据挖掘方法来预测PE和相关危险因素,采用了Logistic回归、k-近邻、C5.0决策树、判别分析、随机森林、支持向量机等6种数据挖掘方法,筛查出的诊断PE的最重要危险因素有:基础疾病、年龄、妊娠季节和怀孕次数。模型的准确性[(真阳性率+真阴性率)/总数]如下:逻辑回归(0.713)、k-近邻(0.742)、C5.0决策树(0.788)、判别分析(0.687)、随机森林(0.758)和支持向量机(0.791)。其中,支持向量机表现最佳,但是由于这是一项横断面研究,尚缺乏足够的说服力。
现有的模型大多对早发型PE有较好的预测效果,但是对于晚发型PE,有些模型的表现却不尽如人意。Vonck等[17]的研究旨在解决这一问题,其研究结果中可以看到较为满意的晚发型PE模型的性能。该研究通过对8~15+6周和18~27+6周的969名妇女进行随机筛查,获得了其在这两个时间段中的母体特征(包括孕妇年龄、孕前体重、身高、孕前BMI、过敏、胎次、糖尿病史/子宫内死亡/子宫内生长受限/血栓形成倾向/高血压)以及生物物理参数(包括标准化心电图-多普勒超声检查、阻抗心动图和生物阻抗),基于此开发的偏最小二乘判别分析模型得到了如下结果:早发型PE的ROC曲线下面积(AUCROC)为0.999,晚发型PE的AUCROC为0.953。偏最小二乘回归与传统的多元线性回归相比,有更强大的功能,它在多元线性回归分析的基础上增添了典型相关分析和主成分分析,能尽可能多的提取所在变量组的变异信息,同时保证了两者之间的相关性最大。这一运用偏最小二乘判别分析模型的研究结果很令人惊喜,在未纳入生化参数的情况下,仅使用母体特征结合生物物理指标的预测模型对早发型PE和晚发型PE均有很好的筛查性能。但是此模型也存在阳性预测值低的缺点,对早发型PE和晚发型PE来说,尽管在FPR分别为0%和14%时,DR与阴性预测值均为100%,可阳性预测值却分别只有67%和21%。此外,如此高的AUCROC可能存在过拟合的问题,而且这项研究使用超声等检查也需要医务人员投入更多的时间和精力,同时患者也将承担更为昂贵的检查费用。
现将部分有代表性的PE预测模型列出,见表2。
表2 PE预测模型相关指标及其表现
3 采用模型进行预测的妊娠阶段及时机
孕12周时,胎儿头臀长在45~84 mm之间,可查NT、B超,并进行孕早期唐氏筛查,在第一次排除胎儿形态和染色体异常可能后,即进入常规产检流程并办理健康手册。此次产检检查的项目较多,包括孕妇各项生化指标,NT和B超等,利用这些检查结果可以对母体和胎儿情况做出初步判断,PE预测模型所纳入的指标多在这一时期获得。从指标的获取以及阿司匹林的预防效果两方面考虑,大多数模型应用的时间都在11~13周,但是根据不同国家和地区经济水平与社会环境的差别以及纳入指标的适宜检测时间不同,模型应用的时间也有一些变动,在8~18周不等。
FMF三联检验模型应用的时间为11~13周[8]。Serra等[21]的研究使用多元高斯分布模型对单胎妊娠进行早发型PE筛查,包括在8~13+6周评估的母体特征、PAPP-A、PLGF,以及在11~13+6周测量的MAP和UtA-PI。而加拿大一项研究[23]则在妊娠10~18周进行PE预测,这可能是因为模型中纳入了sFlt-1,与正常孕妇相比,PE患者的sFlt-1水平从妊娠15周才开始显著升高,且差异随孕龄增加而增大[24]。
4 PE预测模型的地域差异(外部验证)
不同的国家和地区由于经济水平、地域特征、生活习惯的不同,孕期妇女PE的患病情况也不尽相同,在某一地区建立的模型可能对其他地区人群的预测效果不佳,因此需要用本地区的人群来验证新的预测模型以检测该模型在本地区的筛查效果。此外,模型若直接在训练集内验证会出现过拟合现象,使准确率偏高,外部验证则可以防止过拟合。
FMF三联检验的预测模型作为表现突出的模型,很多研究对其进行了外部验证。O′Gorman等[25]在英格兰、西班牙、比利时、意大利和希腊12家妇产医院中的8 775名接受孕早期PE筛查的单胎妊娠妇女中检查了FMF算法的性能。在10%的FPR下,FMF算法对PE<32周、PE<37周、PE≥37周的DR分别为100%(95%CI:80%~100%)、75%(95%CI:62%~85%)、43%(95%CI:35%~50%),优于NICE指南仅采用危险因素进行预测的结果:在10.2% FPR下相应的DR分别为41%、39%和34%,而ACOG中当FPR为64.2%时,相对应的DR分别为94%、90%和89%。这项外部验证的结果与开发FMF算法时得出的DR相似,印证了FMF算法在此类人群中确实具有相对稳定且较为优越的性能。另一项在英格兰7家国家卫生服务妇产医院的16 747名妇女中开展的前瞻性多中心队列研究[26]也紧跟其后,在FMF算法的筛选下,筛查阳性率为10.0%时,PE<34周、PE<37周和PE≥37周的检出率分别为90.0%(79.5%~96.2%)、81.7%(74.3%~97.7%)、42.6%(37.2%~48.1%),验证结果较满意。2019年发表的一篇文章报告了孕早期FMF三联检验在亚洲人群中的外部验证,这是一项基于10 935例单胎妊娠的前瞻性非干预多中心研究[27],FMF三联检验在5%、10%、15%和20%的固定FPR下预测早产PE实现了48.2%、64.0%、71.8%和75.8%的检测率,性能也优于ACOG和NICE。这项研究表明,基于FMF贝叶斯定理的模型可较为有效地预测亚洲人群的早产PE。但FMF模型纳入了子宫动脉压等参数,需要B超辅助测量,在很多地区的临床产检中并未对所有孕妇进行检测,这也是FMF模型应用的一个局限性因素。
5 PE预测模型在我国的应用现状
目前,中国PE的总体患病率为2.3%,其中68.1%为SPE[28]。我国已针对PE验证并建立了一些模型。
在一项前瞻性、多中心、观察性队列研究中[29],以来自于中国七座城市13家医院的10 899名单胎妊娠妇女为样本,使用FMF算法计算早产PE的个体化风险,在固定的FPR为10%、15%和20%时分别达到了65.0%、72.7%和76.1%的早产PE检出率。由于FMF三联算法在我国的表现尚不令人十分满意,而且在资源匮乏的地区推广应用的可行性、经济性都不高,进一步开发针对中国人群的预测模型势在必行。
2022年的一项研究[30]对检测成本与可行性进行了探讨,该研究结合早孕期非整倍体筛查(即早孕唐筛)获得PAPP-A数据,用PAPP-A取代FMF算法中的PLGF,以母体因素+MAP+PAPP-A的方案预测早产型PE,其敏感性接近70%。该方案不增加超声检查和生化检测等额外医疗费用,具有良好的成本效益比及可行性。
一项回顾性队列研究[31]使用最小绝对收缩和选择算子(LASSO)从人口统计学特征、血压、血常规检查和生化测试中进行变量选择发现,在妊娠5~10周和11~13周检测尿酸,18~23周和24~31周检测血小板,28~31周、32~35周和36~39周检测碱性磷酸酶,可以进一步提高Logistic回归模型的预测性能。使用此Logistic回归模型在11~13周基于母体特征、病史、平均动脉压(5~10周,11~13周)和生物标志物(含尿酸)对PE进行预测,AUCROC分别为:早发型PE(0.78)、晚发型PE(0.75),早产PE(0.78)、足月PE(0.74)。对于所有PE,测试集上的最佳预测模型的AUCROC为:11~13周(0.75)、24~27周(0.80)、36~39周(0.95),此预测模型覆盖了妊娠全阶段,其性能也值得肯定。
为制定经济有效的PE筛查计划,一项基于福建省568例孕妇的研究[32]利用低成本易获取的外周血变量,使用TensorFlow(一个端到端开源机器学习平台)生成了1个BP神经网络,将清蛋白、血小板平均体积和尿素在内的25个潜在影响因素作为输入神经元节点,并使用PE、妊娠高血压和正常足月妊娠的妇女样本类型作为输出节点。对神经网络模型进行训练后,得到输入层神经元节点的权重值W1,并根据权重的大小确定了对PE影响最大的前5个因素是清蛋白、血小板平均体积、尿素、乳酸脱氢酶和三酰甘油。使用测试集测试训练好的神经网络,结果表明神经网络的正确率为79.8%。另一项基于2 338例中国籍孕妇的回顾性研究[33],纳入了患者的一般资料、PE发病危险因素、6~10周常规实验室指标,采用传统Logistic回归和机器学习XG Boost算法构建预测模型,结果表明XG Boost模型(AUCROC:0.867,95%CI:0.839~0.896)在孕早期预测PE发病的性能优于Logistic回归模型(AUCROC:0.752,95%CI:0.735~0.769)。目前中国的PE预测模型已经在不断发展创建,部分模型也有着不错的性能,期待未来有合适的模型能最终广泛应用于临床,使患者受益。
6 总结与展望
PE作为妊娠期一种严重的并发症,正在引起人们越来越多的关注,对PE的预测从ACOG和NICE的单一风险因素到逐渐改进为纳入更多的生化指标和生物物理参数,从传统的Logistic回归到竞争风险模型、机器学习等多种新模型的创建,预测模型的准确性日趋升高。目前FMF联合算法及竞争风险模型已成为风险预测的主流,而机器学习算法和人工智能也有不可忽视的发展潜力。由于FMF模型的大多数证据都是基于白种人或非洲裔美国人,在中国人群中的表现尚不能令人非常满意,因此虽然国际妇产联合会[34](The International Federation of Gynecology and Obstetrics,FIGO)在PE预测预防指南中接受了这一算法,但是该模型却未能在中国大规模地投入临床使用。
期待未来可以创建性能更优、应用更广,经济成本较低的预测模型,实施有效的预防措施,减小PE对孕产妇及胎儿的不良影响。