D3胚胎活产结局的预测模型
2022-11-01张京业王苗苗吴克良
张京业,王苗苗,吴克良
[山东大学生殖医学研究中心(山东大学附属生殖医院),济南 250012]
随着辅助生殖技术在世界范围内的广泛应用,有关多胎妊娠的报道逐渐增多。多胎妊娠会带来许多问题,包括早产、低出生体重、新生儿死亡和残疾等的概率显著增加[1]。提高妊娠率的同时降低多胎妊娠的发生,这就需要一种更有效且更严格的移植前胚胎选择方案。近年来time-lapse(延时摄像)技术在一定程度上弥补了传统胚胎观察方式无法连续观察的局限性,大大提高了人们对胚胎发育过程的认识。time-lapse技术也越来越多地被用于预测胚胎的发育潜能和胚胎染色体的整倍性[2-8]。目前,基于time-lapse技术建立的预测胚胎发育潜能的模型有很多。有根据胚胎着床数据(known implantation data,KID)建立的适用于挑选移植胚胎模型[9-12],也有基于优质囊胚形成建立的胚胎预测模型[13-15],但基于胚胎活产数据的预测模型较少[7]。此外,同一个模型在不同IVF实验室的适用性可能存在差异[16],因各实验室之间可能有着不同的胚胎培养环境[17-18],不同的卵巢刺激方案[19],以及不同的患者群体[20-22]等。本研究根据活产胚胎的早期动力学参数和D3形态学评分,建立一个新的胚胎预测模型,为本中心辅助生殖实验室服务的同时,也为类似患者条件以及胚胎培养条件的生殖中心提供新思路。
1 材料与方法
1.1 研究对象 回顾分析2017至2019年在山东大学附属生殖医院就诊的患者。剔除标准:非第一周期,年龄>40岁,严重男性因素,多囊卵巢综合征(polycystic ovarian syndrome,PCOS),子宫内膜异位症,身体质量指数(body mass index,BMI)>30kg/m2,胚胎植入前遗传学检测(preimplantation genetic testing,PGT)周期,低反应周期和过度刺激周期(成熟数<5枚或>15枚)。纳入标准:助孕方式为常规体外受精(in-vitro fertilization,IVF)或胞浆内单精子注射(intracytoplasmic sperm injection,ICSI);在time-lapse培养箱中培养,且有完整的胚胎发育视频;正常受精优胚数≥2,第三天移植一枚或两枚胚胎,且每个胚胎的活产结局是已知的。移植一枚胚胎,其结局为活产或未活产;移植两枚胚胎,其结局为两枚都活产或两枚都未活产。若移植两枚胚胎,仅有一枚活产,该数据将不被采用。
1.2 胚胎培养与移植 所有胚胎均放入time-lapse培养箱(EmbryoScope,Vitrolife)培养。培养条件37℃、6.0% CO2和5.0% O2,序贯培养液为G1,G2(Vitrolife)。培养箱每隔15min在7个层面对胚胎进行拍照。D3移植一枚或两枚优质胚胎,胚胎移植后常规行黄体支持。移植后14d检测血β绒毛膜促性腺激素(β-HCG),4~6周阴道B超下出现孕囊和胎心为临床妊娠,并持续追踪活产结局。
1.3 胚胎发育的评估 由一位经验丰富的胚胎学家利用Embryo Viewer软件(Vitrolife)来完成对胚胎发育的评估。t2-tPNf、t3-tPNf、t4-tPNf、t5-tPNf、t8-tPNf分别为从原核消失到胚胎分裂为2细胞、3细胞、4细胞、5细胞、8细胞的时间点。CC2(t3-t2)、CC3(t5-t3)、S2(t4-t3)、S3(t8-t5)以及t5-t2分别为多个细胞分裂的持续时间。直接分裂(direct cleavage,DC):胚胎在三次同步分裂过程中发生的异常分裂行为,一个卵裂球在5h内分裂为至少3个卵裂球。68h胚胎的形态学评分,依据本中心一直采用的Puissant评分体系,将胚胎分为1~4分,4分胚胎的标准为卵裂球形态大小正常均一,没有或几乎没有碎片[23-24]。
1.4 预测模型的建立、评估与验证 根据活产胚胎与非活产胚胎动力学参数的差异,筛选出与胚胎活产相关的参数。进一步通过各个参数四分位数范围和对应的活产率来最终确定用于建立模型的参数。结合形态学评分建立一个基于决策树的模型。绘制受试者工作特征曲线(receiver operating characteristic,ROC),并用曲线下面积(Area Under the Curve,AUC)来确定模型的预测价值。通过五倍交叉验证法来检验上述预测模型的鲁棒性。将所有移植胚胎随机分成5份,其中4/5胚胎组成校准组,按建立模型流程图建立新的模型,剩余1/5胚胎为验证组,验证该模型的有效性。校准-验证运行五次,统计每次运行的动力学参数以及校准组和验证组的AUC。
1.5 两种胚胎挑选模型的定义 KIDScore模型[12]:该模型是一种广泛使用的模型,旨在避免低植入潜能胚胎而不是选择高植入潜能胚胎。Embryo Viewer软件根据胚胎发育过程中的多个发育节点,可自动对每个胚胎进行1~5分的评分。Liu模型[11]:利用定性参数DC、RC、ICCP(在4-细胞末期,卵裂球之间小于6个细胞间接触点)和定量参数T5_PNF和S2将胚胎分为F、E、D、C、B、A、A+共七个等级。
1.6 统计学处理 采用SPSS 17.0软件进行连续性参数、比值性参数之间的比较以及动力学参数四分位数的划分,P<0.05为差异有统计学意义。采用MedCalc软件进行二元逻辑回归分析以及AUC的比较,P<0.05为差异有统计学意义。
2 结 果
2.1 患者基本信息 共纳入434例患者(IVF患者384例,ICSI患者50例)。患者的平均年龄(31.2±4.0)岁,平均获卵数(10.3±2.0)个。活产组177例患者,其中173例移植两枚胚胎均获得活产,4例移植一枚胚胎且获得活产,活产胚胎共350枚。非活产组257例患者,其中238例移植两枚胚胎均没有活产,19例移植一枚胚胎且没有活产,非活产胚胎共495枚。因此本研究共纳入已知活产结局的胚胎845枚。
2.2 预测模型的建立 非活产组的异常分裂DC比例显著高于活产组,见表1。因此,胚胎发育过程中是否有DC发生可作为筛选胚胎的重要前提。将发生DC的103枚胚胎剔除后,分析两组的定量参数。结果显示,两组的t3-tPNf、t4-tPNf、t5-tPNf以及t8-tPNf四个参数比较,差异有统计学意义(P<0.01)。t4-tPNf、t5-tPNf的前三个四分位数Q1、Q2和Q3所对应的活产率高于最后一个四分位数Q4,差异有统计学意义(P<0.05)。t8-tPNf的前两个四分位数Q1和Q2所对应的活产率高于后两个四分位数Q3和Q4,差异有统计学意义(P<0.05)。见表2。综合考虑下,t4-tPNf和t8-tPNf被用来构建胚胎预测模型。根据胚胎发育过程是否有异常分裂(DC),两个定量参数t4-tPNf和t8-tPNf,以及形态学评分建立了胚胎预测模型,见图1。该模型将所有移植胚胎分为1~4分,分数高低代表了胚胎的活产潜能。
表1 两组胚胎定性参数DC和定量参数t3-tPNf、t4-tPNf、t5-tPNf、t8-tPNf的比较
表2 定量参数t3-tPNf、t4-tPNf、t5-tPNf、t8-tPNf的四分位数范围和对应的活产率
2.3 预测模型评估 根据预测模型评分绘制ROC曲线,AUC为0.664,见图2。五倍交叉验证法验证后发现建立预测模型的两个参数t4-tPNf和t8-tPNf未发生大的偏差,且校准组与验证组的AUC非常稳定,与预测模型的AUC无显著差异,见表3。这证明了该预测模型的鲁棒性。
表3 五倍交叉验证法验证预测模型
2.4 预测模型与外部模型的比较 将两个广泛应用的胚胎植入预测模型应用到本研究的845枚胚胎中,结果显示,3种模型的AUC存在显著差异,见图3。KIDScore模型和Liu模型对本中心活产数据的预测能力低于本研究的预测模型。
3 讨 论
基于time-lapse技术的胚胎模型有很多,一个成熟的胚胎预测模型在某个实验室可能需要做出调整或根本不适用。因此,每个实验室可根据KID数据制定自己的胚胎挑选模型。本研究借鉴了多个模型[9-12]的建模思路和参数,综合分析影响胚胎活产的动力学参数,结合D3形态学评分,建立一个新的胚胎预测模型。
DC作为一种常见的异常分裂现象,被认为会显著降低胚胎的着床率[9,25]。本研究中活产组和非活产组的DC比例存在显著差异。因此,DC被用作挑选胚胎重要的定性参数。定量参数在不同模型中差异较大,Meseguer模型采用了t5、S2(t4-t3)和CC2(t3-t2)。Liu模型采用t5-PNF、S2以及68h时是否达到8细胞。KIDScore模型采用t3-tPNF、t3、t5-t3/t5-t2以及66h时是否达到8细胞。本研究中,上述定量参数在两组中不存在显著差异;而两个新参数t4-tPNf和t8-tPNf表现出了显著差异,且有着最合适的四分位数范围和对应的活产率。本研究选择t4-tPNf、t8-tPNf代替t4和t8,是考虑到不同胚胎之间精卵结合的时间可能存在差异。如IVF和ICSI两种授精方式造成的差异,卵子成熟度不同造成的差异,以及ICSI操作中第一个卵子和最后一个卵子精子注射时间的差异等。为避免这些可能存在的差异对结果的影响,我们采用了原核消失时间来代替授精时间。本研究将形态学评分标准纳入了模型,并作为模型的最高评分标准。这是因为在日常工作中使用time-lapse技术做移植胚胎的最终决定时,形态学评分占很高的比重。事实上,目前形态学评分仍在胚胎挑选时有着重要的作用[26]。此外,胚胎形态学评分也是Liu模型的一个筛选条件[11]。
本研究中患者挑选非常严格,尽量排除了影响胚胎着床的其它因素,真正体现了胚胎本身发育潜能对妊娠结局的影响。患者的平均年龄为31.2岁,低于多篇已发表文章中的患者年龄,34.5岁[11]和38.0岁[10]等。体现在临床结局上则为活产率(41.4%),高于这些文章中的临床妊娠率。因此,本研究的预测模型可以为患者平均年龄较低的生殖中心提供一定的指导意义。已发表的胚胎预测模型,对D3胚胎植入的预测能力往往低于对囊胚形成的预测能力,它们预测植入的AUC值都相对温和,处于0.6~0.7之间[27,7,12,10]。这可能是因为相比于囊胚形成,胚胎植入涉及到更多不可控因素。而本研究的模型则为活产能力预测模型,它比植入预测模型有着更多的不可控性;AUC为0.664,表明本研究的预测模型有着正常的预测水准。
KIDScore模型是一种取消选择的模型,它旨在避免植入低潜能胚胎而不是选择高植入潜能胚胎的算法。因此评分为5分组包含很大比例的胚胎,将最后移植或冻结的选择权留给胚胎学家。尽管5分组的胚胎如此之多,其着床率仍显著高于其它几组。此模型采用来自24家生殖中心的庞大数据,利用3275枚已知着床结局(KID)的胚胎建立模型,并用11218枚胚胎进行了模型验证。因此是一种有着普遍适用性的模型。Liu模型是一种选择导向性模型,其评分为A+胚胎的比例很少,但其着床率是所有模型中最高的。该模型能很好地帮助胚胎学家挑选他们所需要的胚胎。此外Liu模型的形态学评分F评分在本文中不适用。Liu模型的0.622和KIDScore模型的0.618在本文中的数据中表现出的预测能力不佳,可能与患者年龄、培养环境、用药方案等有关。这进一步表明每个实验室应制定自己的胚胎预测模型。
综上所述,本研究建立的胚胎预测模型,可为类似患者条件以及胚胎培养条件的生殖中心提供借鉴意义。本文的局限性在于,该预测模型未经前瞻性的数据验证,其有效性也未经外部数据验证。接下来的研究方向为建立随机对照临床试验,进一步验证该模型的适用性。