APP下载

基于ADC诊断局部晚期直肠癌新辅助治疗后完全缓解准确性的Meta分析

2022-10-08李戟玭张文凯庄乐怡孙亦华何东王祥

磁共振成像 2022年8期
关键词:异质性阈值检索

李戟玭,张文凯,庄乐怡,孙亦华,何东,王祥

作者单位:1.兰州大学第二临床医学院,兰州 730000;2.兰州大学第二医院消化科,兰州 730030

局部晚期直肠癌(locally advanced rectal cancer,LARC)被定义为T3或T4、伴或不伴淋巴结转移、但无远处转移的肿瘤(T3~T4和/或N+,M0)[1-2]。目前LARC的主要治疗方式是新辅助放化疗(neoadjuvant chemoradiotherapy,nCRT)联合全直肠系膜切除术(total mesorectal excision,TME)[1-4],新辅助治疗有助于LARC患者实现肿瘤降期、提高保肛率、降低局部复发率,从而提高其生存率[5-6]。新辅助治疗后直肠癌患者可出现不同治疗反应,部分患者可出现疾病缓解,而小部分患者可能出现疾病进展[7]。LARC患者在接受nCRT后5~12周行手术治疗,然后经组织病理检查提示肿瘤完全消退被定义为病理完全缓解[8-10]。约有10%~30%直肠癌患者在接受新辅助治疗后可实现完全缓解,新辅助治疗后完全缓解组的患者与非完全缓解组的患者相比,局部复发率降低,生存率及预后有所改善[11-12]。有研究表明新辅助治疗后达到完全缓解的患者不进行根治性手术治疗,而采用严格的随访和观察策略(watch-and-wait)是可行的,其局部无复发率、无病生存率及总体生存率与手术组相比无明显差异[11,13-16]。由此可见,在新辅助治疗后手术治疗前,准确评估LARC的肿瘤反应,尤其是准确识别完全缓解有助于为患者制订侵入性较小的个性化治疗方案;并且提前预测治疗效果有助于及早调整和优化治疗[11]。

盆腔MRI 能清楚地显示直肠壁各层组织及直肠周围脂肪间隙,并且通过三维重建能将各个断面的成像整合为一体[17]。高场强MRI 的优点是采集图像速度快,空间分辨率和信噪比高,因此使用高场强MRI 能够改善直肠壁的可见性[18]。基于对直肠成像的优势,MRI 被推荐为评估直肠癌新辅助治疗疗效的首选检查方法[16,19-20]。

扩散加权成像(diffusion-weighted imaging, DWI)作为一种功能MRI,以水分子在细胞内外的自由扩散为基础,能够反映组织内部的微环境[21]。表观扩散系数(apparent diffusion coefficient, ADC)是评估水分子在组织内扩散的定量参数,即DWI 的定量参数,其与组织细胞密度呈负相关[22]。目前大部分研究通过测量治疗前ADC 值(pretreatment ADC, pre-ADC)、治疗后ADC值(posttreatment ADC, post-ADC)及治疗前后ADC变化率[ΔADC=(post-ADC-pre-ADC)/pre-ADC]评估直肠癌新辅助治疗后的肿瘤反应,然而ADC值在评估直肠癌新辅助治疗后完全缓解的诊断价值存在争议[23]。本文通过系统评价的方法,全面检索已发表的文献,评价基于ADC 诊断LARC 新辅助治疗后完全缓解的临床价值。

1 材料与方法

1.1 纳入与排除标准

本研究的纳入标准:(1)研究类型:国内外公开发表的关于ADC 评估LARC 新辅助治疗疗效的诊断性研究;(2)研究对象:明确诊断为非黏液型直肠癌的患者,患者年龄、种族不限;(3)诊断标准:ADC为待评价试验,术后组织病理检查为金标准;(4)测量的结局指标:合并的敏感度(sensitivity, SEN)、特异度(specificity,SPE)、阳性似然比(positive likelihood ratio, PLR)、阴性似然比(negative likelihood ratio, NLR)、诊断比值比(diagnosis odds ratios, DOR)、分层综合受试者工作特征(hierarchical summary receiver-operating characteristic curve, HSROC)曲线下面积(area under the curve, AUC)。排除标准:(1)未报告完全缓解的研究;(2)参照诊断方法不是术后组织病理检查结果;(3)研究数据不完整不能提取诊断数据信息:真阳性(true positive, TP)、假阳性(false positive, FP)、假阴性(false negative, FN)、真阴性(true negative, TN);(4)研究计划书、社论等文献类型;(5)重复的研究;(6)无法获取全文的研究。

1.2 文献检索策略

计算机全面检索数据库,包括中国知网(CNKI)、万方数据库(Wanfang Database)、中国生物医学文献数据库(CBM)、维普数据库、PubMed、Embase、The Cochrane Library,收集DWI诊断直肠癌新辅助治疗后完全缓解的相关文献,检索时间均由建库至2022 年1 月。采用自由词检索与主题词检索相结合的方法,所有检索式均通过预检后确定。英文检索词包括:“rectal cancer”“diffusion magnetic resonance imaging” “apparent diffusion coefficient”“sensitivity”和“specificity”,中文检索词包括:“直肠癌”“直肠肿瘤”“扩散磁共振成像”“敏感度”和“特异度”。同时对纳入文章的参考文献进行手动检索。

1.3 文献筛选

将检索的文献导入Endnote X8,首先查找并剔除重复文献,然后由2名研究者根据纳入及排除标准独立筛选文献,阅读文献题目及摘要进行初筛,再阅读全文筛选最终纳入的文献。如遇分歧,则讨论解决。对于缺乏资料的文献,尽量与原作者取得联系予以补充。

1.4 资料提取

采用Office Excel 2019设计资料提取表,资料提取的主要内容包括:(1)纳入研究信息:第一作者、国家、发表年份、研究类型(前瞻性/回顾性研究);(2)病例特征:研究对象的年龄、数量、性别、MRI与新辅助治疗的时间间隔、MRI与手术治疗时间间隔;(3)诊断方法特征:ADC 类型、磁场强度、是否对病理结果盲法;(4)诊断数据信息:TP、FP、FN、TN。

1.5 纳入文献的质量学评价

由2 名研究者采用诊断准确性研究的质量评价工具修订版(Quality Assessment of Diagnostic Accuracy Studies-2, QUADAS-2)对纳入研究进行偏倚风险评价[24],并交叉核对,意见不一致时通过讨论解决,讨论未果则由第3名研究人员协助判断。主要评价内容包括4个领域:病例的选择、待评价试验、金标准、病例流程和时间。所有组成部分在偏倚风险方面都会被评估,前3部分也会在临床适用性方面被评估。每一条标准以“是”(低度偏倚或适用性好)、“否”(高度偏倚或适用性差)和“不清楚”(缺乏相关信息或偏倚情况不确定)评价。

1.6 统计学分析

首先对纳入研究进行阈值效应检验,采用Spearman相关系数判断阈值效应,若P<0.05存在阈值效应,若P>0.05则不存在阈值效应。排除阈值效应后进行Cochran-Q检验并且计算I2值,若Cochran-Q检验的P<0.05或I2>50%,表明研究间的异质性由非阈值效应所致的可能性较大,分析异质性来源,按照可能产生异质性的因素进行Meta 回归分析。使用Stata 15.0软件合并效应量,本研究采用双变量混合效应模型,基于“midas”命令计算合并的SEN、SPE、PLR、NLR、DOR,并绘制HSROC曲线,计算AUC。根据AUC值评价诊断方法的价值,当AUC为0.7~0.9时表示诊断方法准确性中等,当AUC>0.9时表示其诊断准确性较高。最后使用Stata 15.0 绘制Deek's 漏斗图(Deek's funnel plot asymmetry test)检测是否存在发表偏倚。

2 结果

2.1 文献筛选流程及结果

计算机检索共获得文献1496 篇,导入Endnote X8 软件筛除重复文献442 篇,通过阅读剩余1054 篇文献的题目和摘要后获得可能相关文献77 篇,进一步阅读全文最终纳入34 个诊断试验[22,25-57]。文献筛选流程及结果见图1。

图1 文献筛选流程图。Fig.1 Flow diagram of the literature selection for the meta-analysis.

2.2 纳入文献基本特征和质量学评价结果

2.2.1 纳入文献基本特征

纳入文献基本特征见表1,共纳入34篇文献,共纳入LARC 患者1914 例,其中达到完全缓解的患者有758例。纳入文献中有5篇中文文献,29篇英文文献;18篇回顾性研究,16篇前瞻性研究。纳入文献的ADC类型主要包括pre-ADC、post-ADC 及ΔADC。纳入文献中有7篇文献未提及对病理结果是否进行盲法,但所有纳入研究均以术后组织病理结果为金标准。2篇研究未报告新辅助治疗后的MRI与治疗结束间隔时间,7篇研究未报告治疗后的MRI与外科手术具体间隔时间。

表1 纳入文献基本特征Tab.1 Characteristics of included studies

2.2.2 纳入文献质量学评价

纳入文献质量学评价结果见图2。偏倚风险评价方面,纳入文献中共有2 篇被评价为高偏倚风险,其余为低风险或不清楚风险。临床适用性方面,所有研究在病例选择、待评价诊断试验及金标准领域均不存在临床不适用性。

图2 纳入文献质量学评价结果。Fig.2 The methodological quality of included studies.

2.3 基于ADC值的定量分析结果

2.3.1 新辅助治疗前ADC值定量分析结果

共有23篇文献对完全缓解组及非完全缓解组的新辅助治疗前ADC值进行了比较(图3A),完全缓解组的pre-ADC 平 均值是0.931×10-3mm2/s,非 完全缓解组的平均值是0.995×10-3mm2/s。进行Meta 分析得出完全缓解组与非完全缓解组pre-ADC 值相差-0.06×10-3mm2/s(95%CI:-0.10×10-3mm2/s~-0.02×10-3mm2/s,P<0.001)。

2.3.2 新辅助治疗后ADC值定量分析结果

共纳入25 篇文献、26 组数据比较了完全缓解组及非完全缓解组post-ADC 值的差异(图3B),完全缓解组的post-ADC 平均值是1.434×10-3mm2/s,非完全缓解组的post-ADC 平均值是1.266×10-3mm2/s。进行Meta 分析得出完全缓解组与非完全缓解组post-ADC 值相差0.17×10-3mm2/s(95%CI:0.12×10-3mm2/s~0.23×10-3mm2/s,P<0.001)。

2.3.3 新辅助治疗前后ΔADC定量分析结果

共纳入17篇文献对完全缓解组及非完全缓解组治疗前后ΔADC进行了比较(图3C),完全缓解组ΔADC平均值是56.07%,非完全缓解组ΔADC 平均值是28.62%,两组之间的差异是23.55%(95%CI:17.25%~29.84%,P<0.001)。

图3 完全缓解组与非完全缓解组pre-ADC(3A)、post-ADC(3B)、ΔADC(3C)比较结果。Fig. 3 Forest plot regarding difference in pre-ADC (3A), post-ADC (3B) and ΔADC (3C) values between patients with complete response and those with incomplete response.

2.4 基于ADC值的诊断价值

2.4.1 治疗前ADC值的诊断价值

有15 篇文献对pre-ADC 的诊断价值进行了研究。Spearman 相关系数为0.141,P=0.616,故研究间不存在阈值效应;Meta 分析显示I2=89%,P<0.001,考虑纳入研究间存在非阈值效应导致的异质性。对纳入文献进行合并效应量,结果如图4A 所示,pre-ADC 诊断完全缓解的SEN合并是0.76(95%CI:0.62~0.86),SPE合并是0.68(95%CI:0.60~0.75),PLR合并是2.4(95%CI:1.8~3.0),NLR合并是0.35(95%CI:0.22~0.57),DOR合并是6.70(95%CI:3.49~12.83)。绘制Deek's 漏斗图(图5A)得出斜率系数P=0.35,提示不存在发表偏倚。拟合HSROC 曲线,AUC=0.77(95%CI:0.73~0.80)(图6)。

图4 pre-ADC(4A)、post-ADC(4B)、ΔADC(4C)诊断完全缓解的敏感度(左)及特异度森林图(右)。Fig.4 Forest plot of sensitivity and specificity of pre-ADC(4A),post-ADC(4B)and ΔADC(4C).

图5 pre-ADC(5A)、post-ADC(5B)、ΔADC(5C)的Deek's漏斗图。 图6 不同类型ADC诊断完全缓解的HSROC曲线。Fig. 5 Publication bias of pre-ADC (5A), post-ADC (5B), ΔADC (5C) using Deek's test funnel plot. Fig. 6 Summary hierarchical summary receiver operating characteristic for different ADC.

2.4.2 治疗后ADC的诊断价值

通过21 篇文献、23 组数据分析post-ADC 的诊断价值,Spearman 相关系数为0.216,P=0.322,得出研究间不存在阈值效应;Meta 分析I2=93%,P<0.001,提示研究间存在非阈值效应导致的异质性。合并效应量结果显示(图4B)post-ADC 诊断完全缓解的SEN合并、SPE合并、PLR合并、NLR合并和DOR合并分 别 为0.82(95%CI:0.72~0.88)、0.77(95%CI:0.71~0.82)、3.5(95%CI:2.8~4.5)、0.24(95%CI:0.16~0.37)、14.59(95%CI:8.25~25.80)。绘制Deek's 漏斗图(图5B)提示不存在发表偏倚(P=0.13)。绘制HSROC 曲线(图6),得出AUC=0.86(95%CI:0.82~0.88)。

2.4.3 ΔADC值的诊断价值

有18 篇文献研究了ΔADC 的诊断价值,Spearman相关系数为0.411,P=0.090,故不存在阈值效应;Meta 分析I2=85%,P=0.001,考虑研究间存在非阈值效应的异质性。合并效应量(图4C)结果显示ΔADC诊断完全缓解的SEN合并、SPE合并、PLR合并、NLR合并和DOR合并分别为0.83(95%CI:0.77~0.87)、0.75(95%CI:0.67~0.81)、3.3(95%CI:2.5~4.3)、0.23(95%CI:0.17~0.30)、14.37(95%CI:9.32~22.15)。绘制Deek's 漏斗图(图5C)显示倾斜系数P=0.05,提示存在发表偏倚的可能性小。绘制HSROC 曲线(图6),得出AUC=0.86(95%CI:0.83~0.89)。

2.4.4 Meta回归分析结果

根据纳入文献的研究类型、磁场强度类型、再评估MRI 与新辅助治疗时间间隔、再评估MRI 与手术时间间隔、病理结果的盲法对纳入文献进行Meta 回归分析,发现再评估MRI与手术时间间隔可能造成治疗后ADC 研究间的异质性(P<0.05),其他变量P值均大于0.05,不考虑为研究间异质性来源。

3 讨论

本研究使用Meta 分析的方法,系统评价了ADC对LARC新辅助治疗后完全缓解的诊断价值。首先对pre-ADC 值、post-ADC 值及ΔADC 值定量分析的研究进行Meta 分析,得出完全缓解组的pre-ADC 平均值显著低于非完全缓解组(-0.06×10-3mm2/s),post-ADC 及ΔADC 高于非完全缓解组(差值分别为0.17×10-3mm2/s、28.62%)。然后对诊断价值进行了Meta分析,得出新辅助治疗前ADC值的诊断价值最低,治疗后ADC值及ΔADC的诊断价值相当,三者的AUC分别是:pre-ADC为0.77、post-ADC为0.86、ΔADC为0.86。

3.1 不同ADC值评估疗效的特点

DWI 通过细胞内外水分子的随机布朗运动反映组织内部的微环境。水分子在生物组织中的扩散速率取决于多种因素,包括组织温度、组织细胞密度、细胞外组织情况、细胞膜的完整性和液体的黏度[58]。研究显示使用DWI 评估LARC nCRT 后是否达完全缓解的准确性优于常规MRI[59-60]。ADC 是评估水分子在组织内扩散的定量参数,ADC 值与组织细胞密度呈负相关[22],肿瘤细胞限制水分子的扩散,随着肿瘤生长,肿瘤细胞密度增大,并且细胞外组织结构被破坏,导致ADC 值下降[61]。本研究对新辅助治疗前后ADC 及ΔADC 的定量分析研究进行Meta 分析,结果显示完全缓解组的pre-ADC平均值明显低于非完全缓解组(差值为-0.06×10-3mm2/s),这与许多研究的结果一致[22,32,34],考虑可能是因为在非完全缓解组中存在较多肿瘤坏死组织。组织坏死导致组织灌注差,氧气浓度低以及组织微环境呈酸中毒,从而使肿瘤抵抗放化疗,导致新辅助治疗效果差[62],因此在新辅助治疗前进行MRI 检查并测定肿瘤的ADC 值有助于明确肿瘤特征,预测肿瘤对新辅助治疗的反应,从而确定初始治疗方案,尽早予以个体化治疗。另外,本研究结果显示完全缓解组的post-ADC 平均值及ΔADC 显著高于非完全缓解组,可见新辅助治疗后完全缓解组的ADC值增加程度大于非完全缓解组,放化疗可诱导肿瘤细胞凋亡和坏死、肿瘤结构完全性丧失,并伴有不同程度的纤维化和炎症;此外血管内皮生长因子大量释放,使血管通透性增加,导致原发病灶局部水肿,因此新辅助治疗后ADC 值增加[22,32]。ADC 值增加程度越大说明新辅助治疗疗效越好,实现完全缓解的可能性越大。在诊断价值方面,新辅助治疗前ADC值的诊断价值最低,治疗后ADC值及ΔADC的诊断价值相当,三者的AUC 分别是:pre-ADC 为0.77、post-ADC为0.86、ΔADC为0.86。但是Amodeo等[63]研究表明post-ADC 的诊断准确性较ΔADC 值低,原因可能是post-ADC 不能准确区分残留的肿瘤细胞和治疗后的纤维化。同样,Delli Pizzi 等[32]及Chen 等[64]研究表明ΔADC 相比于pre-ADC、post-ADC 可作为诊断完全缓解的可靠指标。ΔADC 是根据pre-ADC 和post-ADC得出,同时考虑了pre-ADC 和post-ADC 的变化程度。综上,在临床实践中可使用治疗前ADC值预测肿瘤对新辅助治疗的反应,而在评估新辅助治疗后肿瘤是否达到完全缓解时推荐使用ΔADC。

3.2 影响ADC诊断准确性的因素

本研究对可能导致异质性的因素进行Meta回归分析,发现MRI与手术间隔时间可能为研究间异质性来源。新辅助治疗后MRI 评价肿瘤反应的最佳时机取决于新辅助治疗后的手术时机,新辅助治疗对肿瘤的杀伤效应随时间推移而增加[20]。Probst 等[65]研究表明新辅助治疗结束至手术间隔时间大于8 周可提高完全缓解率;而另有研究表明延迟手术并未使患者获益[66-69]。目前国内指南推荐新辅助治疗结束5~7周后行手术治疗[70],但关于最佳MRI检查时机仍缺乏共识,有待进一步研究。

3.3 本研究的优势及局限性

本研究对ADC 诊断LARC 新辅助治疗后完全缓解的相关文献进行了全面检索,纳入文献较全面,纳入研究对象均为LARC 并行nCRT 的患者,本文首先排除研究间的阈值效应,然后计算合并诊断指标,研究结果更加可靠。但本研究存在以下局限性:(1)本文纳入的少数研究质量不高,这可能影响整体研究结论的可靠性;(2)本文从研究类型、磁场强度、不同间隔时间以及结果盲法方面进行了研究间异质性分析,但是尚有其他一些因素也可导致研究间异质性,如检查前是否进行肠道准备、MRI 扫描层厚、检查结果判读者的经验差异等。

综上所述,本研究得出新辅助治疗前ADC值有助于预测肿瘤治疗反应,而新辅助治疗后ADC值及治疗前后ADC变化率的诊断准确性更高。

作者利益冲突声明:全体作者均声明无利益冲突。

猜你喜欢

异质性阈值检索
城市规模与主观幸福感——基于认知主体异质性的视角
管理者能力与企业技术创新:异质性、机制识别与市场价值效应
非平稳声信号下的小波变换去噪方法研究
异质性突发事件对金融市场冲击分析
基于收入类型异质性视角的农户绿色农药施用行为研究
土石坝坝体失稳破坏降水阈值的确定方法
一种改进小波阈值去噪法及其仿真
一种小波阈值函数构建的图像去噪算法研究
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率