APP下载

PI-RADS v2.1与PI-RADS v2对前列腺癌诊断性能比较的Meta分析

2023-11-13白国杰李珂欣刘文远兰广郭红孙雅苹王煜童卫玲张克宇

肿瘤防治研究 2023年10期
关键词:总体敏感度前列腺癌

白国杰,李珂欣,刘文远,兰广,郭红,孙雅苹,王煜,童卫玲,张克宇

0 引言

MRI已成为临床可疑前列腺癌(prostate cancer, PCa)患者的重要检测工具。MRI引导前列腺穿刺活检可以提高有临床意义的前列腺癌(clinically significant prostate cancer, csPCa)的检测准确性[1]。目前,前列腺影像报告和数据系统(prostate imaging-reporting and data system,PI-RADS)是解释前列腺MRI不可或缺的一部分,其目的是对前列腺癌进行风险分层,以指导组织学检查以及临床治疗方法的选择。自从2012年PI-RADS v1发表以来,2015年对其进行了重大修订(PI-RADS v2),但PI-RADS v2仍表现出一些局限性,比如观察者间的一致性只有良好到中等,对移行带(transition zone, TZ)前列腺癌的诊断准确性不高。因此2019年对PI-RADS v2再次进行了修订(PI-RADS v2.1),旨在为MRI解释提供更精确的定义,以减少观察者之间的差异,提高诊断准确性,特别是对于TZ病变[2]。Linhares Moreira[3]等学者研究显示PI-RADS v2.1诊断性能没有显著提高,然而Wang等[4]学者的研究显示PI-RADS v2.1在诊断csPCa的特异性显著降低,Oerther等[5]学者研究则表明,PI-RADS v2.1在评估TZ病变方面特异性和准确性明显高于PI-RADS v2。因此,PI-RADS v2.1的诊断性能仍然存在不确定性。因此,本研究拟对文献进行Meta分析,评价PI-RADS v2.1和PI-RADS v2在检测csPCa方面的诊断性能。

1 资料与方法

1.1 文献检索与筛选

检索中国知网(CNKI)、万方数据库、中国生物医学文献数据库(CBM)、Medline、Embase、Web of Science、Cochrane Library数据库,检索时间从建库至2022年4月16日。检索词为“PIRADS 2.1”或“PIRADSv 2.1”或“PI-RADS 2.1”或“PI-RADS v2.1”等,采用主题词加自由词对数据库进行文献检索,结合人工检索,并对纳入文献的参考文献进行二次检索。

由三位医师进行文献检索和初始标题/摘要审查,然后由两位医师阅读全文后以协商一致方式进行文献筛选,如仍不能达成一致,由经验更丰富的两位医师共同加入,共四位医师协商一致。不符合纳入标准的研究,如与研究目标相关,仍保留供一般审查和参考。

纳入标准分为主要标准和次要标准。主要标准:(1)PI-RADS v2.1与PI-RADS v2诊断性能比较的相关研究;(2)PI-RADS v2.1与PI-RADS v2在前列腺癌诊断方面的敏感度(sensitivity,SEN)、特异性(specificity, SPE)、阳性预测值(positive predictive value, PPV)和阴性预测值(negative predictive value, NPV)的研究;(3)文献构建2×2列联表,提供真阳性(true positive,TP)、假阳性(false positive, FP)、假阴性(false negative, FN)、真阴性(true negative, TN)数据,或提供足够的数据可以计算以上数据。次要标准:(4)关于PI-RADS v2.1和PI-RADS v2的观察者间一致性的研究;(5)提供PI-RADS v2.1和PI-RADS v2的PI-RADS有关类别csPCa比率。满足主要纳入标准(1)(2)(3),但不符合次要纳入标准(4)和(5)的研究也被纳入本研究。

排除标准:(1)会议论文、病例报道、评论、综述以及Meta分析;(2)不符合主要纳入标准的研究;(3)样本量小于30的研究。

1.2 数据提取

数据提取与合成由四名医师根据《Cochrane干预措施系统性评审手册》和《系统评价与荟萃分析首选报告项目》(PRISMA)检查表中的指南进行。

数据提取根据预先设计的表格进行数据提取,数据包括患者人口统计学、血清PSA、样本量、MRI扫描仪强度、DWI最高b值、观察者人数、前列腺分区和参考标准。PI-RADS v2.1和PIRADS v2的TP、FP、FN和TN计数直接或通过重新计算从每项研究中得出,构建2×2列联表。

1.3 文献质量评价

由研究员根据QUADAS-2对纳入的研究进行质量评价,如仍不能达成一致,由经验更丰富的医师加入,协商一致。

1.4 统计学方法

使用STATA软件(Stata/MP 17.0)和ReMan(Review Manager 5.4.1)进行Meta分析。使用森林图表示每项研究的PI-RADS v2.1与PI-RADS v2的敏感度、特异性,并对SEN、SPE、阳性似然比(positive likelihood ratio, PLR)、阴性似然比(negative likelihood ratio, NLR)、诊断比值比(diagnostic odds ratio, DOR)进行合并,以综合受试者工作特征曲线(summary receiver operator characteristic curve, SROC)表示。对三个协变量:肿瘤位置(移行带)、阈值(阈值3与阈值4)、作者国籍(中国与外国)进行亚组分析。

2 结果

2.1 数据库检索结果

共检索到文献552篇,中文112篇、英语440篇,去除重复文献后共236篇,通过阅读标题与摘要排除215篇(不相关文献159篇,综述29篇,评论10篇、会议论文6篇、学位论文11篇)。选择21项研究进行全文阅读,其中6篇与研究内容不相符被排除,3篇数据不完整被排除,最终共12项研究被纳入Meta分析,文献筛选流程见图1。

图1 文献筛选流程图Figure 1 Process of literature screening

2.2 纳入文献的基本特征

12项研究共纳入3 158例患者,3 243个病灶。患者年龄41~86岁,血清PSA 0.5~129.3 ng/ml。

纳入的12项研究,对PI-RADS v2.1与PI-RADS v2在csPCa诊断性能方面进行了研究,其中6项关于TZ研究,1项研究外周带(peripheral zone, PZ),2项研究PZ、TZ及总病变,3项研究没有进行分区。

所有研究均为回顾性研究,7项研究以PIRADS评分3~5分为阳性,1~2分为阴性;5项研究以PI-RADS评分4~5分为阳性,1~3分为阴性。所有研究都通过穿刺活检或前列腺切除术组织学诊断,以病理结果作为诊断标准,Gleason(GS)评分≥7和(或)体积≥0.5 cm3和(或)包膜外侵犯的病灶定义为csPCa。文献特征见表1。

表1 纳入Meta分析的12项研究的基本特征Table 1 Basic characteristics of 12 studies in the Meta-analysis

使用诊断准确性研究质量评估工具(QUADAS-2)对文献进行质量评价,见图2。

图2 QUADAS-2质量评价Figure 2 QUADAS-2 assessment

2.3 PI-RADS v2与PI-RADS v2.1对前列腺癌的诊断性能分析

2.3.1 整个腺体(包括PZ、TZ、ALL)诊断性能 对所有分区及整个腺体(包括PZ、TZ、ALL)共12项研究3 243处病变,所有纳入单个研究PI-RADS v2与PI-RADS v2.1诊断准确性的敏感度均较高,总体敏感度分别为0.93(0.80~0.96)和0.93(0.77~0.98);特异性均稍低,总体特异性分别为0.53(0.25~0.89)和0.61(0.24~0.91),纳入的每个研究详细敏感度、特异性,见图3。PI-RADS v2的总体敏感度、总体阴性似然比与PI-RADS v2.1比较差异较小,PI-RADS v2的总体特异性、总体阳性似然比、总体诊断比值比比PI-RADS v2.1略低,见表2。与 PI-RADS v2相比,PI-RADS v2.1在所有分区及整个腺体检测csPCa性能的SROC曲线下面积(area under curve, AUC)较大,见图4A。

表2 PI-RADS v2.1 vs.PI-RADS v2对整个腺体及移形带csPCa的诊断性能 (95%CI)Table 2 Diagnostic performance of PI-RADS v2.1 vs.PI-RADS v2 for the whole gland and transition zone csPCa (95%CI)

图3 所有分区PI-RADS v2.1与PI-RADS v2诊断性能森林图Figure 3 Forest maps of diagnostic performance of PI-RADS v2.1 and PI-RADS v2 for all zones

图4 PI-RADS v2.1 vs.PI-RADS v2诊断性能SROC曲线Figure 4 SROC curves of diagnostic performance ofPI-RADSv2.1 vs.PIRADSv2

2.3.2 肿瘤部位(分区)诊断性能亚组分析 (1)TZ区诊断性能:纳入TZ研究共8项2 205处病变。PI-RADS检测移形带前列腺癌与整个腺体诊断性能基本相同,PI-RADS v2的总体敏感度、总体阴性似然比与PI-RADS v2.1差异较小,PI-RADS v2的总体特异性、总体阳性似然比、总体诊断比值比比PI-RADS v2.1略低,见表2。与PI-RADS v2相比,PI-RADS v2.1在检测TZ区csPCa性能的SROC曲线下面积(AUC)较大,见图4B。(2)PZ区诊断性能:纳入PZ研究共3项1 513处病变,由于STATA软件metandi命令要求至少4项研究才能合并分析,因此未能合并诊断性能指标和也未绘制SROC曲线。

2.3.3 不同阈值(阈值为3vs.阈值为4)诊断性能亚组分析 共7项研究采用阈值3,采用阈值3时,PI-RADS v2.1总体敏感度较PI-RADS v2没有明显提高;PI-RADS v2.1总体特异性较PI-RADS v2有所提高;共5项研究采用阈值4,采用阈值4时PI-RADS v2.1总体敏感度较PI-RADS v2没有明显提高;PI-RADS v2.1较PI-RADS v2总体特异性有所提高。无论是PI-RADS v2还是PI-RADS v2.1,采用阈值3时,总体敏感度均较采用阈值4时稍高,采用阈值4时,总体特异性均较采用阈值3明显提高,见表3。PI-RADS v2.1结合4为阈值检测csPCa性能的SROC曲线下面积(AUC)最大,见图4C。

表3 不同阈值及不同作者国籍PI-RADSv2.1 vs.PI-RADS v2诊断性能的比较 (95%CI)Table 3 Diagnostic performance of PI-RADS v2.1 vs.PI-RADS v2 for different thresholds and different nationalities of the authors (95%CI)

2.3.4 不同国籍(中国vs.国外)诊断性能亚组分析 纳入的中国研究共5项,中国的研究PI-RADS v2与PI-RADS v2.1的总体敏感度相同;PI-RADS v2的总体特异性较PI-RADS v2.1有所提高;纳入的国外研究共7项,国外的研究PI-RADS v2.1的总体敏感度较PI-RADS v2没有明显提高,PI-RADS v2.1的总体特异性较PI-RADS v2有所提高。中国的研究PI-RADS v2和PI-RADS v2.1总体敏感度和国外的研究相同,总体特异性明显高于国外研究,见表3。PI-RADS v2.1的中国研究在检测csPCa性能的SROC曲线下面积(AUC)最大,见图4D。

3 讨论

高危患者在前列腺活检前进行MRI检查,以对其进行风险分层,指导前列腺活检。PI-RADS旨在标准化前列腺MRI的成像参数、术语和报告[18]。PI-RADS v2虽然在临床得到广泛应用,但仍有局限性,如DWI评分模糊、不同研究之间诊断准确性存在差异等[19]。因此,在2019年引入了PI-RADS v2.1,在不改变PI-RADS v2总体目标的情况下,通过微小的修改来改善这些局限性[2]。PI-RADS v2对T2加权成像(T2weightedimaging, T2WI)评分为2分的病变未进行分类,PI-RADS v2.1的一个重要变化是T2WI对TZ评分为2分病变进行分类评估,如果DWI评分≤3分,那么病变总评分为2分,如果DWI评分为≥4,那么病变总评分提升至3分。典型囊变的良性前列腺增生(benign prostatic hyperplasia, BPH)结节T2WI评分为1分,新分类的“非典型结节”T2WI评分为2分。

本研究结果表明,PI-RADS v2.1与PI-RADS v2检测csPCa的敏感度(分别为0.92与0.93)都较高,从v2升级到v2.1版本总体敏感度并没有明显提高,但是在TZ中,敏感度稍微有所提高(0.92与0.93),但提高也并不明显。因此,对于临床怀疑前列腺癌的患者,MRI被推荐作为筛查的一线检查手段[20]。然而其特异性都比较低,尽管PI-RADS v2.1的特异性(0.64)较PI-RADS v2(0.57)有所提高,但总体还是处于中等水平。这可能会影响患者主动监测的长期成本效益,因此MRI靶向活检监测被整合到主动监测方案中,以优化诊断,改善监测期间疾病状态评估[21-22]。PI-RADS v2.1特异性有所提高,可能由于基于DWI序列的非典型结节由2分(PI-RADS v2)升级到了3分。由于DWI序列是肿瘤多参数MR成像的重要序列,有学者建议T2WI评分为3分、且DWI评分<4分的TZ病变可降至2分,这可能会提高PIRADS的特异性。

本研究结果与Lee等[23]学者的研究结果有些不同。Lee的Meta分析显示PI-RADS v2.1比v2的特异性显著降低,该分析纳入了8项研究(本研究纳入了其中7项研究,其中1项研究[4]没有明确指出是关于csPCa的而被排除),并且Lee的研究只纳入了英文文献,本研究纳入了5篇中文文献,并且本研究采用Lee纳入的8项研究进行验证时得出结果与其结果一致,目前结果的差异可能是本研究纳入了更多的研究,导致研究结果异质性增大。本结果与Park等[24]学者的Meta分析结果基本一致。

此外,本研究还对阈值和作者国籍进行了亚组分析。研究发现不管阈值为3还是4,PI-RADS v2.1与v2诊断csPCa的SEN、SPE、PLR、NLR、DOR差异均明显;然而,不管PI-RADS v2.1还是v2在阈值取4时,SPE、PLR、DOR都比阈值取3时有显著提高。在不同国籍的亚组分析中也得到类似的结果,不管中国还是外国,PI-RADS v2.1与v2诊断csPCa的SEN、SPE、PLR、NLR、DOR差异不显著;然而,不管PI-RADS v2.1还是v2在中国研究中,SPE、PLR、DOR都比外国的研究有显著提高。这提示选取不同阈值可能会造成研究异质性,同时中国的研究特异性明显高于国外的,可能与国内学者大多选取阈值为4有关。

本研究尚存在一定局限性:(1)各研究之间存在一定的异质性,但在可接受范围内;(2)不同研究的扫描参数不同可能会影响研究结果一致性;(3)纳入的文献相对较少,但我们已经纳入常见数据库的所有相关文献,纳入的12项研究的总体数量较少,关于PZ区研究少于4项,而未能进行亚组分析;(4)纳入研究均为回顾性研究,这可能会引入发表偏倚。与2015年发布的PI-RADS v2相比,PI-RADS v2.1在2019年刚刚实施,相对较短的经验也可能是研究结果中的混淆因素。

PI-RADS v2.1与PI-RADS v2比较,在诊断性能方面并没有显著提升,总体特异性仍为中等水平,这可能导致阴性活检率增加,特别是对于PIRADS评分为3分的病变特异性较差,可以考虑通过调整阈值来提高总体诊断的特异性。

利益冲突声明:

所有作者均声明不存在利益冲突。

猜你喜欢

总体敏感度前列腺癌
用样本估计总体复习点拨
2020年秋粮收购总体进度快于上年
前列腺癌复发和转移的治疗
关注前列腺癌
认识前列腺癌
全体外预应力节段梁动力特性对于接缝的敏感度研究
外汇市场运行有望延续总体平稳发展趋势
前列腺癌,这些蛛丝马迹要重视
电视台记者新闻敏感度培养策略
直击高考中的用样本估计总体