基于CT影像组学数据构建的综合模型预测乳腺癌新辅助化疗疗效价值的研究

2021-02-13段艳莉杨光杰王洋洋毛艳苗文杰颜蕾左盼莉金萌麻杰李晓旭王振光

精准医学杂志 2021年6期

段艳莉杨光杰王洋洋毛艳苗文杰颜蕾左盼莉金萌麻杰李晓旭王振光

(1 青岛大学附属医院PET-CT中心，山东青岛 266061； 2 青岛大学附属医院乳腺病诊疗中心； 3 慧影医疗科技(北京)有限公司)

乳腺癌是女性最常见的恶性肿瘤，近年来发病率逐年上升[1-2]。目前的治疗方法主要是外科手术，但分期较晚的乳腺癌术后预后明显变差[1]。新辅助化疗(NAC)是指对非转移性的肿瘤在手术及应用局部治疗前进行系统性的辅助性的细胞毒性药物治疗,亦称术前化疗、诱导化疗或初始化疗，可使进展期肿瘤“降级降期”，使更多患者获得手术治疗机会，还可降低复发转移风险，改善预后[3-5]。NAC目前已经成为大多数乳腺癌，尤其是局部进展期乳腺癌的标准治疗方法[3,6]。但是乳腺癌是一种高度异质性肿瘤，虽然大多数患者可以从NAC中获益，但是仍然有少数患者因对NAC治疗反应较差而影响预后[7]。所以有效预测乳腺癌NAC临床疗效，准确筛选乳腺癌NAC的潜在获益人群是临床面临的重要问题。

目前尚无公认的可以有效预测乳腺癌NAC疗效的临床因素，越来越多的研究表明影像组学数据联合临床特征等多种因素的综合模型对预测乳腺癌NAC疗效有较好的效能[8]。影像组学可从医学影像图像中高通量提取图像参数，对肿瘤的异质性进行表征，在肿瘤诊断、疗效评价和预后评估中具有重要价值[9-10]。研究证实通过MR和PET影像组学分别从肿瘤组织的弛豫时间、糖代谢的异质性进行表征，预测乳腺癌NAC疗效准确性较高[2,11]，也表明了影像组学在预测乳腺癌NAC中具有重要价值。尽管目前乳腺超声、钼靶、MR是乳腺癌推荐的首要检查方式，但是CT检查的作用也不能忽视，例如在评估乳腺癌临床分期中占据重要位置，尤其是对胸骨、肺甚至内乳区淋巴结等乳腺癌常累及部位能进行更好的诊断。目前研究表明基于CT的影像组学可对肿瘤组织密度的异质性进行表征，进而实现对肿瘤放化疗疗效做出精准预测，筛选放化疗的潜在获益人群[9-10,12]。所以CT影像组学有望对乳腺癌NAC疗效进行有效预测，甚至可以联合MR以及PET影像组学构建更为精准的预测模型。但是目前CT影像组学预测乳腺癌NAC的价值尚未见研究报道。本研究拟基于CT影像组学联合临床特征数据建立综合模型，并验证其预测乳腺癌NAC疗效的价值。

1 资料与方法

1.1 一般资料

收集2017年1—12月于我院行NAC的109例乳腺癌患者的临床资料并进行回顾性分析。患者年龄32～74岁，平均(51.6±10.1)岁。纳入标准：①病理确诊为单侧原发浸润性乳腺癌并且无远处转移的女性患者；②在NAC开始前2周内进行了胸部CT检查，并接受了完整的NAC治疗者；③NAC治疗之后并进行了术后Miller-Payne(MP)病理分级者[13]；④临床资料完整者。排除标准：①同时患有影响乳腺癌影像的其他乳腺疾病者，如乳腺炎症性疾病、乳腺良性病变等；②经2名影像医师一致确认因肿瘤边界不清难以确定肿瘤三维感兴趣区(ROI)者；③CT图像质量较差者。收集患者的临床基本资料，包括年龄、体质量指数(BMI)、肿瘤直径、绝经状态、淋巴结转移状态(淋巴结短径>1 cm定义为淋巴结转移)、雌激素受体(ER)、孕激素受体(PR)、人表皮生长因子受体2(HER-2)、肿瘤增殖细胞核抗原67(Ki-67)、乳腺癌分子分型、NAC疗效MP病理分级结果。其中，肿瘤直径测量的是CT图像横断面/冠状面/矢状面上肿瘤的最长径，多发肿瘤者只测量最大病灶的直径，并选取最大病灶勾画肿瘤ROI；ER、PR、HER-2、Ki-67、乳腺癌分子分型为患者接受NAC前信息；ER/PR阳性的定义为核染色≥1%的肿瘤细胞，ER/PR阴性的定义为核染色<1%的肿瘤细胞；HER-2阳性的标准为IHC染色评分3+或FISH检测阳性[14]；乳腺癌分子分型分类为luminal A型(ER/PR+、HER-2-、Ki67低表达)、luminal B1型(ER/PR+、HER-2-、Ki67高表达)、luminal B2型(ER/PR+、HER-2+)、HER-2阳性(ER/PR-、HER-2+)及三阴性(ER-、PR-、HER-2-)[2]。MP病理分级总共分为G1～G55级[13]。

根据美国国立综合癌症网络(NCCN)指南[15]，所有的患者在手术前接受4、6或8个周期的NAC，治疗方案以紫杉烷/蒽环类/紫杉烷和蒽环类为基础，HER2阳性患者还接受了曲妥珠单抗(负荷剂量8 mg/kg，维持剂量6 mg/kg)治疗。所有患者依据NAC后MP病理分级结果进行分组，MP病理分级G3～G5者为有效组，G1～G2者为无效组。同时再依据CT检查时间将患者分为2组，检查时间为2017年1—9月的77例患者为训练集，检查时间为2017年10—12月的32例患者为验证集。其中，训练集中MP病理分级G3～G5者为A1组，G1～G2者为A2组，验证集中MP病理分级G3～G5者为B1组，G1～G2者为B2组。本研究经医院伦理委员会批准(伦审批件号：QYFYWZLL26303)。

1.2 仪器与方法

患者均采用SIEMENS 64排螺旋CT行胸部扫描，扫描范围为胸廓入口至膈顶。扫描参数：管电压120 kV，管电流220～250 mA，扫描层厚5 mm，层间距5 mm。

1.3 影像组学分析

1.3.1肿瘤分割将CT图像从图像存储与传输系统(PACS)以DICOM格式导出，采用ITK-SNAP软件(version3.8.0，www.itksnap.org)对肿瘤病灶进行手动勾画ROI(图1)。先随机选取出30例患者，由2名具有3年(医师1)和8年(医师2)以上胸部CT诊断经验的医师逐层手动勾画肿瘤ROI，提取影像组学特征，计算医师1与医师2两者之间的相关系数(ICC1)；2周后由医师1再次对上述30例患者进行ROI勾画，计算医师1前后2周的ICC2。剩余79例患者由医师1独立完成肿瘤ROI勾画。

1.3.2影像组学特征提取通过radiomics cloud platform V3.1.0(慧影医疗科技(北京)有限公司)进行图像预处理及影像组学特征提取。影像组学特征包括强度特征、形状特征、纹理特征以及图像滤波特征4个方面，其中图像滤波特征使用了包括指数、平方、平方根以及对数4种类型的滤波器，及wavelet-LLL、wavelet-HHH、wavelet-HLL、wavelet-HHL、wavelet-LLH、wavelet-HLH、wavelet-LHL、wavelet-LHH 8种小波变换滤波器组合方式。

1.4 统计学分析

采用R软件(Version:3.3.3，https://www.r-project.org)对数据进行统计学分析。

1.4.1临床特征分析及临床特征模型构建对A1组、A2组间临床特征进行单因素比较，筛选有统计学差异的临床特征构建临床特征模型。其中，计量资料比较采用t检验，计数资料比较采用卡方检验。以P<0.1为检验标准。

1.4.2影像组学特征的筛选与影像组学模型构建通过最大相关最小冗余(mRMR)算法、最小绝对收缩和选择算子(LASSO)回归分析对影像组学特征进行降维，选择出具有最佳鉴别价值的影像组学特征构建影像组学模型，并计算影像组学得分。

1.4.3综合模型构建及效能评价将单因素分析获得的有差异的临床特征和最佳影像组学特征，通过Logistic多元回归分析构建联合临床特征和影像组学得分的综合模型，并绘制包含临床特征和影像组学得分的列线图。通过ROC曲线分析评价临床特征模型、影像组学模型、综合模型这3个模型在训练集和验证集中预测乳腺癌NAC疗效的效能，计算相应曲线下面积(AUC)以及95%CI、诊断灵敏度、诊断特异度。再以Hosmer-Lemeshow拟合优度检验评价列线图的拟合度，绘制校正曲线。通过Delong检验比较临床特征模型与综合模型之间效能差异是否具有统计学意义。通过决策曲线评价综合模型预测乳腺癌NAC临床疗效净获益的价值。

2 结果

2.1 患者临床特征模型的建立

训练集中A1组42例，A2组35例；验证集中B1组17例，B2组15例。单因素分析结果显示，A1组和A2组间肿瘤直径与绝经状态比较差异有显著性(P=0.057和0.076)，而年龄、BMI、淋巴结转移状态、ER、PR、HER-2、Ki-67、乳腺癌分子分型比较差异无显著性(P>0.1)。B1组和B2组间PR比较差异有显著性(P=0.072)，而年龄、BMI、肿瘤直径、绝经状态、淋巴结转移状态、ER、HER-2、Ki-67、乳腺癌分子分型比较差异无显著意义(P>0.1)。见表1。将训练集中有差异的临床特征进行Logistic多元回归分析后构建临床特征模型，模型方程为：Ln(π/1-π)=(-0.097)×肿瘤直径+1.141×绝经状态。

表1 训练集和验证集中患者临床特征比较

2.2 影像组学特征提取、筛选及影像组学特征模型的构建

通过radiomics cloud platform V3.1.0，共提取到1 409个影像组学特征，为了排除两名医师勾画ROI的差异，选取ICC1和ICC2均大于0.75的影像组学特征，得到931个影像组学特征。再通过mRMR算法和LASSO回归分析后，最终得到12个最佳的影像组学特征(图1)。利用所得到的影像组学特征与LASSO回归系数进行线性拟合计算影像组学得分，以Radscore表示，并根据影像组学得分绘制影像组学得分图(图2)。结果显示，训练集和验证集Radscore差异具有显著统计学意义(t=-4.844、-1.443，P<0.05)。影像组学得分计算公式：Radscore=0.192×lbp_2D.firstorder.10Percentile+0.768×wavelet_HHH.glcm.SumSquares-0.314×wavelet_HLH.glszm.HighGrayLevelZoneEmphasis-0.117×wavelet_LLH.firstorder.Skewness+0.062×wavelet_LHL.glszm.LargeAreaLowGrayLevelEmphasis+0.225×wavelet_HHH.glcm.JointAverage+0.211×lbp_2D.firstorder.Median+0.391×wavelet_LHL.firstorder.Maximum+0.023×wavelet_HLH.firstorder.RootMeanSquared-0.094×square.firstorder.10Percen-tile+0.379×wavelet_HHH.firstorder.Variance+0.154×wavelet_LHL.glcm.DifferenceVariance-0.269

图1 筛选获得的12个影像组学特征及其所占权重

A：训练集影像组学得分示意图，B：验证集影像组学得分示意图

2.3 综合模型的构建及其效能评估

将训练集中有显著差异的临床特征(肿瘤直径与绝经状态)与影像组学得分通过Logistics多元回归分析构建综合模型，回归方程为：Ln(π/1-π)=(Intercept)×2.014+肿瘤直径×(-0.199)+绝经状态×(-1.964)+影像组学得分×2.769，并绘制列线图(图3)。绘制的ROC曲线显示，综合模型具有较好的预测效能(图4)，其预测NAC临床疗效的AUC高于临床特征模型(表2)。绘制的校正曲线(图5)显示综合模型预测乳腺癌NAC疗效具有良好的拟合性。

图3 基于临床特征联合影像组学得分的综合模型的列线图

A：训练集各模型ROC曲线分析，B：验证集各模型ROC曲线分析

A：训练集校正曲线，B：验证集校正曲线

表2 训练集和验证集中各模型预测疗效的ROC曲线分析

Delong检验结果表明，临床特征模型与综合模型间的AUC有显著统计学差异(训练集Z=2.922，P<0.05，验证集Z=2.318,P<0.05)，说明影像组学得分对临床特征预测乳腺癌NAC疗效具有重要增益价值。绘制的决策曲线示综合模型较临床模型预测乳腺癌NAC疗效具有较高的净获益(图6)。

图6 综合模型和临床特征模型预测乳腺癌NAC疗效的决策曲线

3 讨论

目前，通过NAC可以使肿瘤“降级降期”，增加了患者手术的机会，提高了患者的生存质量，已成为局部进展期乳腺癌的标准治疗方法[3,6]。但目前临床上缺乏可以有效预测乳腺癌NAC疗效的方法。

本研究基于CT影像组学建立了预测乳腺癌NAC疗效的综合模型，并通过验证集进行了效能验证，结果证实基于影像组学联合临床特征的综合模型具有较好的预测效能。综合模型预测效能明显优于临床特征模型，说明影像组学对临床模型具有重要的增益价值，而且综合模型较临床特征模型具有更高的临床净获益。

在既往关于临床特征与乳腺癌NAC疗效关系研究中发现，乳腺癌NAC疗效与肿瘤直径、ER、PR、HER-2有关[8,16]。在本研究临床特征分析中，训练集中仅直径和绝经状态在A1组和A2组间具有一定差异，然而，在验证集中仅PR在B1组和B2组间具有一定差异，这可能与样本量有一定关系。在训练集中，建立的临床特征模型AUC为0.70，然而这两个指标在验证集中显示出较差的预测效能(AUC为0.49)。联合影像组学特征之后，综合模型的鉴别效能明显提高(训练集AUC为0.88，验证集AUC为0.78)。Delong检验证实综合模型明显优于临床特征模型，差异有统计学意义，表明CT影像组学对临床特征模型有重要的增益价值。

目前，国内外已有研究报道了基于影像组学的预测模型评估乳腺癌NAC疗效的应用价值。如LI等[2]通过FDG PET/CT影像组学预测乳腺癌NAC病理完全缓解(pCR)，回顾性分析了100例接受过NAC的乳腺癌患者，发现联合临床特征和PET/CT影像组学的综合模型的AUC达到0.958(训练集)和0.730(验证集)，均优于临床预测模型。杨志企等[8]分析了91例乳腺癌动态对比增强MRI(DCE-MRI)图像，通过建立影像组学特征预测乳腺癌NAC pCR的价值，结果显示通过联合基于治疗前DCE-MRI影像组学特征和ER、PR建立的联合诊断模型对于预测NAC pCR具有较高的价值。此外，LIU等[11]通过多中心研究对586例乳腺癌进行回顾性分析后发现，结合了临床特征与影像组学特征的综合模型预测乳腺癌NAC pCR的AUC显著高于临床模型。以上研究均证实了基于影像组学的综合模型预测乳腺癌NAC疗效具有较高的准确性，影像组学在预测乳腺癌NAC疗效中具有重要价值。本研究通过对109例行NAC的乳腺癌患者进行回顾性分析，证实基于CT影像组学的综合模型同样对预测乳腺癌NAC 疗效具有较高的预测效能，明显优于临床模型，而且具有更高的净获益。

此外，本研究的统计学检验水准为P<0.1，临床特征统计学分析中显示肿瘤直径与绝经状态在两组中具有一定差异(P=0.057和0.076)，与传统统计学检验水准(P<0.05)不相符。但我们仍把这两个因素纳入模型中，因为一般在临床预测模型的研究中，具有统计学差异很多时候并不是纳入模型的标准，只是其中一个参考，入选模型的标准依次是指南推荐、高循证水平的Meta分析、综述、现有模型、文献报道有差异因素、单样本统计学差异等。有文献证实这两个因素和NAC的疗效相关，本研究中两者P均稍大于0.05可能与样本量有关。结果表明肿瘤直径联合绝经状态诊断NAC效能AUC为0.70，但在验证集中较差。我们后续将扩大样本量进一步改善模型。

另外，本研究也存在一定的局限性，第一，患者病例数较少，有待扩大样本量进一步研究；第二，未将乳腺癌NAC方案及疗程纳入研究，有待进一步细化；第三，对肿瘤范围ROI的确定为手动勾画，不同操作者对影像组学特征的测量有一定的误差和偏倚；第四，本研究为单中心研究，缺乏对影像组学特征的独立外部验证，为了得到更准确的研究结果，后续研究有待加入更大样本量的多中心研究。

综上，本研究通过建立预测乳腺癌NAC疗效的综合模型，进一步说明了影像组学对临床特征模型具有重要的增益价值，也表明了基于CT影像组学联合临床特征构建的综合模型对乳腺癌NAC疗效具有较高的预测效能，有助于指导乳腺癌患者个体化诊疗。