基于灰阶超声的不同影像组学模型鉴别乳腺肿块良恶性的价值
2022-03-03潘婷婷桑彩影李静怡于阿丽孙明睿谢玉海
周 艳 叶 磊 潘婷婷 张 清 桑彩影 李静怡 于阿丽 孙明睿 谢玉海
在女性中,乳腺癌的发病率和死亡率均最高,早期诊断和早期治疗是提高乳腺癌生存率及生存质量的最佳途径[1-2]。目前,超声是临床上最常用的筛查方法,但其对乳腺癌诊断的灵敏度和特异度较低[3-5],且受到医师的诊断水平影响较大。影像组学(Radiomics)于2012年由Lambin等[6]首次提出,2016年被Radiology正式命名,作为一种新兴的前沿科学领域,目前已成为研究的热点。影像组学是通过高通量的特征提取,利用大规模的训练队列来阐明图像特征与疾病状态之间的相关性,从而为临床诊断提供重要信息。本研究基于乳腺肿瘤灰阶超声的影像组学特征,采用5种方法构建模型,旨在探讨各模型间的表现能力及最优模型预测乳腺肿块良恶性的临床价值。
1 资料与方法
1.1 一般资料 回顾性分析2018年10月至2020年10月皖南医学院附属太和县人民医院行乳腺超声检查的180位女性患者资料,年龄27~83岁,平均(54.41±13.00)岁;每位患者均有1个乳腺肿块纳入研究,共180个乳腺肿块。纳入标准:①有完整的临床及超声影像资料;②超声检查前未行任何临床治疗。排除标准:①无病理结果;②超声图像不佳,影响兴趣区(region of interest,ROI)勾画;③超声检查与手术间隔时间超过14 d者。
1.2 图像采集 采用三星麦迪逊RS80A超声诊断仪,配备L3-12A线阵探头,频率5~12 MHz。由具有丰富乳腺超声诊断经验的医师采集图像,每幅图像包含肿瘤的最大横切面和纵切面,导出原始图像(DICOM格式),用于特征提取。
1.3 图像分割、预处理和特征提取 由一名高年资主治医师(医师1)和一名副主任医师(医师2)在不知病理结果的情况下,分别使用3D Slicer 4.10.2软件手动完成肿块ROI的勾画并进行特征提取。见图1。从形态、直方图、纹理和小波4个方面共提取851个乳腺肿块的高通量特征。见表1。为了保证结果的可重复性,通过标准差标准化算法对原始数据进行预处理。
图1 乳腺肿块ROI勾画示意图
表1 影像组学特征名称及数量
1.4 特征一致性检验 医师1进行2次ROI勾画及特征提取,间隔时间为2周。医师2进行1次ROI勾画及特征提取。采用组内和组间相关系数(inter and intra correlation coefficient of groups,ICC)评价测量者自身和测量者之间的一致性。测量者自身的ICC评价使用医师1前后2次的测量结果进行分析,测量者之间的ICC使用医师1和医师2的测量结果进行分析;ICC>0.75认为一致性较好[7]。本研究最终采用医师2提取的影像组学特征参数进行降维建模。
1.5 特征降维和建模 在180个样本中按照7∶3比例随机抽样分成训练组(n=126)和验证组(n=54)。降维在训练组上进行,分两步,第一步采用单因素方差分析进行降维,对符合正态分布的参数行t检验,非正态分布的参数行秩和检验。第二步采用最小绝对收缩和选择算子(least absolute shrinkage and selection operato,LASSO)筛选最优特征用于模型构建。
1.6 统计学方法 采用R软件(Version 3.6.1)进行统计学分析,使用软件包有psych、pROC、glmnet、rpart、rpart.plot、random forest、e1071、adabag。以病理结果为金标准,P<0.05为差异有统计学意义。
2 结果
2.1 临床资料分析 180例乳腺肿块中100例为恶性,均为浸润性乳腺癌;80例为良性,均为纤维腺瘤,其中32例合并有乳腺腺病。训练组126例乳腺肿块中恶性70例、良性56例,验证组54例乳腺肿块中恶性30例、良性24例。训练组与验证组中,浸润性乳腺癌与乳腺纤维腺瘤患者的年龄差异无统计学意义(P>0.05)。
2.2 一致性检验 测量者自身(见图2A)和测量者之间(见图2B)均具有较高的一致性(P>0.05)。通过一致性检验ICC=0.75剔除其中27个特征后,剩余824个特征用于进一步分析。
注:A为观察者内一致性比较;B为观察者间的一致性比较。
2.3 特征降维 通过单因素方差分析及最小绝对收缩和选择算子(Lasso)进行降维,从824个影像组学特征选取8个系数非零的影像组学特征。见表2、图3。
2.4 影像组学模型鉴别价值 通过两步降维将筛选出的8个最优特征与其对应的加权系数乘积构成线性组合形成预测患者良恶性模型标签,运用逻辑回归、决策树、随机森林、支持向量机和集成算法进行模型建立,结果见表3。在训练组,随机森林和支持向量机模型的表现能力略高于决策树和逻辑回归,集成算法最差,但在验证组,随机森林和逻辑回归模型的表现能力最强,而在验证组鉴别乳腺肿块良恶性的准确性、灵敏度、特异度、阳性预测值和阴性预测值以逻辑回归模型最佳,其值分别为83.33%、91.70%、83.33%、85.71%、81.82%。见图4。
表2 系数非零的影像组学特征
注:A为使用10倍交叉验证法筛选特征的特征系数收敛图;B为使用10倍交叉验证法调节参数λ绘制。左边和右边的虚线分别表示最小准则和1-标准误差准则,本研究选择标准为1-标准误差准则,共选出8个最优特征特征。
表3 5种模型的表现能力
注:逻辑回归模型训练组(A)和验证组(B)的ROC曲线;决策树模型训练组(C)和验证组(D)的ROC曲线;随机森林模型训练组(E)和验证组(F)的ROC曲线;支持向量机模型训练组(G)和验证组(H)的ROC曲线;集成算法模型训练组(I)和验证组(J)的ROC曲线。
3 讨论
常规超声检查作为一种便捷、无创又经济的影像检查技术广泛应用于乳腺肿瘤的筛查及随访,但对乳腺肿块良恶性的鉴别缺乏特异性,且受到操作者主观性影响较大。影像组学是一种通过自动化的高通量的特征提取,利用大规模的训练组来阐明图像特征与疾病状态之间的细微关系,从而鉴别患者乳腺肿块良恶性[8]。近年来,影像组学在临床中的应用研究越来越多,主要是用于肿瘤良恶性的判断[9-12]、病理分级[13]、新辅助放化疗疗效的评价[14-15]以及预测淋巴结的转移[16-17]等。
目前,影像组学建模的常用方法有逻辑回归、K-近邻、支持向量机、随机森林、决策树、集成算法和人工神经网络[18]。本研究通过对选取8个系数非零的影像组学特征分别运用了逻辑回归、决策树、随机森林、支持向量机和集成算法建模,结果表明逻辑回归模型的表现能力最强,尤其是对验证组的预测能力高于其它4种模型,其预测乳腺肿块良恶性的曲线下面积(area under the curve of ROC,AUC)、准确性、灵敏度、特异度、阳性预测值和阴性预测值在训练组和验证组分别为0.949、87.30%、82.14%、94.30%、93.48%、83.75%和0.879、83.33%、91.70%、83.33%、85.71%、81.82%,在两组间均具有较高的诊断效能,这与既往研究[19-21]结果相一致。集成算法模型的表现能力最差,决策树、随机森林和支持向量机模型在训练组和验证组的表现能力差异较大,说明这3种模型存在过拟合现象。
刘丽等[22]研究表明,常规超声检查对乳腺肿块良恶性判断的准确性、灵敏度、特异度分别为79.17%、81.48%、64.81%。张春菊等[23]使用超声弹性成像对乳腺良恶性肿块鉴别的准确性、灵敏度、特异度分别为77.94%、79.49%、75.86%。陈爽等[24]研究表明,超声造影、弹性成像诊断乳腺癌的准确性、灵敏度、特异度分别为74.60%、73.53%、75.86%和71.43%、70.58%、72.41%。本研究结果表明,逻辑回归模型标签预测乳腺癌的准确性、灵敏度、特异度、阳性预测值和阴性预测值在训练组和验证组分别为87.30%、82.14%、94.30%、93.48%、83.75%和83.33%、91.70%、83.33%、85.71%、81.82%,均优于常规超声、超声弹性成像和超声造影。本研究最终选取的8个系数非零的影像组学特征全部为纹理特征和小波特征,提示二维灰阶超声图像的纹理特征和小波特征可反映肿块的异质性。
本研究创新点在于对基于灰阶超声影像组学特征的5种预测模型进行了比较,但不足之处有样本量较少且为单中心研究,因此,后期需要增大样本量并进行多中心研究,以进一步验证和提升影像组学模型的预测能力。
综上,在基于常规二维灰阶超声的影像组学模型中,逻辑回归模型表现能力最强,能有效预测乳腺肿块良恶性。