超声影像组学对乳腺BI-RADS 3类及以上结节良恶性鉴别诊断的应用价值
2023-09-21周牧野侯迎迎马小开孙医学
苏 蕾,周牧野,李 阳,郭 婕,侯迎迎,马小开,孙医学
近年来,乳腺癌的发病年龄呈年轻化趋势,对其治疗的方案也更倾向个体化、精准化,因此,在保证病人生存获益的前提下,同时要满足女性的正常生理、生活需求,乳腺癌的手术范围不断缩小,手术方式更加微创,以期最大程度保留病人乳房的功能,减少术后可能带来的并发症,这就对乳腺癌的精确诊断提出更大的挑战。目前,对于乳腺疾病的筛查普遍利用超声来进行,并依据BI-RADS分类[1]标准进行诊断,但不同医生的诊断存在一定的主观差异性。而影像组学作为新型影像图像技术,通过提取、量化图像的高维特征,对定量数据进行分析,避免主观误判。本研究基于超声影像组学,通过构建统计学模型来分析及预测超声诊断为BI-RADS 3类及以上乳腺结节的良恶性。现作报道。
1 资料与方法
1.1 一般资料 选取2018年6月至2021年11月蚌埠医学院第一附属医院收治的乳腺结节病人164例,均为女性,年龄26~68岁,平均(41.7±8.4)岁,共164个病灶,且经超声诊断均为BI-RADS 3类及3类以上,后经病理证实良性病灶71例,恶性病灶93例。纳入标准:(1)所有病人图像清晰,肿瘤形态能完全显示在图像中;(2)病人行超声检查获取图像前均未行任何辅助治疗;(3)病人除乳腺肿瘤外均未有其他肿瘤。排除标准:(1)获取病理前提示存在远处转移或合并其他肿瘤;(2)超声图像存在大量声影,肿瘤较大导致感兴趣区(ROI)不能完全勾画。本项目经蚌埠医学院伦理委员会批准,伦科批字[2022]第186号。
1.2 超声检查及方法 选用GE S8彩色超声诊断仪,高频线阵探头11L-D,频率3~11MHz,对病人进行图像采集。病人选取仰卧位,行双侧乳腺常规超声扫查,记录图像中结节的大小、数目及位置,根据病灶形态、大小、边界、内部回声、后方回声衰减特征、钙化及病灶与周围组织之间关系等进行BI-RADS分类,多枚结节共存的情况下,只保留分类等级最高的结节作为ROI选取,所有图像经由2名具有7年以上乳腺超声诊断经验的医生采集并评估,最终综合一致性意见得到分类结果。采集图像时调节频率、焦点、增益及时间补偿曲线使图像达到最佳成像质量。每个乳腺肿瘤病人选取最大长轴切面图像,导出为DICOM格式文件。
1.3 图像预处理 原始图像由960 mm×720 mm×1 mm体素尺寸(Voxel Size)、1 mm×1 mm×1 mm体素间距(Voxel Spcaing)和[0,255]的灰度值构成。在特征提取之前对每幅图像都进行相同的标准化预处理,将原始3D图像转换为960 mm×720 mm像素尺寸,1 mm×1 mm像素间距,且对灰度值进行Z-score标准化处理,获得均值为0、标准差为1的灰度图像。转换公式:(x-μ)/σ,x为原始像素点值,μ为原始像素均值,σ为原始像素标准差。
1.4 ROI勾画、特征提取及数据预处理 所有图像由一名副高职称医生使用3D-slicer(Version 4.11.0,www.slicer.org)软件对病灶ROI进行手动勾画,并由另一名副高职称医生核查,导出肿瘤图像及ROI掩模(见图1)。使用Python(Version 3.7.6,www.python.org)的Pyradiomics程序库[2]对所有原始图像进行小波变换(Wavelet filter)及指数变换(Exponential filter),获得16幅变换图像,同时提取原始图像、小波变换及指数变换图像的2D组学特征。对所有提取的超声组学特征值进行Z-score标准化处理。
1.5 特征建模与统计分析
1.5.1 特征初步筛选 为了消除特征之间多重共线性对预测结果的影响,组内采取Pearson相关系数对重复性较高的特征进行筛选,相关系数r>0.9的特征认为与其他特征高度线性相关,并予以剔除。组间采用t检验和Mmann-whitney检验,筛选P>0.05的特征予以剔除,剩余特征入组待下一步降维、筛选。
1.5.2 特征降维及建模 将164个病灶按照3∶1的比例依据BI-RADS分类随机分层分为训练集(n=123)和测试集(n=41)。训练集用于特征降维、筛选及建立模型,测试集用于评估模型。运用L1正则化(LASSO)算法对剩余入组特征进行压缩、降维,采用十折交叉验证筛选最优lambda值,特征系数不为0的参数作为最终纳入超声影像组学评分模型Radscore的变量。
1.6 统计学方法 采用Mmann-whitney检验、t检验、χ2检验和Pearson相关性分析,运用错配率、ROC曲线及曲线下面积(AUC)评价二元logistic回归模型的预测能力。
2 结果
2.1 一般资料 164个病灶中,共71例良性病灶,93例恶性病灶。训练集123例,测试集41例。训练集与测试集组结节最大径、良恶性分布以及类别分布差异均无统计学意义(P>0.05)(见表1)。
表1 训练集和测试集良恶性病灶数及BI-RADS分类结果
2.2 特征筛选及模型构建 在训练组上使用特征提取器将每幅图像提取567个特征,组内运用Pearson相关系数剔除r>0.9的特征,共有289个特征予以保留,组间经过t检验和Mmann-whitney检验,筛选出P<0.05的特征。组内和组间初筛后剩余97个特征。采用LASSO进一步对以上特征进行降维,将特征数压缩成8个影像组学特征和一个截距值,同时获得最优Lambda值0.033 28,错配率0.072 4(见图2),8个特征包括1个一阶特征、2个2D形体学特征及5个纹理特征,5个原始图像特征,1个对数变换特征,2个小波变换特征,见表2中①~⑧。
表2 特征筛选表
利用上述特征建立二元logistic回归方程,Radscore(Radscore:1.Radscore=1.292 039 07×①-1.827 093 27×②+0.171 499 44×③+0.016 014 77×④+0.471 442 47×⑤-0.178 953 20 ×⑥-0.146 347 98×⑦+0.343 899 66×⑧-⑨)为最终保留的特征与其对应系数乘积之和再与截距(Intercept)相加,最终预测变量为是否为乳腺癌概率P(二分类逻辑回归模型:概率P=1÷(1+e-Radscore),特征系数为数据标准化过后的回归系数及截距值(见表2)。
2.3 模型的诊断效能 在测试集41例病人超声图像上对影像组学模型进行验证。模型的敏感性、特异性、阴性预测值、阳性预测值、准确性、Youden指数分别为87.51%、84.62%、90.91%、77.78%、85.00%、0.7033,AUC为0.854(0.707~0.946)(P<0.01)(见图3)。结果表明超声影像组学鉴别良恶性乳腺病变具有良好的诊断效能。
3 讨论
目前,对乳腺疾病的影像学诊断包括超声、钼靶和MRI等。MRI虽然具有多序列成像特点,但对于较小病灶的检测具有一定的局限性,而且需要依赖Gd增强和弥散加权成像来辅助判断。钼靶X线具有高分辨率成像特点,但为重叠的静态图像,当乳腺腺体增多时,X线发现病灶难度增加,无法进行精准诊断,且具有辐射性。而超声具有图像清晰无重叠,检查方便快速,无辐射,发现病灶准确等特点,常作为首选的检查手段。超声影像组学作为新的影像组学技术,近些年被逐渐重视。超声基于声波成像,不同于其他影像学的密度及氢质子成像方式,运用组学对超声图像分析方面可以获得其他影像组学不同的特征信息,从而构建不同的模型,因此超声影像组学是乳腺疾病诊断技术中不可或缺的一部分。
本研究采用超声影像组学对超声图像进行特征提取和特征降维、分析,提取特征分为训练集和测试集数据。在训练集中动态的降低模型分类结果与真实分类结果之间的误差从而筛选Lamdba值和最佳特征参数,构建逻辑回归模型,最终因变量返回为乳腺癌的概率P。测试集上运用ROC曲线及AUC方法验证逻辑回归模型分类的准确性。模型分类的敏感性和特异性较高,分别为87.51%和84.62%。筛选出的8个超声组学特征用来构建模型,提取了包括一阶直方图特征、2D形态学特征和高阶纹理特征[3]。其中original_shape2D_Elongation和original_shape2D_Sphericity为形态学特征,Elongation将图像分成两个主体部分,计算其伸长率,Sphericity为反映图像球形率的特征。original_firstorder_Entropy为一阶直方图特征熵,反映图像灰阶分布的随机性。而其余5个均是高阶纹理特征[4],original_glcm_ClusterProminence反映ROI集群突出的特征,纹理集群越突兀,不对称性越大,其值越大。original_glrlm_RunEntropy反映灰度行程的不确定性,其值增加,ROI的异质性和不均匀性增加。exponential_glrlm_RunLengthNonUniformity测量灰度游程相似性,较低值表示灰度长程更加均匀。Wavelet-LH_gldm_DependenceVariance测量ROI区域灰度依赖方差大小。Wavelet-LH_glszm_ZoneEntropy反映ROI灰度分布区域的不确定性和随机性,值越大表明随机性越大。相对于一阶直方图特征与形态学特征,纹理特征作为诊断、鉴别良恶性肿瘤具有明显的意义,肿瘤纹理特征表示肿瘤图像的像素排布与空间像素关系[5],代表肿瘤生长发展的纹理异质性表现[6]。以上这些表现在图像上无法辨别,同时也难以发现这些微观信息与疾病发生的内在联系。
超声组学对鉴别乳腺病变的良恶性的研究较少,多数集中在对甲状腺结节的分析[7]。本研究数据纳入了BI-RADS 3类及以上的结节,因3类及以上结节均具有恶性潜能,而BI-RADS分级高也并非完全是恶性,有研究[8]表明,BI-RADS 4类结节良性率高达62%,恶性可能性为2%~95%[9]。大部分影像组学对鉴别乳腺癌良恶性的研究集中在MRI及X线,既往资料显示MRI及X线利用影像组学鉴别乳腺结节的AUC分别为0.75~0.81[10]、0.76~0.86[11],而本研究的AUC为0.85,更是高于MRI组学,与X线组学基本接近。
影像组学利用机器学习思想建立模型预测乳腺疾病的性质已经得到证实[12-13],本研究通过对乳腺BI-RADS 3类及以上结节的分析发现,超声影像组学作为影像组学对乳腺肿瘤良恶性鉴别诊断具有重要价值,同时拥有快速、经济以及无辐射等特点,但研究存在一定的局限性。首先,本次研究选取样本为单中心样本,需要多中心样本来增加模型的泛化性;其次,影像图像不同于自然图像容易获得,同时由于病灶的异质性等原因不能运用自然图像的图像增强技术来处理,存在一定的模型过拟合问题,今后将开展多中心、大样本研究,同时改进超声影像图像的提取技术,减少过拟合等问题,增加模型预测的泛化性及准确性。