多模态超声特征结合机器学习可预测乳腺浸润导管癌中Ki-67的表达水平
2024-10-30储小爱胡爱丽汪珺莉秦信沈春云尹晶夏秦仲唐晓磊
摘要:目的" 探讨多模态超声特征结合机器学习预测乳腺浸润导管癌中Ki-67 高表达的可行性。方法" 回顾性分析155例乳腺浸润导管癌患者,155个病灶经病理证实。术前行常规超声和声辐射力脉冲成像,免疫组化染色记录Ki-67的表达,将患者分为Ki-67高表达组(n=105)和低表达组(n=50)。采用Logistic回归分析得出独立危险因素,采用随机森林及Logistic回归模型预测。结果" 单因素分析显示Ki-67表达与肿块最大径、边界、腋窝淋巴结状态、阻力指数、声触诊组织成像及声触诊组织定量的差异有统计学意义(Plt;0.05)。多因素分析结果显示,最大直径、边界、声触诊组织定量及阻力指数对Ki-67为独立危险因素。随机森林模型结果显示,Ki-67 表达影响因素的重要性排序依次是最大直径、声触诊组织定量、阻力指数及边界。随机森林及Logistic回归模型预测乳腺浸润导管癌中Ki-67高表达曲线下面积分别为0.871、0.866,Ki-67值与肿块直径呈正相关关系(r=0.319,Plt;0.001)。结论" 多模态超声特征结合机器学习可用于预测乳腺浸润导管癌Ki-67的表达水平。
关键词:乳腺浸润导管癌;Ki-67;声辐射力脉冲成像;剪切波速度;机器学习
Value of combining multimodal ultrasound features with machine learning to predict high expression of Ki-67 in breast infiltrating ductal carcinoma
CHU Xiaoai1, HU Aili1, WANG Junli1, QIN Xin1, SHEN Chunyun1, YIN Jing1, XIA Qinzhong2, TANG Xiaolei2
1Department of Ultrasound Medicine, Wuhu Hospital Affiliated to East China Normal University, Wuhu 241000, China; 2Medical Transformation Center, the Second Affiliated Hospital of Wannan Medical College, Wuhu 241000, China
Abstract: Objective To" investigate the value of multi-modal ultrasound features combined with machine learning in predicting high expression of Ki-67 in breast invasive ductal carcinoma. Methods A retrospective analysis was conducted in 155 patients with invasive ductal carcinoma and 155 lesions confirmed by pathology. Preoperative conventional ultrasound and acoustic radiation force impulse were performed, immunohistochemical staining was used to record the expression of Ki-67, and the patients were divided into overexpression groups(n=105)and low expression groups(n=50). Logistic regression analysis was used to analyze the differential indicators to obtain independent risk factors, and random forest and Logistic regression models were used for prediction. Results Univariate analysis showed that there were significant differences in the expression of Ki-67 and the maximum diameter, boundary, axillary lymph node status, resistance index, virtual touch tissue imaging and virtual touch tissue quantification of the lesion (Plt;0.05). Multivariate analysis showed that the maximum diameter, boundary, virtual touch tissue quantification and resistance index were independent risk factors for Ki‑67 expression. The random forest model showed that the influencing factors for Ki‑67 expression were ranked in order of importance as the maximum diameter, virtual touch tissue quantification, resistance index and boundary. The areas under the curve of the random forest and logistic regression models in predicting high expression of Ki-67 in breast invasive ductal carcinoma were 0.871 and 0.866, respectively. There was a positive correlation between the expression level of Ki-67 and the diameter of the lesion (r=0.319, Plt;0.001). Conclusion Multi-modal ultrasound features combined with machine learning can be used to predict the level of Ki-67 expression in invasive ductal carcinoma, providing reference value for clinical diagnosis and treatment.
Keywords: breast infiltrating ductal carcinoma; Ki-67; acoustic radiation force pulse imaging; shear wave velocity; machine learning
收稿日期:2023-09-28
基金项目:安徽省重点研究与开发计划(202104j07020018);安徽省高校自然科学基金(KJ2020A0614)
作者简介:储小爱,主治医师,E-mail: cxa8758@163.com
通信作者:汪珺莉,主任医师,硕士生导师,E-mail:1012901455@qq.com
乳腺癌是女性最常见的恶性肿瘤之一,其发病率逐年上升,并呈现年轻化趋势[1] 。随着个性化医疗和精准医疗技术的迅速发展,肿瘤生物标志物在临床管理中的重要性日益凸显。Ki-67作为一种关键的细胞增殖相关标志物,已被多项研究证明与乳腺癌的复发风险和生存率密切相关[2-4] 。目前,乳腺癌分子分型需通过穿刺或术后标本的免疫组化信息获得,这些检测具有侵入性,亦不能全面代表肿瘤的全部情况。术前如能通过非侵入性方法准确预测乳腺癌分子分型对指导临床治疗具有重要意义。既往研究发现乳腺癌Ki-67表达在超声影像上具有不同的特征表现[5-7] ,但通过机器学习预测的研究较少。本研究在既往研究基础之上结合随机森林模型筛选各特征的贡献率及重要性来预测乳腺浸润导管癌(IDC)的Ki-67表达,从而为临床诊疗和预后提供依据。
1" 资料与方法
1.1" 一般资料
回顾性分析2020年5月~2022年12月在华东师范大学附属芜湖医院接受乳腺癌手术的患者155例进行研究。所有患者术前均行乳腺超声检查,穿刺或手术切除病灶后经病理证实为IDC(n=155,共155个病灶)。患者年龄32~83(56.05±9.53)岁,为单侧单发。依据 Ki-67增殖指数20%为分界点(gt;20%为高表达,≤20%为低表达)将患者分为高表达组(n=105)和低表达组(n=50)。纳入标准:超声及临床资料完整;术前未进行放疗、化疗或穿刺检查;术后有明确的Ki-67值。排除标准:临床资料有缺失;复发癌再手术、远处转移。本研究经院伦理委员会审核批准(2022伦审5号)。
1.2" 超声检查
采用西门子AcusonS2000 US诊断仪配备线阵换能器 9L4(4~9 MHz);常规 B 型超声和声辐射力脉冲成像技术应用于本研究。患者取仰卧位,充分显露乳腺,图像稳定并清晰显示病灶后,选择最能代表病变及其周围组织特征的切面进行分析进行了声辐射力脉冲成像的声触诊组织成像(VTI)(图1C)。然后调整采样框架以覆盖病变及其周围组织,存储最佳图像以供后续分析。使用5分评分来评估乳腺病变。随后应用声触诊组织定量(VTQ)(图1B),将采样框架放置在感兴趣区域中,在测量中避开肿块的钙化区域及液化坏死区。并以m/s为单位测量所选感兴趣区域的弹性剪切波速度(SWV)。SWV连续测量5~7次,计算SWV的平均值。存储VTQ结果以供后续分析。当SWV值显示为“X.XX m/s”时,在排除操作错误,肿块的钙化区域及液化坏死区等因素,SWV值记录为“9.99 m/s”。
1.3" 免疫组织化学
采用免疫组织化学检测IDC生物标志物Ki-67的表达。根据2015年圣加仑国际专家共识[8] ,Ki-67阳性定义如下:计算Ki-67阳性细胞占总细胞的百分比作为增殖指数记录,以增殖指数20%为分界点(gt;20%为高表达,≤20%为低表达)。
1.4" 统计学分析
采用SPSS 23.0进行统计分析。计量资料符合正态分布以均数±标准差表示,组间比较采用t检验;不符合正态分布数据采用中位数和四分位数间距表示,组间比较采用秩和检验。计数资料以n(%)表示,组间比较采用χ2检验。采用单因素分析筛选出具有统计学意义的变量,采用多因素Logistic回归模型进行危险因素分析。采用Python3.8.5构建随机森林及Logistic回归模型,计算ROC曲线下面积(AUC)。以Plt;0.05为差异有统计学意义。
2" 结果
2.1" 两组超声及临床特征比较
单因素分析显示,Ki-67高表达组与Ki-67低表达组在年龄、形态、微钙化、纵横比及血流分级差异无统计学意义(Pgt;0.05)。两组最大直径、边界、腋窝淋巴结状态、阻力指数(RI)、VTI及VTQ的差异有统计学意义(Plt;0.05,表1)。
2.2" Logistic分析多模态超声特征与Ki-67 高表达相关风险因素
将单因素分析中差异有统计学意义的因素(最大直径、边界、腋窝淋巴结状态、RI、VTI及VTQ)作为自变量,纳入Logistic回归模型进行多因素分析,结果显示最大直径、边界、RI及VTQ均是Ki-67高表达的独立危险因素(Plt;0.05,表2)。
2.3" 随机森林模型的因素重要性分析
Ki-67高表达影响因素的重要性排序依次是最大直径、VTQ 、RI及边界(图2)。
2.4" 两种模型的ROC曲线分析
随机森林及多因素Logistic回归模型预测IDC中Ki-67高表达的AUC为0.871、0.866,两种模型预测效能均较高,但随机森林模型的预测效能稍高于多因素Logistic回归模型(图3)。
2.5" Ki-67表达与肿块直径的相关性
当Ki-67表达水平和肿块最大直径均为连续变量时进行Pearson相关分析,结果显示二者呈正相关关系(r=0.319,Plt;0.001,图4)。
3" 讨论
Ki-67是一种与肿瘤细胞增殖活性密切相关的增殖细胞核抗原,其半衰期很短,被认为具有很高的价值[9] 。Ki-67是乳腺癌检测中常用的免疫组化标志物,其表达水平与乳腺癌的侵袭性、类型、治疗效果及预后密切相关。有研究发现Ki-67标志物指数在乳腺良性肿瘤、导管原位癌再到浸润性乳腺癌的表达水平逐渐升高,在正常乳腺组织中,Ki-67表达水平很低(lt;3%)[10] 。因此,肿瘤预后较差通常与Ki-67高表达有关,但在临床上,Ki-67在肿瘤中的表达只能通过术后病理组织染色获得,如何发掘更准确的无创诊断方法具有重要意义。
有研究发现Ki-67与血管内皮生长因子呈正相关,血管内皮生长因子在肿瘤细胞增殖分化过程中促进血管生成,增加血管的通透性及供应营养,这导致肿块生长更快,体积增大,分化程度更高[11-13] 。既往研究发现肿瘤直径与Ki-67表达呈正相关[14-15] ,这一结论与本研究相似。有研究发现阻力指数大小与Ki-67表达相关,恶性肿瘤细胞新生血管壁较薄,缺乏支撑,致血管内压力增加[15] 。此外,恶性肿瘤血管管腔的粗细不均,存在静脉栓子和盲端,致血流阻力增大[16] 。有研究发现乳腺癌肿块的微钙化是 Ki-67的预后不良因素[17-19] ,但本研究中两组间微钙化征象的差异无统计学意义,Ki-67高表达乳腺癌的VTQ高于Ki-67低表达。分析原因可能是肿块的硬度在二维超声上主要表现为钙化的形成。VTQ技术通过超声波获得组织深部的成像信息的方法可以更好地穿透较硬的机体表面,达到组织深部通过数值定量来反应组织硬度。Ki-67高表达肿块可能由于肿瘤细胞过度增殖伴周围缔组织增生、胶原纤维增多而致硬度增大[20] 。
随机森林模型是一种高效的数据分析方式,能够准确地对大规模无规律且复杂的数据进行分类处理[21] 。该模型具有可解释性分类工具,能够快速显示每个危险因素的重要性及排序,并具有较高的分类能力,能全面评估个体差异。本研究建立了预测IDC中Ki-67高表达的随机森林模型,发现最大直径、VTQ、RI和边界是影响因素的重要性排序。本研究采用随机森林与Logistic回归模型AUC分别为0.871、0.866,提示两个模型均有较高的预测效能,而随机森林模型的预测效能较好。
本研究的局限性为:首先,由于乳腺癌是一种多基因疾病,可能需要更多的生物标志物用于诊断评估和早期临床检测,以及用于评估预后和确定术后治疗方案;乳腺癌的病理类型多种多样,但本研究仅针对IDC,其代表性有限;这是一项单中心数据研究,样本量小,正在调查的参数集有限。
综上所述,乳腺多模态超声特征与生物学指标具有一定相关性,结合机器学习有助于筛选高风险人群,从而制定相关防治措施。在未来的临床实践中,可以通过超声图像特征初步评价IDC的预后,从而提高超声在乳腺癌临床诊治中的应用价值。
参考文献:
[1]" " 任晓燕, 陶玉梅, 金晓霞, 等. 雄激素受体在不同分子分型乳腺癌中的表达及临床病理意义[J]. 南京医科大学学报: 自然科学版, 2020, 40(1): 62-6.
[2]" " 胡莺菡, 吴云秋, 邓" 建, 等. 三阳性与HER2过表达型乳腺癌患者新辅助化学药物治疗的疗效对比[J]. 中国普外基础与临床杂志, 2022, 29(12): 1605-10.
[3]" "于" 馨, 曹军英, 金" 壮, 等. 乳腺浸润性导管癌超声表现与雌激素受体、孕激素受体、人表皮生长因子受体-2、Ki-67表达相关性分析[J]. 临床军医杂志, 2022, 50(7): 666-9.
[4]" "梁小静, 王" 莉, 黄晓玲. Ki-67表达与乳腺癌超声征象的关系研究[J]. 医学影像学杂志, 2022, 32(9): 1535-8.
[5]" "李" 英. 不同分子亚型乳腺癌患者超声表现及病理学特征的对比研究[J]. 临床超声医学杂志, 2023, 25(2): 131-6.
[6]" "栾玉爽, 李" 霞, 李媛媛, 等. 不同分子亚型乳腺癌的超声特征[J]. 中国超声医学杂志, 2021, 37(5): 512-5.
[7]" "高军喜, 马方婧, 杨" 磊, 等. 不同分子亚型乳腺癌超声造影特征及定量参数对比研究[J]. 中国临床医学影像杂志, 2019, 30(4): 261-6.
[8]" "Coates AS, Winer EP, Goldhirsch A, et al. Tailoring therapies: improving the management of early breast cancer: St Gallen International Expert Consensus on the Primary Therapy of Early Breast Cancer 2015[J]. Ann Oncol, 2015, 26(8): 1533-46.
[9]" "夏梦楚, 孙井军, 朱亚楠. 超声征象及MRR和TOPK、Ki-67表达与乳腺癌新辅助化疗敏感性的关系[J]. 临床和实验医学杂志, 2022, 21(23): 2564-8.
[10] Hashmi AA, Hashmi KA, Irfan M, et al. Ki67 index in intrinsic breast cancer subtypes and its association with prognostic parameters[J]. BMC Res Notes, 2019, 12(1): 605.
[11] Darwito D, Dharmana E, Riwanto I, et al. Effects of omega-3 supplementation on ki-67 and VEGF expression levels and clinical outcomes of locally advanced breast cancer patients treated with neoadjuvant CAF chemotherapy: a randomized controlled trial report[J]. Asian Pac J Cancer Prev, 2019, 20(3): 911-6.
[12]" 杨自力, 邵" 凯, 赵" 凡, 等. 扩散峰度联合动态增强磁共振成像对乳腺癌预后因子的鉴别诊断价值[J]. 临床放射学杂志, 2023, 42(12): 1876-81.
[13]" 王玉敏, 梁丹艳, 王" 芳, 等. 基于超声造影参数的Logistic回归模型预测浸润性乳腺癌Ki-67表达水平的临床价值[J]. 临床超声医学杂志, 2023, 25(11): 905-9.
[14]" 乐" 坚, 刘雅静, 高" 毅, 等. 常规超声假阴性与钼靶X线假阴性乳腺癌的临床病理特征比较[J]. 中国超声医学杂志, 2020, 36(9): 792-4.
[15]" 石" 红, 杨彦辉, 张亚萍, 等. Nomogram预测乳腺浸润性导管癌Ki-67表达水平[J]. 中国超声医学杂志, 2023, 39(1): 17-21.
[16]" 魏均羽, 韦舒静. 不同直径非肿块型乳腺病变的超声特征表现及多模态超声检查对非肿块型乳腺病变性质的诊断效能[J]. 广西医学, 2023, 45(5): 531-5.
[17]Scott R, Lyburn I, Cornford E, et al. Breast calcification micromorphology classification[J]. Br J Radiol, 2022, 95(1139): 20220485.
[18]" 陈逸凡, 李星阳, 向俊桦, 等. BI-RADS分级在乳腺单纯浸润性非特殊癌中的价值与应用[J]. 分子影像学杂志, 2023, 46(6): 1055-9.
[19]" 吴" 昊, 张可新, 冯佩明, 等. 524例乳腺浸润性导管癌的超声征象与多种免疫组化因子表达的相关性[J]. 分子影像学杂志, 2022, 45(5): 709-17.
[20]" 王" 璐, 张" 曼, 张世坤. 声触诊组织成像面积比法与声触诊组织量化技术对BI-RADS 4类乳腺肿块的鉴别诊断价值[J]. 中国中西医结合影像学杂志, 2023, 21(1): 31-4.
[21]" 陈小鹏, 王会东. 基于随机森林模型的乳腺癌患者术后并发下肢深静脉血栓预测模型的初步研究[J]. 血管与腔内血管外科杂志, 2023, 9(8): 987-91, 1024.
(编辑:熊一凡 )