基于临床信息的logistic回归模型在乳腺影像报告和数据系统4类中对病灶良恶性的鉴别价值
2020-06-05
南方医科大学南方医院放射科,广东 广州 510515
乳腺癌已成为全球女性死亡的主要疾病之一,其发病率呈逐年上升的趋势[1-2]。在中国,乳腺癌高居女性恶性肿瘤发病率之首,严重影响其身心健康[3]。因此,早发现、早诊断、早治疗,有利于提高乳腺癌的治愈率,降低死亡率。乳腺X线摄影作为主要的筛查手段,在早期诊断中发挥着重要作用[4]。为了更好地指导临床,方便临床医师对乳腺病灶进行综合性评估,美国放射学会(American College of Radiology,ACR)提出乳腺影像报告和数据系统(Breast Imaging Reporting and Data System,BI-RADS)的X线分类标准[5]。尽管这种分类已广泛用于影像学诊断评估,但在临床研究中发现仍然存在大量的良性活检[6]。本研究通过回顾性分析,构建基于临床信息的logistic回归模型并联合BIRADS分类鉴别乳腺病灶良恶性,以提高诊断效能,减少不必要的良性活检。
1 资料和方法
1.1 一般资料
本研究通过了南方医科大学南方医院伦理委员会的批准,所有受检者均签署知情同意书。回顾并收集2018年7月—2019年12月于南方医科大学南方医院行乳腺X线摄影,检查报告BI-RADS分类为4类(包括4A、4B、4C)且经病理学检查证实的女性患者共221例,其中良性133例,恶性88例。所有患者均有完整的临床信息。
1.2 仪器及方法
采用美国Hologic公司的Selenia Dimensions乳腺X线机,所有患者均行头尾位和内外斜位检查。在进行检查前,患者需填写个人信息,包括年龄、初潮年龄、结婚年龄、生育第一胎年龄、是否绝经、哺乳史、生育史、家族史。操作技师填写触诊信息,包括是否触及病灶、病灶是否固定、病灶最大径是否>2 cm等。
1.3 统计学处理
采用SPSS 20.0统计分析软件,对患者年龄、初潮年龄、结婚年龄、生育第一胎年龄等4个临床信息特征行独立样本t检验,对其余7个临床信息特征行χ2检验。采用logistic回归分析检验不同特征与乳腺病灶良恶性之间的关联,筛选有统计学意义的临床信息;入选的临床信息根据比值比(odds ratio,OR),建立乳腺病灶良恶性评分模型,并根据模型的临界值调整BI-RADS分类。具体调整方案:① BI-RADS 4A类病灶,评分<临界值时BI-RADS分类保持不变;评分>临界值时调整为BI-RADS 4B;② BI-RADS 4B类病灶,评分<临界值时调整为BI-RADS 4A;评分>临界值时调整为BI-RADS 4C;③ BI-RADS 4C类病灶,评分<临界值时调整为BI-RADS 4B;评分>临界值时保持不变。采用受试者工作特征(receiver operating characteristic,ROC)曲线评价BI-RADS联合评分模型及单独采用BI-RADS对乳腺病灶良恶性的诊断效能。P<0.05为差异有统计学意义。
2 结 果
2.1 病理学检查结果
221个乳腺病灶中,良性病灶133个,包括乳腺纤维腺瘤40个,乳腺腺病32个,纤维囊性病27个,导管内乳头状瘤16个,炎性反应肿块8个,增生性病变5个,囊肿2个,隆突性皮肤纤维肉瘤1个,管状腺瘤1个,良性分叶状肿瘤1个;恶性病灶88个,包括导管内癌71个,浸润性癌(含小叶及导管成分)14个,乳头状癌2个,肌上皮癌1个。
2.2 临床信息比较
除初潮年龄外,恶性病灶的患者年龄、结婚年龄、生育第一胎年龄均显著高于良性病灶的患者(P<0.05)。经χ2检验,是否触及病灶、病灶最大径是否>2 cm、病灶是否固定等3个特征差异有统计学意义(表1)。
表1 患者临床信息特征分析
2.3 logistic回归分析
以经过病理学确诊的乳腺病灶作为因变量(恶性病灶Y=1,良性病灶Y=0),经logistic单变量分析,发现9个临床信息特征差异有统计学意义。其中是否触及病灶(OR=7.196,P<0.001)、病灶最大径是否>2 cm(OR=4.208,P<0.001)、病灶是否固定(OR=10.15,P<0.001),这3个特征有较高的危险度,2个临床信息特征差异无统计学意义(P>0.05,表2)。将9个差异有统计学意义的临床信息特征进行二元logistic回归分析(表3),并建立评分模型。计算公式:Z=0.037×患者年龄+0.303×是否绝经+0.092×结婚年龄-0.006×生育第一胎年龄+0.481×哺乳史-0.591×生育史+0.141×是否触及病灶+0.743×病灶最大径是否>2 cm+1.949×病灶是否固定-4.756。
表2 单变量logistic回归分析结果
2.4 单独采用BI-RADS分类与BI-RADS分类联合评分模型的诊断效能比较
以病理学诊断结果为金标准,BI-RADS 4A判断为良性,BI-RADS 4B、4C判断为恶性。对221例患者单独采用BI-RADS分类诊断,其诊断乳腺病灶的灵敏度为86.3%、特异度为69.9%、准确率为76.5%,曲线下面积(area under curve,AUC)为0.781;采用BI-RADS分类联合评分模型的灵敏度为88.6%、特异度为75.2%、准确率为80.5%,AUC为0.827(图1)。图2A和图3A为拍摄的患者患侧头尾位及内外斜位图像,通过调整BI-RADS分类,使得其BI-RADS分类与病理学检查结果(图2B、图3B)一致。
表3 二元logistic回归分析的结果
图1 BI-RADS分类与BI-RADS分类联合模型诊断乳腺良恶性病灶的ROC曲线
图2 典型病例1(女性,54岁)的影像学和病理学表现
图3 典型病例2(女性,62岁)的影像学和病理学表现
3 讨 论
BI-RADS分类标准已广泛应用于临床,使乳腺X线摄影报告更加规范,指导临床医师更加准确地对乳腺病灶做出处理,同时对乳腺随访检查起到重要作用。然而,单独应用BI-RADS分类诊断病灶的良恶性会有一定的误判,特别是对于4类病灶[7-8]。为避免不必要的活检,本研究将BI-RADS分类联合基于患者临床信息的logistic回归模型,用于提高鉴别乳腺病灶良恶性的诊断效能。
经logistic回归分析,是否触及病灶、病灶是否固定及病灶最大径是否>2 cm这3个临床特征有较高的危险度。Mazouni等[9]的研究发现,是否触及肿块这个特征的危险度要高于年龄、是否绝经、病灶大小等特征,这与本研究结果一致。另外病灶是否固定的危险度最高,无论是单变量logistic回归分析,还是二元logistic回归分析,表明恶性病灶的触诊位置相对固定,而良性病灶的触诊位置多可移动。目前,仍没有文献对这一特征的风险性进行报道,在未来有望作为乳腺癌的高风险因子以及良恶性的鉴别特征。特征病灶最大径是否>2 cm也存在一定的危险度,表明恶性病灶的最大径要大于良性病灶。
研究表明,患者年龄可作为一个危险因子,随着年龄增高,乳腺癌患病风险逐渐增高[10]。Zheng等[11]把年龄作为特征用于区分乳腺癌患者与正常人,通过ROC曲线得到AUC为0.633,证明年龄具有一定的区分效果。在本研究中,恶性患者的年龄要显著高于良性患者,且在logistic回归分析中,患者年龄具有风险性。Ahern等[12]的研究证实,有家族史的患者其乳腺癌患病风险要高于无家族史的患者。而在本研究中,家族史在良恶性患者中没有风险性,可能与恶性病灶的数据量偏少有关。
根据患者的临床信息特征,我们建立了logistic评分模型,联合BI-RADS分类结果,重新对BI-RADS 4类的病灶进行调整,结果表明,BIRADS联合评分模型较单独应用BI-RADS诊断乳腺病灶的准确率更高。在临床工作中,单独应用BI-RADS分类的灵敏度要高于特异度,说明医师对恶性病灶的判断准确率较高,而在良性病灶上,所给出的BI-RADS分类可能偏高,因此增加了良性活检的次数。而加入本研究所提出的logistic评分模型之后,将7个定义BI-RADS 4B的良性病灶降低为BI-RADS 4A,最后归纳为良性,提高了特异度,有助于降低后续不必要的良性活检。
本研究仍存在不足之处:① logistic回归模型需进一步扩大训练样本量;② 恶性与良性患者的数量比例有待提高。
总之,构建基于临床信息的logistic回归模型并联合BI-RADS分类鉴别乳腺病灶良恶性,有利于提高诊断准确率,减少不必要的良性活检。