多层感知器模型预测纯磨玻璃结节肺腺癌浸润程度
2021-01-04巴文娟刘金沙孙婷婷伍建林
尹 柯,巴文娟,汤 敏,刘金沙,汪 琼,孙婷婷,谢 梅,沈 晶,林 琳,伍建林
(大连大学附属中山医院放射科,辽宁 大连 116000)
2011年,国际肺癌研究协会(International Association for the Study of Lung Cancer, IASLC)、美国胸科学会(American Thoracic Society, ATS)和欧洲呼吸学会(European Respiratory Society, ERS)将肺腺癌分为不典型腺瘤样增生(atypical adenomatous hyperplasia, AAH)、原位腺癌(adenocarcinoma in situ, AIS)、微浸润性腺癌(minimally invasive adenocarcinoma, MIA)和浸润性腺癌(invasive adenocarcinoma, IA)[1],其中AIS、MIA和以贴壁生长为主的IA胸部CT多表现为纯磨玻璃结节(pure ground glass nodule, pGGN)[2]。既往研究[3-7]表明,AIS、MIA与IA患者预后存在差异[8-12],因此,准确评估pGGN肺腺癌病理亚型对临床早期正确干预十分重要。人工神经网络起源于对人类大脑思维模式的研究,属于数据建模工具[13-14],其中的多层感知器(multilayer perceptron, MLP)可对输入数据进行非线性分类。本研究利用MLP对pGGN分类,探讨MLP预测pGGN肺腺癌浸润程度的价值。
1 资料与方法
1.1 一般资料 收集2015年1月―2018年10月于大连大学附属中山医院、大连医科大学附属第二医院和大连市中心医院经手术病理证实为肺腺癌的393例pGGN患者作为训练集,男121例,女272例,年龄24~78岁,平均(55.8±11.1)岁;共442枚pGGN,根据病理学诊断分为浸润前病变(pre-invasive lesions, PIL)组(共254枚pGGN,其中AAH 31枚,AIS 62枚,MIA 161枚)和IA组(188枚pGGN)。以2019年6月—8月于大连大学附属中山医院及大连医科大学附属第二医院经手术病理证实为肺腺癌的89例pGGN患者为测试集,男27例,女62例,年龄18~77岁,平均(54.8±11.9)岁;共100枚pGGN,其中PIL组59枚, 包括AAH 10枚、AIS 18枚、MIA 31枚,IA组41枚。纳入标准:pGGN患者,术前1个月内接受胸部CT检查,图像层厚1 mm,pGGN最大径≤30 mm。排除标准:①术前接受化学治疗或放射治疗;②图像存在严重伪影。
1.2 仪器与方法 采用Siemens SOMATOM Definition双源CT及SOMATOM Definition AS 64层CT扫描仪,于吸气末行胸部扫描,扫描范围自胸廓入口至肺底。扫描参数:管电压100~140 kV,管电流200~280 mAs,层厚和层间距均为5 mm,肺窗窗宽1 200 HU,窗位-600 HU;纵隔窗窗宽350 HU,窗位-50 HU,以高分辨骨算法进行后处理,重建层厚为1 mm。
1.3 评估图像 由2名分别具有6年及8年工作经验的医师采用图像存储与传输系统(picture archiving and communications system, PACS)系统评估pGGN的CT征象,意见分歧时由1名具有30年胸部影像学诊断经验的主任医师评判。评估项目包括pGGN形状(圆形、类圆形或非圆形、非类圆形),边缘(是否清晰)以及是否存在胸膜凹陷征、空泡征、空气支气管征及主要血管穿行,后者定义为肺门发出供应各肺段血管至其直达胸膜下区分叉前或各肺段血管分支在其二级分叉之前进入病灶[15],以多平面重建及最大强度投影图像对其进行分析。测量CT定量参数,包括病灶最大径及平均CT值。
1.4 统计学分析 采用SPSS 20.0统计分析软件。连续变量用±s表示。以独立样本t检验比较组间pGGN直径与CT值。以受试者工作特征(receiver operating characteristic, ROC)曲线评价pGGN直径和CT值鉴别诊断pGGN的效能,并获得最佳截断值。采用χ2检验比较组间分类变量,以差异存在统计学意义的指标分别建立二元Logistic回归模型及MLP模型。通过测试集以曲线下面积(area under the curve, AUC)、准确率、敏感度及特异度评估模型的预测效能。P<0.05为差异有统计学意义。
2 结果
2.1 CT征象 训练集IA组pGGN直径(15.34±5.69)mm,CT值(-577.10±98.8)HU,均高于PIL组[(8.76±3.02)mm,(-607.00±112.40)HU,P均<0.05]。以直径10 mm、CT值-675 HU为最佳截断值,pGGN直径>10 mm(χ2=127.296)及CT值>-675 HU(χ2=12.408)的pGGN多为IA(P均<0.001)。PIL组与IA组pGGN形状、边缘、胸膜凹陷征、空泡征、主要血管穿行及空气支气管征差异均有统计学意义(P<0.05)。见表1。
表1 训练集PIL组及IA组CT征象(枚)
2.2 建立模型及评估预测效能 回归分析显示pGGN直径、CT值、主要血管穿行、胸膜凹陷征及空气支气管征是IA的独立危险因素(表2);以之构建的二元Logistic回归模型在验证集的AUC(图1)、预测准确率、敏感度、特异度分别为0.799、0.820、0.683和0.915。
表2 训练集pGGN二元Logistic回归变量分析结果
图1 MLP模型与二元Logistic回归模型检出验证集IA的ROC曲线 AUC分别为0.869和0.799
2.3 建立MLP模型并评估预测效能 以单变量分析显示差异具有统计学意义者作为因子建立的MLP模型见图2。以AUC(0.869)、预测准确率(0.880)、敏感度(0.805)及特异度(0.932)评估MLP模型对于验证集的预测效能,其绝对净重新分类改善指数(net reclassification improvement, NRI)为6%,与二元Logistic回归模型差异具有统计学意义(Z=3.473、P=0.001),见表3;模型验证案例见图3、4。
图2 MLP模型示意图 模型包括1个输入层、1个隐藏层和1个输出层,输入层神经元数16个,隐藏层6个,输出层2个
图3 患者女,42岁,右肺上叶pGGN,术后病理证实为MIA CT见右肺上叶直径10.3 mm类圆形pGGN,CT值-694 HU,边缘清晰,未见胸膜凹陷征、主要血管穿行及空气支气管征,MLP模型及二元Logistic回归模型均判断为PIL 图4 患者女,26岁,右肺上叶pGGN,术后病理证实为IA CT见右肺上叶直径9.6 mm类圆形pGGN,CT值-587 HU,边缘清晰,未见胸膜凹陷征及主要血管穿行,可见空气支气管征, 二元Logistic回归模型判断为PIL,MLP模型判断为IA
表3 MLP模型与二元Logistic回归模型预测验证集的效能比较
3 讨论
随着人工智能辅助CT筛查肺癌在全球范围内逐渐展开,大量pGGN被检出。既往研究[16-17]证实,根据pGGN直径及CT特征如胸膜凹陷征和空气支气管征等,可分析和鉴别其恶性浸润程度。本研究发现,通过评估pGGN的CT特征并建立MLP模型可预测PIL和IAC,并具有较高的AUC、预测准确率、敏感度和特异度。MLP模型具有输入层、输出层以及输入和输出之间的“隐藏”层;一个或多个隐藏层构成神经元,神经元之间的连接赋予相关权重,在迭代过程中不断调整权重以训练学习算法,使得预测误差最小化。
本研究将AAH、AIS和MIA归入PIL组[18-20],此类患者亚肺叶切除术后5年生存率接近100%;对IA而言,肺叶切除术与淋巴结清扫术或采样是标准外科手术方式,术后患者5年生存率60%~88%[8-12],但术中冰冻切片往往难以准确反映腺癌的侵袭性。术前预测pGGN的浸润性有助于制定手术规划方式。为此有必要建立无创性术前预测模型,辅助放射科医师及胸外科医师更好地区分PIL及IA。
既往研究[16]表明,利用二元Logistic回归分析建立诊断模型对于鉴别良恶性磨玻璃结节[(ground glass nodule, GGN),包括pGGN和混合磨玻璃结节(mix ground glass nodule, mGGN)]具有较高诊断价值,但其前期研究模型建立组数据较少,为单中心样本,且未涉及GGN浸润程度及由此带来的手术方式及预后差异。本研究采用多中心较大样本量建立二元Logistic回归预测模型,同时以同一数据样本建立MLP模型,后者只需输入pGGN的放射学特征(是否具有某种CT征象)即可自动预测其分类,较前者具有更高的AUC、敏感度、特异度和预测准确率,与二元Logistic回归模型相比NRI为6%。有学者[18]尝试利用随机森林统计工具预测GGN中的PIL及IA,本研究所获AUC与之近似,但本研究对象是性质更难以判断的pGGN,而mGGN往往多提示为病理学上的IA[21]。
本研究的不足是使用放射学特征,而非直接从CT图像中提取信息,未来将直接以成像数据集来开发用于相同目的的深度学习算法;另外,本研究未纳入患者临床信息资料,可能导致损失部分诊断效能。
总之,本研究发现MLP模型较二元Logistic回归模型预测pGGN为PIL或IA的效能更佳,有望作为一种无创性预测工具,替代或部分替代活检,亦可在pGGN病变早期和随访期间辅助临床进行有效管理,并有助于胸外科医师术前制定合理手术方案,具有较好的临床应用前景。