CT特征联合人工智能定量参数评估ⅠA期肺腺癌高级别组织学亚型
2023-02-23梁演婷李夙芸莫梓阳刘昱琳刘再毅
梁演婷,林 欢,李夙芸,刘 晨,莫梓阳,刘昱琳,刘再毅*
[1.广东省心血管病研究所,广东 广州 510080;2.广东省人民医院(广东省医学科学院)放射科,广东 广州 510080;3.广东省医学影像智能分析与应用重点实验室,广东 广州 510080;4.华南理工大学医学院,广东 广州 510006]
腺癌是肺癌最常见病理类型[1-2]。临床ⅠA期肺腺癌(lung adenocarcinoma,LADC)预后一般较好,患者5年生存率68%~100%[3],但仍有15%~21%患者存在隐匿性淋巴结转移[4]。2020年国际肺癌研究协会病理委员会(International Association for the Study of Lung Cancer Pathology Committee,IASLC)提出的新版病理分级系统[5]将高级别生长方式占比≥20%的LADC定义为高级别LADC,其与较差的生存率和较高的复发率相关,且更易出现淋巴结转移[6-7]。目前仅有少数研究[8-9]发现吸烟、结节类型、最大标准摄取值及能谱CT参数与LADC病理分级有关。本研究探讨薄层CT特征联合人工智能(artificial intelligence,AI)定量参数术前评估临床ⅠA期高级别LADC的价值。
1 资料与方法
1.1 研究对象 回顾性分析2019年1月—2021年6月482例于广东省人民医院经病理确诊的临床ⅠA期浸润性LADC患者,男214例,女268例,年龄27~86岁,平均(58.8±10.8)岁;均于术前30天内接受薄层胸部CT检查,之后均接受亚肺叶切除术或肺叶切除术。排除标准:①CT检查前或术前接受新辅助治疗;②囊腔型肺结节或存在空腔直径>5 mm肺结节;③图像质量差;④病理类型为变异型LADC;⑤无法获得2020年版IASLC病理分级。记录患者年龄、性别、吸烟史、肿瘤家族史及术后病理结果。
1.2 仪器与方法 采用GE Lightspeed VCT/Philips Ingenuity CT/Philips iCT 256/Somatom Definition Flash CT扫描仪。嘱患者仰卧,采集胸部轴位薄层CT图,参数:管电压120 kVp,管电流150~200 mAs,准直器宽度0.625 mm,球管旋转时间0.6 s,FOV 35 cm×35 cm,矩阵512×512,层厚1~1.25 mm。
1.3 CT特征及AI定量参数 由分别具有3、6年胸部影像学诊断经验的放射科医师各1名采用盲法根据肺窗(窗宽1 500 HU,窗位-600 HU)图像评估病变特征:①结节类型(实性/亚实性);②结节最大径;③肺窗实性成分最大径(mm);④实性成分占比=(肺窗实性成分最大径/肺窗结节最大径)×100%;⑤结节形态(分叶征、毛刺征、空泡征、空气支气管征、胸膜凹陷/牵拉征、血管集束征)。计算结节最大径及实性成分最大径的平均值。将图像上传至联影智能肺结节CT影像辅助检测软件(uAI Discover Chest版本号:R001),记录AI定量参数,包括平均CT值、标准差、峰度、偏度及熵。
1.4 病理学分级 2011年版病理分级[9]:G1级,以贴壁型生长为主;G2级,以腺泡或乳头状生长为主;G3级,以实性或微乳头生长为主。2020年IASLC病理分级系统[5]:G1级,以贴壁型生长为主,且高级别生长方式(实性、微乳头型或其他复杂腺体结构)占比<20%;G2级,以腺泡或乳头状生长为主,且高级别生长方式占比<20%;G3级,高级别生长方式占比≥20%。参照2020年IASLC病理分级系统,将G1及G2级归为低级别组(n=366),G3级归为高级别组(n=116)。
1.5 统计学分析 采用SPSS 22.0、R 4.2.1统计分析软件。以±s表示符合正态分布的计量资料,组间行Studentt检验;以中位数(上下四分位数)表示不符合正态分布者,组间行Mann WhitneyU检验;以频数表示计数资料,以χ2检验或Fisher精确概率法行组间比较。采用组内相关系数(intra-class correlation coefficient,ICC)或Kappa检验评估观察者间测量及评价结果的一致性。对AI量化参数进行logistic回归分析,获得个体AI评分(AI-score)。将具有统计学差异的特征纳入向前逐步多因素logistic回归分析,分别构建主观特征模型、AI模型及联合模型。绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC),评价各模型评估效能,并以DeLong检验比较其差异。采用1 000次Bootstrap自抽样方法绘制各模型校正曲线。P<0.05为差异有统计学意义。
2 结果
低级别组LADC患者年龄小于高级别组(P<0.001);组间性别、吸烟史、淋巴结转移、脉管浸润、脏层胸膜侵犯及ALK突变比例差异均有统计学意义(P均<0.01),见表1。
表1 高、低级别LADC患者基本资料及病变病理特征比较
2.1 CT特征 观察者间评价计量资料的一致性良好(ICC:0.901~0.915,P均<0.05),评价计数资料的一致性良好(Kappa:0.844~0.946,P均<0.05)。低级别组262例结节最大径≤2 cm、104例最大径>2 cm;高级别组74例最大径≤2 cm、42例最大径>2 cm。组间肺窗结节最大径、肺窗实性成分最大径、实性成分占比、结节类型、分叶征、毛刺征、空气支气管征、胸膜凹陷/牵拉征及血管集束征比例差异均有统计学意义(P均<0.05),见表2及图1、2。
图1 患者男,48岁,高级别LADC A.胸部轴位平扫肺窗CT图示右肺下叶实性结节(箭)最大径约14 mm,可见分叶征、毛刺征、胸膜牵拉征;B.病理图(HE,×200)示肺浸润性腺癌,腺泡状(约60%)、实性(约35%)及微乳头型(约5%)生长方式 图2 患者男,46岁,低级别LADC A.胸部轴位平扫肺窗CT图示右肺下叶亚实性结节(箭)最大径约14 mm,可见分叶征、毛刺征、空气支气管征;B.病理图(HE,×200)示肺浸润性腺癌,腺泡状(约70%)和贴壁样(约30%)生长方式
表2 高、低级别LADC CT特征比较
2.2 AI-score 高级别组病变平均CT值及峰度高于低级别组(P均<0.05),而标准差、偏度及熵低于低级别组(P均<0.05),见表3。多因素logistic回归分析结果显示,平均CT值和峰度是评估临床ⅠA期高级别LADC的显著特征(P均<0.05),见表4。AI-score=-0.183+0.008×平均CT值+0.089×峰度。
表3 高、低级别LADC AI-score定量参数比较
表4 AI定量参数评估高级别LADC logistic回归分析结果
2.3 评估模型 单因素回归分析显示,12个临床及影像学主观特征(年龄、性别、吸烟史、结节类型、肺窗结节最大径、肺窗实性成分最大径、实性成分占比、分叶征、毛刺征、空气支气管征、胸膜凹陷/牵拉征及血管集束征)和5个AI定量参数(平均CT值、标准差、峰度、偏度及熵)均为评估高级别LADC的独立因子(P均<0.05)。多因素回归分析显示,主观特征中,实性成分占比、结节类型及空气支气管征是评估高级别LADC的独立因子(P均<0.05),以此构建的主观特征模型评估高级别LADC的AUC为0.886[95%CI(0.853,0.919)],敏感度为56.02%,特异度为94.51%;AI定量参数中,平均CT值、峰度是评估高级别LADC的独立因子(P均<0.05),以之构建的AI模型评估高级别LADC的AUC为0.885[95%CI(0.850,0.921)],敏感度为71.61%,特异度为90.71%(图3)。将上述12个临床主观特征和AI-score纳入多因素回归分析,发现空气支气管征[OR=0.31,95%CI(0.17,0.55),P<0.001]、实性成分占比[OR=8.75,95%CI(1.46,52.54),P=0.018)]及AI-score[OR=45.12,95%CI(8.59,237.08),P<0.001)]是评估高级别LADC的独立因子,以之构建的联合模型评估高级别LADC的AUC为0.901[95%CI(0.871,0.932)],敏感度为71.62%,特异度为91.82%(图3)。
图3 不同模型评估高级别LADC的ROC曲线 图4 不同模型评估高级别LADC的校正曲线
上述3个模型预测曲线与实际曲线的一致性均较好,其校正曲线见图4。联合模型评估效能优于主观特征模型(P=0.010)及AI模型(P=0.041),后二者差异无统计学意义(P>0.05)。
联合模型判断实性结节、亚实性结节、小结节(肺窗结节最大径≤2 cm)及大结节(肺窗结节最大径>2 cm)的AUC分别为0.748[95%CI(0.666,0.831)]、0.785[95%CI(0.707,0.864)]、0.905[95%CI(0.867,0.944)]及0.878[95%CI(0.821,0.935)];其评估2011年版IASLC高级别LADC、有无高级别组织学成分、脏层胸膜侵犯及淋巴结转移的AUC分别为0.890[95%CI(0.838,0.942)]、0.894[95%CI(0.863,0.925)]、0.838[95%CI(0.786,0.891)]及0.875[95%CI(0.836,0.915)]。
3 讨论
本研究结合薄层CT特征和AI定量参数评估2020年IASLC临床ⅠA期高级别LADC,结果显示实性成分占比及空气支气管征可作为评估高级别LADC的独立因子,与SHIMOMURA等[10]的结果相符,提示实性成分占比是评估LADC淋巴结转移、浸润程度及预后的重要因子,实性成分越多代表侵袭性越强。空气支气管征代表肿瘤内残存部分支气管结构,可用于区分预后不同LADC的组织学亚型[11];相比低级别LADC,高级别LADC更易压迫或破坏周围肺实质导致支气管截断,其中更少出现空气支气管征。
研究[12-13]认为平均CT值对预测LADC侵袭性具有重要意义,但也有学者[14]持相反意见。本研究联合模型中,以平均CT值及峰度构成的AI-score与高级别LADC显著相关,且与结节类型、实性成分占比等主观特征相比,AI-score的相关性更高。峰度反映结节密度分布的陡缓程度,绝对值越大,其分布形态与正态分布的差异程度越大[15]。本研究中,峰度越大提示LADC级别越高,可能因高级别LADC细胞排列较为紧密,CT多表现为实性结节,故其峰度较大。本研究联合模型评估高级别LADC的效能优于主观特征模型及AI模型,且用于判断是否为2011年IASLC高级别LADC、有无高级别组织学成分、脏层胸膜侵犯及淋巴结转移等也显示出较好性能。
综上,CT特征联合AI定量参数有助于术前无创评估临床ⅠA期高级别LADC。但本研究为单中心、回顾性研究,样本量有限,且仅以一种AI肺结节辅助诊断软件进行分析,未能对不同病理分级肿瘤患者进行随访观察,有待进一步完善。