CT影像组学联合临床特征在预测肺腺癌EGFR突变中的价值
2021-09-16李健维王小雷张书海谢宗玉
李健维,杨 昭,王小雷,张书海,谢宗玉
肺癌是全球癌症相关死亡的主要原因[1],非小细胞肺癌(nonsmall-cell lung cancer,NSCLC)最常见的基因突变是表皮生长因子受体(epidermal growth factor receptor,EGFR)突变[2]。与野生型EGFR病人相比,酪氨酸激酶抑制剂(tyrosine kinase inhibitors,TKIs)对EGFR突变病人有着更高的应答率[3],能够提高病人的无进展生存期[4],改善生活质量,因此TKIs被美国国家综合癌症网络(national comprehensive cancer network,NCCN)推荐为NSCLC的一线治疗方法[5]。活检组织病理学标本最常用于检测EGFR的突变状态,但是由于肿瘤的异质性、取样的偏差、耗时的程序、有创并且增加了癌症转移的风险[6],一定程度上限制了其在EGFR突变检测中的应用。影像组学是从影像图像中高通量地提取大量影像信息,将视觉影像信息转化为深层次的定量影像特征来进行量化研究,不仅有效地解决了肿瘤异质性难以定量评估的问题,而且无创,可以重复进行[7]。影像组学在肺部病变的定性、肺癌的分级与分期、肺癌的疗效评估和预后预测等方面已有较为广泛的研究[8-9],本文旨在探究影像组学联合临床特征在预测肺腺癌EGFR突变状态中的价值。
1 资料与方法
1.1 一般资料 选取2019-2020年蚌埠医学院第一附属医院收治的125例经病理证实为肺腺癌的病人,男51例,女74例,年龄29~82岁。纳入标准:(1)术前2周内接受完整的胸部CT检查;(2) CT检查前未接受任何治疗;(3)病理证实为肺腺癌;(4)临床资料完整。排除标准:(1)术前2周内未接受完整的胸部CT检查(6例);(2)未进行根治性手术治疗(8例);(3)CT检查前接受过系统性或局部性治疗(3例);(4)术后病理证实为非肺腺癌(8例);(5)合并阻塞性肺不张或其他肺部病变(8例);(6)临床资料不完整(3例)。
入组病人中,EGFR突变77例,野生型EGFR 48例。按照6:4随机分成训练组(共74例,其中EGFR突变49例,野生型EGFR 25例)和验证组(共51例,其中EGFR突变28例,野生型EGFR 23例)。临床资料包括年龄、性别、吸烟史。本研究经医院伦理委员会审核通过。
1.2 仪器与方法 所有病人均排除CT检查禁忌证,检查前训练病人吸气后屏气。病人取仰卧位,扫描范围为肺尖至肺底。采用GE Revolution 256排CT(GE Healthcare,USA),管电压120 kV,管电流380 mA,螺距0.992∶1,视野444 mm×444 mm,扫描层厚和层间距均为5 mm,窗宽800 HU,窗位-700 HU,图像重建层厚为0.625 mm。
1.3 CT征象分析 在不告知病理结果的前提下,由两名放射科医生对每位病人进行CT征象评估,意见不一致时,经讨论达成一致后记录主观评估结果。评估项目包括病灶形态(规则或不规则)、密度[实性或磨玻璃(ground glass opacity,GGO)]、边界(清晰或模糊)、分叶征、毛刺征、晕征、钙化、瘤内坏死、空泡、空洞、空气支气管征、外周纤维化、胸膜牵拉、胸膜接触、临近胸膜增厚、胸腔积液、周围肺气肿、肺门/纵隔淋巴结肿大。
具体评价标准(1)病灶大小:目标病灶横断面的最大直径。(2)形态规则:病灶形态呈圆形、椭圆形,包括2或3个波状起伏。(3)形态不规则:病灶形态既不是圆形、椭圆形,也不是分叶。(4)分叶:定义为>3个波状起伏。(5)毛刺:从肿块上突出的尖锐线条。(6)晕征:为磨玻璃影围绕结节或肿块。(7)GGO:为CT图像上肺密度轻度增加,支气管血管束清晰可辨,形似磨玻璃。(8)空泡:肺部肿块内残留的含气肺组织或支气管形成的直径3 mm以内的含气低密度区。(9)空洞:病灶内直径3 mm以上的含气低密度区。(10)空气支气管征:在实变区中可见到含气的支气管分支影。(11)胸膜牵拉:从断层图像显示为近脏层胸膜面见小三角形影或小喇叭状阴影,三角形的底部在胸壁,尖指向结节,结节与三角形影之间可为线状影相连。(12)周围肺气肿:指终末细支气管远端气腔出现持久异常的扩张,并伴有肺泡和细支气管的破坏、肺透亮度增高。(13)肺门/纵隔淋巴结肿大:淋巴结短径>15 mm。
1.4 肿瘤分割、特征提取与降维 将CT平扫薄层图像上传至“医准-达尔文”智能科研平台(www.yizhun-ai.com),在病灶边界手动逐层勾画肿瘤的三维感兴趣体积(volume of interest,VOI)(见图1、2),提取影像组学特征。采用“最小最大值归一化”进行数据预处理,将每一维度特征线性拉伸到指定的区间[1],以使算法收敛更快,得到更加合理的模型。采用LASSO-Logistic算法经验性地保留50个影像组学。经过5折交叉验证后确定LASSO最优调谐参数alpha值,并绘制LASSO系数剖面图。在最优调谐参数alpha处绘制垂直线,得到6个衰减系数非零的影像组学特征。
1.5 模型建立与验证 采用支持向量机(support vector machine,SVM)分类器,结合临床因素、CT征象构建临床模型,结合影像组学特征构建影像组学模型,结合临床因素、CT征象及影像组学特征构建联合模型。
1.6 统计学方法 采用t检验、χ2检验以及logistic回归分析。
2 结果
2.1 一般资料 无吸烟史、毛刺征、GGO以及胸膜牵拉与肺腺癌EGFR突变状态显著相关(P<0.05)(见表1)。
表1 肺腺癌病人的临床因素与CT征象统计[n;构成比(%)]
续表1
2.2 影像特征的选择 共提取936个影像组学特征,经降维最终选取了6个与EGFR突变显著相关的影像组学特征,将其按照权重系数由高到低排列(见图3)。
2.3 模型的构成与预测效能 临床模型由吸烟史、毛刺征、GGO及胸膜牵拉构成;影像组学模型由提取的6个影像组学特征构成;联合模型由吸烟史、毛刺征、磨玻璃密度、胸膜牵拉以及6个影像组学特征构成。联合模型在训练组和验证组中的AUC均高于影像组学模型和临床模型(见表2),联合模型比影像组学模型和临床模型具有更高的预测效能(见图4)。
表2 3种模型在训练组和验证组中的AUC
3 讨论
本研究旨在探究影像组学结合临床对肺腺癌EGFR突变状态的预测效能。本次研究共纳入6个影像组学特征对肺腺癌EGFR的突变状态进行预测,在训练组和验证组中的AUC分别达到了0.818和0.797,高于临床因素与CT征象的预测效能。当影像组学结合临床因素与CT征象后,其预测效能得到进一步提高,AUC分别达到了0.860与0.855,展示出了较佳的预测能力。ZHANG等[10]的研究也表明影像组学对EGFR的突变状态具有较佳的预测效能,其在训练组与验证组中的AUC分别为0.759、0.770,优于临床变量;当影像组学特征结合临床变量后,其AUC分别提高到0.861、0.872,本研究结果基本与之一致。影像组学是将横断面影像阵列(如 CT、MRI、PET-CT)转化为可定量的影像特征,本质上是将图像数据化,进行精准定量分析,大量的影像数据可以实现常规影像学不能达到的医疗数据整合,相比于传统的形态学诊断模式,更为详细、客观与准确,这可能是影像组学模型的预测效能高于临床模型的原因。
峰度作为一阶特征(First order),用于描述感兴趣区域内灰度值分布的陡峭程度。峰度的绝对值数值越大,表示其分布形态的陡缓程度与正态分布的差异度越大[11]。本次研究发现,肺腺癌EGFR突变型与野生型的峰度有较为显著的差异,这与DIGUMARTHY等[12]的研究基本一致。此外,一项研究报告[13]表明,峰度还可以作为肿瘤血管生成的替代标志物,有助于预测和评估EGFR突变型腺癌病人抗血管生成治疗的反应。归一化尺度区域不均匀性(size zone non-uniformity normalized,SZNN)是灰度区域大小矩阵(gray level size zone matrix,GLSZM)特征,为高阶纹理特征,是衡量整个图像大小区域体积可变性的度量[14]。在一项对298例病人的研究[15]中,研究者从病灶平扫CT的VOI中提取影像组学特征,并进行逻辑回归分析,发现SZNN是EGFR突变的危险因素,本研究结果与之一致。在我们的分析中,基于CT图像的肿瘤最大直径并不是EGFR突变的显著预测因子,而基于影像组学的最大2D直径(列)(Maximum 2D diameter Column)却与EGFR突变状态相关,我们认为,这种差异可以部分地由以下事实来解释:CT上评估肿瘤直径是在横断位最大层面上手工测量的,并且限于肿瘤的一个维度,而基于尺寸的影像组学特征则考虑了整个肿瘤。本次研究发现EGFR突变型与野生型肺腺癌病人在吸烟史、GGO、胸膜牵拉方面存在显著差异。先前研究[16-17]表明无吸烟史、GGO以及胸膜牵拉是EGFR突变阳性的独立预测因子, DANG等[18]的研究同样验证了该结果。WANG等[19]发现EGFR突变型肺腺癌病人的GGO体积百分比明显高于野生型病人,这一结果可能与EGFR突变在贴壁为主型腺癌中更常见有关,其在CT上通常表现为GGO为主的结节[20]。此前也有研究[21]表明EGFR突变状态和GGO无关,产生分歧的原因可能是样本量选择存在偏差所致。研究者为了避免病灶血管管腔内高浓度造影剂对病灶产生硬化伪影干扰,遮盖病灶纹理特征,故选取平扫CT图像进行研究。
本研究存在几点不足之处:(1)样本量小;(2)病灶VOI是由放射科医生手动分割完成,一定程度上受到观察者主观意识的影响,特别是在肿瘤具有GGO成分和短毛刺的情况下,它们的边缘通常与邻近正常的肺实质分界不清,难免产生分割误差;(3)本研究为回顾性研究,存在一定偏倚。
总之,我们的研究发现肺腺癌EGFR突变状态与某些影像组学特征之间存在一定的相关性,影像组学特征有望成为鉴别EGFR突变的潜在替代生物标记物,这些特征结合临床因素与CT征象后可以前瞻性地预测肺腺癌的EGFR突变状态,为EGFR突变病人的临床精准治疗提供支持。