非小细胞肺癌预后预测模型的建立与验证
2022-01-29桂思语桂思吟
桂思语 桂思吟
肺癌作为一种恶性程度极高的肿瘤,是2018 年全球癌症相关死亡主要原因(发病率11.6%,死亡率18.4%),近一半新发肺癌病例和半数以上死亡病例发生在亚洲[1],约占男性癌症患者癌症死亡率的19%[2]。肺癌总诊断率中,非小细胞肺癌(NSCLC)约占85%,预后差[3]。癌细胞异常突变是表观遗传和表位转录组改变等的结果[4]。化疗产生的耐药性[5]和多发性高频转移极大限制了其临床疗效和患者中位生存时间,所以寻找一种简便有效的预测模型、为肺癌患者提供个性化的治疗手段显得尤为重要。本文研究了不同因素对NSCLC 患者预后的影响[6],包括年龄、性别和吸烟状况、电离辐射[7]、空气污染(职业接触和环境致癌物也是增加肺癌发病率的因素)等,发现ANN 具有良好的预后预测性能。
1 资料与方法
1.1 一般资料
本研究资料来源于淮南东方医院集团肿瘤医院肺癌诊断中心、微创中心和肺癌患者。本研究中的患者数据在收集前获医院批准且每个受试者均签署了知情同意书。研究对2016 年1 月—2019 年6 月收治的507 例NSCLC 患者,男性356 例,女性151 例,年龄58~74岁,腺癌254 例,鳞癌101 例,大细胞癌12 例,其他类型140 例,汇总所有资料人口统计学特征。数据集按8 ∶2 随机分为训练集和验证集,训练集的患者的年龄58~74,平均(66±4.31)岁;验证集的患者的年龄60~74 岁,平均(65±3.96)岁。训练集包括405 个样本单元,221 例预后良好,184 例较差。其余55 例预后良好,47 例预后差。利用训练集建立模型和诺莫图,缺失数值被多重插补代替,验证集被用来评估每个模型的有效性,研究遵循TRIPOD 声明。
1.2 研究方法
病历进行回顾性分析,肿瘤分期和病理分型的确诊基于第8 版TNM 分期系统和国际癌症控制联合会发表的病理学文献。
1.3 统计学方法
采用SPSS 20.0 和R(3.4.1 版)软件分析数据,采用Pearson 检验或Fisher 精确概率法进行计数资料单因素分析,用t检验比较分类变量和连续变量的分布。采用logistic 多元回归、cox 多元回归模型、神经网络模型、决策树模型、随机森林模型和诺莫图,P<0.05 被认为差异有统计学意义。
2 结果
将不同人口学特征的变量(P<0.05 和P<0.001)纳入各模型,得到各模型具有统计学意义的因子和指标的C 指数结果,如表1 所示。同时绘制ROC 曲线并计算相应曲线下面积的AUC,如图1。决策树调整后模型如图2;随机树森林调整后模型如图3;神经网络调整后模型如图4。根据各自变量大小回归系数制定评分标准,计算每个患者的诺莫图如图5、6。
表1 调整前后神经网络、随机森林、决策树、Logistic 多元回归和Cox 多元回归模型的评价指标
3 模型概述
经过不同模型的多向分析,可见:神经网络模型的预测性能最高(AUC=0.985),其次是随机森林模型(AUC=0.881),而logistic 回归模型(AUC=0.746)略低于cox 回归模型(AUC=0.855),决策树的预测性能最低(AUC=0.723)。
与线性模型(包括logistic 回归和cox 回归)相比,非线性模型对NSCLC 患者的预后有更好的预测效果。其次,泛化能力弱的树突状模型(如决策树)对NSCLC患者预后的预测性能低于线性模型(如logistic 回归),但线性模型的预测性能低于泛化能力强的树模型(如随机森林)。
4 讨论
4.1 模型比较
临床应用中建立预测模型需要考虑以下几个方面:自变量选择、自变量与因变量之间的关系、自变量之间的关系、选型(简单线性,广义线性,混合线性,降维,弹性处理线性和非线性的能力,可视化等)。Logistic 回归和Cox 回归属于广义线性方程,神经网络和决策树属于分类模型,随机森林属于非线性拟合模型。这些模型的优缺点不尽相同,在临床预测中均得到了广泛的应用,因此分析模型的特点对于临床工作者和预测模型在临床疾病中的应用都极为重要。
Logistic 和cox 回归模型用来描述不随时间变化的多个特征对某一时间死亡率的影响,是广义线性半参数回归模型[8],而ANN 是按不同层次组织的多个物流单元的网络,每一层的输出变量作为下一层的输入变量,原始特征是输入层。在NSCLC 预测模型中,ANN 是生物神经系统数学模型的推广,具有最高的预测精度和性能(AUC=0.985),对于给定数据集的输入输出映射关系有极好的学习能力[9],具有固有的非线性特性,更适于复杂数据模式的精确建模,被应用于许多医学领域如心脏病、胃肠病、神经内科、儿科、肺内科、肿瘤学等[10],如Hart 团队[11]通过对年龄、BMI、吸烟史、心脏病等信息的处理得到ANN 预测肺癌危险性的敏感度为75.3%,特异性为80.6%。ANN 反映了生物神经系统处理外界事物的基本过程,反映了人脑功能的多种反应[12],它是在模拟人脑神经组织的基础上开发的计算系统。数学理论证明,三层神经网络能以任意精度逼近任意非线性连续函数。
树模型根据给定的预测变量对所有特征进行逐一处理,线性模型将所有特征相加得到新的值,这正是决策树与logistic 回归的分类差异之处。Logistic 回归是将所有特征转化为概率后,将其划分为大于某一概率阈值的特征,将小于某一概率阈值的特征划分为另一类;决策树是每个特征的分区。此外,logistic 回归能找到线性分割(除非x 是多维映射的,否则输入特征x 与logit 之间是线性的),而决策树只能找到非线性分割。因此,树模型更接近人类的思维方式,产生可视化的分类规则,并且生成的模型是可解释的(规则可以提取)。树模型拟合的函数实际上是分区间的阶跃函数。随机森林是一种Bagging 算法。由于树的组合,RF 可以处理非线性数据,属于非线性分类(拟合)模型。作为非线性拟合的代表,其优良的非线性映射能力使其特别适用于解决内部机制复杂的问题,如非小细胞肺癌的预后预测。决策树模型对异常缺失值的处理能力较强,但数据不稳定、准确性较差。随机森林解决了其泛化能力弱的问题,每棵树独立生成,处理高维数据无需特征选择,适应性强,精度高,方法易于并行化,尤其适用于解决内部机制复杂如NSCLC 的预后预测的问题。我们的评估参数显示,随机森林(调整后AUC=0.881)的预测能力大于决策树(调整后AUC=0.723)。决策树模型代表了一系列属性与结果之间的映射关系。
诺莫图能预测所有已知变量单独或组合情况下的中值生存时间或生存概率,作为评估肿瘤预后的新工具,在Logistic、Cox 回归结果可视化应用中倍受关注。
4.2 高血压(HTN)预测能力的论证
HTN 作为全身基础状态的评价指标之一,诊断准确率高,假阳性率低,可作为监测治疗效果和患者预后的指标。HTN 可能是由于血管内皮生长因子(VEGF)途径的抑制而导致的功能性或结构性血管稀疏。治疗诱导的HTN 的存在意味着VEGF 信号通路的成功阻断,因此HTN 被认为是抗血管生成药物临床疗效的替代生物标志物。二期临床试验初步结果表明,阿帕蒂尼在晚期非鳞状NSCLC 和晚期NSCLC 患者中具有显著临床活性。Fang 等人[13]对接受阿帕蒂尼治疗的晚期NSCLC患者进行了回顾性分析,结果显示HTN 患者有效率是非HTN 患者的5 倍以上,提示HTN 可作为预测晚期NSCLC 患者预后的生物标志物,此结论在本研究中得到了验证。
4.3 治疗策略对NSCLC 患者生存时间的显著影响
Cox 分析显示,影响NSCLC 患者生存时间的重要因素包括NSCLC 分型、M 分期、放疗和化疗次数,优化前后影响因素无差异,AUC 分别为0.726 和0.746。肺癌的生物学特性与肿瘤本身的恶性程度如是否有转移、NSCLC 的类型、M 分期等有高度的相关性。由此推断,生存时间更依赖于后期治疗的效果,包括治疗策略和个体因素:临床干预包括放化疗次数、剂型和剂量;个体因素包括患者依从性、药物耐受性,影响药物疗效的因素(如肝抑制剂)、遗传因素、营养状况(吸烟、饮酒)和精神状态。因此后续研究需要扩大样本量,对评价因子进行细致划分,以获得更准确的信息,做出更有效的评价。
4.4 人群选择偏差
决策树优化前有M 分期、淋巴细胞计数、矽肺与否、辅助化疗次数4 个节点,调整后有年龄、N 期、M 期、辅助化疗次数、淋巴细胞计数6 个节点。矽肺不是决策树最终模型中的节点之一,其发生反映了人群地理区域和职业环境。本研究地区矽肺病患者数量高于其他居住区,导致决策树模型在调整前发生偏差。因此,矽肺作为一个不稳定因素在调整后被消除,模型精度也得到了提高。为了提高正电子发射断层扫描/计算机断层扫描(PET/CT)对NSCLC 转移淋巴结(LN)的诊断性能,Pak K 建立了一个九变量决策树模型,包括115 名NSCLC 患者、66 名NSCLC 患者和49 名验证集患者[14],该模型的敏感性和特异性分别为50%、40%、99.28% 和96.23%。敏感性低,特异性好,阴性预测值高。
4.5 诺莫图
根据各自变量的大小回归系数制定评分标准,对每个自变量的每个取值水平进行评分。对于每个患者,可以计算出总得分,根据得分与结果概率之间的转换函数计算每个患者的结果时间概率,此方法得到的即诺莫图。在诺莫图中,预测模型的变量列在左侧,绘制顶部β 项线以显示每个项目的分数。这些数字之和位于总分轴上,每个患者的值位于每个可变轴上,向上绘制一条线以确定每个变量值接收的点数。这些数字的总和位于总点的轴上,因此很容易看到对应的可能性关系。
诺莫图可以方便地查询中值生存时间或预测生存概率。该方法是在相应的线段中查询已知预测变量的值,然后结合图线的对应关系。因此,可以获得在所有已知预测变量单独或组合的情况下的中值生存时间或预测生存概率。诺莫图作为一种评估肿瘤和医学预后的新工具,在Logistic 回归或Cox 回归结果可视化的应用中日益受到重视,可视化工具的有效应用为临床医生快速掌握流行病学工具带来了方便,提高了模型的实际应用能力[15-16]。
机器学习的目的是预测,统计学的主要目的是解释,预测模型必须依靠两者的有效结合。随着机器学习理论和方法在临床决策中的日益广泛应用,如何建立一个有效的临床预测模型逐渐受到重视。神经网络可以不加选择地包含尽可能多的预测变量,具有最高的预测性能,但若想强调结果的状态,我们的研究结果建议使用非线性模型来预测NSCLC的预后。非小细胞肺癌,包括鳞癌、腺癌、大细胞癌等类型,生物学机制不一致,死亡率高,晚期转移,影响预后的各种因素尚不清楚,因此,神经网络模型是一种非线性拟合模型,具有较强的泛化能力和容错能力,可以高精度地预测非小细胞肺癌患者的预后。本文分析的危险因素和模型的结论有助于进一步研究NSCLC 患者预后因素、模型选择和循证医患沟通等诸多问题。