肿瘤微环境细胞亚群基因标签预测复发转移性头颈鳞状细胞癌EGFR单抗疗效*
2019-10-31黄环张琴肖何王阁
黄环,张琴,肖何,王阁
400042 重庆,陆军军医大学大坪医院 肿瘤中心
头颈部鳞癌解剖位置复杂、病理类型多样,是一组具有很强异质性的疾病。疾病会对患者的外貌、味觉、嗅觉等功能造成破坏,给患者造成严重的心理负担,极大影响患者的生活质量。头颈部鳞癌采取以手术、放疗、化疗及靶向治疗等综合治疗方式,不幸的是约50%~60%的头颈部鳞癌首次诊断时已是局部晚期或晚期,在这部分人群中靶向治疗发挥着越来越重要的作用。
表皮生长因子受体(epidermal growth factor receptor,EGFR)在头颈部鳞癌中高表达,且该受体的表达与预后相关,是头颈部鳞癌的一个重要治疗靶点。基于国际前瞻性III期随机临床实验(EXTREME)[1]和中国人群的CHANGE-2研究,2019年《中国抗癌协会临床肿瘤学协作专业委员会头颈肿瘤诊疗指南》进行了更新,将复发转移性头颈部鳞癌西妥昔单抗联合化疗一线治疗的2类证据级别更新为1A类证据。西妥昔单抗是一种EGFR单克隆抗体,此更新肯定了其在头颈部鳞癌中的治疗价值。然而,并不是所有头颈部鳞癌患者均能从抗EGFR单抗如西妥昔单抗联合化疗获益[2],因此如何进一步筛选出更有效的获益人群就成为了亟待解决的问题。
Lavin等[3]和Chevrier等[4]发表在《Cell》上的两项研究表明,肿瘤微环境中的免疫细胞组成常常会决定其对某种特定疗法的疗效。由此,我们拟通过公共数据库基因表达谱数据GSE65021(发现集)和GSE102995(验证集),在细胞亚群的特征基因中发现抗EGFR单抗治疗敏感指标,构建头颈部肿瘤对抗EGFR单抗疗效的预测模型,为头颈部肿瘤患者抗EGFR靶向治疗提供预测性生物标志物提供线索。
1 材料和方法
1.1 数据集获取和预处理
数据集GSE65021和GSE102995均从Gene Expression Omnibus(GEO)获取。GSE65021包含40例接受一线铂类联合西妥昔单抗治疗的晚期复发转移性头颈鳞癌患者。其中有14例和26例患者无进展生存时间(progression free survivid,PFS)时间分别大于12个月(LONG group)和小于5.6个月(SHORT group)[5]。GSE102995包含25例一线接受帕尼单抗治疗复发转移性晚期头颈鳞癌PFS数据[6](表1-2)。两个数据集均采用Illumina HumanHT-12 WG-DASL V4.0 R2 expression beadchip微阵列芯片,共检测29 377个探针表达值。采用R软件包’annotate’将各微阵列探针ID号注释到基因ENTREZID号上,对于多个探针对应一个基因,取四分位距最大探针代表该基因表达值。此外,过滤掉不能对应到ENTREZID上的探针值。两个数据集共有19 434个重叠基因纳入分析。从Isella等[7]的研究和Angelova等[8]的研究分别获取肿瘤相关成纤维细胞(carcinoma-associated fibroblasts,CAF)和肿瘤浸润淋巴细胞特异性表达基因列表。将这些细胞特异性表达基因符号转化成ENTREZID,并剔除与GSE65021和GSE102995不重叠的基因,得到822个基因对应32个细胞亚群(表3)。
1.2 抗EGFR单抗敏感指数的建立
采用R软件包”limma”分析GSE65021数据集LONG相对于SHORT组间差异表达基因(differentially expressed genes, DEGs)。表达倍量变化大于2倍并且FDR<0.05作为显著DEGs。为进一步纳入合适数量的基因构建模型,将2 179个未校正P<0.05 DEGs与32个细胞亚群特征表达基因重叠,筛选出同一个细胞亚群特征表达基因中高表达DEGs和低表达DEGs,各个细胞亚群特征基因数目和及其所属的高表达和低表达基因数目见补充材料。在各个具有所属的高表达基因和低表达基因的细胞亚群中,计算高表达基因表达均值与低表达基因均值比值,作为该细胞亚群的敏感指标。共有18个细胞亚群可计算敏感指标,涉及99个基因。利用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LOSSA)算法筛选与LONG组显著相关的细胞亚群指标。利用显著细胞亚群指标归回系数与对应敏感指数的乘积之和作为预测抗EGFR单抗敏感评分(anti-EGFR antibodies sensitive score,EASS)。
表1 所用数据集GSE65021的基线特征
Table 1. Baseline Characteristics of Datasets GSE65021 Used
VariableGSE65021 n(%)Gender Female31 (77.5) Male9 (22.5)Anatomy site of primary lesions Oral cavity19 (47.5) Oropharynx9 (22.5) Hypopharynx4 (10.0) Larynx8 (20.0)T stage T13 (7.5) T28 (20.0) T39 (22.5) T420 (50.0)Degree of differentiation Well2 (5.0) Moderately 20 (50.0) Poorly18 (45.0)Radiotherapy No6 (15.0) Yes34 (85.0)PFS Long14 (35.0) Short26 (65.0)Biospy site Primary tumour31 (77.5) Recurrence or metastasis9 (22.5)
PFS: Progression free survival.
1.3 EASS的验证
在GSE102995数据集中同法计算18个细胞亚群可计算敏感指标和EASS。由于GSE102995数据集给出了每个患者的具体PFS时间和删失情况,采用Cox回归分析EASS与PFS的相关性,并对分期和体质评分进行校正。采用一致性指数(C-index)判断临床分期和EASS对PFS预后作用的准确性,并相互比较。
表2 所用数据集GSE102995的基线特征
Table 2. Baseline Characteristics of Datasets GSE102995 Used
VariableGSE102995 n(%)Performance status 014 (56.0) 111 (44.0)Stage II7 (28.0) III2 (8.0) IV9 (36.0) IVA6 (24.0) IVB1 (4.0)Biopsy site Primary tumour20 (80.0) Recurrence or metastasis5 (20.0)
1.4 统计学处理
18个细胞亚群敏感指数在LONG和SHORT组间比较采用Kruskal-Wallis非参数检验。热图采用R软件包NMF(Version 0.21.0) ”aheatmap”函数完成,表达值以及聚类间相似性采用欧氏距离量度。主成分分析采用”FactoMineR”软件包”PCA”和”fviz_pca_ind”函数完成。LASSO分析采用包”glmnet”完成。一致性指数及其95%置信区间以及一致性指数间比较采用软件包”survcomp”完成。其它统计学方法和图形均由SPSS 20.0完成,P<0.05定为有统计学意义,所有检验均为双尾检验。
2 结 果
2.1 临床病理学资料
为了筛选抗EGFR单抗治疗敏感性基因标记物,我们对来源于GEO数据库的使用抗EGFR单抗治疗的转移性头颈部肿瘤转录组芯片GSE65021和GSE102995芯片数据进行了分析。两个数据集纳入病例基线临床特征如表1所示。两个数据集均纳入了不同分期的头颈部肿瘤患者,不同之处为GSE65021数据集纳入患者使用的抗EGFR单抗为西妥昔单抗,而GSE102995数据集纳入患者使用的为帕尼单抗。肿瘤对药物治疗的响应评估基于患者在经抗EGFR单抗治疗后PFS时间。在GSE65021文献中,经抗EGFR单抗治疗后PFS时间大于12个月和小于5.6个月的患者分别定义为对抗EGFR单抗治疗敏感型(LONG组)和抵抗型(SHORT组)。
2.2 EASS的构建及其对LONG组预测作用
在32个细胞亚群中,有18亚群可计算细胞亚群敏感指数。18个细胞亚群敏感指数在LONG组与SHORT组间分布均有显著差异(表3,图1)。对18个亚群敏感指标的主成分分析表明,前两个主成分可将LONG与SHORT人群较好区分(图2)。LASSO对18个敏感指数进行Logistic回归,仅有9个细胞亚群纳入模型(表2)。9个细胞亚群敏感指标值在LONG与SHORT组间差异热图见图3。利用这9个细胞亚群回归系数和对应敏感指标构建EASS,计算得到在全体40例人群中EASS中位值为30.73(26.24~41.29)。EASS值分布在LONG与SHORT组间有显著差异(median: 35.02vs29.08, Kruskal-Wallis rank sum testP=2.459×10-7)。ROC曲线分析表明,EASS可完全区别LONG组人群与SHORT人群(AUC:1.000,95%CI:1.000~1.000,P<0.001)。
图1 18个细胞亚群敏感指数在LONG和SHORT组间比较(P<0.01)
Figure1.DistributionandComparisonsof18CellSubpopulationsSensitiveIndexesBetweenLONGGroupandSHORTGroup(P<0.01)
表3 发现集中18个细胞亚群敏感指数和预测长PFS组LASSO算法回归系数
Table 3. Sensitive Indices of 18 Cell Subpopulations in Discovery Set and Coefficients Deduced from LASSO Algorithm for Predicting Long Progression Free Survival Patients
Cell subpopulationLong median (IQR)Short median (IQR)P(Kruskal-Wallis)Coefficient (LASSO)T cells1.485 (1.367-1.528)1.208 (1.142-1.293)<0.001-CAF0.779 (0.721-0.856)0.628 (0.593-0.661)<0.0014.661pDC0.891 (0.866-0.908)0.830 (0.786-0.865)<0.001-MDSC1.317 (1.213-1.377)1.083 (1.027-1.209)<0.0013.114
Cell subpopulationLong median (IQR)Short median (IQR)P(Kruskal-Wallis)Coefficient (LASSO)Central memory CD40.751 (0.666-0.830)0.629 (0.568-0.692)0.003-Th11.208 (1.148-1.251)1.061 (0.897-1.141)0.001-Eosinophil2.096 (1.967-2.158)1.872 (1.666-1.969)0.002-Effector memory CD80.868 (0.814-0.939)0.734 (0.702-0.802)<0.001-Mast cells1.244 (1.167-1.314)0.982 (0.869-1.126)<0.001-Th21.771 (1.682-1.988)1.554 (1.461-1.697)0.0010.584iDC1.293 (1.161-1.432)1.101 (1.025-1.210)0.004-DC0.825 (0.715-0.899)0.616 (0.571-0.686)<0.001-Treg1.088 (1.033-1.189)0.880 (0.814-0.985)<0.0013.687NK56 dim1.111 (0.962-1.235)0.850 (0.731-0.931)<0.0016.054Macrophages0.906 (0.838-1.002)0.745 (0.660-0.784)<0.0010.797Immature B cells1.509 (1.438-1.582)1.321 (1.277-1.402)<0.0016.453Th171.080 (0.934-1.121)0.879 (0.795-0.959)0.0013.026TFH0.983 (0.906-1.046)0.808 (0.758-0.851)<0.0012.089EASS35.02 (34.41-36.05)29.08 (27.99-30.27)<0.001
EASS: Anti-EGFR antibodies sensitive score.
图2 主成分分析表明18个细胞亚群敏感指数前两个组成分可较好区别发现集LONG和SHORT组
Figure2.PrincipleComponentAnalysisShowingEfficientDiscriminationBetweenLONGGroupandSHORTGroupintheDiscoverySet
2.3 对EASS的验证结果
在独立验证集GSE102995中,用与训练集相同方法计算EASS。EASS中位值为35.70(31.997~39.100),以中位值作为截断值,高于中位值组为进展低风险组,低于中位值组为进展高风险组。高低风险组中位PFS时间分别为51天(95%CI:45.13~56.87)和166天(95%CI:57.37~274.63)(Log RankP=0.021)(图4A)。而肿瘤临床分期II~III与IV期患者间PFS无显著差异(Log RankP=0.409)(图4B)。EASS以连续变量Cox分析表明,进展风险随EASS增加而降低(HR=0.647,95%CI:0.504~0.831,P=0.001)。对分期(IVvsII~III)和PS评分校正后,EASS依然是PFS的独立预后因素(HR=0.647,95%CI:0.503~0.831,P=0.001)。EASS和分期对PFS预测准确性的C指数分别为0.755(95%CI:0.719~0.791,P=6.311),0.542(95%CI:0.336~0.748,P=0.688)。两个C指数间差异有统计学意义(P=0.032)。
图3 9个细胞亚群敏感指标值在LONG组与SHORT组的热图
Figure3.SensitiveIndexesof9CellSubpopulationsbetweenLONGGroupandSHORTGroup
图4 Kaplan-Meier曲线表明EASS划分低危和高危组间(A)以及临床分期组间(B) PFS差异
Figure4.Kaplan-MeierCurvesShowingDifferencesinProgressionFreeSurvivalbetweenLowRiskGroupandHighRiskGroupDividedthroughAnti-EGFRAntibodiesSensitiveScore(A)andClinicalStage(B)
3 讨 论
既往有多项研究探索了晚期头颈部肿瘤对EGFR单抗治疗敏感性的分子标记物。Licitra等[9]分别用荧光原位杂交和免疫组化的方法评价了EGFR拷贝数或表达水平对头颈肿瘤对EGFR单抗敏感性的影响,发现EGFR拷贝数和表达水平与头颈部肿瘤的总生存时间、PFS以及对药物的反应均无相关性。De Cecco等[10]通过全转录组测序筛选差异表达基因构建模型及头颈部肿瘤的分子分型来预测头颈部肿瘤对抗EGFR单抗治疗的敏感性,并在多线治疗后使用西妥昔单抗的晚期肠癌患者中验证其模型的有效性,发现通过分子分型来预测头颈部肿瘤的准确性为87.7%。
西妥昔单抗的抗肿瘤的主要作用包括阻断EGFR依赖的生长信号、抗体介导的细胞毒性作用以及活化自噬基因,诱导肿瘤细胞自噬。目前还没有研究分析免疫微环境对西妥昔单抗在头颈部肿瘤中疗效的影响。因此,我们构建基于免疫细胞亚群的头颈部肿瘤抗EGFR单抗治疗敏感性预测评分EASS。我们发现EASS不但可完全区别发现集LONG组人群与SHORT组人群,而且在验证集中是PFS的独立预后因素。本文中EASS在独立验证集中得到较好的预测效能主要归因于如下两点:一是在发现集DEGs筛选中使用了PFS极端值组别;二是在各个细胞亚群中使用了基因表达率的计算方法,该方法也被用于构建免疫预测指标的研究中[11]。
在纳入到EASS计算的9个免疫细胞亚群中,CAF、髓源性抑制细胞(myeloid-derived suppressor cells,MDSC)和Th2这3个细胞亚群可能发挥了更为重要的作用(表2)。CAF是肿瘤微环境中宿主细胞的主要成分。CAF具有很强的异质性,来源多种多样,包括成纤维细胞、上皮细胞、间充质干细胞和骨髓来源的干细胞等[12]。CAF来源等异质性也部分决定其表型和功能等异质性。CAF的功能包括:促进肿瘤发生、发展、转移、胞外基质重塑、血管生成、上皮间质转化以及肿瘤耐药等[13]。在属于CAF细胞亚群特征基因中,LONG组表现出DPT、COL8A1、PTN、PTGIS、DDR2、EFEMP1(fibulin-3)和EPHA3等基因表达水平下调,提示这些基因可能通过影响CAF功能进而调控头颈鳞癌对抗EGFR单抗的敏感性。在一项乳腺癌的研究中[14],间充质干细胞诱导的DDR2介导间质-乳腺癌的相互作用和转移生长。此外,下调DDR2可降低肝癌的生长速度[15]。以上研究提示DDR2基因在肿瘤的生长和转移中发挥着重要作用,而其表达下调可能对肿瘤控制有促进作用。Han等[16]在研究膀胱移形细胞癌时发现,Fibulin-3表达水平与多个膀胱癌细胞株的侵袭能力相关。在小鼠原位膀胱癌模型中,下调fibulin-3降低了侵袭性膀胱癌的发生率。La Rocca等[17]发现沉默酪氨酸激酶EPHA3表达降低了多发性骨髓瘤细胞的体外黏附和侵袭以及体内生长和血管生成。
在肿瘤微环境中,MDSC是免疫抑制环境的主要宿主成分[18],它们是一群具有免疫抑制功能的未成熟细胞,通过抑制效应T细胞和自然杀伤细胞等抗肿瘤免疫细胞的功能介导肿瘤免疫逃逸。Li等[19]通过注射可溶性FLT1可以抑制肝癌小鼠模型的肿瘤生长和延长生存期。而该基因在LONG组MDSC细胞中上调表达,提示FLT1参与调控DMSC功能促进抗EGFR单抗疗效。
综上所述,头颈鳞癌肿瘤微环境免疫细胞对抗EGFR单抗疗效可能具有重要影响。由于头颈部鳞癌患者可能合并人乳头瘤病毒(human papllomavirus,HPV)感染,在未来研究中应增加HPV感染的因素[20],并进一步在大量临床样本中分析EASS对西妥昔单抗一线治疗PFS的预测能力[21]。
作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。
同行评议:经同行专家双盲外审,达到刊发要求。
利益冲突:所有作者均声明不存在利益冲突。
文章版权:本文出版前已与全体作者签署了论文授权书等协议。