基于癌症基因组图谱数据库结直肠癌免疫细胞浸润预测模型的建立
2022-04-11丁婷婷曾楚雄胡丽娜余明华
丁婷婷,曾楚雄,胡丽娜,余明华
(上海市浦东医院,复旦大学附属浦东医院肿瘤科,上海 201399)
尽管结直肠癌的筛查、诊断和根治性切除术目前已取得了进展,但其仍是全球范围内癌症相关死亡的主要原因之一[1]。大约20%~25%新确诊的结直肠癌患者存在远处转移,且其中只有一小部分可以接受根治性手术[2]。此外,大约50%的结直肠癌患者具有可切除指征,其中多数会在切除后2年内复发[3]。在过去的几十年里,人们不断地对肿瘤细胞的基因组和生物学变化进行研究,识别具有不同预后和治疗反应的患者亚群,并寻找潜在的药物治疗靶点[4]。然而,肿瘤的恶性表型不仅由肿瘤细胞的内在活性决定,还由肿瘤相关微环境中募集和激活的免疫细胞决定。
肿瘤浸润性免疫细胞(tumor-infiltrating immune cells,TIICs)的功能和组成会根据宿主的免疫状态发生微妙的变化,可被药物有效靶向并与临床预后相关[5]。相关机制研究证实,在TIICs与肿瘤基质中的恶性细胞之间存在着复杂的相互作用,这种相互作用具有显著的预后相关性,免疫系统可通过支持宿主防御或肿瘤进展而发挥双重作用[6]。然而,即使在具有相同实验设计的研究中,某些TIICs亚群的预后价值也不总是保持一致,比如白细胞介素-17(interleukin-17,IL-17)已被证明在肿瘤的进展中具有双重作用,IL-17+T细胞的功能和预后价值在不同的研究中相互矛盾[7-8]。上述有矛盾结果的研究均局限于免疫反应观点,其基于免疫组织化学方法分析评估TIICs,仅依赖于单个标记识别一个特定的TIICs亚群,但因为许多标记蛋白可在不同细胞类型中表达,该方法可能不够全面。
CIBERSORT是一种基于基因表达的反卷积算法,其被用于评估一组基因相对于样本中所有其他基因的相对表达变化[9-10],可用于确定TIICs的多样性。由于CIBERSORT的优越性能,其在细胞异质性研究中的应用越来越受到关注。因此,本研究应用CIBERSORT来量化参与结直肠癌免疫反应的22个TIICs亚群,以研究其与5年生存率之间的关系,希望能为结直肠癌TIICs异质性、肿瘤分子亚型及疾病进展之间的复杂关系提供一些信息。
1 资料与方法
1.1 数据下载与数据分析
本研究利用美国国家生物信息技术中心TCGA数据库(https://portal.gdc.cancer.gov/),检索条件设定如下:(1)案例选项:基本位点为“结直肠癌(设定病理分型为腺癌)”,其余条目默认系统设定;(2)文件选项:数据分类为“转录组分析”,数据类型为“基因表达定量”,实验策略为“转录组测序技术”,工作流程类型为“HTSeq计数”,其余条目默认系统设定。下载截至2020年7月1日上传的原发性结直肠癌患者基因表达谱和临床信息,下载得出的肿瘤组织和配对的正常组织进行后续差异分析。
1.2 TIICs与临床特征的关系分析
通过CIBERSORT算法预测结直肠癌组织及正常对照组织基因表达谱中22种TIICs基因的表达水平来确定其基因组成,进行基因表达分析,再将基因的表达转化为免疫细胞水平,得出肿瘤组织和正常组织样本中TIICs的组成和比例,计算每个样本的标准差和CIBERSORTP值以提高CIBERSORT的准确性,并筛选出P<0.05的样本进行临床分析,将过滤后的免疫细胞矩阵与临床数据合并,探讨免疫细胞与临床特征之间的关系。最后筛选差异浸润的免疫细胞,计算免疫细胞水平与患者生存的相关性,并绘制生存曲线图。
1.3 统计分析
所有分析均通过R软件(3.5.2版)进行,符合正态分布的连续变量用均数和标准差描述,非正态分布资料用中位数(P25,P75)描述,分类变量用频数和百分数表示。将CIBERSORTP<0.05的样本纳入下一步分析。使用Pearson相关分析得出不同免疫细胞亚型之间的相关性,通过corrplot R包评估不同类型免疫细胞之间的关系,生存R包用于执行Kaplan-Meier曲线, 应用Wilcoxon检验分析免疫细胞和临床特征之间的相关性。
2 结果
2.1 结直肠癌患者临床资料
从TCGA数据库共下载符合设定条件的转录组数据514个(包括473例结直肠癌样本和41个正常对照样本),其中结直肠癌患者中位年龄69(58,77)岁,其他基本临床资料见表1。
2.2 结直肠癌组织TIICs的分布
共有6个正常样本和118个肿瘤样本符合CIBERSORTP<0.05。使用CIBERSORT对正常组织与结直肠癌组织中22个TIICs亚群进行分析,绘制条形图,以不同颜色显示每个各组织样本中免疫细胞的比例,条形的长度表示该细胞水平。从图1可以看出,结直肠癌组织中M0、M1和M2巨噬细胞和单核细胞的比例相对较高,约占22个TIICs亚群的60%;相反,B细胞和中性粒细胞的比例相对较低,约占10%。我们推断 TIICs比例的差异可能是个体差异的基本特征并具有预后价值。
进一步绘制出的矩阵图提示,滤泡辅助性T细胞和M1巨噬细胞(r=0.53)、单核细胞和静息肥大细胞(r=0.46)、静息自然杀伤(natural killer,NK)细胞和CD4+T细胞等呈显著正相关,CD4+T细胞和M0巨噬细胞(r=-0.53)、M1巨噬细胞和M0巨噬细胞(r=-0.46)、CD4+T细胞和调节性T细胞(r=-0.42)等呈显著负相关(图2)。
表1 TCGA数据库中结直肠癌患者一般临床特征Table 1 General clinical characteristics of colorectal cancer patients in the TCGA database
2.3 结直肠癌组织TIICs比例与临床特征的关系
部分TIICs的比例与患者的TNM分期及临床分级显著相关:T1~T2期患者静息NK细胞和CD8+T细胞水平高于T3~T4期(P<0.05),T3~T4期患者浆细胞比例高于T1~T2期(P<0.05);活化树突状细胞在N0期的比例高于N1~N2期(P<0.05);M0期患者M1巨噬细胞水平高于M1期患者,而M1期患者激活的肥大细胞水平更高(P<0.05)。此外,M1巨噬细胞和单核细胞在临床分级Ⅰ和Ⅱ级患者中均处于高表达水平(P<0.05,图3)。
2.4 不同TIICs表达程度与患者5年生存率之间的关系
Kaplan-Meier曲线显示,结直肠癌患者的预后部分受个体TIICs亚型差异的影响:活化的树突状细胞表达越高,结直肠癌患者的5年生存率越高;但幼稚的CD4+T细胞则相反,其表达越高,患者的5年生存率越低(P<0.05,图4)。这意味着TIICs特征可以为治疗策略提供更多的预后价值。
3 讨论
除了恶性肿瘤细胞,肿瘤组织也包括免疫细胞、成纤维细胞、内皮细胞,以及细胞因子、趋化因子、生长因子等多种分子[11]。这些成分及其复杂的相互作用形成了肿瘤相关微环境,该微环境甚至可以对侵袭性恶性肿瘤细胞产生抑制作用,但在其进展过程中,肿瘤细胞可能会绕过这些抑制信号,而是利用免疫细胞和其他细胞为自己谋取利益,从而继续生长、侵袭、转移[12-14]。在肿瘤微环境中募集和激活的主要宿主细胞是各种免疫细胞,众所周知,免疫系统同时具有促癌和抑癌作用,肿瘤基质中的免疫细胞和恶性肿瘤细胞之间实际上存在着一个复杂的生物学过程,并具有显著的预后相关性[15]。在结直肠癌中,不同类型免疫细胞的分布、组织定位、细胞类型均与肿瘤进展显著相关。与TIICs高浸润组相比,低浸润组临床Ⅲ期结直肠癌患者5年生存率和无病生存期(disease-free survival,DFS)显著降低[16]。此外,直肠癌活检中TIICs的高浸润与改善肿瘤对术前放化疗的反应相关,并与延长的DFS和总生存期(overall survival,OS)显著相关。这些结果提供的证据表明,TIICs高浸润不仅是一个有利的预后因素,而且还可以预测化疗的结果。
作为一种免疫敏感性肿瘤,结直肠癌被异质性的TIICs集合浸润,包括T细胞、树突状细胞、巨噬细胞、中性粒细胞和肥大细胞,此外,结直肠癌内TIICs的类型、密度和位置对预后的判断有很大价值[17]。例如,Klintrup等[18]评估了直肠癌患者的整体炎症细胞反应及各种TIICs密度,其免疫组织化学实验表明,浸润边缘的炎症反应是OS和DFS的重要预测因子。此外,成熟T细胞、树突状细胞和记忆T细胞通常可出现在预后良好的结直肠癌患者TIICs亚群中,而免疫抑制性调节性T细胞则与结直肠癌的预后不良相关[19]。最近的几项研究甚至指出,与目前用于结直肠癌分期的组织病理学方法相比,免疫学数据(肿瘤样本中免疫细胞的类型、密度和位置)可以更好地预测患者的存活期[20]。
Different colors represent different immune cells, and the length of the bars in the bar graph represents the level of immune cell populations.图1 结直肠癌和正常组织样本中免疫细胞比例Figure 1 The proportion of immune cells in each colorectal cancer and normal tissue sample
Some immune cells were negatively related, represented in blue, and others were positively related, represented in red. The darker the colour, the higher the correlation was.图2 22种TIICs比例的相关矩阵Figure 2 Correlation matrix for all 22 TIICs proportions
图3 TIICs与结直肠癌TNM分期和临床分级的关系Figure 3 Relationship between TIICs and TNM stage and clinical stage of colorectal cancer
A, activated dendritic cells; B, naïve CD4+T cells.图4 与5年生存率显著相关的特定免疫细胞群的生存曲线Figure 4 Survival curves of specific immune cell populations with significantly correlated five-year survival rate
本研究应用CIBERSORT评估了结直肠癌及正常组织的免疫细胞浸润模式,结果显示结直肠癌组织中浸润水平较高的免疫细胞类型为B细胞、浆细胞、CD4+T细胞、NK细胞、M0巨噬细胞、M2巨噬细胞、活化肥大细胞等,并发现活化的树突状细胞与结直肠癌患者的5年总生存率正相关。树突状细胞是体内功能最强大的抗原提呈细胞,在机体的抗肿瘤免疫应答中发挥着重要作用。体内未成熟树突状细胞在摄取外来抗原后转化成熟,通过主要组织相容性复合体(major histocompatibility complex,MHC) Ⅰ和Ⅱ分别与CD8+T细胞和CD4+T细胞相互作用,诱发免疫反应[21]。有研究发现,相比药物治疗,肝癌患者在术后接受树突状细胞疫苗以及活化的T细胞治疗,患者的OS明显延长,以其为基础的肿瘤免疫治疗将有可能成为最有效的疗法之一[22]。
本研究结果显示,幼稚CD4+T细胞是结直肠癌中浸润比例相对较高的免疫细胞,其与结直肠癌患者5年生存率呈负相关。有研究证实,机体抗肿瘤的免疫效应主要为T细胞介导的特异性细胞免疫反应[23]。相较于正常组织,结直肠癌组织中幼稚CD4+T细胞数量明显减少。一方面,当幼稚CD4+T细胞减少后,诱导针对肿瘤的免疫应答减弱,利于肿瘤的生长;另一方面,肿瘤细胞通过抑制记忆性T淋巴细胞的表达,逃避机体的监视,利于肿瘤细胞发生浸润及转移[24]。
尽管本研究已经用统计方法来消除队列偏差,但这些数据的异质性仍然在一定程度上阻碍了可重复性。由于本研究选择的病例数量有限,在对结直肠癌患者进行生存分析时有一定的局限性。随着数据库的完善,可以进一步增加样本量并延长随访时间,以更准确地评估预后。本研究对结直肠癌患者TIICs亚群的分析揭示了其与临床结果的重要关联,这些关联将有助于识别可能从化疗中受益的患者,并预测新药的可能靶点。将可靠的反卷积算法与大规模基因组数据相结合,能进一步揭示构成结直肠癌肿瘤微环境的非肿瘤细胞的临床和生物学意义。探索免疫细胞指标的异质性对于结直肠癌预后预测乃至未来的个体化治疗势在必行。