单细胞转录组测序及其在乳腺癌中的应用
2021-03-28韩香臣李小光
韩香臣,李小光,胡 欣
复旦大学附属肿瘤医院乳腺外科,复旦大学上海医学院肿瘤学系,上海 200032
单细胞转录组测序是一项能在单细胞水平上进行无偏倚、高通量、高分辨率全转录组学分析的新技术[1]。针对肿瘤组织等异质性高的样本,传统的高通量测序技术只能提供样本中所有细胞转录水平的平均值,但单细胞转录组测序可以精准描绘样本中每个细胞的转录组特征。单细胞转录组测序技术可以帮助我们了解组织学意义相同细胞的差异,进一步探究细胞类型已知的细胞转录组特征或发现新的细胞类型[2]。
国家癌症中心2019年统计数据显示,乳腺癌占全部女性癌症的17.1%,位于中国女性癌症发病率首位,严重威胁中国女性健康[3]。有研究[4]表明,乳腺癌是一种高度异质性的肿瘤,传统的高通量测序技术不足以解决肿瘤异质性等难题。将单细胞转录组测序技术应用于乳腺癌,不仅可以解决肿瘤异质性问题,还能为阐明肿瘤微环境、转移播散、治疗耐药等问题提供新思路。
1 单细胞转录组测序技术概述
近10年来,得益于新技术的出现与实验方法的改进,单细胞转录组测序的规模呈指数增长,费用不断降低[5]。2009年,Tang等[6]运用单细胞全转录组扩增技术,将卵细胞中的mRNA无偏倚地反转录成长达3 kb的cDNA,基于二代测序SOLiD平台,首次获得了单细胞水平的转录组图谱,描绘了卵细胞中5 270个基因的转录本信息。然而,该技术只能描绘单个细胞的转录组特征,应用范围有限。2011年,Islam等[7]研发了单细胞标记反转录(single-cell tagged reverse transcription,STRT)技术,先将细胞分离到96孔板中,再利用链转化原理给每孔中的细胞加入孔特异性条形码,因此STRT技术可描绘上百个细胞的转录组图谱。
近年来,得益于微流控、随机捕获和原位标记等技术的出现,单细胞转录组测序技术得以自动化和商业化。以集成射流回路(integrated fluidic circuit,IFC)芯片[8]为例,IFC芯片可以连续地、精准地将极小体积的液体转移至反应室中。将细胞捕获至IFC芯片各反应室后,后续的单细胞转录组测序实验步骤都可以在IFC芯片中完成。联合IFC芯片技术,CEL-seq、SMART-seq等单细胞转录组测序技术得以自动化,并可检测成百上千个细胞。Drop-seq技术[9-10]则是将细胞捕获至油滴中,后续的单细胞转录组测序实验步骤则在各个油滴中完成。两股液流,一股包含单细胞悬液,另一股包含细胞裂解液、反转录试剂和带有poly(T)反转录引物的磁珠,汇聚后被油滴捕获。
目前,完整的单细胞转录组测序实验可分为单细胞捕获、单细胞RNA测序、数据处理和数据分析4个部分[11]。首先,肿瘤组织等样本被制备成单细胞悬液,并被捕获到液滴或芯片反应室中,细胞裂解并释放RNA。其中,带有poly(A)尾的mRNA会与带有唯一分子标识符和细胞特异性标签的poly(T)引物结合。在经历反转录、第二链合成、cDNA扩增、片段化、加测序接头后,得到可用于高通量测序的文库。基于细胞特异性标签,测序数据被拆解,并被映射到相应的基因组上,构建单细胞基因表达矩阵,该矩阵可应用于下游分析[12]。
2 单细胞转录组测序数据分析
单细胞转录组测序数据下游分析可分为细胞水平分析和基因水平分析两大部分。细胞水平分析集中于聚类分析和轨迹推断,基因水平分析则集中于寻找差异表达基因、基因富集分析和基因调控网络[13]。
2.1 聚类分析
聚类分析是单细胞转录组测序数据分析的第一步,可用于区分细胞类别[14]。运用机器学习中的聚类分析方法,将基因表达谱相似的细胞归为一类,每个类别的标记基因还可用于描述类别特征或推断细胞类型。目前,K均值聚类算法等无监督聚类分析是主流分析方法,数据经t-分布随机邻域嵌入(t-distributed stochastic neighbor embedding,t-SNE)[15]、主成分分析(principle component analysis,PCA)[16]、统一流形逼近与投影(uniform manifold approximation and projection,UMAP)[17]等算法降维和可视化后,得到的图形中每个点代表一个细胞,邻近的细胞则可认为是同一类细胞。Peng等[18]对肿瘤患者的57 350个细胞进行单细胞转录组测序,后续的聚类分析将这些细胞分为10个类别,并结合常见的细胞类型标记基因,将这些细胞注释为巨噬细胞、T淋巴细胞、B淋巴细胞和成纤维细胞等。
2.2 轨迹推断
组织异质性的发生、发展过程是动态的,而轨迹推断则是通过寻找使相邻细胞间转录组差异最小的路径,重建这个动态过程[19]。Chen等[20]对来自肿瘤患者的48 584个细胞进行单细胞转录组测序,利用Monocle算法[21],推断肿瘤浸润T淋巴细胞的分化轨迹:CD4+T淋巴细胞始于CD4+初始T淋巴细胞并向CD4+活化T淋巴细胞或失能T淋巴细胞两个方向分化;CD8+T淋巴细胞则始于CD8+T淋巴细胞并向CD8+细胞毒性T淋巴细胞或失能T淋巴细胞两个方向分化。虽然轨迹推断在单细胞转录组测序数据分析中广泛应用,但应注意细胞轨迹推断的结果并不一定能代表真实的生物学进程[22]。
2.3 基因集分析
分析单细胞转录组测序数据时,可以找到许多差异表达基因,但其数量过多,反而阻碍我们解读测序数据的生物学意义。因此,可以基于这些基因的共同特征,将多个差异表达基因以基因集为单位分析,如基因集变异分析(gene set variation analysis,GSVA)、基因集富集分析(gene set enrichment analysis,GSEA)、京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析、基因本体(gene ontology,GO)分析等[23]。Azizi等[24]对乳腺癌患者的47 016个免疫细胞进行单细胞转录组测序,并对差异表达基因中的环境刺激应答相关基因富集分析,结果显示,不同类型CD4+记忆T淋巴细胞对Ⅰ、Ⅱ型干扰素、缺氧、失能的应答模式不同,而不同类型CD4+调节性T淋巴细胞对抗炎、耗竭、缺氧的应答模式相同。
2.4 基因调控网络
通过识别基因共表达模式可推断基因调控网络,如SCENIC算法通过识别与转录因子共表达的基因以推断基因调控网络[25]。Chen等[20]对来自鼻咽癌患者的40 000个免疫细胞进行单细胞转录组测序,基因调控网络分析提示,EOMES、RUNX3、XBP1等转录因子在自然杀伤(natural killer,NK)细胞和CD8+细胞毒性T淋巴细胞中表达均上调,提示这些转录因子可能参与调节细胞毒作用,后续实验也证实,下调NK细胞和CD8+T淋巴细胞中EOMES、RUNX3、XBP1的表达会降低颗粒酶B和穿孔素等细胞毒作用效应分子的表达。
3 单细胞转录组测序技术在乳腺癌中的应用
乳腺癌是一类异质性高的肿瘤,将单细胞转录组测序技术应用于乳腺癌研究,可以从全新的角度揭示乳腺肿瘤异质性、肿瘤微环境、转移播散及治疗耐药等问题。
3.1 肿瘤异质性
尽管目前对乳腺肿瘤异质性已有初步了解,基于转录组测序的分子分型和基于基因组测序的基因检测被广泛应用于指导乳腺癌个体化治疗[26-27],但还远远不够。在肿瘤增殖过程中,肿瘤细胞可表现出不同表型:干性、上皮-间质转化(epithelial-mesenchymal transition,EMT)、侵袭、迁移、免疫浸润、凋亡及缺氧等,这些表型在肿瘤侵袭、转移播散、治疗耐药过程中发挥重要作用[28]。然而,传统的高通量测序无法保留这些肿瘤内异质性信息,单细胞转录组测序则可解决肿瘤异质性这一难题。Chung等[29]对不同分子分型乳腺癌患者的共515个细胞进行单细胞转录组测序,数据表明,同一患者的肿瘤细胞基因表达谱相似性很低,在不同患者间,肿瘤细胞在干性、EMT、血管形成等方面都表现出高度异质性。
3.2 肿瘤微环境
肿瘤微环境主要由基质细胞和免疫细胞组成,研究[30-32]表明,肿瘤相关成纤维细胞(carcinoma associated fibroblast,CAF)、肿瘤内皮细胞(tumor endothelial cell,TEC)、肿瘤浸润免疫细胞等微环境组分与肿瘤生长、血管形成及肿瘤免疫调节等生物过程有关,因此,精准描绘肿瘤微环境可以帮助我们寻找治疗靶点和预后标志物。Azizi等[24]分析了8例乳腺癌患者的肿瘤组织、正常组织、淋巴结及血液中的免疫细胞,单细胞转录组测序数据显示,来自不同部位的免疫细胞表型有明显差异,提示血液中免疫细胞的生物标志物不一定能反映肿瘤浸润免疫细胞表型;且大部分肿瘤浸润T淋巴细胞的活化、终末分化、缺氧相关的信号呈不断变化的趋势。Lu等[33]分析了新辅助化疗前后患者的肿瘤浸润B淋巴细胞,单细胞转录组测序数据显示,可诱导共刺激分子配体(inducible costimulator ligand,ICOSL)+B淋巴细胞在新辅助治疗后明显增多,临床队列的免疫组织化学和预后数据也证实,ICOSL+B淋巴细胞在化疗后明显增多,且ICOSL+B淋巴细胞数目与临床疗效呈正相关,后续机制研究发现,ICOSL+B淋巴细胞可激发T淋巴细胞抗肿瘤免疫,增强肿瘤对化疗的敏感性,提示ICOSL+B淋巴细胞可作为预后标志物。
3.3 肿瘤转移
肿瘤转移是乳腺癌患者死亡的首要原因,未转移患者的5年生存率高达98%,而转移患者的5年生存率仅为27%[34],且约30%的初治未转移乳腺癌最终进展为转移性乳腺癌[35]。单细胞转录组测序可解析原发灶和转移灶的肿瘤异质性和免疫微环境,帮助我们研究肿瘤转移机制。目前肿瘤转移的主流猜想是:少数有“干细胞”能力的肿瘤细胞播种到远处导致肿瘤转移。Lawson等[36]对乳腺癌人源肿瘤异种移植模型的原发灶和转移灶进行单细胞转录组测序,数据表明,低肿瘤负荷小鼠转移灶的肿瘤细胞基因表达谱和干细胞相似,高表达干性、EMT、促生存和休眠相关基因;而高肿瘤负荷小鼠转移灶的肿瘤细胞基因表达谱和原发灶的肿瘤细胞相似,异质性高并高表达分化相关基因,提示少数干细胞样肿瘤细胞启动肿瘤转移。
3.4 治疗耐药
化疗、内分泌治疗、靶向治疗、免疫治疗耐药的出现是乳腺癌治疗的难题,许多患者最初对药物敏感但后续对药物抵抗,导致肿瘤进展。联合治疗前后的单细胞转录组测序数据和临床预后数据,可以研究肿瘤耐药机制,并寻找合适的预后标志物。Kim等[37]对三阴性乳腺癌患者新辅助化疗前后的肿瘤组织进行单细胞转录组测序,GSVA显示,化疗抵抗患者AKT1、CDH1、缺氧、EMT、血管形成等信号在化疗后明显上调,临床队列数据证实,化疗后AKT1和缺氧信号上调患者预后更差,提示AKT1和缺氧信号可作为预后标志物。
4 结语
单细胞转录组测序技术是一项有应用前景的高通量、高分辨率测序技术,可以帮助我们探索乳腺癌的肿瘤异质性、免疫微环境、复发转移及治疗耐药等问题。虽然现在该技术仍有许多局限性:只能检测活细胞样本、细胞数目要求高、费用较高,但是可以提高细胞捕获效率以减少细胞投入量,改进实验方法以适用于多种样本,研发分析方法以挖掘更多信息,甚至可以与单细胞多组学数据联合分析,多角度揭示乳腺癌的生物学过程。