APP下载

单细胞转录组测序技术原理及其应用

2019-01-11李丽娟师书王月张村宇雷初朝黄永震

中国畜牧杂志 2019年2期
关键词:单细胞高通量异质性

李丽娟,师书王月,张村宇,贺 花,雷初朝,陈 宏,黄永震*

(1.贵州工程应用技术学院毕节试验区研究院,贵州毕节551700;2.西北农林科技大学动物科技学院,陕西杨凌 712100;3.西北农林科技大学动物医学学院,陕西杨凌 712100)

随着二、三代测序技术的不断完善和发展,单细胞转录组测序技术逐渐被各个领域广泛应用,如肿瘤基因组计划和人类基因组计划等。这些测序项目所运用的常规转录组分析方法需要对数百万个细胞的混合样本进行分析,其结果是大量细胞测序分析得出的平均值,或者反映的是占数量优势的细胞数据,但其忽略了单个细胞间基因表达的异质性,不利于对细胞病变过程的追踪和生物多样性的研究[1]。同样对于肿瘤细胞、干细胞和早期发育的胚胎细胞等这类样本较少的细胞来说,常规的转录组分析方法已经不能满足需要[1-2]。而单细胞转录组测序 (single-cell RNA-sequencing,sc RNA-seq) 技术[3]将分离的单个细胞的微量全转录组RNA扩增后进行高通量测序,从单细胞水平上获得全转录组的表达谱,对于需要进行特异性细胞研究或者样本较少的细胞来说无疑是很好的选择。同时,sc RNA-seq技术可用于不同类型干细胞的异质性分析,例如胚胎干细胞、造血干细胞、诱导多功能干细胞等[2,4-5]。

1 单细胞分离技术

单细胞测序(Single Cell Sequencing,SCS)的第一步是从微生物培养菌落或者病原微生物所感染的组织中分离出单个细胞。常用的单细胞分离技术包括微流控法、连续稀释法、显微操作法、荧光激活细胞分选法和激光捕获显微切割法。虽然分离方法众多,但各有利弊。由于单个细胞体积微小,极易被破坏,并对外界环境极其敏感,且细胞内外的各种组分间含量差异极大,使得分离时细胞易因环境变化而使其内外组分发生改变,同时在数量上常常会差出好几个数量级。因此,分离时难免会对细胞造成影响或难以分离出单个细胞[1]。

1.1 微流控技术分离单细胞 微流控技术培养细胞主要分为二维(2D)培养和三维(3D)培养2种方式[6]。2D培养即使细胞在芯片上贴壁生长,通过在芯片上流过培养基来提供营养物质,排出废物,操作简单易行。3D培养即将细胞培养在类似于细胞外基质的芯片环境中,可以尽可能地使细胞活动趋近于体内。微流控技术可以通过各种细微结构以及技术进行单细胞分离,例如微振坑的应用。该技术具有消耗样品量小、微型化、分析速度快、自动化程度高等显著优势,强大的集成能力能够将反应、前处理、检测等流程集成到一个微流控系统中去完成操作。目前,商业化的微流控技术已经可以用于单细胞的全基因组和转录组测序[7-8]。

1.2 连续稀释法分离单细胞 连续稀释法是将细胞群体放入合适的细胞悬液中,不断进行一系列不同梯度倍比稀释,直至得到极少数量细胞甚至是单个细胞为止[9-10]。该方法是相对最简单的一种获取单细胞的途径,不依赖特殊设备,但不易精确控制得到单个细胞,易出错,故而很少应用于SCS。

1.3 显微操作法分离单细胞 显微操作法是依赖于人工在高倍显微镜下观察细胞的形态与颜色,利用显微操作器进行挑选以分离出单个细胞[11]。该方法是在显微镜下主观操作得到单个细胞,比起连续稀释法更加灵活,能有效控制单个细胞的获取与释放,但不宜操作大量细胞,且耗时较长、难度较大适合只有少量细胞时的单细胞分离,故常用于从早期胚胎或培养的微生物中提取单个细胞[12]。

1.4 荧光激活细胞分选法分离单细胞 荧光激活细胞分选法(Fluorescence-activated Cell Sorting,FACS)[13]是基于预先用荧光标记的细胞表面特异性分子标志或细胞光散射的特性,通过流式细胞仪分选出单个细胞或某些特殊细胞群的技术。此技术具有全自动、高精度和高通量优势,能够特异性地分选细胞,是目前比较经济且有效的方法。

1.5 激光捕获显微切割法分离单细胞 激光捕获显微切割法(Laser Capture Microdissection,LCM)是选择性地利用激光在显微镜下从固定组织切片中进行显微切割和分离单细胞。此技术可以快速、准确地获取单一细胞或细胞亚群,有效地解决了细胞异质性的问题,可广泛应用于癌症单细胞的分离与研究[14]。

2 sc RNA-seq技术

SCS是在单个细胞水平上对包括基因组、转录组(Transcriptome)和表观遗传组在内的组学测序技术。其中,转录组广义上是指在某一特定生理条件下,一个细胞、组织或生物体内所有转录产物的总和,包括编码RNA(rRNA、tRNA、mRNA)和非编码RNA;狭义上特指细胞中转录出来的所有mRNA的总和[15]。与基因组不同的是,转录组的研究有着时间和空间上的限制,即同一细胞在不同的生长阶段和环境下,其基因的表达情况是有所差别的。sc RNA-seq首先是构建cDNA文库,然后进行全转录组cDNA的扩增和测序,其中转录组的扩增是该技术的关键步骤[1]。

据估计,在单细胞中总RNA或mRNA的量分别约为10 pg或0.1 pg[16]。因此,全转录组测序(Whole Transcriptome Sequencing,WTA)是用于构建sc RNA-seq的cDNA文库的必要步骤。在新一代测序技术(Nextgeneration Sequencing,NGS)出现之前,WTA已被用于扩增单细胞的RNA以获得微阵列中的基因表达谱[17-18]。Tang等[3]改进了单细胞全转录组扩增方法,并使用NGS代替微阵列在单细胞中鉴定更多基因和以前未知的剪接点。这一研究标志着sc RNA-seq的成熟。该方法的原理是使用寡脱氧胸腺苷酸(oligo dT)引物进行逆转录,并通过PCR选择性扩增聚腺苷酸化mRNA。另一种WTA方法,即SMART-seq,被用于使用莫洛尼鼠类白血病病毒(Moloney Murine Leukemia Virus,MMLV)逆转录酶来构建全长cDNA文库[19]。

SMART-seq的优势在于从单细胞RNA中产生并扩增全长cDNA,从而检测出可变剪接的外显子[20]。SMART的低灵敏度是SMART-seq2[21]的主要缺点。改良的SMART-seq2可以对数百个细胞的转录组同时进行测序,不依赖特殊的单细胞捕获工具或者试剂盒。同样,单细胞反向标记技术是基于逆转录酶的模板转换特性来标记cDNA的5'端[22]。这种方法使研究人员能够比较多个样本中的基因表达谱差异而没有偏差,但是它会产生强烈的5'端偏差。通过线性放大细胞表达法(Cel-seq)用条形码标记cDNA并从多重单细胞收集这些cDNA用于体外转录来线性扩增cDNA[23]。与基于PCR的扩增方法相比,Cel-seq的结果更加灵敏,具有线性特征,但它易产生3'端偏差。

独特的分子标识符(UMIs)标记技术应用于单细胞WTA中来实现定量单细胞RNA测序[24]。该方法通过消除扩增偏差,明显提高了单细胞全转录组测序的准确性。最近,2种新的基于液滴的RNA-seq技术,被称为Drop-seq[25]和inDrop[26],已被用于从组织中并行测序数千个单细胞。每个纳米级的水溶液都是一个微小的反应室,其中包含单个细胞、DNA启动子条形码和UMI标记的引物以及缓冲液。它在溶解细胞后,经转录,mRNA被条形码标记,以此可以追踪每个基因在细胞中的来源,极大地提高了测序通量。在实验过程中,于Drop-seq中对附着在微粒上的单细胞转录子进行PCR扩增,而对inDrop使用Cell-seq进行测序。这些方法的优点是能够区分每个mRNA的原始细胞,这有助于在复杂的组织中进行单细胞分析。

此外,传统的PCR技术对温度等条件要求较高,且扩增的片段较短,变异系数较高,容易造成非特异性扩增。而多重置换扩增技术利用phi29DNA聚合酶以及6个随机碱基的寡核苷酸引物,在30℃条件下进行指数扩增,不需要进行高温处理。反应开始时,6个寡核苷酸引物先分别与模板链的不同部位结合,之后在phi29DNA聚合酶的作用下开始在不同位点同时复制延伸获得产物并代替原来模板的互补链,而原来模板的互补链则会成为新的模板链继续进行下一轮反应。因为引物与模板链结合较紧密,所以该反应可获得高分子量的DNA产物,最高可达100 kb,避免了因高温而导致DNA降解对产物的影响和因GC含量不同而引发的优势扩增。但由于该技术扩增均匀度不高,故可用于单核苷酸多态性及其突变的相关研究[1,27]。

3 高通量测序技术

高通量测序技术(High-throughput RNA Sequencing)有第2代测序技术(454 焦磷酸测序、Solexa聚合酶合成测序和SOLiD连接酶测序)和第3代测序技术(单分子纳米孔测序技术和单分子实时测序技术等)[28]。第2代测序技术基于“边合成边测序”,利用高通量测序技术对转录组进行测序分析,对测序得到的大量原始读长(Reads)进行过滤、组装及生物信息学分析出不同RNA的表达量,因此能够发现新的转录本,识别可变剪切位点和单核苷酸多态性。第2代测序技术因其高通量、高效率和低成本的优势,已经被广泛应用于生物学研究、医学研究和药物研发等领域[29]。第3代测序技术是基于单分子水平上的“边合成边测序”,不依赖PCR扩增,降低了系统误差,同时还能检测特定序列的SNP,测定出稀有突变及其发生频率。相对于第2代测序技术来说,第3代测序技术的原始读长较长,因而不易受GC含量影响,能够直接对RNA测序。

将上述高通量测序技术应用到RNA逆转录生成cDNA的测序分析中,就产生了RNA-seq技术。与其他转录组学技术相比,高通量测序技术的相对优势就更加明了:能够用较少的样本在较短时间内进行高通量、低成本、高度可重复性的测序;基因表达定量的范围较广,可用于基因转录水平的研究;可获得未知转录本,对低丰度表达的基因检测更加准确[28]。

4 sc RNA-seq的应用

4.1 在肿瘤研究领域的应用 癌症的异质性来自于克隆的多样性和突变的进化,它促进了癌细胞转移并发现了癌症的诊断和治疗[30]。SCS作为一种理想的工具已被越来越多地应用于揭示各种原发肿瘤内的异质性,如乳腺癌、肺癌[31]、结肠癌等。

Eirew等[32]研究了乳腺癌患者的基因组克隆在单个细胞的分辨率下的动力学,该研究表明基因组畸变可能是进化轨迹的可重复决定因素。有趣的是,单细胞全基因组测序研究结肠癌时发现了大量在个体水平上的突变基因SLC12A5,并且发现结肠癌具有双源性[33],但随后发展为2个不同的肿瘤细胞亚群。然而,另一项利用单个细胞外显子序列的研究揭示了膀胱癌的演变过程,它表明66个个体膀胱癌细胞是由单个的细胞分裂而成,但是随后发展成2个不同的肿瘤细胞亚群[34]。Hughes等[35]从3种骨髓增生异常综合征(MDS)中提取出单个细胞,从大量样品分析中确定了克隆结构。单细胞外显基因测序揭示了在JAK2阴性骨髓增力肿瘤中发生的单克隆进化,并进一步确定了肿瘤的候选基因突变。

近些年,一系列研究使用SCS来了解不同的罕见循环肿瘤细胞(Circulating Tumor Cells,CTCs)。CTCs是从肿瘤原发灶中脱落而进入患者外周血中的一种癌细胞,数量稀少,但与肿瘤细胞的转移和复发有着密切的关联,已经有很多平台用于检测和充实CTCs[1]。例如,Ramsköld等[36]通过SMART-seq对单个循环系统的肿瘤细胞分析找到了多个基因的不同表达,并在前列腺淋巴结癌细胞中检测出了大多数的活跃基因,同时还发现了不同的基因表达模式。计数CTCs已经被用作预测癌症患者存活率的预后指标。然而,CTCs应该具有更大的潜力。对单细胞水平的CTCs的研究可能有助于揭示肿瘤发生和转移的潜在机制。这一领域虽然远未发展,但在提供新的临床应用和深入了解肿瘤转移和癌症发展方面仍有很大的潜力。

4.2 在眼科研究领域的应用 视网膜具有一定的神经元多样性,能够用于研究神经元分化和神经系统多样性。视网膜由神经节细胞、小胶质细胞、光感受器细胞等多种类型细胞组成,由于其复杂的组成结构,常规的基因测序已不能准确反映细胞间的特异性,而sc RNA-seq却能够克服这一困难,精确地反映出单个视网膜细胞的基因表达情况。Goetz等[37]阐述了对于单个视网膜细胞转录组基因表达分析的实验步骤。Shekhar等[38]用GSP转染双极细胞和 Müller 胶质细胞,通过FACS 收集 GFP 阳性细胞,并应用大规模Drop-seq将约25 000个小鼠视网膜双极细胞分类,获得了15个双极细胞亚型;同时利用分子表达和细胞形态相匹配的方法验证了这种分类方法的准确性,并鉴定了多种新的遗传标记物。鉴定单个视网膜细胞亚型遗传标记物有利于研究与特定视功能相关的靶点,使人们能够更深入地了解细胞功能和细胞异质性的来源。

视网膜退行性病变,如年龄相关性黄斑变性(Agerelated Macular Degeneration,AMD) 是光感受器细胞发生损伤的结果,这也是发达国家人群视力退化的主要原因。Radeke团队将68例眼组织进行了转录组测序,其中有31例正常,26例已经确诊为AMD,11例被认为是极有可能发展为AMD。研究发现,在干性AMD患者中与凋亡相关的转录因子表达度高;在湿性AMD患者中与血管生成相关的转录因子表达度高;所有类型的AMD都是有细胞介导的免疫反应。因此,AMD可能是具有共同的免疫反应的单一性疾病[11]。

4.3 在免疫学研究领域的应用 免疫系统的异质性有助于抵御多种不同病原体的有效防御。近年来,sc RNA-seq开始被应用于免疫系统的研究当中。免疫细胞对抗原物质的应答反应的特点是具有复杂和不均一的异质性。脂多糖能够激活树突状细胞的ToⅡ样受体从而引发转录组的改变。Mahata等[39]使用sc RNA-seq来揭示T helper 2(Th2)细胞群内的广泛异质性,并鉴定出一种新的Th2细胞亚群,其标记有调控类固醇合成途径的Cyp11a1。Shalek等[40]利用RNA转录5´末端的技术,对来源于小鼠骨髓树突状细胞(Bone-marrowderived dendritic Cells,BMDCs)构建了 cDNA 文库及其测序分析,结果显示,在单细胞水平上,树突状细胞的反应呈高度异质性。在部分树突状细胞中许多已知的调控炎症反应的基因一直处于完全被激活状态,而在其他细胞中仅处于被低度激活或未被激活,并且这种反应应答的异质性与树突状细胞的成熟状态和基因调控网络的随机性有关[1]。

尽管目前SCS研究免疫系统的应用比较有限,但SCS已经显示出了对免疫细胞子群的强大潜力以及检测基因表达变异性、差异拼接和基因调控网络的潜力。

4.4 在动物育种研究领域的应用 在幼畜体外胚胎生产和移植技术(Juvenile in vitro Embryo Transfer,JIVET)中,利用sc RNA-seq筛选出影响羔羊卵母细胞成熟的关键基因,并结合实时定量PCR技术对基因进行定量验证,即从分子水平研究卵母细胞成熟的调控机制,以此来提高羔羊卵母细胞发育后期胚胎的潜力,并成功发现 MOS、RPS6KA1、CPEB1、ANAPC13和 CDK1 5个基因对羔羊卵母细胞的成熟有极其重要的作用[41]。JIVET以幼龄母畜卵巢上卵母细胞为卵源在体外培养胚胎,有利于缩短家畜繁殖的世代间隔,充分发掘出具有优良遗传性状的母畜的繁殖潜能,同时提高了家畜的遗传改良速度与生产效率,为家畜育种提供了丰富的遗传资源。

Di等[42]对发情期的滩羊和小尾寒羊卵巢的miRNA通过高通量测序技术进行了研究,发现在183个不同miRNA家族中的483条miRNA,在乏情期中有25条表达情况差异显著,对发情期的调控起重要作用。有研究发现,通过分析比较转录组,对于下丘脑-垂体-卵巢性腺轴调控的排卵及卵泡发育方面神经活性的配体-受体相互作用信号通路起着重要的调控作用,且筛选出影响产羔数的相关基因,丰富和补充了绵羊基因组的信息[43]。

兰道亮等[44]通过RNA-seq技术对牦牛GV期和MⅡ期卵母细胞进行了转录组学测序和数据对比分析,筛选出了4 767个差异表达基因;对差异基因经KEGG通路互作分析后发现,在牦牛卵母细胞成熟过程中代谢通路对基因上调和下调通路均起着关键性的调控作用。该团队在另外一项研究中通过RNA-seq技术对牦牛和中原黄牛发情期卵巢的转录组学测序和对比分析发现[45],细胞粘附过程是区别黄牛和牦牛卵巢生理活动的重要条件之一;补体和凝血级联通路与牦牛的繁殖和卵巢发育之间关系密切,这可能与牦牛所处的特殊的自然环境有关。兰道亮等[44]对牦牛MⅡ卵母细胞和发情期卵巢分别进行的转录组测序研究进一步解释了两者的分子作用机制,为了解牦牛的繁殖特异性提供了新的理论基础。

5 总结与展望

综上所述,单细胞体积微小,极易被破坏,对外界环境敏感,且细胞内外组分不稳定,虽分离时难度大,但多种单细胞分离技术能够满足不同类型细胞的分离与提取,在最大程度上得到理想状态的单细胞;sc RNA-seq通过从单个细胞水平上获得全转录组的表达谱,可以深入分析不同单个细胞之间的异质性、基因表达网络等;高通量、高效率和低成本的高通量测序技术可以直接对RNA测序,能够发现新的转录本,可以直接对RNA测序,且结果更加准确。基于这一综合优势,sc RNA-seq的应用领域从哺乳动物早期胚胎发育逐渐扩大到现在的免疫学、眼科、肿瘤等人类疾病方面,并获得良好效果。

要使sc RNA-seq在未来的应用范围更加广泛,发挥出更大的应用价值,一方面,应对该技术进行更深一步的研究,解决当前存在的诸多问题,使该项技术更加完善,尤其是单细胞分离技术,如何更加高效、优质、快速地获取单细胞,同时,测序技术也需要向高通量、准确、廉价等方向进一步完善。另一方面,如何将sc RNA-seq与其他技术完美结合并应用于实际生产操作和疾病治疗将会是今后相关研究的重要方向。如,转录组学与蛋白组学的联合分析在有关绵羊发情的主效基因研究中起着至关重要的作用,但两者之间通过相互作用来调控生理活动的作用机制仍是目前研究的热点问题;sc RNA-seq与细胞成像技术的结合可为揭示基因表达网络引起细胞差异以及进行动态调控的作用机制提供检测方法。实时和体内对单个细胞的DNA和RNA进行测序和分析将成为一个新的领域,它可以深入了解单个细胞的分子结构在空间和时间上的测量。另外,基于sc RNA-seq已有的应用,该技术自身还存在待改进的地方:庞大的样本量使得数据分析更为复杂;应该向高通量、自动化方向更进一步发展,不仅仅对单个细胞或样品分析,而且能够完成集成化和规模化的分析,整个实验过程的自动化操作,使用专业商业试剂盒,更大程度上提高效率,降低成本;细胞之间转录组的差别较大,对于不同丰度的转录组在放大时仍有线性扩增现象,使一些低拷贝的基因在此过程存在丢失的可能,从而引起分析结果的偏差,因此,改善放大转录组的方法,尽可能防止基因的丢失,使分析结果更为精准也是有待解决的一个问题。总之,随着科研人员的大量实验与研究,sc RNA-seq技术不断发展,以及各环节技术日益成熟,许多相关病理生理的调控机制会被逐渐阐明,在动物育种、疾病的治疗及药物研发等领域将会有更加丰硕的成果,对人类战胜疾病和丰富家畜育种的遗传资源有着重大意义。

猜你喜欢

单细胞高通量异质性
Meta分析中的异质性检验
单细胞转录组测序技术在骨关节炎发病机制中的研究进展
18F-FDG PET/CT代谢参数及代谢异质性与胃癌临床病理特征的相关性
城市规模与主观幸福感——基于认知主体异质性的视角
新一代高通量二代测序技术诊断耐药结核病的临床意义
基于可持续发展的异质性债务治理与制度完善
人工智能助力微生物单细胞鉴定
高通量血液透析临床研究进展
比较高通量血液透析与血液透析滤过在尿毒症患者中的应用效果
核心素养背景下生物重要概念课例