APP下载

scRNA-seq技术及其在动物研究中的应用与进展

2020-12-24赵敏蝶赵宇卓刘学东梁冬莹

野生动物学报 2020年1期
关键词:单细胞胚胎图谱

赵敏蝶 吴 尽 赵宇卓 刘学东 郑 冬 梁冬莹

(东北林业大学,哈尔滨,150040)

细胞是生物体的基本结构和功能单位,在其生长发育过程中,因细胞类型、环境以及内部调节的不同,转录组信息的变化呈多样性。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。传统转录组的研究主要是在器官或者组织水平上测序,即转录组测序(RNA-seq),忽略了单个细胞在遗传方面的特殊性。单细胞转录组测序(single cell RNA-seq,scRNA-seq)是在单个细胞水平对mRNA进行高通量测序的一项新技术,将分离的单个细胞的微量全转录组RNA扩增后进行高通量测序,从单细胞水平上获得全转录组的表达谱[1-3]。scRNA-seq能够以高通量和单分子分辨率研究单个细胞表达谱,揭示复杂细胞群体的异质性,避免单个细胞的基因表达信号被群体的平均值所掩盖。scRNA-seq更加精准,最终得到的是每个细胞型的表达量,从而可以帮助理解组织异质性,鉴定罕见的细胞类型,检测细胞组分的变化,在人类的癌症异质性、胚胎发育、细胞对药物的反应、神经细胞分型、差异表达通路等方面都发挥重要作用[4-7]。本文对scRNA-seq技术原理及其在动物研究中的应用与进展进行综述。不仅可以了解动物不同发育时期组织细胞之间的特性,为动物研究提供科学参考,针对野生动物的研究也能提供一个新的方向。

1 scRNA-seq技术的发展历史及其在生物学研究中的作用

1990年Brady等首次描述了一种基于聚合酶链式反应(PCR)的单细胞cDNA扩增方法[8]。几乎同时,Eberwine等提出了另外一种基于体外转录的线性扩增方法[9]。随着基因芯片技术的发展,2002年起多篇文章报道了单细胞转录组的基因芯片分析[10-13]。2009年,Tang等首次报道单细胞转录组的深度测序分析[3],并于2010年再次发表相关研究工作[14]。至今,scRNA-seq已成为生物学研究中应用热门之一。

单细胞转录组研究能够在单个细胞水平上揭示细胞内整体水平的基因表达状态和基因结构信息,准确反映细胞间的异质性,深入理解其基因型和表型之间的相互关系[15]。scRNA-seq作为一种针对单细胞转录组进行测序的技术,随着其发展,人们将会对细胞的认识更加全面丰富。在生物学研究中,scRNA-seq可以研究基因调控网络,基因表达的异质性与随机性,基因表达水平,监测新的基因(包括新的蛋白质编码基因和非编码RNA基因,尤其是低表达基因),定量研究基因的突变情况等。scRNA-seq技术主要用于大规模细胞图谱构建[16-20]、细胞亚群细化和稀有细胞类型鉴定[19,21]、肿瘤方向研究[22]、干细胞发育及分化研究[23]、免疫方向研究[24-27]、神经科学研究[28]、发育生物学[3-4,16-19,29-38]等。这些研究为人类认识和了解生物机体和各种功能提供了重要的方法和途径。同样,scRNA-seq在动物的研究中也得到推广和应用。

2 scRNA-seq在动物研究中的方法

近年来,随着单细胞转录组测序技术的发展,许多研究人员利用该技术对动物的某些单细胞的转录本进行研究,初步实现在单个细胞水平上对动物机体的了解,确定了scRNA-seq技术在动物研究中的适用性。具体的研究方法通常分为以下几部分。

2.1 单细胞分离

首先,研究者要对单个细胞进行分离以获得单细胞样品。分离单个细胞,常用技术:连续稀释法、显微操作法、微流控芯片(microfluidics)、荧光激活细胞流式分选(fluorescence-activated cell sorting,FACS)、磁性激活细胞分选(magnetic-activated cell sorting,MACS)、转录组体内分析法(transcriptome in vivo analysis,TIVA)以及激光捕获显微切割法(laser capture microdissection,LCM)等。研究人员根据实验条件和目的对单细胞的分离采取不同的方法。例如汪俊帮等人在显微镜下分离出了小鼠(Musmusculus)胚胎二细胞期的细胞[39]。

2.2 建库及数据获得

scRNA-seq数据的获得通常包括细胞裂解、mRNA逆转录成cDNA、cDNA扩增、文库构建4个步骤。首先加入缓冲液使细胞降解,获得mRNA,去除蛋白质和DNA等杂质,纯化mRNA,然后进行逆转录,一般使用oligo-dT引物和SuperscriptⅡ或Ⅲ逆转录酶,将mRNA逆转录出cDNA第一链,并通过模板转换,合成cDNA的第二条链。再对已逆转录生成的cDNA进行PCR或者IVT扩增,对扩增得到的产物进行纯化测序。

单个哺乳动物细胞内的总RNA含量约为10 pg,其中mRNA约为0.1—0.5 pg,而目前高通量测序文库需要至少数十纳克DNA,因此单细胞RNA-seq的文库构建过程需将起始核酸进行数十万倍扩增[40]。根据合成第二条cDNA链时使用的酶,可将单细胞转录组测序的cDNA扩增方法分为PCR法、体外转录法和Phi29 聚合酶法。将扩增得到的产物进行纯化后,一般采用高通量测序技术(high-throughput RNA sequencing)对转录组进行不同深度测序分析,得到大量原始的读长(reads),初步得到单细胞转录组数据。

2.3 分析

对scRNA-seq数据的处理首先要进行质量控制、表达量估计以及数据的标准化。获得scRNA-seq原始reads后,需要对原始reads,对齐reads及不同批次细胞进行质量控制,以剔除低质量数据。质量评估后,采用不同的数据表达方式来代表表达水平。但这些方法不适用于直接比较细胞间的表达量差异,对于大多数下游分析,均需要先将不同细胞的数据进行标准化。scRNA-seq实验中存在的各种噪声,会对后续分析造成影响,所以,也需对数据进行评估和调整实验误差,来减少技术或生物来源造成的scRNA-seq实验的噪声。根据所调查的生物问题有许多分析方法,本文从细胞水平分析和基因水平分析两个方面进行介绍。

2.3.1 细胞水平分析

细胞水平分析包括可视化、聚类分析、细胞发育阶段推断和排序等[18,31-33]。处理单细胞转录组数据这样一个高维的数据时,一个常用的策略是将这些细胞投影到低维的空间上,达到可视化分析,也就是降维技术,通过仅考虑二维或三维空间,可视化提供了定性地探索数据的平均值。聚类分析用于识别细胞亚型(如细胞异质性、细胞分化周期的判定等),提供了通过相似性对细胞进行分组的机制。scRNA-seq能够提供单个细胞全基因表达谱,利用scRNA-seq数据,结合计算机技术可将非同步细胞群中单个细胞的分化路径排序。细胞发育阶段推断和排序分析是通过降维和基于图论的原则,将处于不同分化阶段的细胞进行排序。Monocle、PQ-trees等方法的使用使得scRNA-seq数据转化成细胞所处的不同分化阶段,可以确定基因表达的动态变化。

2.3.2 基因水平分析

基因水平分析包括高变异基因的鉴定、差异表达基因和标记基因的识别、基因调控网络分析等。对于高变异基因的鉴定,Brennecke等首先利用插入分子估计了技术噪音,并建立了均值-方差关系模型来识别高度可变的基因[41];Kim等提出了一个基于生成模型的统计框架,将总方差分解为技术和生物方差,这将有助于识别可变基因[42];贝叶斯模型可联合模拟尖峰和内源性基因,并提供生物变异程度的后验分布[43]。在scRNA-seq研究中识别亚群的差异表达基因和标记基因是一个简单但重要的分析。MAST、M3Drop等scRNA-seq实验方法通过混合模型或简单统计检验识别差异表达。标记基因的识别是通过差异分析来识别每个cluster下的标记基因,将该cluster下的细胞作为一组,其他cluster下的细胞作为另一组,然后进行差异分析。scRNA-seq研究的一个重要应用是识别基因的共调控模块和利用基因与基因表达相关性构建的基因调控网络。研究人员已经鉴定了许多共表达基因的功能模块,可以描述小鼠的每个胚胎发育阶段。scRNA-seq研究中推断的网络是无向的;也就是说,它们不能在基因之间提供直接的调节关系。为了揭示哪个基因位于调控级联的上游/下游,通常需要进行扰动实验(例如敲除目的基因)。

3 scRNA-seq在动物研究中的应用

3.1 早期胚胎发育

在胚胎发育的早期阶段,受精卵会经历广泛的转录调节和表观遗传重编程过程。早期胚胎发育阶段的细胞数量极为稀少,其转录组分析尤其需要scRNA-seq技术。2009年,Tang等首次应用scRNA-seq于单个小鼠卵裂球,检测到比微阵列技术多75%的基因表达,并识别出1 753个以前未知的剪接连接;对于卵母细胞,与野生型对照相比,1 696和1 553个基因分别异常上调[3]。2013年,小鼠和人类着床前胚胎的高精度单细胞转录组图谱陆续完成[16-17]。利用scRNA-seq筛选出影响盘羊(Ovisammon)卵母细胞成熟的关键基因,并结合实时定量PCR技术对基因进行定量验证,即从分子水平研究卵母细胞成熟的调控机制,以此来提高羔羊卵母细胞发育后期胚胎的潜力[29]。兰道亮等对野牦牛(Bosgrunniens)GV期和MⅡ期卵母细胞进行了转录组学测序和数据对比分析,筛选出了4 767个差异表达基因[30]。单细胞转录组测序的时间序列可以揭示细胞分化途径的动态特征。研究人员用scRNA-seq技术分别在斑马鱼(Daniorerio)和非洲爪蟾(Xenopuslaevis)早期胚胎发育过程中建立了基因表达动态图谱,将相关数据以几分钟到几小时的时间间隔组合在一起,对细胞进行逐个描述,并观察胚胎最终形成的过程,揭示了单个细胞构建整个生物体的完整过程[31-33]。这些研究为野生动物早期胚胎发育的研究提供了新的途径。

3.2 组织器官发育

组织器官发育是scRNA-seq技术应用的另一个重要领域。多种组织器官(包括肺[4]、脑[34]、心脏[35]、肾脏[36]、小肠[37]等)发育过程中的单细胞转录组分析已被报道。2018年,研究人员对来自小鼠20个器官和组织的约10万个单细胞进行单细胞转录组分析,结果揭示了之前研究中从未完整展示的基因表达图谱,并且能直接比较不同组织和细胞类型的基因表达,最终建立了一个名为Tabula Muris的储存小鼠细胞信息的开源数据库[39]。DeLaughter等从小鼠胚胎发育的7个不同阶段提取心脏细胞样本,利用scRNA-seq技术检测了单个细胞基因活性随时间的变化,提供了一个时间和空间的图谱,描绘了心脏不同细胞群的发展[35]。scRNA-seq技术可以通过分析单个细胞转录组精细地识别出各种细胞类型,同时能够发现新的细胞类型以及标记基因。Carter等研究得到了来自12个关键发育时间点的小鼠小脑单细胞图谱,鉴定了主要的小脑细胞亚群,确定了有助于小脑发育的亚群[18]。Pandey等将单细胞转录组与脑解剖相结合,得到了约13 000个斑马鱼松果体缰细胞,确定了18种神经元类型和几十种标记基因,创建了全面的斑马鱼松果体缰单细胞图谱[19]。scRNA-seq技术鉴定细胞类型和识别标记基因的特点将有力推动发育生物学的研究。

3.3 免疫系统

免疫细胞对抗原物质的应答反应具有复杂和不均一性的异质性特点,单细胞转录组测序技术有望在此方面揭示丰富的未知信息。先天性淋巴细胞(ILCs)是动物免疫应答和体内平衡的重要介质。Hernández等利用scRNA-seq获得了组织稳态期间和免疫攻击后斑马鱼淋巴细胞的综合图谱,从野生型斑马鱼的肠道以及rag1突变(缺少T和B细胞)的斑马鱼中共收集14 080个单细胞,发现了ILC样细胞[24]。应用scRNA-seq可以获得斑马鱼特异性免疫细胞类型的第一个转录组并对其进行表征。差异表达分析揭示了新的免疫细胞特异性基因,为免疫系统的进化提供了更多的线索[25]。在其他研究中,scRNA-seq揭示了斑马鱼中存在Th2和调节T细胞(Tregs),进一步证实了哺乳动物和硬骨鱼在免疫生物学上的相似性[26-27]。

3.4 其他

scRNA-seq技术可作为一种新的肿瘤细胞鉴定技术,更加精准地判定肿瘤类型以及揭示相关基因调控网络。Puram等采用scRNA-seq的方法分析了来自头颈鳞状细胞癌的细胞。他们通过分析构建出头颈癌中存在的所有不同细胞的图谱[22]。scRNA-seq还可用于大脑细胞图谱绘制。Carter等研究得到了来自12个关键发育时间点的小鼠小脑单细胞图谱,利用已知的谱系标记进行验证,表明单细胞数据能准确概括小脑的发育。最后,创建了名为Cell Seek的数据集[18]。Davie等研究构建了全面的成年果蝇(Drosophilamelanogaster)大脑细胞图谱;开发了SCENIC果蝇数据库,能映射出果蝇大脑中神经元和神经胶质类细胞的基因调控网络;绘制了大脑衰老过程中的细胞状态变化,利用机器学习的方法,根据细胞的基因表达谱来准确预测细胞的年龄[20]。除此之外,Gerber等针对东方蝾螈(Cynopsorientalis)肢体再生的问题,联合使用Cre-loxP报告基因谱系跟踪和scRNA-seq,追踪了CT细胞谱系的再分化轨迹及肢体再生过程中特殊谱系的分子重建步骤[44]。Feregrino等利用发育中的红原鸡(Gallusgallus)的足趾作为研究脊椎动物模式形成的范例,使用scRNA-seq,对来自鸡自噬模式3个关键发育阶段的17 628个细胞进行了测序[45]。结果显示鉴定了23个具有不同转录谱的细胞群,检测出稀有细胞类型,推断出在发育过程中与不同组织类型相一致的基因共表达模块。Foster等研究小海胆(Hakiacorbularis)胚胎时利用scRNA-seq分析揭示了胚胎发育过程中存在的细胞类型、抑制各种信号通路导致的基因调控网络的变化,以及这些通路在影响发育轨迹方面的选择性[46]。非洲爪蟾蝌蚪具有很高的再生潜力,为了描述这种再生反应,Aztekin等人在尾部截肢后进行了scRNA-seq[47]。转录谱分析显示,再生组织细胞分泌与关键再生途径相关的配体,向祖细胞发出信号,以重建丢失的组织。

4 展望

随着第三代测序技术的发展,scRNA-seq技术也逐渐得到重视。近年来,单细胞转录组测序技术已经取得了较为明显的发展,被应用到诸多领域,随着方法学的成熟,scRNA-seq技术在未来动物研究中将会得到更加广泛地应用。可能包括对各种组织器官的发育过程进行单细胞转录组分析,发现新的细胞类型等;与基因组编辑技术结合,对转录调控网络进行单细胞分辨率分析;与细胞成像技术结合,揭示基因表达网络引起细胞差异以及进行动态调控的作用机制提供检测方法等。目前,scRNA-seq在野生动物保护研究中的应用并不广泛。野生动物保护研究主要集中在栖息地保护、环境资源保护、人为干扰等方面,对个体与基因层次的研究并不深入。scRNA-seq在小鼠、果蝇、鸡等实验模型动物或家畜以及蝾螈、非洲爪蟾、斑马鱼等的应用研究证明了该技术可应用于野生动物的个体和基因层次的保护研究中。未来,如果将scRNA-seq技术更多的应用到野生动物研究中,在单细胞水平上研究野生动物不同组织的基因表达情况,包括基因突变、基因调控网络等,构建个体不同组织的细胞图谱,研究个体干细胞发育及分化等内容,从早期胚胎发育到组织器官发育、免疫系统等多个领域,可以更加充分地从个体和基因方面了解野生动物的发育生长,对更好地保护和利用野生动物具有重要意义。

猜你喜欢

单细胞胚胎图谱
母亲肥胖竟然能导致胚胎缺陷
绘一张成长图谱
人工智能助力微生物单细胞鉴定
母亲肥胖竟然能导致胚胎缺陷
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
DiI 在已固定人胚胎周围神经的示踪研究
联合SNaPshot和单倍型分析技术建立G6PD缺乏症单细胞基因诊断体系
单细胞测序技术研究进展
冷冻胚胎真的可以继承吗?