转录组学技术及其在植物系统学上的研究进展
2020-02-04蒋费涛王书平祁俊生熊春霞
蒋费涛 王书平 祁俊生 熊春霞
摘 要:转录组学作为系统生物学的一个重要分支,可以从整体水平上反映细胞或者组织中基因的表达情况及其调控规律,已经被应用到各个研究领域。主要简述了转录组学以及转录组学在植物系统学中的应用,最后展望了转录组学技术在植物系统学中的研究前景。
关键词:转录组学;植物分类学;分子标记
基金项目:“重要跨境农业入侵生物精准识别与智能化快速检测”(2017YFC1200602)
系统学这一词最早出现在林奈的书籍中,随后在Smith和Nutall等人的著作中,系统植物学(Systematics Botany)作为一门学科被提出,系统学最初的含义是将命名的生物按照某个鉴别性状或顺序排列起来。Simpson Michael G.在他编写的《植物系统学(Plants Systematic)》一书中将系统学定义为“包括并涵盖传统分类学、描述、识别、命名和生物分类,其首要的目标是重建系统发育和生命进化史”[1]。
植物系统学既是植物学的基础,同时,也是生态学等全部生命科学的基础,对植物系统学进行研究有着至关重要的意义。首先,对植物系统学的研究可以提供生命巨大的多样性信息,可以让人们充分地了解植物种间的系统发育关系和生命发展史,而对生命发展史的充分了解不仅可以洞察其他领域,还具有实用价值。其次,系统学的研究为划分物种和种下分类(亚种和变种)提供了科学依据,并为确定种间区别提供了科学依据,这类研究在保护生物学的今天尤为重要,了解种类分类群的界限,可以更明确地对稀有或濒危的物种加以保护和保存。植物系统学是记录生物多样性的主要工具,也是帮助拯救生物多样性的重要工具[1]。
转录组学作为功能基因组学的代表,利用高通量测序开发分子标记的优势明显,由于不需要物种的选择性、测序灵敏度高,特别是对于尚未公布基因组测序的新物种,转录组测序能够快速高效地呈现出覆盖面广、准确度高的信息,成为开发分子标记的良好工具而被广泛应用于植物的遗传育种、种质资源保护和开发等领域,从分子的层面研究物种的演化和系统的分类[2]。本研究就目前转录组学的研究方法以及转录组学在植物分类中的应用情况作介绍。
1 转录组学
1.1 转录组学概述
20世纪90年代以来,越来越多的基因组序列被测定,后基因组学时代到来,转录组学(Transcriptomics)、基因组学(Genomics)、代谢组学(Metabolomics)和蛋白质组学(Proteomics)等组学技术得到了迅速的发展与广泛的应用[3]。其中以转录过程作为研究对象的转录组学是最先发展且应用最广的组学技术[4]。
轉录组学是一门在整体水平上研究细胞中基因转录情况及转录调控规律的学科。转录组通常是狭义上的转录组,指细胞中所有参与蛋白质翻译的信使RNA(mRNA)的总和[5]。研究整个转录组的第一次尝试开始于20世纪90年代初,转录组(Transcriptome)这个术语是C. Auffray于1996年最先提出来的,用来描述整套转录本的特征。随后在1997年,VECLALESUC在研究酿酒酵母细胞时提出并在科学论文中第一次使用[6]。
自20世纪90年代初开始尝试研究转录组学后,到20世纪90年代末,科学技术的快速进步与发展使转录组学成了一门被广泛应用于各个领域的科学[7]。目前,转录组学研究技术主要分为两类:一类是在20世纪90年代发展起来的基于杂交方法的微阵列技术(Microarray),另一类是在2000年发展起来的基于测序的方法,主要包括表达序列标签技术(Expressed Sequence Tag,EST)、基因表达序列分析技术(Serial Analysis of Gene Expression,SAGE)、大规模平行测序技术(Massively Parallel SignatureSequencing,MPSS)以及高通量直接全转录组RNA测序技术(RNA Sequencing,RNA-seq)等[8]。
其中,较早发展起来的技术是Microarray以及EST技术,随着近几年的快速发展,RNA-seq逐渐成了基因表达分析的首选技术,在转录应用和微阵列的替代等方面都取得了极其重大的进展[9]。
1.2 微阵列技术
20世纪90年代,微阵列技术逐渐发展起来,其通过与一系列互补探针的杂交来测量一组已确定的转录组的丰度,最早发表于1995年[10]。微阵列技术的原理是将短核苷酸寡聚体构成的探针分子固定在玻璃等支持物上,然后与已经被标记的样品分子进行杂交,对杂交的信号强度进行检测和分析后,就可以得到样品分子的数量和样品分子的基因表达信息。随着科技的发展,微阵列设计和制造的进步提高了探针的特异性,并允许更多基因在单个阵列上进行检测。与此同时,荧光检测技术的快速发展提高了低丰度转录组的灵敏度和测量精度。用于转录分析的微阵列通常分为两类,一类是低密度斑点阵列,另一类是高密度短探针阵列[11]。直到2000年末,高密度微阵列都是转录分析首先选择的方法[12]。
1.3 表达序列标签技术
20世纪80年代,低通量Sanger测序开始被用来对cDNA库中的随机单个转录本进行测序,称为表达序列标签。表达序列标签是由单个RNA转录体产生的核苷酸短序列[13]。20世纪80年代早期,人们认识到来自cDNA的短片段可以用于鉴定基因后开始研究EST技术。基因研究所(The Institute for Genomic Research,TIGR)的科学家是最早大规模生成EST数据的科学家。
表达序列标签是随机挑选cDNA文库,通过单向测序获得的部分序列信息来代表完整cDNA序列的一种技术方法,EST序列的长度通常小于1 000 bp。通过对生物体EST 的分析,可以获得生物体内基因的表达情况和表达丰度[14]。使用EST技术时可以不需要了解它们来自于具体哪些有机体,对非模型生物具有吸引力[15]。表达序列标签技术目前已经被应用在发现和分离新的基因、绘制遗传学图谱等领域[14]。
1.4 基因表达系列分析
1995年,最早的基于测序的转录组学方法之一—SAGE被开发出来,它是由Sanger对连接的随机转录片段进行测序的结果。SAGE是EST方法的一种发展,因为EST方法通量低、价格昂贵且一般无法定量,SAGE就是为了克服这些限制而发展起来的。SAGE目的是提高标记的吞吐量,并能够对转录的丰度进行量化[16]。
SAGE技术的原理是将mRNA逆转录成cDNA后,利用限制性内切酶将cDNA切割为11 bp的片段,然后将cDNA片段连接成长度大于500 bp的长链,利用低通量长读数的方法测序,然后根据特定序列标签出现的次数估计基因表达的丰度。SAGE技术在疾病、发育、细胞凋亡等多个领域已被广泛地应用,但在植物方面的研究相对较少[17-18]。
1.5 RNA测序
RNA-seq是利用深度测序技术来对转录组学进行分析的一种方法。与那些以杂交为原理的转录组学技术相比,以测序技术为基础的技术可以直接测定cDNA序列。RNA-seq通过使用高通量测序方法,再结合一些计算方法来达到捕获和量化提取物中转录本的目的,所产生的核苷酸序列长度根据所使用测序方法的不同而不同,一般在30~1 000 bp。RNA测序技术自2006年被提出后,发展得非常迅速并且被广泛使用,2015年取代微阵列成为主要的转录技术[19]。
RNA-seq主要以第二代测序平台为基础,拥有一整套全新且完备的建库、测序以及分析体系[20]。目前,用于RNAseq的高通量测序平台可从4家公司获得,分别是Illumina,Roche 454,Helicos BioScience和Life Technologies[21]。
RNA-seq虽然是一项正在开发的技术,但与其他的现有技术相比,优势仍然比较明显。与基于杂交方法的微阵列技术相比,RNA-seq不能局限于检测与现有基因组序列相对应的转录本,RNA-seq对于尚未确定基因组序列的生物特别有吸引力;微阵列技术在应用于低水平或者高水平表达的基因时敏感性比较低,同时,RNA-seq也具有很大的动态范围,RNA-seq的典型动态范围约为5个数量级。RNA-seq的输入RNA量也远低于微阵列技术,在表达水平方面,RNA-seq被证明是非常准确的,其结果也显示了高水平的重复性且使用的成本要低于Sanger测序等[22-24]。
2 转录组学在植物分类研究中的应用
2.1 转录组学在物种鉴定上的研究
随着高通量测序技术的不断发展,利用RNA-seq开发EST-SSR标记,逐渐成为一種低成本、高效率的技术,该技术已经在中药伪品鉴定、植物品种鉴定方面有广泛的应用[25]。
蒋超等[26]对忍冬与其变种的ESTs序列进行了分析,选出15对引物对52份金银花进行实验验证,发现其中3对引物可以准确鉴别金银花的原植物忍冬。马庆华等[27]开发12对EST-SSR引物对平欧杂种榛进行品种鉴定,其中 CAF-2、CAF-3、CAF-12和CAF-13等4对引物的组合使用,可区分43个平欧杂种榛品种,CAF-2、CAF-13等2对引物可区分主栽的16个品系,为平欧杂种榛的鉴定提供了快捷且有效的方式。这表明EST-SSR 标记法应用于物种的鉴别具有较好的可行性。
2.2 转录组学在种质资源上的研究与应用
种质资源是生物体遗传给子代的遗传物质,可以保证生命延续和种族繁衍,种质资源是作物遗传改良和相关研究的基础,拥有种质资源的数量和质量,直接影响种质资源的利用效率和现代种业的可持续发展[28]。
龙荡等[29]对早实枳进行转录本测序,共设计SSR引物29对,对18份来自芸香科柑橘3大属的不同品种进行研究,将18份材料成功聚类到3个群体,并开发选择出9对多态性好的引物对早实枳种质资源进行监督,鉴定出15份不同程度的变异植株。龙妮等[30]对6种野生烟草种和西红柿的蛋白质组进行基因家族分析,识别出2 491个单拷贝基因家族,从转录组水平上解释了野生烟草在进化上的位置。同时,研究了野生烟草种的抗性基因及烟碱转录基因,对今后烟草和茄科物种抗病性品种的育种具有指导意义。这些转录组序列丰富了烟属野生种生物的信息数据,为今后烟草分子标记开发、重要形状相关基因克隆及功能分析等研究奠定了基础。
2.3 转录组学在遗传多样性上的研究与应用
遗传多样性不仅是生物多样性的基础,同时显示着基因的多样性,在分子层面对遗传多样性进行研究可以揭示差异的本质[31]。
孙圣[31]基于SSR标记对濒危植物血皮槭11个群体288个样本的天然群体遗传变异的研究,结果说明血皮槭具有较高的遗传多样性,同时,发现血皮槭自然分布区内中心群体的遗传多样性要高于周围群体遗传多样性,综合分析认为血皮槭的遗传多样性不是导致其濒危的主要原因。张甜等[32]基于Illumina HISeq 2 000对核桃的4种组织(叶、芽、雌花、雄花)进行转录组测序,并进行生物信息学分析,对转录组数据进行特征分析,开发EST-SSR引物,随机挑选78对进行扩增,其中53对有条带,39对具有多态性。利用这些引物对来自88个核桃的个体进行遗传多样性研究,结果表明不同地理群体的核桃具有其特有的遗传性状,且88个个体遗传多样性都很高。
2.4 转录组学在植物系统分类中的应用
邢俊连等[33]利用皂荚转录组与基因组数据对皂荚属在豆科植物中的系统进化位置进行研究,通过使用直系同源对建立物种系统进化树的方法,对皂荚在豆科中的进化位置进行分析,实验结果与形态学分类定位一致。同时,利用皂荚属转录组数据开发EST-SSR引物,为今后品种鉴定、遗传多样性分析以及皂荚遗传资源评价提供了分子手段。李清莹等[34]对火力楠的10个天然群体进行EST-SSR分子标记研究,对火力楠进行转录组测序后利用转录组数据,设计并筛选出火力楠EST-SSR引物12对,利用这些引物将火力楠的10个天然群体分为两大类群4个亚类群。
3 问题与展望
近年来,随着科学技术的不断发展,转录组学被广泛应用于各个研究领域。目前,转录组学在研究植物系统分类、物种鉴定以及遗传多样性分析等方面均取得了一定的进展,在植物系统学的研究及内部系统发育关系中发挥着不可或缺的作用。目前,寻找准确且快速鉴定和测试植物种类的技术逐渐成为很多国家的目标,很多研究表明EST-SSR标记应用于植物品种鉴定是可行的[35]。
转录组学技術的发展为植物系统学研究提供了新的技术手段,使植物的转录组研究进入到一个快速发展的阶段。但在实际应用中,转录组学研究也面临着一些问题,比如如何高效地挖掘功能基因。随着生物信息学软件的不断开发与完善,蛋白组学及代谢组学等多组学时代到来,在进行植物系统学的研究时,有必要将转录组学技术与其他组学技术有机结合起来,合理分析,提供更科学和准确的结果。
[参考文献]
[1] JUDD W S,李德株.植物系统学:中文版[J].3版.李德株,译.生命世界,2012(12):98.
[2] 王飞,刘林波,高天歌,等.转录组学在牧草上的应用进展[J].草业科学,2019,36(2):135-146.
[3] YAN W,ZHAO W W,XV W T,et al.Advances in omics technology and application in food science research[J]. Biotechnology Bulletin,2011,21(11):26-32.
[4] LOCKHART D J,WINZELER E A.Genomics,gene expression and DNA arrays[J].Nature,2000,405(6788):827-836.
[5] 王跃,毛开云,王恒哲,等.转录组学测序技术应用与市场分析[J].生物产业技术,2017(5):11-17.
[6] VELCULESCU V E,ZHANG L,ZHOU W,et al. Characterization of the yeast transcriptome[J].Cell,1997,88(2):243-251.
[7] LOWE R,SHIRLEY N,BLEACKLEY M,et al.Transcriptomics technologies[J].Plos Computational Biology,2013(5):1005457.
[8] QIAN X,BA Y,ZHUANG Q,et al.RNA-seq technology and its application in fish transcriptomics[J].Omics:A Journal of Integrative Biology,2013,18(2):98.
[9] 祁云霞,刘永斌,荣威恒.转录组研究新技术:RNA-seq及其应用[J].遗传,2011,33(11):1191-1202.
[10] WANG Z,GERSTEIN M,SNYDER M.RNA-seq:a revolutionary tool for transcriptomics[J].Nature Reviews Genetics,2010,10(1):57-63.
[11] HELLER M J.DNA microarray technology:devices,systems,and applications[J].Annual Review of Biomedical Engineering,2002,4(1):129-153.
[12] CORLAN A D.Medline trend:automated yearly statistics of PubMed results for any query[J].Mendele,2017(4):27.
[13] MARRA M A,HILLIER L,WATERSTON R H.Expressed sequence tags—ESTablishing bridges between genomes[J]. Trends in Genetics Tig,1998,14(1):4.
[14] PUTNEY S D,HERLIH Y.Nature 302[J].Science,1983(2):718-721.
[15] 金基强.茶树EST-SSR标记的建立及其应用研究[D].杭州:浙江大学,2006.
[16] EL-MEANAWY M A,BARATHAN S,HAYDEN P S,et al.Serial analysis of gene expression[M].Totowa:Humana Press,1995.
[17] FRED V R,FRANK B.Serial analysis of gene expression(SAGE)[J].Nature Protocols,2007,383(2):1743-1760.
[18] 张振乾,谭太龙,肖钢,等.基因表达系列分析法(SAGE)的改进及其在植物功能基因组研究中的应用[J].基因组学与应用生物学,2009,28(6):1204-1210.
[19] 朱莉,常汝镇,邱丽娟.基因表达系列分析技术在植物基因表达分析中的应用[J].中国农业科学,2003(11):5-12.
[20] MEYERS B C,VU T H,TEJ S S,et al.Analysis of the transcriptional complexity of Arabidopsis thaliana by massively parallel signature sequencing[J].Biotechnol., 2004(2):22.
[21] WANG Z,GERSTEIN M,SNYDER M.RNA-seq:a revolutionary tool for transcriptomics[J].Nature Reviews Genetics,2010,10(1):57-63.
[22] SU Z,FANG H,HONG H,et al.An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era[J].Genome Biol.,2014(3):15.
[23] 王楚彪,盧万鸿,林彦,等.转录组测序的发展和应用[J].桉树科技,2018,35(4):27-33.
[24] 祁云霞,刘永斌,荣威恒.转录组研究新技术:RNA-seq及其应用[J].遗传,2011(11):42-53.
[25] 刘培培,罗光明,柴华文,等.SSR标记技术在中药鉴定中的应用[J].生物技术通报,2019,35(2):198-203.
[26] 蒋超,袁媛,刘贵明,等.基于EST-SSR的金银花分子鉴别方法研究[J].药学学报,2012,47(6):803-810.
[27] 马庆华,李京璟,赵天田,等.基于EST-SSR标记的平欧杂种榛品种鉴定[J].植物遗传资源学报,2017,18(5):952-959.
[28] 黎裕,李英慧,杨庆文,等.基于基因组学的作物种质资源研究:现状与展望[J].中国农业科学,2015(17):52-72.
[29] 龙荡.基于转录组测序大规模开发早实枳SSR标记[D].武汉:华中农业大学,2014.
[30] 龙妮.烟草属野生种转录组比较分析[D].昆明:昆明理工大学,2016.
[31] 孙圣.基于SSR标记的血皮槭天然群体遗传变异研究[D].南京:中国林业科学研究院,2014.
[32] 张甜.核桃谱系地理学和转录组学遗传标记开发研究[D].西安:西北大学,2016.
[33] 邢俊连.皂荚属系统进化分析及SSR分子标记开发[D].合肥:安徽农业大学,2016.
[34] 李清莹.火力楠种质资源遗传多样性研究[D].南京:中国林业科学研究院,2018.
[35] 黄少勇,张智俊,罗淑萍,等.山核桃EST-SSR引物的筛选及通用性分析[J].经济林研究,2013(3):16-21.
Research progress of transcriptional technology and its advances in plant phylogeny
Jiang Feitao1, Wang Shuping2, Qi Junsheng1, Xiong Chunxia1(1.Chongqing Three Gorges University, Chongqing 050024, China; 2.Animal, Plant and Food Inspection and Quarantine Technology Center of Shanghai Entry Exit Inspection and Quarantine Bureau, Shanghai 200000, China)
Abstract:As an important branch of systems biology, transcriptomics can reflect the expression of genes and their regulation in cells or tissues from the overall level, and has been applied to various research fields. The application of transcriptomics and transcriptomics in plant phylogeny is briefly described in this paper. Finally, the prospect of transcriptomics in plant phylogeny is prospected.
Key words:transcriptomics; plant taxonomy; molecular markers