紫叶紫薇新品系叶色变化转录组分析
2018-09-10王莹李玉娟李敏马祥建谈峰郭聪张健
王莹 李玉娟 李敏 马祥建 谈峰 郭聪 张健
摘要:对紫叶紫薇新品系的叶片进行RNA-Seq测序和分析,共获取145 338条Contig,得到组装的Unigene有53 654条,平均长度1 186.25 bp。32 667条Unigene可以匹配到蛋白质数据库获得注释信息,KEGG和GO注释与富集分析显示,差异DEG主要调节激素信号转导、碳水化合物代谢、核糖体代谢等生物学功能。58个表达差异基因分别对比到毛果杨和拟南芥2个模式植物的数据库,筛出与叶绿素代谢相关候选基因9个,其中2个候选基因共同参与了叶绿素兼类黄酮代谢的调控,2个候选基因可能参与类黄酮代谢过程,它们分别属于DUF547、Polyketide_cyc2、Pkinase、Calreticulin、NAD_Gly3P_dh_N、Glyco_hydro_9等13个基因家族,主要经氧化还原反应、物质能量代谢、植物激素信号转导等机制介入紫薇叶色调控。本研究结果为探究紫叶紫薇叶色变异的分子机制提供参考。
关键词:紫叶紫薇:叶色变化:转录组
中图分类号:S687.9
文献标识码:A
文章编号: 1000-4440(2018) 05-1128-10
紫薇(Lagerstroemia indica)以其观赏性佳、抗逆性好,受到广泛关注。虽然紫薇属资源在中国分布非常广泛,但该属植物的育种研究起步较晚,主要集中在花色,如李文芳等和刘龙昌等分别对紫薇花色素的化学性质及结构进行了初步研究:花香,如徐婉等对紫薇杂交后代花香气成分做了定性与定量分析;抗逆性,如谢宪等对紫薇抗寒性的研究。紫薇属稀缺彩叶品种,近年来育种专家们通过引种与选育,逐步获得了一批集观花、观叶性于一体的彩叶紫薇。然而,对彩叶紫薇的研究目前仅集中于传统的引种与栽培技术研究,基础研究方面过于薄弱,尤其关于叶片呈色机理的研究。目前仅能查阅到宋倩等和王淑安等关于彩叶紫薇的叶色变异机制的研究报道,分别阐明了彩叶紫薇叶色变化与叶片中色素含量的关系,得到了大量與类胡萝卜素和叶绿素合成相关的候选基因。
作为非模式植物中的一员,紫薇全基因组测序尚未完成,生物信息学信息十分匮乏。随着测序技术日益成熟,高通量测序技术可以在不涉及基因组信息的情况下,检测到所有物种的转录本,为彩叶紫薇叶片呈色机制的研究提供可能。
RNA-Seq测序技术可获得大量的遗传信息,能诠释植物生化水平的多样性及植物次生代谢分支调控机理,为研究彩叶植物叶色转化带来新的机遇。曹桦等对铁皮石斛叶色突变体进行转录组测序分析,认为do GLK1表达水平低和do Ftsz不表达导致了突变体叶绿体合成和分裂受阻。任杰对红花槭品种艳红叶色转化期转录组解析结果表明,花青素苷代谢途径基因差异表达对叶色变化起重要调控作用。红掌突变体叶色呈色机制的研究结果表明,AaGLK和AaARC5分别是调控叶绿体发育和分裂的关键基因,AaDFR在花青素合成过程中起着关键作用。转录组测序技术已经被广泛应用在非模式彩叶植物的叶片呈色机理研究中。
本项目组2011年开始进行紫薇实生选种工作.2012年开始进行杂交育种工作,通过2种方法已选育出一批观赏性状优良的彩叶紫薇新品系。其中在黑钻石系列Best Red后代实生苗中发现l株植株叶片在春季呈现更加明艳的紫红色,初夏开始返青,上位叶紫红色,中位叶呈紫色与绿色相交的花叶色,下位叶绿色,色叶期比亲本长15~20d,通过繁育观察,其特异性、一致性、稳定性均达到新品种的申报要求,拟定名为紫晶l号,已申报国家林业局植物新品种权。本研究利用Illumina HiSeq高通量测序平台对紫晶1号不同叶位叶片进行转录组测序分析,比较不同叶片中基因表达的差异,以期通过RNA-Seq技术获得与叶色性状相关的基因序列,为揭示紫叶紫薇叶色变异的分子机制和培育彩叶紫薇新品种提供参考。
1 材料与方法
1.1 试验材料
以江苏沿江地区农业科学研究所紫薇种质圃内新选育的紫叶紫薇紫晶l号为试验材料。选取转色期叶色性状稳定、生长健壮、长势一致的植株,采集上位叶(紫叶)、中位叶(花叶)和下位叶(绿叶),用锡纸包裹,在液氮中迅速冷冻。本项目中试验材料总RNA的提取与质量检测以及无参考基因组序列的转录组高通量测序分析均由北京百迈客生物科技有限公司进行。
1.2 试验方法
1.2.1 总RNA的提取与质量检测 用总RNA提取试剂盒(QIAGEN)对不同叶位叶片进行RNA提取,样本的纯度、浓度和完整度分别选用Nanodrop、Qu-bit 2.0、Aglient 2100分析。后续进行合格RNA的cDNA文库构建和RNA-Seq测序。
1.2.2 cDNA文库构建和转录组测序检测后合格的样品,以mRNA为模板,构建cDNA双链,利用AMPure XP beads试剂盒依次进行纯化、末端修复和片段大小选择,通过PCR富集得到紫薇cDNA文库。cDNA文库的质量用Agilent 2100检测,再通过Illumina Hi-Seq平台完成RNA-Seq测序分析。
1.2.3 De novo组装及质量控制 获得的原始数据(Raw reads)经过滤得到Clean reads,将其用Trinity拼接,得到Contigs,利用De Bruijn图的方法和测序Read信息,在片段集合中读取转录本序列,最长Contig即为最终转录本的Unigene。
1.2.4 Unigene功能注释使用BLAST软件将DEGs序列与NR、Swiss-Prot、GO、COG、KOG、eggNOG4.5、KEGG数据库分别比对,获得相关注释信息。
2 结果与分析
2.1 转录组测序与de novo组装
利用Illumina Hi-Seq对3个不同叶位叶片(每个叶位3个重复)共计9个样品进行转录组测序(表1),共获得68.56Gb(过滤后序列),各样品过滤后的序列量均达到6.87Gb以上;Q30碱基百分比在91%以上,G、C含量在49%以上,可以用于下一步的De novo组装。利用Trinity软件将所有的短序列拼接,获得145 338条Contig,进一步组装得到53 654条Unigene,总长度63646992 bp,平均长度为l 186.25bp,其中长度在200—300 bp的Unigene所占的比例最高,Unigene的N50为2229 bp,组装完整性较高(图1),获得的Mapped Read可用于后续分析。
2.2 差异基因表达量分析
将FDR小于0.01,差异倍数FC≥4作为筛选标准,对紫晶l号3个不同叶位叶片中差异表达基因进行比对,共筛选得到58条差异表达基因(图2、表2):以绿叶为对照,上位叶检测出的差异表达基因数目最多,有4792个转录因子的转录水平发生了改变,其中上调表达的转录因子基因高达4017个,上调倍数在4.00~1573.76,最大上调基因ID为c49503.graph_c0;在下调基因中,下位叶与中位叶对比,差异DEG最少,其次为上位叶与下位叶对比得到的差异DEG数,其中最大下调表达基因ID为c41691.graph_c0,下调倍数达1 418.35。
2.3 差异表达基因功能注释
通过选择BLAST参数(E-value≤le-5)和HM-MER参数(E-value≤le-10),将全部Unigene序列与COG、GO等8个数据库比对(表3、表4),最后得到32667个有注释信息的基因,其中长度在1000 bp以上的基因注释效率为53.05%,而未得到注释的Unigene为20 987条(39.12%)。
2.4 差异表达基因GO分类和功能富集
紫晶l号差异表达基因在GO数据库进行比对,有18 718条Unigene在GO数据库中得到相关注释,其中每2个样品相比得到的差异基因在GO数据库中注释率最多达56.88%(图3),注释的基因参与生物学过程、细胞组分和分子功能调控(表5),功能组涉及到53个。生物学过程的注释显示,Uni-gene表达差异显著顺序依次为代谢过程,细胞过程和单组织过程;在细胞成分分类信息中,细胞部分和细胞显著富集:在分子功能分类中,富集程度最高的是催化活性,说明紫晶l号转色时期叶片中催化活性受影响较大。
2.5 差异表达基因KEGG注释和富集分析
有7544个(23.10%) Unigene在KEGG数据库得到注释,涉及了119个KEGG代谢通路,其中绿叶与紫叶对比获得注释的919个差异表达基因( DEG)可以被分配到118个KEGG通路(表6),绿叶对比花叶获得注释的187条DEG可以被分配到88个KEGG通路,紫叶对比花叶获得注释的599条DEG可以被分配到113个KEGG通路,排名前10显著性富集差异基因主要涉及到细胞途径、遗传信号响应、环境信号响应和新陈代谢4个方面,其中最大的分类是新陈代谢,包括碳水化合物、氨基酸、多糖生物合成以及能量、次生物质等;环境信号响应类最小。同时,KEGG的注释结果也显示,差异基因主要参与了次生物质代谢、植物激素信号转导、核糖体代谢和碳水化合物代谢等通路。紫晶l号在转色期叶片类黄酮生物合成途径的KEGG通路注释结果显示,花青素合成途径中有9个基因表达上调,3个基因下调,肉桂酰辅酶a是花色苷合成关键酶,相应的基因ID为c37587.graph_c0、c50617.graph_c0和c54586.graph_c0(K05278+K08695+K00660).
2.6 差异基因注释结果分析
叶色转化期间,log2FC达8倍以上差异表达的基因如表7所示,高水平差异表达的注释基因中,以绿叶为对照,紫叶对比花叶的短链脱氢酶还原酶c27313.graph_c0基因表达下调水平显著;以紫叶为对照,c52058.graph_c0(表皮原因子基因)也显示出相似的下调趋势。在差异表达DEG中,除c47073.graph_c0、c27117.graph_c0为假定的脂质转移蛋白基因,其他的基因功能主要涉及到基础代谢、逆境响应因子、性别决定等几个方面。
2.7 叶色相关转录因子分析
在转色期间,3种不同叶位筛选到差异基因58个。与模式植物毛果杨和拟南芥的GO和KEGG蛋白数据库作比对(表8),筛出与叶绿素代谢相关候选基因9个,其中2个候选基因共同参与了叶绿素兼类黄酮代谢的调控,2个候选基因可能参与类黄酮代谢过程,分别属于DUF547、Polyketide_cyc2、Pki-nase、Calreticulin、NAD Gly3P dh_N、Glyco hydro 9等13个基因家族,主要经氧化还原反应、物质能量代谢、植物激素信号转导等机制介入紫薇叶色调控。在与叶色相關差异表达候选基因中,有11条Uni-gene与卟啉环代谢和叶绿素合成相关基因表现出同源性:而c56217.graph_c0基因在叶绿素降解通路中发挥了一定作用;在花青素苷代谢途径中,尿苷二磷酸葡萄糖基转移酶、富含亮氨酸重复序列受体蛋白激酶、松脂醇还原酶I、聚半乳糖醛酸酶Ⅱ等均参与了对花青苷代谢途径的调控。
3 讨论
3.1 基于RNA-Seq技术的植物叶色基因的发掘
新一代高通量测序技术是基于边合成边测序和可逆终止子的原理,双端测序的使用,不仅可以提高测序的深度,还能提高从头拼接的效率和准确性。一大批彩叶植物包括紫背天葵(Gynura bi-color)、银杏(Ginkgo biloba)、花叶矢竹(Pseudosasa japonica f.Akebonosuji)等的转录组已经被测序,为研究彩叶植物色素合成途径及叶色转化带来新的机遇。本项目组对紫晶l号3种叶色叶片作了转录组测序分析和功能基因预测,获得145338条Contig,进一步组装得到53654条Uni-gene,Q30均大于91%,被标记的序列数比例(被标记的序列数/过滤后的序列数)均在72%以上,Uni-gene的N50为2229 bp,测序数据的输出和装配质量能够满足转录分析的基本要求,为诠释紫晶l号叶片色素代谢分支调控机制,为色素合成关键基因的挖掘提供重要参考。
3.2 差异基因表达与功能注释分析
杨海芸等的研究结果表明,同一转录组Uni-genes的序列越长,其匹配率越高,本研究中长度在1000 bp以上的基因注释率为53.05%,而在300—1000 bp的Unigenes的注释率只有29.50%,结果与前者相似。在生物学过程分类中,表达差异最大的是代谢过程,这与吴全金、郭小鸥的研究结果相似,表明紫晶l号叶片中代谢相关基因的表达存在显著差异,代谢产物的差异可能导致生物学功能与形态的差异。罗成科等在相关研究中指出,DUF是一大组未表明功能的蛋白家族,一些植物特有的DUF蛋白家族在调控植物生长发育、防御病虫害和非生物胁迫应答反应等方面起着重要作用。Kodama等的研究结果显示,拟南芥叶绿体运动响应是DUF家族中WEB1和PMI22个基因互相作用调控的,推测c42391.graph_c0可能与其作用过程相似。韩晓斌等的研究结果表明,阻遏或敲除Pkinase家族中的Os EDR1基因,突变体植株均会出现斑叶,推测与Os EDR1同源的紫薇c45897.graph_c0转录因子影响了叶绿素的表达,进而使叶色发生变化。在毛果杨、拟南芥、水稻等研究结果中表明,HMA基因家族是植物吸收、转运Zn、Cu、Cd等重金属的重要组分,拟南芥HMA1功能缺失会导致叶绿体中Cu含量下降和Zn含量上升,进而影响叶绿素的合成。以绿叶为对照,紫叶中属于HMA家族的c51707.graph—c0表达量显著上调,进一步推测c51707.graph_c0是控制紫薇叶色表达的候选基因。花色苷作为类黄酮物质的一类,是植物呈现红、橙、粉、紫、蓝等颜色的主要色素,而葡萄糖醛酸转移酶家族(UDPGT)在花色苷合成途径起到重要作用。Kotepong等研究马六甲蒲桃果皮发现,UFGT表达强度随着红巴梨果实的成熟而降低,招雪晴等研究指出,UFGT家族的PgUFGT基因在红宝石和水晶甜石榴品种的发育期内具有不同的表达模式,这与本研究的结果相似,推测c47870.graph_c0可能参与了紫薇叶片中类黄酮物质的3-0位置的糖基化,与之相似的同源基因MDP0000543445、At UGT78D2等已在红肉苹果、黄果草莓等研究中被找到,并已证实其与花青素的代谢活动密切相关。孙海燕等在三色堇花色形成机制的研究中,克隆出属于SDR(短链脱氢/还原酶)超基因蛋白家族的Vw DFR基因,推测该基因可能是花青素合成结构基因。本研究中c29868.graph_c0属于SDR基因家族,在类黄酮的生物合成过程中起到了正向调控作用,在紫叶中表达水平最高,说明c29868.graph_c0是紫晶1号叶片色素合成的关键候选基因。
本研究利用高通量测序技术对紫叶紫薇新品系紫晶l号转色期叶片进行了转录组测序,共获得145338条Contig,进一步组装得到53 654条Uni-gene。KEGG和GO注释与富集分析显示,差异DEG主要调节激素信号转导、碳水化合物代谢、核糖体代谢等生物学功能。将最终获得的58条差异表达Unigene对比到毛果杨和拟南芥2个模式植物的数据库,筛出与叶绿素代谢相关候选基因9条,有2条候选基因共同参与了叶绿素兼类黄酮代谢的调控,2条候选基因可能参与类黄酮代谢过程,它们分别属于DUF547、Polyketide_cyc2、Pkinase等13个基因家族,主要经氧化还原反应、物质能量代谢、植物激素信号转导等机制介入紫薇叶色调控。