APP下载

西鄂尔多斯珍稀植物绵刺的避旱相关基因研究

2021-06-01陶彦彤张颖娟

关键词:差异基因测序因子

陶彦彤, 马 娟, 张颖娟,3

(1.内蒙古师范大学 生命科学与技术学院,内蒙古 呼和浩特 010022;2.哈尔滨市香坊中学,黑龙江 哈尔滨 150036; 3.内蒙古师范大学 学报编辑部,内蒙古 呼和浩特 010022)

西鄂尔多斯是荒漠化草原到草原化荒漠的过渡地区,年降水量稀少,蒸发量远大于降水量。该地区是亚洲中部荒漠区古老特有植物分布最集中、最丰富的区域,分布着多种国家级重点保护珍稀濒危植物,有第三纪孑遗植物“避难所”之称[1-3]。绵刺(Potaniniamongolica)为荒漠强旱生小灌木,是蔷薇科(Rosaceae)绵刺属(Potaninia)的古地中海孑遗植物,分布于西鄂尔多斯和阿拉善荒漠[4]。绵刺对干旱气候有特殊适应性,若生长季降水稀少,则叶、花、果实全部脱落,并以假死方式进入休眠; 若秋季有降水补给,绵刺则迅速吸水,进行二次生长繁殖[4]。目前对于绵刺的研究多集中于分类、形态、生理生态[5-8]等方面,对其分子生物学方面的研究较少。研究人员利用AFLP分子标记法对8个绵刺种群遗传结构进行分析,发现随机遗传漂变不是影响绵刺种群遗传多样性的主要过程[9-10]; 采用兼并PCR(polymerase chain reaction)和RACE(rapid amplification of cDNA ends)技术分离了绵刺肌动蛋白(actin)基因cDNA序列,验证了PmActin基因可作为分子内标的可靠性[11]。

随着高通量测序技术的快速发展,转录组测序因能够快速有效的从整体水平探究基因功能与基因结构,在生物学各个领域得到广泛应用,已成为研究基因差异表达的重要手段[12]。2017年Khan等[13]利用转录组测序技术对自然条件下及干旱胁迫下的耐旱型蚕豆Hosa wi-2进行了转录组分析,获得了Hosa wi-2相关抗旱基因。段娜[14]通过对干旱胁迫下的唐古特白刺叶片进行转录组学分析,发现干旱胁迫下白刺差异表达基因的主要相关酶。

本研究利用转录组Illumina HiSeq X-ten测序平台,对不同时期绵刺进行转录组测序,筛选出生长期与休眠期耐旱相关的差异表达的功能基因和调控基因,并对基因的相关信息进行了分析,旨在为西鄂尔多斯地区珍稀濒危植物的耐旱研究提供依据。

1 材料与方法

1.1 材料来源

绵刺样品取自西鄂尔多斯自然保护区内(106°45′24″E,39°56′15″N),本区地处亚非荒漠东部边缘,生态环境脆弱。年均温8 ℃,极端最高温度40.2 ℃,地面极端最高气温可达68.5 ℃,≥10 ℃的活动积温3 200 ℃左右; 年降水量为190~250 mm,年蒸发量约3 000 mm,湿润系数小于0.13。气候干旱少雨,风大沙多,春迟秋旱,为中温带大陆性气候。

对自然生境下具有休眠复苏特性的珍稀植物绵刺,随机选取长势一致的成年植株90株,设计3个阶段植物的处理,每10株作为一个处理,每个处理重复3次。90株分为三个阶段并标记, (1) 生长期(Z): 绵刺正常生长的时期; (2) 休眠期(X): 绵刺植株下部叶片发黄达到50%; (3) 复苏期(F): 绵刺第二次生长。将每个阶段处理的植株选取顶端嫩茎上的叶片,用铝箔包好,迅速放入布袋中用液氮冷冻保存带回实验室,随后送到北京百迈克公司进行RNA提取以及转录组测序。

1.2 方法

1.2.1 绵刺总RNA提取、文库构建及转录组测序 提取样品总RNA并检测合格后用带有Oligo(dT)的磁珠富集真核生物mRNA,加入Fragmentation Buffer将mRNA进行随机打断; 以被打断的mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H和DNA polymerase I合成第二条cDNA链,利用AMPure XP beads纯化cDNA; 纯化得到的双链cDNA再进行末端修复、加A尾并连接测序接头,使用AMPure XP beads进行片段大小选择,最后通过PCR富集得到cDNA文库。北京百迈克公司使用Illumina HiSeq X-ten高通量测序平台完成测序。

1.2.2 Unigene功能注释与差异表达基因分析 使用BLAST软件将Unigene序列与NR、GO、Swiss-Prot、COG、KOG、eggNOG4.5、KEGG的数据库进行比对,使用KOBAS2.0技术鉴定Unigene在KEGG中的KEGG Orthology结果,使用HMMER软件与Pfam数据库比对,获得Unigene的注释信息。采用Benjamini-Hochberg法筛选差异表达基因,并进行差异基因的GO和KEGG富集分析。

2 结果

2.1转录组测序与组装结果分析

绵刺生长期(Z)、休眠期(X)和复苏期(F)转录组测序共得到75.63 Gb Clean Data,每个样品Clean Data质量值≥30的碱基百分比均不小于92.84%。利用Trinity软件经对过de novo组装后,Clean reads被组装得到435 276条Transcript(转录本)和141 608条Unigene,Transcript和Unigene平均长度分别是1 974.70 bp和702.73 bp; Transcript与Unigene的N50分别为3 269和1 103,由表1可以看出Unigene分布变化随着长度区间的增加而减少,组装完整性较高。

表1 组装结果统计Tab.1 Assemble result table

2.2 Unigene功能注释

选择BLAST参数E-value≤10-5和HMMER参数E-value≤10-10,最终获得87 707个有注释信息的Unigene(表2)。比对到eggNOG和NR数据库里的Unigene数较多,分别占All Unigene的90.92%和89.54%,其他依次为Pfam、KOG、Swissprot、GO、KEGG、COG数据库,分别占All Unigene的59.95%、59.21%、55.63%、41.16%、37.97%、29.36%,其中每个Unigene可能被比对到多个数据库中。

表2 Unigene注释结果Tab.2 Results of Unigene annotations

2.3 差异表达基因的筛选结果

绵刺三个时期两两之间的差异表达基因筛选结果见表3。生长期与休眠期差异表达基因数共999条,其中上调基因数635条,下调基因数364条; 生长期与复苏期差异表达基因数共2 596条,其中上调基因数1 631条,下调基因数965条; 休眠期与复苏期的差异表达基因数共476条,上调基因数204条,下调基因数272条。生长期与复苏期差异基因表达的数最多,说明采用的试验样品时间的间段增加,参与基因调控的数目增多。

表3 差异表达基因数目统计结果Tab.3 The number of DEGs statistical result

2.4 差异表达基因功能筛选

基于基因在不同样品中的表达量,对识别到的差异表达基因进行功能注释,各差异表达基因注释的统计结果见表4。注释到各功能数据库数量最多的是生长期与复苏期,为2 475条; 其次是生长期与休眠期的938条; 最少的是休眠期与复苏期的451条。不同差异表达基因的各功能数据库注释到的基因数目,与总数变化呈一致性。

表4 注释的差异表达基因数量Tab.4 The number of DEGs annotation

2.5 差异表达基因GO功能富集

绵刺GO功能富集在生长期与休眠期有340条样本基因注释到“生物学过程”,主要聚集在代谢过程(metabolic process)、细胞过程(cellular process)和单生物过程(single-organism process)等(图略)。注释到“分子功能”中有356条差异表达基因被富集,主要富集条数最多的为催化活性(catalytic activity)和物质结合(binding)等。注释到“细胞组分”中共246条,注释到的差异表达基因数最多的条目为细胞(cell)、细胞成分(cell part)和细胞器(organelle)等,这些富集差异表达基因数最多的条目主要与细胞、细胞成分有关,表现在干旱胁迫下,细胞及细胞成分的性状发生变化。在绵刺生长期与复苏期得到注释的共有1 224条。其中绵刺基因注释到“生物学过程”中共有989条,数量多于生长期和休眠期间的注释,主要富集差异基因较多的仍是代谢过程、细胞过程和单生物过程等。在“分子功能”中同样富集条数最多的为催化活性和物质结合等,这与植物的耐旱功能紧密相关。“细胞组分”中共677条差异基因被富集,细胞、细胞成分和细胞器等得到大量聚集。休眠期与复苏期有200条注释到GO数据库。其中绵刺基因富集到“生物学过程”中共有154条,富集较多的过程同生长期与休眠期相同,但数量较小。“分子功能”中有167条差异表达基因被富集,富集条数最多的同生长期与休眠期一致。“细胞组分”中共105条差异表达基因被富集,注释到基因数较多的同生长期与休眠期相符。这些功能表达说明在绵刺耐旱性中起重要作用。

2.6 差异表达基因KEGG功能富集

绵刺生长期与休眠期有316条和KEGG富集通路相关的差异表达基因,被注释到通路中的有88个,其中富集显著性可靠且参考价值较大包括真核生物核糖体起源(ribosome biogenesis ineukaryotes)、葡萄糖醛酸转换(pentose andglucuronate interconversions)、光合作用(photosynthesis)等。生长期与复苏期有1 162条和此通路相关的差异表达基因,被注释到通路中的有114个,其中富集显著性可靠且参考价值较大为光合作用、光合作用-天线蛋(photosynthesis-antenna proteins)等。休眠期与复苏期有225条和此通路相关的差异表达基因有78个,其中光合作用-天线蛋白、精氨酸与脯氨酸代谢(arginine and proline metabolism)等富集显著性可靠且参考价值较大,其他通路的富集显著可靠性较低。

2.7 绵刺耐旱相关的功能基因

随着干旱胁迫的逐渐增加,绵刺在生长期与休眠期的差异表达基因中,耐旱相关的基因有36条Unigenes预测为功能基因(表5),主要有渗透调节物质、内源激素类物质、活性氧清除类物质、果胶酶和保护生物大分子物质等相关的基因。绵刺在水分胁迫下,植物体内相关的基因均会发挥重要的调节作用,筛选出6条差异表达基因与植物激素相关,其中生长素(auxin)5条占比最多,4条上调表达基因,1条为下调表达。

表5 干旱诱导与功能相关的差异表达基因的表达情况Tab.5 Expression of differentially expressed genes related to drought and function

续表5 干旱诱导与功能相关的差异表达基因的表达情况Continude Tab.5 Expression of differentially expressed genes related to drought and function

果胶酶分为果胶酯酶(pectinesterase,PME)和多聚半乳糖醛酸酶(polygalacturonase,PG)两种,注释到的差异表达基因中筛选到10个基因与果胶酶相关,干旱胁迫下植物体内的果胶酯酶有6条均上调表达。渗透调节类有两类相关的差异基因,脯氨酸(proline)和海藻糖(trehalose)类均有1个上调表达的差异基因,有11个差异表达基因与活性氧清除类物质相关,其中与过氧化物酶(peroxidase,POD)相关的基因有5条,均呈上调表达。与谷胱甘肽(glutathione)相关的基因有3条,2条为上调表达1条下调表达。与抗坏血酸氧化酶(ascorbic acid oxidase,AO)相关的3条基因均呈上调表达。经筛选共有6条保护生物大分子物质,其中与LEA蛋白相关的基因有3条,2条上调表达,1条下调表达。与水通道蛋白(aquaporin)相关的基因有3条,均呈上调表达。

2.8 绵刺耐旱相关调控基因

干旱胁迫的环境条件会在植物体内诱导一系列转录因子基因,干旱胁迫信号转导过程中,转录因子通过启动多条途径从多个层面调节、降低胁迫对植物的伤害[15],对植物在逆境下的生长发育起到重要作用。绵刺生长期与休眠期得到注释的差异表达基因中,耐旱相关的转录因子共8条,主要来自AP2/EREBP、NAC、bHLH、MYB/MYC四个转录因子家族的转录因子。筛选的每个转录因子注释的信息和调控表达见表6。属于NAC的基因共2条,基因c66600.graph_c2和c58089.graph_c0均为下调表达。属于AP2/EREBP的基因共有4条,c57840.graph_c0、c40137.graph_c0和c69583.graph_c0基因上调表达,AP2/EREBP家族中ERF类转录因子c65442.graph_c0表现出下调表达,同是下调表达基因的有bHLH的基因c68718.graph_c0。只有一条属于MYB/MYC的基因c41021.graph_c0为上调表达。

表6 干旱诱导与调控相关的差异表达基因的表达情况Tab.6 Expression of differentially expressed genes related to drought induction and regulation

3 讨论

转录组测序适用于缺乏基因信息的研究对象,该技术可以对在单核苷酸水平上检测指定材料的整体转录活动,且不需要参考基因组来获得有用的转录信息[16]。本研究通过高通量测序对自然生境下的绵刺在转录组水平分析其耐旱响应。在对绵刺不同时期的差异表达基因(DEG)的研究中,三组的差异表达基因的数目共有4 071条,而成功被注释到的差异表达基因数量为3 864条这一结果与其他植物转录组测序结果一致[17]。由于物种基因信息不足,不是所有Unigenne都能得到注释。但基于被检测出来的DEG,可筛选出多条富集通路和过程,从而为研究绵刺对干旱胁迫的响应机制提供理论基础。在DEG的KEGG富集分析中,核糖体生物合成“ribosome biogenesis in eukaryotes”在生长期与休眠期的比较中富集显著性最高,生长期与复苏期中“光合作用”的富集显著性最高,而休眠期与复苏期的“光合作用-天线蛋白”富集显著最高。说明随着环境的变化,激发了各通路的相关基因的表达,而富集显著性较高的基因,就可能在绵刺适应胁迫过程中起重要的作用。

由于2017年绵刺复苏期返青较晚(10月上旬),平均气温接近10 ℃,返青前有降雪,影响绵刺叶片的生长,差异表达基因筛选只比较了生长期与休眠期,共有37条Unigenes预测为抗旱相关功能基因。活性氧清除类物质在植物中广泛存在,绵刺在逆境胁迫加剧的环境下,呈差异表达基因只发现POD、GSH和AO,并且三种酶的基因表达量变化大部分呈现上调表达。与过氧化物酶(POD)相关的基因含有5条,均是上调表达。这与段丽[14]对白刺干旱胁迫下POD相关差异基因表达呈上调的研究结果相一致; 研究发现与GSH相关的基因有3条,其中1条下调表达2条上调表达,而与AO基因相关的有3条,均是上调表达,说明在休眠期干旱胁迫加剧AO相关基因表达量的增加使绵刺耐旱性增强。

渗透调节物质中与脯氨酸和海藻糖相关的差异基因各有一条,均呈上调表达。研究表明,脯氨酸的过表达可增强植物的耐旱能力。杜俊瑞[18]对白沙蒿相关抗旱基因研究发现,控制白沙蒿脯氨酸合成的基因表现为上调表达,与本文研究结果一致,说明脯氨酸相关基因的上调表达有助于绵刺的耐旱性。在绵刺中参与海藻糖相关的差异表达基因仅有一条上调表达与多数研究相一致。黄晓钰[19]对干旱胁迫下的柠条锦鸡儿进行转录组分析结果表明,海藻糖合成途径相关酶基因的表达量出现不同程度地上调,表明海藻糖合成途径在柠条锦鸡儿应对干旱胁迫时发挥重要作用。

姜扬[20]对长春在逆胁迫下的变化研究发现,干旱胁迫使PME基因表达上调,有助于保持细胞水分,增强抗逆能力; 在逆胁迫处理下番茄的PG基因表达显著增加[21]。本研究结果也表明,随干旱胁迫加剧,绵刺体内的果胶酯酶有6条均上调表达,PG相关的差异表达基因有4条均是上调表达。绵刺休眠期叶片脱落,PG可能起到了一定的作用,PME和PG可能增强绵刺耐旱能力。

LEA蛋白是一类种子胚胎发育后期富集的脱水保护蛋白。Veeranagamallaiah等[22]通过SDS-PAGE研究发现,随LEA蛋白的表达增加来减弱水分胁迫导致的蛋白质凝聚现象,表明LEA蛋白可间接增强植物抗逆性。Zhang等[23]将沙漠牧草隐子草(Cleistgenessongorica)中的脱水蛋白CsLEA转化到紫花苜蓿(MedicagosativaL.),发现CsLEA在紫花苜蓿中的过表达显著提高了转基因植株的抗旱性和耐盐性。本研究也发现,绵刺在干旱胁迫加剧的休眠期,2个LEA蛋白基因呈上调表达,仅有一个是下调表达,上调的LEA蛋白基因,可能对绵刺适应干旱胁迫起较重要的调控作用。

AQP是一种跨膜输水蛋白,能增加生物膜对水分的透性,调节细胞渗透平衡,胁迫条件下调节水分在植物内长距离或短距离运输[24]。其在逆胁迫下的响应表达不同,且每个AQP也有单独的意义。韦兴炎[25]对箭舌豌豆的水通道蛋白相关基因进行研究发现,在根、茎、叶组织中有8个VsAQP基因在干旱处理过程中呈现出不同的表达模式,反映了它们在箭筈豌豆响应干旱胁迫中可能具备不同的功能。本研究结果发现,绵刺在休眠期绵刺有3条与AQP有关的基因呈上调表达,具体如何参加绵刺耐旱调控需要进一步研究。

干旱胁迫信号转导过程中,转录因子在水分胁迫中起到不同作用,表达量的变化也不同。张翠梅[26]在紫花苜蓿响应干旱胁迫的研究中发现,NAC转录因子苜蓿抵抗干旱胁迫过程中起负调控因子。王一航对舟山新木姜子(Neolitseasericea)幼苗叶片的耐旱性进行研究,发现bHLH家族的转录因子AtbHLH112可能参与调控干旱胁迫的ABA信号转导[27]。MYB44的过表达通过抑制蛋白PHOSPHA Tase 2C(PP2C)基因赋予拟南芥植物抗旱性[28]。TaPIMP1表达上调,转基因烟草在干旱胁迫期间表现出增强的耐性[29]。与本文筛选绵刺的AP2/EREBP、NAC、bHLH、MYB/MYC四类转录因子的DEG变化不完全一致,转录因子在干旱胁迫加剧的休眠期,呈现不同的调控表达,表明转录因子对绵刺的作用相对复杂多变,具体转录因子如何提高绵刺耐旱能力,需要更进一步的研究验证。

4 结论

本研究对自然生境下不同时期的绵刺进行转录组测序,共得到75.63 Gb Clean Data。共有87 707条Unigenes被注释到NR、GO、COG、KEGG、Swissprot、eggNOG和Pfam数据库。绵刺不同时期GO功能富集发现注释到GO数据库中的DEG有440条,在三大类别中富集DEG较多,分别为代谢过程、催化活性细胞、细胞成分等。不同时期KEGG功能富集分析,主要集中于核糖体生物合成,光合作用,光合作用-天线蛋白等代谢通路等。发现有37条Unigene与绵刺抗旱相关的功能基因主要有渗透调节物质、内源激素、果胶酶等相关基因。在生长期与休眠期的注释到的差异表达基因中,统计与耐旱相关的转录因子共8条,主要来自AP2/EREBP、NAC、bHLH。

猜你喜欢

差异基因测序因子
两种高通量测序平台应用于不同SARS-CoV-2变异株的对比研究
我刊2021年影响因子年报
生物测序走在前
外显子组测序助力产前诊断胎儿骨骼发育不良
一些关于无穷多个素因子的问题
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
基因测序技术研究进展
山药被称“长寿因子”
紫檀芪处理对酿酒酵母基因组表达变化的影响
扮靓爱车拒绝潜伏危险因子