长白落叶松形成层差异表达的miRNA1)
2018-07-13魏佳玉张素芳刘紫怡张海胤付粱晨杨树云张磊
魏佳玉 张素芳 刘紫怡 张海胤 付粱晨 杨树云 张磊
(林木遗传育种国家重点实验室(东北林业大学),哈尔滨,150040)
MicroRNA(miRNA)是一类由内源基因编码的长度约在18~24个核苷酸的非编码单链RNA分子,主要参与转录后水平基因表达的调控,其结构很保守,所以可以通过生物信息学的方法来预测miRNA和其靶基因。自从2002年在拟南芥(Arabidopsisthaliana(L.)Heynh.)中发现植物中第一个miRNA后[1],截止到2017年目前为止,曼彻斯特大学和剑桥大学组建的miRBase数据库miRBase(18.0)公布了223个物种的28 645条miRNA前体序列,35 828条成熟序列,但是绝大多数是被子植物,裸子植物只有火炬松(PinustaedaL.)和云杉(Piceaaspoerata)等少数物种的miRNA信息被收录[2-3]。裸子植物miRNA信息的匮乏很大程度阻碍了其miRNA的研究进展,高通量测序技术的运用可帮助解决这个问题,特别对于基因组庞大、ESTs信息少的针叶树,Solexa测序可高通量、快速、有效的获取miRNA信息。
长白落叶松作为中国东北地区重要的经济、生态及主要的造林树种之一采用常规改良的方法获得的遗传增益随着改良周期的增加而降低,而且其遗传背景较为复杂,基因组庞大,对其生长发育等分子机理的研究比较落后,通过对长白落叶松不同发育时期的形成层样品的miRNA差异表达分析,找出可能参与调控长白落叶松生长发育过程的miRNA,从而为针叶树种分子育种的研究奠定基础。
1 材料与方法
形成层是木本植物位于木质部和韧皮部之间的一种分生组织,向茎的中轴方向分裂而形成新的木质部细胞,向外分裂形成新的韧皮部细胞,大量调控木材合成的基因在此过程中表达,所以本研究以生长在东北林业大学帽儿山实验林场的长白落叶松无性系的形成层为试验材料,选取相同无性系材料3株,根据长白落叶松生长物候期及前期观测[4-6],分别于粗生长开始时期(5月5日,S01)和粗生长旺盛期(6月15日,S02)取已木质化的侧枝,剥去树皮及韧皮部,取形成层及周围组织薄层样品,立刻置于液氮中,带回实验室置于冰箱-80 ℃保存,提取RNA。
采用Nanodrop、Qubit2.0、Agilent2100 bioanalyzer方法检测RNA样品的纯度、浓度和完整性等,保证样品符合测序要求,样品检测合格后,以总RNA为起始样品,使用small RNA Sample Pre Kit试剂盒提取构建small RNA文库。然后通过Solexa测序技术快速分离鉴定miRNA,使用miRDeep2软件鉴定出保守的和新发现的miRNA。
通过原始测序数据处理后对miRNA进行预测及数据分析,采用植物miRNA本地命令软件TargetFinder预测miRNA的靶基因。利用blast软件将预测靶基因序列与COG、GO、KEGG、SwissPort和NR数据库中的与其相应的mRNA序列分别进行比对,从而获得靶基因的注释信息。
2 结果与分析
2.1 miRNA序列结果分析
构建miRNA文库后,通过质量控制,每个样品的干净数据均大于11.91 M,其中S01从原始数据21 095 170中获得15 294 797分析数据,占总数的72.50%,S02从原始数据16 395 342中获得11 913 982待分析数据,占总数的72.67%。最终共预测到78个新的miRNA,未得到已知的miRNA,由于Dicer酶和DCL酶的特异性,最终生成的成熟miRNA长度主要集中在20到22个核苷酸的范围内,其中以21个核苷酸居多,占总数的55.13%。
新预测的78个miRNA中,差异表达的miRNA为49个,分属于miR164、miR166、miR160、miR950、miR396这5个miRNA家族,其中16条上调表达,33条下调表达。
2.2 差异表达的miRNA分析
2.2.1差异表达的miRNA GO分析
差异表达的miRNA在GO分析中主要分为3个分支:分别是细胞组分(描述基因产物在什么地方起作用)、分子功能(描述在个体分子生物学上的活性)、生物学过程(由分子功能有序地组成具有多个步骤的一个过程)。共涉及了23个类别,其中细胞组分8类,分子功能均分6类,生物学过程分9类(图1)。
图1 差异表达miRNA的GO分析
差异表达的miRNA的靶基因注释总共有315个,占所有靶基因注释总数的55.95%。其中,与细胞组分相关的靶基因有39个,所占比例较多的3个分别是:细胞(8个)、细胞器(8个)、细胞组分(8个),其他的总共有15个;与分子功能相关的靶基因有129个,所占比例较多的两个分别是:催化活性(54个)、绑定(70个),其它合计5个;与生化过程相关的靶基因有147个,所占比例较多的3个分别是:代谢过程(38个)、细胞过程(37个)、刺激反应(45个),其它合计共有27个。结果表明差异miRNA参与了细胞组成、分子功能、生化过程3个方面,为后续的miRNA基因的功能研究提供参考。
2.2.2差异表达miRNA的COG分析
差异表达miRNA靶基因的COG数据库分类注释结果表明(图2):所有靶基因涉及到氨基酸、辅酶、脂质、无机离子运输和代谢等运输代谢过程,翻译、核糖体结构和生物起源、细胞壁和细胞膜发生,转录,复制,重组和修复,转录后修饰,蛋白质转运,分子伴侣等生命过程,信号转导机制过程,一般功能预测和未知功能等功能预测几大类别。在不同的功能分类中,注释到的差异miRNA靶基因反映了对应时期和环境下生理或代谢偏向等信息,结果显示与转录,复制,重组和修复,细胞壁和细胞膜发生,转录后修饰,蛋白质转运,分子伴侣等生命过程,无机离子运输和代谢相关的靶基因表达量相对较高,这说明测序样品正处于旺盛的生长发育期,和实际情况样品处于年生长周期的粗生长初期和旺盛期相符。
图2 差异表达miRNA靶基因的COG分析
2.2.3差异表达的miRNA KEGG分析
对miRNA靶基因KEGG的注释结果按照通路类型进行分类,发现其参与16个通路类型,分别为(1)核糖体,(2)脂肪酸生物合成,(3)N-Glycan生物合成,(4)植物激素信号转导,(5)Propanoate新陈代谢,(6)内吞作用,(7)Butanoate新陈代谢,(8)缬氨酸、亮氨酸、和异亮氨酸的生物合成,(9)在真核生物核糖体生物起源,(10)植物-病原互作,(11)丙酮酸代谢,(12)C5-Branched二元酸新陈代谢,(13)在内质网蛋白处理,(14)泛酸酯和生物合成,(15)剪接体,(16)RNA运输。说明在长白落叶松生长发育过程中,可能需要多种代谢途径共同参与,而这些代谢途径由多个miRNA的共同协调作用完成,而miRNA的靶标的作用机制和原理还有待进一步研究和验证。
2.2.4差异表达的miRNA靶基因分析
差异表达miRNA层次聚类分析结果显示:所有miRNA表达丰度不同,可以分为常规表达(表达量很低)和高丰度(表达量较高)两类(图3)。对同一个miRNA在两个样本中的差异表达情况分析,出现差异表达的miRNA(49个)约占所有测序的miRNA(78)的62.82%,差异表达一倍以上的miRNA12个,其中上调表达的2个,下调表达的10个,分别占全部上调表达(16个)和下调表达(33个)的miRNA12.5%和30.3%(表1)。miRNA负调控其靶基因,可以推测在粗生长旺盛期时,与木材材性合成的相关基因大量表达,所以miRNA大多表现为下调表达。差异表达miRNA层次聚类分析结果表明(图3):差异表达部分大都出现高丰度表达的miRNA中,差异表达的miRNA有一部分是属于稳定表达的,而有部分是随着生长发育不断变化的。
S01表示粗生长开始时间(5月5日);S02表示粗生长旺盛期(6月15日)。
2.2.5差异表达的miRNA的注释分析
通过将差异表达的miRNA与数据库中已有序列进行比对发现,部分miRNA与其它已知植物的miRNA序列相似度较高,如拟南芥,火炬松等(表2)[2,7-14],将比对到的物种的miRNA序列查找文献可知其中大部分miRNA处于刚被发现,功能尚不清楚。在已知功能的miRNA中,发现拟南芥miR164c通过调控靶基因影响生长素梯度、侧根的起始以及花瓣的数量[9],拟南芥miR396家族在高表达情况下导致拟南芥花柱头弯曲,拟南芥AtTTP-miR160-ARF17通路参与胼胝质合成的调控等[11],都对拟南芥的生长发育有影响,这些结论将作为长白落叶松miRNA功能初步分析的依据,从中挖掘可能参与调控生长发育的miRNA进行qRT-PCR分析,以进一步判断及分析这些miRNA在的功能。
表1 差异表达
表2 miRNA序列比对结果
3 结论与讨论
长白落叶松粗生长初期和盛期样品中共发现49个差异表达的miRNA,占全部新预测的miRNA(78个)的62.82%,分属于miR164、miR166、miR160、miR950、miR396这5个miRNA家族,其中16条上调表达,33条下调表达。GO分析表明这些差异表达的miRNA主要参与了细胞组分、分子功能和生物学过程中共计23个类别,其中调控把基因参与最多的主要是催化活性、结合、代谢、细胞进程和刺激反应。COG数据库分类注释表明所有靶基因涉及氨基酸、辅酶、脂质、无机离子运输和代谢等8类过程。转录,复制,重组和修复、细胞壁和细胞膜发生、转录后修饰,蛋白质转运,分子伴侣等生命过程、无机离子运输和代谢得到注释到的差异miRNA靶基因表达量相对较高,这说明测序样品正处于旺盛的生长发育期,和实际情况样品相符。
本研究新预测到了多个长白落叶松miRNA,极大地丰富了针叶树种的信息资源。由于miRNA能够揭示分子机理,主要在转录后水平调控基因的表达,可以利用该功能进行基因沉默的研究,使得不利于植物生长及发育的基因不表达,得到人们所需要的性状。而落叶松的基因组复杂,所以在基因组测序方面明显落后于其他物种。目前,只有日本落叶松有miRNA的相关研究结果,共获得了来自于85个miRNA家族的174个miRNAs[15]。落叶松良种选择和繁育已开展多年,获得了较好的效果,但对于落叶松生长发育的调控机理研究很少,本研究弥补了该方面的不足,从miRNA角度探讨了落叶松生长发育的分子机理。随着越来越多的miRNA被发现,将填补人们对其在基因表达调控中的更多的认识。
虽然木本植物中虽已经鉴定出了很多miRNA,但是对其功能研究还尚不足,在不久的将来,对miRNA及其调控机制的挖掘及与其功能相结合,miRNA及其靶基因相互作用将会成为木本植物分子遗传学研究的热点。