张氏江蓠microRNAs鉴定及其基因家族系统进化
2020-06-15尹旭岗何中石
宋 韡, 尹旭岗, 何中石, 王 伟, 樊 悦, 高 帆
(1. 山西体育职业学院, 太原 030006; 2. 山西大学 生命科学学院, 太原 030006)
张氏江蓠(Gracilariachangii)是江蓠属(Gracilaria)中的一种大型经济海藻,多分布于我国的东南和西南沿海以及东南亚诸岛海域[1]。该藻富含多糖、藻胆蛋白及不饱和脂肪酸等生物活性成分,已广泛应用于食品、医药及化工领域[2-4]。随着沿海环境的日益恶化,包括张氏江蓠在内的江蓠属资源正面临着严峻的生存危机。作为江蓠属的重要代表,张氏江蓠的研究目前主要集中在藻体的培养与繁殖[5]、物种分类与多样性研究[6]、生物活性物质的提取及功能分析[7]、富营养化[8]和重金属污染海域的生物修复[9]。目前,对于分子水平上江蓠的相关研究多集中在分子鉴定及功能基因的挖掘[10-11],对于非编码RNA的研究较少。
mciroRNA(miRNA)是一类重要的非编码小RNA,长度约19~22 nt,是一种重要的基因转录后调控子[12]。研究表明,miRNA对其靶基因的抑制方式主要为mRNA切割和翻译后抑制两种[13]。很多报道显示,miRNA对于植物组织与器官的形成、生物信号的转导、非生物胁迫响应以及生理代谢等重要的生物学过程均起着至关重要的调控作用[14]。作为一类重要的大型经济栽培海藻,江蓠资源的品质,包括琼胶、多糖等含量及其对氮磷以及重金属的吸附等亟待提高。利用传统的遗传育种开发藻类资源具有周期长、稳定性差等不足。基于分子生物学方法对江蓠关键基因的有效调控可极大地提高其品质优化效率。
国内外对植物miRNA的研究多集中于一些模式植物或经济作物[14],对藻类的相关研究相对滞后。张氏江蓠是江蓠属的重要代表,目前仍未有关于该藻miRNA及其靶基因的相关报道。相比动物,植物miRNA序列相对保守,利用生物信息学手段[15],搜索潜在的植物miRNA检索数据库,我们可以预测一些植物的未知miRNA信息,这是一种高效地获取植物miRNA及其靶基因信息的重要手段。本研究利用生物信息学方法预测张氏江蓠miRNAs,分析miRNAs及其前体二级结构;分析张氏江蓠miRNA序列在不同植物间的保守性与多态性,并对其系统进化地位进行分析;对miRNA靶位点及其抑制类型进行预测,以期弥补江蓠属miRNAs研究的空白,也为其后转录水平基因的调控及资源的开发利用奠定基础。
1 材料和方法
1.1 材料与相关序列来源
从中国水产科学研究院购置张氏江蓠野生样本3份(采集地:中国青岛沿海)。从miRBase 22.0 数据库下载已知植物miRNAs及其前体序列[16]。去除其中的重复序列,剩余序列作为预测张氏江蓠miRNA的参考序列。从GenBank数据库下载该红藻的EST序列(8147条)及核苷酸序列(125条)。
1.2 应用软件
比对软件BLAST 2.2.28从NCBI下载[17]。MiRNAs 保守性分析利用Clustal W软件[18]及weblogo在线分析工具进行[19]。Mireap软件预测前体二级结构[20]。TargetFinder软件预测miRNA潜在靶标基因[21]。psRNATarget软件预测miRNA对其靶基因的抑制方式。BLAST P分析核酸序列编码蛋白信息。MiRNA前体序列系统进化树运用Clustal W联合MEGA 5.0软件构建[22]。
1.3 张氏江蓠miRNA及其前体序列预测
以张氏江蓠已公布的EST为参考序列,以已公布植物miRNA为探针,预测张氏江蓠miRNA信息。信息分析程序参考Zhang等[23],预测标准参考Ambros等[24]:配对序列间≤3个碱基错配;前体序列能形成典型的茎环状二级结构;成熟miRNA序列位于茎环结构的一条臂上,miRNA*位于另一条臂上;miRNA与其互补链间错配碱基数≤6个;且无环状或泡状结构;miRNA中A/U含量在30%~70%;前体结构最小折叠自由能值<-75.35 kJ/mol。
1.4 张氏江蓠miRNA的验证
参考Xu等提取江蓠总RNA的方法[25],从3个张氏江蓠样本各取2~3 cm叶状体组织液氮速冻后混匀,Triozl法提取总RNA;参考Varkonyi-Gasic的方法[26]设计引物,RNA逆转录后以稀释10倍的cDNA为模板,运用2×SYBR Green PCR Master Mix进行qRT-PCR;以U6 snRNA为阳性对照,以18S rRNA为内参基因,对gch-miRNA进行验证。试验引物由上海生工合成,详细信息见表1。
1.5 不同植物间miRNA基因家族系统进化树构建
整理张氏江蓠miRNA前体序列数据,利用Clustal X 1.83,将其分别与不同植物的miRNA基因家族序列进行多重序列比对。利用MEAG 5.0对预测miRNA前体序列进行系统进化分析,利用改进的Neighbor-Joining算法(NJ法)构建其系统进化树[27],即由默认的Jukes-Cautor单参数模型修改为Kimura两参数模型,bootstrap检验值为1000,删除空位及缺失。
表1 张氏江蓠miRNA验证引物信息
1.6 张氏江蓠miRNAs靶标及其抑制类型预测
根据植物miRNA与其靶位点互补配对原则,通过张氏江蓠miRNA与其EST或mRNA的序列联配分析。参考Xie等的预测标准[28],TargetFinder筛选出可靠的miRNA靶标序列:miRNAs与靶标间的错配<4个(G-U配对记作0.5个错配);miRNA::靶标少于2处相邻位点错配;miRNA::靶标第2~12位相邻位点无错配;miRNA::靶标第10~11位无错配;miRNA::靶标第1~12位≤2.5个错配。根据miRNA::靶标第9~11位是否严格互补配对,psRNATarget预测miRNA对其靶标是否为切割抑制方式[29]。
2 结果与分析
2.1 张氏江蓠miRNAs及其前体序列特征
依据多数植物中相同MIRNA家族内的miRNA成员间序列保守性较高的原则,通过序列比对与去冗余,从张氏江蓠中共预测6条miRNA序列,分属5个MIRNA家族(表2)。由表1可知,新预测的gch-miRNA长度在20~22 nt,A+U含量在20%~57%之间,碱基含量最高为G(占比32.26%),最少为A(占比20.97%)。Gch-miRNAs的碱基偏好性显示(图1-A),gch-miRNA的首位碱基偏好于U,第4位和第11位分别偏好于C和G,第13和15位分别偏好于G/A和G/U。Gch-miR5386b产生于成熟体序列的3′端,在藻体组织中易降解,属于潜在的miRNA*。所有gch-miRNAs前体二级结构形态较为稳定,MFE值均低于-75.35 kJ/mol(表1),均呈典型的RNA颈环状(图1-B)。以上结果基本符合植物miRNAs及其前体序列特征。
2.2 张氏江蓠miRNA在不同植物间的保守性与多态性
根据不同植物miRNA成熟体序列间的联配分析(含gch-miRNA)结果(图2-A),我们发现,张氏江蓠新预测的miRNAs在不同植物间较为保守。其中,gch-miR5658与ath-miR5658的序列保守性最高(同源一致度85.7%,仅在第5、20和21位发生碱基的变化),表明两者具有较高的同源性,这也与miR5658序列报道较少有关(高等植物仅在拟南芥中被发现)。Gch-miR399与其它15种代表性植物miR399s同源性较差(同源一致度42.86%,高度保守的碱基位点仅有9个,且存在错位缺失现象),表明不同物种间miR399序列还具有一定的多态性。此外,5个miRNA基因家族的成员数量也存在一定的差异。如:MIR5386和MIR534分别仅在包括张氏江蓠在内的3个植物物种中被发现,而MIR156家族则在包括张氏江蓠在内的44个植物物种中被发现(图2-B)。
A:gch-miRNA成熟体碱基的偏好性; B:gch-miRNA前体二级结构图
图1张氏江蓠miRNA碱基偏好性及其前体二级结构
Figure 1 Base bias of gch-miRNAs and structures of their precursors
表2 张氏江蓠miRNAs及其前体序列信息
A:4种miRNA在不同植物间的联配; B:植物中4种miRNA基因家族成员数量
图2不同植物间miRNA序列保守性与多态性分析
Figure 2 Conservation and diversity of miRNAs across different plant speices
2.3 植物miR534,miR399及miR156基因家族的NJ系统进化分析
2.3.1 植物miR534基因家族的NJ系统进化树
在张氏江蓠新预测miRNAs中,除miR5386和miR5658因发现物种太少(均少于3个),无法构建基于NJ算法的系统进化树外,其余3种miRNA基因家族均可检测完整的NJ系统进化树。由图3-A可知,张氏江蓠miR534前体序列与水稻pre-miR534单独成簇,作为水生和陆生植物的过渡物种——小立碗藓的miR534基因家族的两条前体序列聚为一簇,有较近的进化距离。
2.3.2 植物miR399基因家族的NJ系统进化树
由图3-B可知,124条植物pre-miR399s可聚为6个大组。多数高等植物miR399前体序列同源性较高,被聚在第1组(36条)和第2组(33条)。第3组(共22条)既包括水稻(1条)、玉米(2条)、小麦(1条)、高粱(3条)等大宗作物的pre-miR399s,也包括柑橘(2条)、二穗短柄草(1条)、丹参(1条)等其它植物。第4组以桃的pre-miR399为主(12条),另包括毛果杨、蒺藜苜蓿、蓖麻和苹果中各一条miR399前体序列。第5与第6组均为小规模聚类群,分别有10条和7条pre-miRN399s。第5组以欧洲云杉pre-miR399为主(5条),另包含玉米(1条)、水稻(1条)、甜瓜(2条)及高粱(1条)4种植物。第6组包含大豆(2条)、可可豆(1条)、棉花(2条)、欧洲云杉(1条)和张氏江蓠(1条),其中gch-pre-miR399与pab-pre-miR399a一起同为该组的外类群,表明它们与其它miR399前体的序列同源性较低。
A:基于NJ法的miR534基因家族系统进化树; B:基于NJ法的miR399基因家族系统进化树; C:基于NJ法的miR156基因家族系统进化树
图3基于NJ法的植物部分miRNA基因家族系统进化树
Figure 3 Phylogenetic trees of some miRNA gene families in plants based on NJ
2.3.3 植物miR156基因家族的NJ系统进化树
由图3-C可知,依据不同植物间miR156序列的同源性高低,141条植物miR156前体序列(含张氏江蓠)可聚为6个大组。第1组聚类成员最多(74条),其次是第2组(48条)。其中,第1组以水稻(8条)、拟南芥(7条)、二穗短柄草(5条)、苹果(5条)、玉米(5条)等高等植物为主。第2组包括26种不同的植物物种,但无任何一种占据明显的数量优势,最多的为亚麻miR156前体(5条lus-pre-miR156s),其它miR156家族成员以1~3条居多。第3组仅有5条pre-miR156s,分属玉米、高粱、向日葵、毛地黄和甜瓜,每种植物各一条pre-miR156。第4组包含高羊茅(2条)、二穗短柄草(1条)、紫球藻(1条)和温泉红藻(1条)。第5组包括张氏江蓠在内的共5个物种,其中,gch-pre-miR156c、gma-pre-miR156c和mtr-pre-miR156a同源性较高,聚为一族;hci-pre-miR156a和ppu-pre-miR156d同源性较高,聚为另一簇。第6组miR156前体序列最少,仅有4条,分属紫球藻、烟草、玉米和豇豆(每个物种各一条)。
2.4 试验验证张氏江蓠miRNA
由图4-A可知,张氏江蓠总RNA的28S rRNA和18SrRNA条带明显,提取的总RNA较为完整。由图4-B可知,验证的6条gch-miRNAs均呈阳性,且大小在80~90 bp,表明本研究鉴定的gch-miRNA基本可信。由图4-C可知,重复3次定量检测后,6条gch-miRNA基因相对定量值(2-△△Ct)均>0.9,最高为gch-miR5386a(表达值3.07),最低为其基因家族的另一个成员gch-miR5386b(表达值0.82),两者表达差异较大。因gch-miR5386a产生于前体序列5′端,而gch-miR5386b产生于前体3′端,我们推测gch-miR5386b可能是一条星状miRNA,在前体序列加工为成熟体后,发生了部分降解。
2.5 张氏江蓠miRNA靶标的预测
经过去冗余处理,共预测到8个潜在的gch-miRNA靶标(表3)。除gch-miR534未预测到任何靶标外,其余5条gch-miRNA均在gch-mRNA上预测到对应的靶标序列。其中,gch-miR156和gch-miR399分别预测到1条靶标,gch-miR5658,gch-miR5386a/b均预测到2条靶标。经注释分析发现,这些靶标均为张氏江蓠EST的cDNA克隆序列,迄今尚未有研究发现其在张氏江蓠中对应的目的基因及其功能。基于miRNA与其靶标的互补配对情况(9~11位均无错配发生),我们预测其对靶基因的抑制类型为切割抑制(表3)。
A:张氏江蓠总RNA的电泳检测; B:基于颈环引物RT-PCR的张氏江蓠miRNA检测; C:张氏江蓠miRNA的相对定量表达
图4张氏江蓠miRNA的试验验证
Figure 4 Experimental validation of miRNAs inGracilariachangii
表3 张氏江蓠miRNA靶标信息
3 讨论
对于基因组测序未完成且非编码RNA研究较薄弱的物种,利用生物信息学技术预测其miRNA是一种较便捷的方法。本研究共预测到6条gch-miRNA且符合典型的植物miRNA特征。QRT-PCR验证结果均为阳性,证实了鉴定结果基本可信。随着高通量测序技术的完善及其价格的降低,运用深度测序法从张氏江蓠获取大量的miRNAs已不是难题,这也为其关键靶向基因后转录水平的表达调控,分子改良江蓠资源奠定了基础。
鉴定的gch-miRNAs分属5个MIRNA家族,其中,miR156和miR399在植物中属保守MIRNA家族,在不同植物物种间保守性较高,进化速率较一致。MiR534、miR5386和miR5658属非保守MIRNA家族,进化时间较保守MIRNA晚,成员数量少,且不同物种间存在序列的多态性(前体序列更明显)。
考查gch-miRNA所属基因家族在不同植物物种间的系统进化地位很有必要。改进的NJ算法,Kimura两参数模型可体现核苷酸的突变规律,遗传距离更为准确,更适合核苷酸系统进化树构建。基于此,我们选取较保守的3个MIRNA家族进行系统发生分析。3条张氏江蓠pre-miRNAs均位于NJ树的外类群,显示了其不同的miRNA进化速率及序列的差异性。MIR399和MIR156的NJ树分支均为6组,且均以2个大的分支为主辅以若干小分支及外类群。不同植物的miRNA系统进化与宿主生物本身的进化不同步,暗示了植物miRNA产生与进化方式的复杂性与多样性。
MiR156靶基因为SPL家族,对拟南芥、玉米等植物的叶原基间距、开花及器官发育起重要的调控作用。MiR399是控制植物磷代谢平衡的一种调控子,其靶基因多为缺磷响应基因。MiR5386和miR5658因进化时间较晚,其基因家族对应的靶基因功能仍然未知。本研究虽然在张氏江蓠中鉴定到miRNA靶标cDNA,但其完整的靶基因仍需通过降解组测序及RACE-PCR等方法获得。对gch-miRNA靶基因进行鉴定将有助于深入了解miRNA在江蓠生长发育、生理调节、应激反应中的分子机制。