藜麦CqKEA基因家族的鉴定及表达
2021-10-14张东亮吴筱林田晓芹郭善利陈世华
张东亮,吴筱林,田晓芹,褚 晶,郭善利,陈世华
(烟台大学生命科学学院,山东 烟台 264005)
KEA(K+/H+逆向转运蛋白,K+efflux antiporter)在植物细胞钾离子的积累和平衡过程中发挥重要作用。KEA基因属于阳离子/质子逆向转运体(Cation/proton antiporter,CPA) 的CPA2亚家族。目前对KEA的研究较少,已有研究主要集中在模式植物拟南芥。拟南芥中有6个AtKEA基因,与细菌K+/H+反向转运蛋白具有同源性,由此推测其在K+的积累和平衡过程中发挥功能[1-2]。现有研究结果表明,AtKEA在花萼、保卫细胞和维管组织等不同部位中均存在[3]。AtKEA1—AtKEA3对光合作用、pH和叶绿体渗透具有调节作用,同时会对多种胁迫产生响应[2,4-7]。AtKEA4通过调节内质网的pH来调控蛋白运输等过程[8]。
藜麦(ChenopodiumquinoaWilld., Cq)是一种起源于南美安第斯山脉的一年生作物,营养价值极高,被联合国粮农组织(FAO)认定为唯一一种单体作物即可满足人类所需全部营养的粮食[9],且藜麦对诸如盐碱、干旱等非生物胁迫具有较强的耐受性[10]。2017年,藜麦高质量参考基因组公布,促进了藜麦基因组的研究[11]。本研究运用生物信息学的方法,对藜麦CqKEA基因家族成员进行鉴定,对其理化性质、基因结构、染色体定位和系统发育关系进行分析,并根据RNA-seq数据对CqKEA基因组织特异性表达及非生物胁迫条件下的表达模式进行探究,为进一步研究藜麦抗逆的分子机理与藜麦遗传改良提供理论基础。
1 材料与方法
1.1 CqKEA基因家族成员鉴定与理化性质分析
藜麦基因组数据来源于Chenopodium DB (https://www.cbrc.kaust.edu.sa/chenopodiumdb/download/dow-nload-auth.html)。使用CPA蛋白保守结构域的HMM模型(PF00999)对藜麦所有蛋白质序列进行搜索,Evalue限定为1,获得候选蛋白;使用NCBI的CDD工具(https://www.ncbi.nlm.nih.gov/cdd/)对候选蛋白的结构域进行鉴定,去除没有保守结构域的蛋白,从而得到所有CqCPA基因家族成员。从TAIR(https://www.arabidopsis.org/)和NCBI(https://www.ncbi.nlm.nih.gov/)下载拟南芥和水稻的KEA蛋白序列,将它们与CqCPA导入MEGA7.0软件,采用邻接法构建系统发育进化树,从而将CqKEA从中分出。根据其与拟南芥AtKEA的同源关系进行重命名。使用ExPASy的Protparam工具(https://web.expasy.org/protparam/)对CqKEA蛋白序列进行理化性质分析。
1.2 CqKEA基因系统进化与跨膜结构分析
根据藜麦、拟南芥和水稻KEA系统发育进化树,对其系统进化关系进行分析。同时将鉴定出的CqKEA基因家族成员蛋白序列提交到TMHMM Server v. 2.0(http://www.cbs.dtu.dk/services/TMHMM/#openne-wwindow)进行跨膜结构预测。
1.3 CqKEA基因结构与蛋白motif分析
从参考基因组的基因注释文件中提取所有CqKEA基因家族成员的基因结构信息,提交到GSDS 2.0在线网站(http://gsds.gao-lab.org/index.php)进行作图分析;使用MEME 5.1在线网站(http://meme-suite.org/tools/meme)对CqKEA蛋白序列进行motif搜索,可被搜索的motif数量设置为10。
1.4 CqKEA基因表达模式分析
从NCBI下载藜麦生长发育过程中各组织器官及非生物胁迫条件下地上和地下组织的RNA-Seq数据(SRP226463, SRP116149, SRS1538629),使用Kallisto计算表达水平[12]。使用TBtools[13]软件绘制CqKEA基因家族的组织表达热图,使用Origin软件绘制非生物胁迫条件下地上和地下组织的表达量柱状图,分析CqKEA基因的表达模式。
2 结果与分析
2.1 CqKEA基因家族成员鉴定与理化性质分析
本研究共鉴定到10个CqKEA基因家族成员,根据其与AtKEA基因的同源关系将其命名为CqKEA1—CqKEA5c,它们的理化性质如表1所示。蛋白长度从486(CqKEA4a)到1227(CqKEA1)个氨基酸残基不等,等电点从5.01(CqKEA3b)到7.08(CqKEA4a,4b)不等,大多数蛋白偏酸性。
表1 CqKEA基因家族成员理化性质
2.2 CqKEA基因系统进化与跨膜结构分析
以藜麦、拟南芥与水稻的KEA蛋白序列为基础,使用MEGA7.0构建NJ系统进化树(图1)。结果表明,来自上述3个物种的KEA蛋白被分为三个亚组(Class Ⅰ,Class Ⅱ和Class Ⅲ)。Class Ⅰ中包括5个CqKEA蛋白,3个AtKEA蛋白和2个OsKEA蛋白;Class Ⅱ中包括2个CqKEA蛋白,1个AtKEA蛋白和1个OsKEA蛋白;Class Ⅲ中包括3个CqKEA蛋白,2个AtKEA蛋白和1个OsKEA蛋白。
图1 CqKEA蛋白系统发育进化树
使用TMHMM对10个CqKEA进行跨膜结构分析,结果如表2所示。CqKEA2a、CqKEA2b和CqKEA4b含有12个跨膜结构域,CqKEA4a和CqKEA5b含有11个跨膜结构域,CqKEA1、CqKEA3a、CqKEA3b和CqKEA5a含有10个跨膜结构域,而CqKEA5c仅有9个跨膜结构域。
表2 CqKEA蛋白跨膜结构数量
2.3 CqKEA基因结构与蛋白motif分析
使用GSDS对CqKEA基因家族成员的基因结构进行作图分析(图2),结果表明,所有CqKEA基因均包含外显子和内含子,同一亚组基因的结构相似,不同亚组基因结构存在较大差异。外显子数目在16~21之间,内含子数目在15~20之间。CqKEA5c有16个外显子和15个内含子,外显子和内含子的数目最少,而CqKEA2b有21个外显子和20个内含子,外显子和内含子的数目最多。
图2 CqKEA基因结构
使用MEME对CqKEA基因家族成员蛋白序列进行motif分析(图3),结果表明,在同一亚组的蛋白质所含有的motif种类和数量基本一致,表明CqKEA在进化过程中变化不大,具有较为稳定的功能。Class Ⅲ中3个CqKEA均含有9个motif;Class Ⅱ中CqKEA3a含有7个motif,CqKEA3b含有6个motif;Class Ⅰ中CqKEA4a和CqKEA4b均含有6个motif,而CqKEA5a、CqKEA5b和CqKEA5c均含有8个motif。
图3 CqKEA蛋白motif分布
2.4 CqKEA基因表达模式分析
由图4(a)的组织特异性表达分析结果可知,除CqKEA5a在叶柄中不表达,其余基因在所有组织中均有表达。同一亚组的基因在13个组织中的表达趋势大致相同,Class Ⅰ中的基因在所有组织中的表达都相对较低,而Class Ⅱ和Class Ⅲ中的基因表达则较高,尤其是CqKEA3a和CqKEA3b在幼苗中的表达最高;CqKEA2a在白甜藜种子和黄苦藜种子中的表达存在差异,这说明在同一物种不同品种之间CqKEA基因的表达模式也存在一定差异。
干旱、高温和盐胁迫下表达分析结果表明所有CqKEA基因都会对胁迫产生响应。由图4(b)可见,在地上部分中CqKEA1、CqKEA2a和CqKEA2b在所有胁迫下均表现上调的趋势,而CqKEA3a和CqKEA3b在盐胁迫下上调最明显,CqKEA4a、CqKEA4b、CqKEA5a、CqKEA5b和CqKEA5c表达量较低,受三种胁迫影响不明显。由图4(c)可见,在地下部分中,大多数基因在胁迫条件下呈下调趋势,只有CqKEA1和CqKEA2a在干旱和高温胁迫下呈上调趋势,CqKEA5c在高温胁迫下呈上调趋势。
图4 CqKEA基因表达模式
3 讨 论
随着全基因组测序技术的不断发展,越来越多的物种的基因组被测序完成,目前已被测序的植物已超过70个[14]。大量的基因组数据为植物基因家族的鉴定和基因功能的验证提供了极为有利的条件。目前对KEA的研究较少,主要集中在拟南芥。AtKEA1和AtKEA2存在于叶绿体内壁上,AtKEA3存在于叶绿体类囊体膜上,它们通过维持pH和K+平衡来保证叶绿体正常的生物功能[7]。通过系统进化分析表明CqKEA1、CqKEA2a和CqKEA2b与AtKEA1、AtKEA2归为同一亚组,CqKEA3a和CqKEA3b与AtKEA3归为同一亚组,由此推测它们具有相似的功能,对光合作用、pH和叶绿体渗透具有调节作用[2,4-7];CqKEA4a和CqKEA4b与AtKEA4归为同一亚组,其可能参与蛋白运输、定位和膜微囊融合等过程[8]。
植物通过多种方式来抵抗逆境胁迫带来的影响,但是在耐受干旱、盐和高温等胁迫的过程中,植物的基因作用机制表现出相似性[15]。本研究对10个CqKEA基因的组织特异性表达和非生物胁迫条件下的表达模式进行了探究。绝大多数基因在所有组织中均有表达,说明CqKEA基因可能是维持植物基本生命活动所必需的。CqKEA3a和CqKEA3b在幼苗中的表达量最高,推测其可能参与维持植株正常生命活动中的离子稳态和K+利用。在地上部分中CqKEA4a、CqKEA4b、CqKEA5a、CqKEA5b和CqKEA5c的表达水平相对较低,而在地下部分中表达水平相对较高,推测这5个基因主要在地下部分发挥功能;CqKEA3a和CqKEA3b则主要在地上部分中发挥功能,同时当植株受到盐胁迫后这两个基因表达水平上调,推测其可以通过维持植株正常的离子稳态来保证植株正常的生命活动。在CqKEA1、CqKEA2a和CqKEA2b中,除地下部分CqKEA2b对干旱和高温胁迫不敏感,其余基因均对干旱和高温胁迫有响应,推测其可能在这两种胁迫下行使功能。综上所述,本研究对CqKEA基因家族进行了系统分析,为CqKEA基因功能研究奠定了理论基础,为研究藜麦耐逆机理和分子育种提供了基因资源。