美洲狼尾草HXK基因家族鉴定及表达
2023-12-04祝诗词叶歆雅王净洁阿布都沙拉木范欲航黄琳凯
祝诗词, 叶歆雅, 王净洁, 阿布都沙拉木, 范欲航, 黄琳凯
(四川农业大学草业科技学院, 四川 成都 610000)
己糖激酶是参与糖酵解第一步反应的不可逆酶[1]。糖酵解途径又称EMP途径,是将葡萄糖或糖原进行分解代谢,并伴有能量生成的反应途径[2-3]。己糖激酶主要是将细胞内的葡萄糖催化磷酸化生成6-磷酸葡萄糖(Glc-6-P)[4],达到活化葡萄糖的目的,有利于完成进一步的分解、合成代谢[5]。己糖激酶可以催化葡萄糖、果糖及氨基葡萄糖等发生不可逆的磷酸化反应,生成相应的6-磷酸酯,是植物呼吸代谢过程中的关键酶之一[2,6]。它也可将对葡萄糖的感受与来自激素、蔗糖、光照和应激信号组成一个信号网络,参与响应非生物胁迫,对植物体的生长发育和信号转导起调节作用[7-8]。
己糖激酶可从多种植物体内获得,在高等植物中具有多样化的酶活性调控机制和基因表达。Karve等[9]研究中发现植物HXK基因均以多基因家族形式存在。其中,在双子叶植物中,如枇杷(Eriobotryajaponica(Thunb.) Lindl.),7个HXK基因家族的成员因其能催化己糖磷酸化,参与调控糖代谢过程,促进植株生长发育的作用而被广泛研究[10]。除此之外,HXK基因也在其他双子叶植物中开展了研究,如拟南芥(Arabidopsisthaliana(L.)Heynh)中有6个家族成员[11],番茄(SolanumlycopersicumL)有4个家族成员[12]等,在单子叶植物中,如水稻(OryzasativaL.)有10个家族成员[13],玉米(ZeamaysL.)有9个家族成员[14],苔藓植物中已糖激酶基因家族成员相对较多,如小立碗藓(Physcomitrellapatens)有11个家族成员[15]。此外还在茶树[16]、葡萄[17-18]、桂花[19-20]和烟草[21]中进行的试验表明,大多数HXK蛋白与线粒体外膜结合,在糖酵解中发挥作用[22]。胁迫过程中,NBhxk1、AThxk1和AThxk2基因能响应甲基紫精和病原体侵染诱导的氧化胁迫,高水平的HXK能增强对氧化胁迫的抵抗力;AThxk2和AThxk3基因能在低温、高盐处理下表达上调;麻风树JChxk1、JChxk2和JChxk1基因在叶片内同样能响应低温而诱导表达;油菜BNhxk1、BNhxk3和BNhxk9基因能响应核盘菌在抗性品种内的侵染而表达显著上调[19]。目前,未见美洲狼尾草HXK基因功能有关的研究报道。
美洲狼尾草(Pennisetumglaucum(L.)R.Br.),又名御谷,一年生草本植物,是一种在粮食栽培与饲料利用等领域具有高效产能的优质牧草,其具有生长速度快、抗旱能力强、抗逆性高[3,23]、耐瘠薄能力强等特点,其分布最广的地区是在中非与西非的热带草原[24],而干旱、盐胁迫等是影响美洲狼尾草品质和产量的重要因素[25]。
本研究采用Blastp、hmmer以及关键字检索三种方法鉴定出12个美洲狼尾草HXK基因,系统地分析了美洲狼尾草HXK基因家族成员的理化特性、染色体定位、多序列比对、系统进化关系、基因结构和保守基序、顺式作用元件以及盐和干旱胁迫下的表达模式,来揭示HXK基因的特征,为进一步深入探讨美洲狼尾草中HXK基因家族的功能提供参考。
1 材料与方法
1.1 美洲狼尾草HXK基因家族成员鉴定
本研究所使用的美洲狼尾草基因组数据、蛋白序列文件从美洲狼尾草全基因组数据库(http://117.78.45.2:91/home)中获得。为鉴定美洲狼尾草中HXK的基因家族成员,从pfam数据库(http://pfam.xfam.org/)获得HXK基因的保守结构域文件Hexokinase_1、Hexokinase_2(PF00349、PF03727)[26],通过Linux系统中的hmmer软件构建隐马可夫模型,搜索含有对应保守结构域的候选蛋白序列;利用美洲狼尾草的全基因组序列构建本地BLASTP数据库,以拟南芥、水稻和玉米的HXK基因家族成员比对得到美洲狼尾草HXK家族的候选成员,阈值设为E<0.001[27];在美洲狼尾草全基因组数据库(http://117.78.45.2:91/search)中以HXK与Hexokinase为关键字进行检索获得HXK基因家族的候选成员。合并上述所有候选成员并进行去重复与去冗余工作,再利用NCBI CD-search在线工具(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)去除无典型HXK结构域[28]的序列,最终鉴定到美洲狼尾草的HXK基因家族成员。
1.2 HXK基因家族系统进化树的构建及蛋白性质预测
在NCBI(https://www.ncbi.nlm.nih.gov/)数据库中下载拟南芥、玉米和水稻相对应的HXK蛋白序列,利用MEGA 7.0软件对美洲狼尾草、拟南芥、水稻和玉米展开分析[29],使用Clustal W对这四种物种的HXK蛋白序列进行多序列联配比对,并利用最大似然法(Maximum Likelihood estimation)构建系统进化树,Model/Method参数设置为”Possion model”,Gaps,missing Data Treatment参数设置为”Partial deletion”,Bootstrap校验参数为1 000,使用Figtree v1.4.4对结果文件进行调整。最后,利用EXPASY(https://web.expasy.org/protparam/)[30]在线工具对美洲狼尾草HXK基因家族蛋白的相关性质进行预测,包括氨基酸数量、相对分子量、理论等电点、不稳定系数、脂溶系数、亲水性平均值等属性。
1.3 HXK基因顺式作用元件分析
在基因组数据库中,利用Linux系统自带的检索功能获取HXK家族基因上游1 500 bp的序列,使用PlantCARE[31]网站预测该序列范围内的启动子元件,采用GSDS 2.0在线工具(http://gsds.gao-lab.org/index.php)与excel构图功能将预测结果绘制成HXK基因家族的顺势作用元件柱状图。
1.4 美洲狼尾草HXK基因家族蛋白结构域及转录本结构分析
根据美洲狼尾草全基因组数据库(http://117.78.45.2:91/home)注释文件gff,利用Linux自带的检索功能获得了HXK基因家族的转录本数据;利用NCBI CD-search在线工具对HXK基因家族成员进行结构域分析,获得了所有HXK基因的蛋白保守结构域数据。利用Tbtools软件的Gene Structure View工具对得到的转录本数据与蛋白结构域数据进行共建分析。
1.5 HXK基因motif分析与染色体位置定位
利用Linux系统的MEME软件对美洲狼尾草HXK家族成员的蛋白序列进行motif基序分析,nmotif参数设置为10,minw参数设置为6,maxw参数设置为50,分析结果利用Tbtools软件可视化。从美洲狼尾草全基因组数据库提取PI537069的全基因组注释文件,通过Linux自带的检索功能提取HXK家族成员的染色体位置信息,利用MG2C v2.1在线工具(http://mg2c.iask.in/mg2c_v2.1/)绘制染色体定位图。
1.6 美洲狼尾草HXK基因家族的表达分析
基于美洲狼尾草全基因组数据库(http://117.78.45.2:91/tools/geneexpression/)的转录组数据,将美洲狼尾草中的HXK基因在不同组织器官、不同胁迫条件下的表达量数据进行可视化分析,利用Tbtools软件的Heatmap工具完成进一步的对数转化、标准化和聚类分析等工作,分析结果包含基因在根、茎、叶、穗和胚共五种组织中的表达情况。
2 结果与分析
2.1 美洲狼尾草HXK基因家族的鉴定及特性
共鉴定到12个美洲狼尾草HXK基因,为其命名PMhxk-1至PMhxk-12(表1)。PMhxk氨基酸数量介于108~590之间;蛋白质分子量介于12 016.81~63 510.52Da之间;理论等电点介于4.63~9.74之间,其中理论等电点大于7的仅有PMhxk-5,PMhxk-7,PMhxk-8,PMhxk-11四个蛋白,属于碱性蛋白,其他8个蛋白为酸性;不稳定指数位于29.41~61.37之间,差异明显,其中PMhxk-2、PMhxk-3、PMhxk-6、PMhxk-7、PMhxk-8、PMhxk-9、PMhxk-10、PMhxk-12的不稳定系数小于40,具有稳定性;脂肪系数变化范围为48.24~110.65;亲水性平均值介于-0.937~0.401之间,其中PMhxk-1,PMhxk-4,PMhxk-5,PMhxk-7,PMhxk-10具有亲水性。
表1 美洲狼尾草HXK基因家族成员基本信息Table 1 basic information of HXK gene family members of Pennisetum glaucum
2.2 美洲狼尾草HXK基因家族系统进化树的构建
基于MEGA7软件,对美洲狼尾草、拟南芥、水稻和玉米的HXK基因进行系统进化分析,并构建了进化树图。如图1所示,根据分支关系,美洲狼尾草HXK基因被分为4个亚组,其中Ⅱ亚组分布的美洲狼尾草HXK基因家族成员最多,包含5个成员(PMhxk-1、PMhxk-2、PMhxk-4、PMhxk-9、PMhxk-11),其次为Ⅰ亚组与Ⅳ亚组,分别包含3个成员(Ⅰ亚组:PMhxk-6、PMhxk-10、PMhxk-12;Ⅳ亚组:PMhxk-3、PMhxk-7、PMhxk-8)而Ⅲ亚组分布的成员最少,只有一个成员(PMhxk-5)。
图1 美洲狼尾草HXK基因家族系统进化树分析Fig.1 Phylogenetic tree analysis of HXK gene family in Pennisetum glaucum
2.3 美洲狼尾草HXK基因家族顺式作用元件分析
鉴定HXK转录因子的调控元件,基于Plant CARE数据库,对美洲狼尾草HXK基因上游1 500 bp序列进行作用元件的预测,美洲狼尾草HXK基因的启动子区域包含多个与植物生长发育和逆境响应相关的调控元件(图2),共有16种顺式作用元件类型(图3),根据注释信息大致分为光响应元件(F2)、逆境胁迫调控元件(F3,F4,F7,F12)、植物生长调控元件(F1,F5,F6,F8,F9,F10,F11,F13,F14,F15,F16)3类,其中光响应元件的占比最大且在每个成员中均有分布,每个成员都具有胁迫响应元件中的厌氧响应位点。植物生长调控元件中多数为植物激素调控的位点,包括茉莉酸响应、生长素响应、水杨酸响应、脱落酸响应等。大量植物激素的作用位点预示着多种生命活动的响应途径,这表明HXK基因在美洲狼尾草的生长发育与逆境响应过程中具有潜在的功能。
图2 美洲狼尾草HXK基因启动子区域中的调控元件Fig.2 Regulatory Elements in the HXK Gene Promoter Region of Pennisetum glaucum注:F1,茉莉酸响应;F2,光响应;F3,无氧响应;F4,低温响应;F5,玉米醇溶蛋白;F6,分生组织;F7,干旱响应;F8,水杨酸响应;F9,脱落酸响应;F10,生长素响应;F11,种子特异性;F12,防御与应激响应;F13,免疫应答响应;F14,昼夜节律调控;F15,栅栏叶肉细胞;F16,细胞周期调控。下同Note:F1,MeJa responsive;F2,Light responsive;F3,Anaerobic responsive;F4,Low-temperature responsive;F5,Zein metabolism;F6,Meristem expression;F7,Drought responsive;F8,SA responsive;F9,ABA responsive;F10,IAA responsive;F11,Seed responsive;F12,Defense and stress responsive;F13,Immune responsive;F14,Circadian control;F15,Differentiation of the palisade mesophyll cells;F16,Cell cycle regulation.The same as below
图3 美洲狼尾草HXK基因启动子顺式作用元件预测Fig.3 Prediction of cis-acting elements of HXK gene promoter in Pennisetum glaucum
2.4 美洲狼尾草HXK基因家族基因结构与蛋白保守序列分析
分析美洲狼尾草HXK基因之间的转录组结构成分,基于NCBI CD-search及MEME分析HXK基因的外显子与内含子的分布、保守motifs,再基于转录本数据以及蛋白结构域数据,利用Tbtools软件的GeneStructureView工具进行共建分析。分析结果如图4所示:各基因成员均存在外显子和内含子,但成员之间存在差异化的结构,其中PMhxk-9含有一个超长的内含子,所有成员的外显子数量介于1~9个之间。PMhxk-1,PMhxk-4,PMhxk-5仅含有2个外显子,而PMhxk-5含有1个内含子和2个外显子,PMhxk-10,PMhxk-3,PMhxk-6,PMhxk-7,PMhxk-8含有外显子数量最多,含有9个,而PMhxk-3,PMhxk-6,PMhxk-7含有内含子数量最多,含有9个。此外,同一亚组内的外显子和内含子的分布模式相似,而外显子的位置在亚组之间存在显著差异,这种亚组之间的差异与系统进化分析中的分组规律一致。根据结构分析发现美洲狼尾草HXK蛋白仅有一个蛋白保守结构域(PLN02914 superfamily)(图4),5个基因(PMhxk-1,PMhxk-3,PMhxk-4,PMhxk-7,PMhxk-12)同时含有5′端和3′端非翻译区(UTR),5个基因(PMhxk-2,PMhxk-5,PMhxk-9,PMhxk-10,PMhxk-11)不含UTR区,基因PMhxk-8仅含有3′端非翻译区(UTR),基因PMhxk-6仅含有5′端非翻译区(UTR)。
图4 美洲狼尾草HXK基因家族结构及聚类分析Fig.4 HXK gene family structure and cluster analysis of Pennisetum glaucum
图5 美洲狼尾草HXK基因家族结构分析Fig.5 Analysis of HXK gene family structure of Pennisetum glaucum
2.5 美洲狼尾草HXK基因motif分析
分析PMhxk家族具有一定特征的蛋白超二级结构(motif),基于Linux系统MEME软件对美洲狼尾草HXK家族成员的蛋白保守motif特征进行分析,发现美洲狼尾草HXK蛋白的motif结构之间有一定的差异性和相似性,共鉴定得到10个比较保守的基序(Motif1-Motif10)(图6,图7)。根据其结构类型大致分为三类,只含有motif5、motif2的单基序结构(PMhxk-4,PMhxk-1,PMhxk-11),含有少量motif的片段结构(PMhxk-5,PMhxk-9,PMhxk-2)和含有多个motif组合的多基序结构(PMhxk-3,PMhxk-12,PMhxk-10,PMhxk-6,PMhxk-7,PMhxk-8)。根据进化分析的分组依据,发现仅含有一个motif结构的HXK成员均来自Ⅱ亚组,而含有多个连续motif结构的HXK成员均来自Ⅰ亚组与Ⅳ亚组,在这些连续motif基序中发现了两个较为保守的片段结构,分别是motif2-motif5-motif6-motif2和motif7-motif4-motif8-motif3-motif9-motif1片段,其出现在Ⅰ亚组和Ⅳ亚组的所有HXK蛋白结构中。
图6 美洲狼尾草HXK基因家族蛋白特征分析Fig.6 Analysis of protein characteristics of HXK gene family in Pennisetum glaucum
图7 美洲狼尾草HXK基因家族蛋白的10个保守结构域Fig.7 The conserved domains of HXK gene family proteins in Pennisetum glaucum
2.6 美洲狼尾草HXK基因家族染色体定位分析
基于MG2Cv2.1分析网站,对PMhxk家族的12个基因进行染色体定位分析(图8),发现HXK基因仅分布在美洲狼尾草的1,2,5,6,7号染色体上且每条染色染上基因数量分布不均匀,其中,1号染色体上染色体分布最多,共有5个基因,而第2,7号染色体上的基因成员最少,均只有1个。
图8 美洲狼尾草HXK基因家族染色体定位图Fig.8 Chromosome mapping of HXK gene family in Pennisetum glaucum
2.7 美洲狼尾草不同组织中的PMhxk基因表达
将美洲狼尾草HXK基因家族的表达数据进行可视化分析后,结果如图9所示,从不同植物组织中HXK基因家族成员的表达量差异来看,在植物的穗组织中,六个成员表达量显著,数值均大于0.5,分别是:PMhxk-6,PMhxk-12,PMhxk-11,PMhxk-9,PMhxk-10,PMhxk-3,占据基因家族成员数量的一半;而在种子中除了PMhxk-6与PMhxk-12外整体呈现低表达量趋势;在分蘖期根组织中仅有PMhxk-7表现出较为明显的高表达量,且相较于该基因在其他组织中的表达量差异显著。从不同亚组之间的表达差异来看,Ⅰ亚组的差异变化最为明显,其所有成员在穗组织中均有较高的表达,在根组织中的表达量也明显高于其他亚组;于Ⅰ亚组相比,Ⅱ亚组的表达上调事件并不显著,但是其成员PMhxk-1、PMhxk-2、PMhxk-4在穗、叶、茎、根和分蘖组织中均有稳定的表达。综上分析,我们发现美洲狼尾草的HXK基因的高表达主要集中在抽穗期的穗组织中,这表明该基因可能参与穗组织的生长与发育调控,并在美洲狼尾草籽粒成熟时期行使一定的生物功能。
图9 美洲狼尾草不同组织PMhxk基因表达Fig.9 Expression of PMhxk gene in different tissues of Pennisetum glaucum
2.8 PMhxk基因表达分析
为探究PMhxk基因在干旱和盐胁迫下的潜在功能,我们采用美洲狼尾草非生物胁迫处理下的RNA-seq数据集,选取胁迫处理的时间分布为0到144小时(图10),以达到检测PMhxk基因的转录丰度的目的。结果表明,PMhxk基因在干旱和盐胁迫处理下存在差异基因。在叶片干旱胁迫144 h后,有4个PMhxk基因表达上调,其中PMhxk-6和PMhxk-12显著上调,同时有3个PMhxk基因在叶片中显著下调;在根组织干旱胁迫144 h后,有2个基因表达上调,有7个PMhxk基因表达下调,其中PMhxk-7下调较为显著。此外在干旱胁迫过程中还有7个基因表达呈现先增加再降低的趋势,例如PMhxk-8与PMhxk-2在叶片干旱诱导48 h时显著上调、144 h时显著下调,PMhxk-4在根组织干旱诱导96 h时上调表达、144 h时显著下调。在盐胁迫过程中我们发现多数PMhxk基因表达呈现先增加后降低或者先降低后增加的趋势。在叶片中PMhxk-1和PMhxk-5均在3 h和96 h显著上调而144 h时又呈现下调表达,在根组织中PMhxk-2、PMhxk-4、PMhxk-9均在48 h时显著上调。PMhxk基因对于胁迫诱导较为敏感,并在胁迫处理的早期呈现差异表达,例如PMhxk-12在两种胁迫诱导1 h的根组织中均表现出显著的上调表达,PMhxk-4在盐胁迫诱导1 h的叶片中显著下调表达。根据PMhxk基因在这两种胁迫诱导下的差异表达可以说明美洲狼尾草在面对高温和高盐的环境压力时能够产生响应,同时也表明PMhxk基因可能在美洲狼尾草耐旱耐盐的机制中有一定的贡献。
图10 美洲狼尾草在干旱、盐胁迫处理下HXK的相对表达量Fig.10 Relative expression of HXK in Pennisetum glaucum under drought and salt stress注:L,叶组织;R,根组织;0-144(h) 胁迫处理的时间(小时)Note:L,leaves;R,root;0-144(h),Time for coerion treatment(h)
3 讨论
己糖激酶具有催化己糖磷酸化的作用,在植物的糖感知和糖信号转导过程中扮演重要的角色[32],是植物体呼吸代谢过程中的关键酶之一[33],正是基于其重要的生物学功能,有关己糖激酶的研究在植物育种领域逐渐成为热点[3]。
3.1 美洲狼尾草HXK基因家族成员鉴定分析
本研究从美洲狼尾草全基因组数据库中分离并鉴定出12个美洲狼尾草HXK基因家族成员,已知几种作物中的HXK家族成员数量,拟南芥中6个HXK基因[11]、水稻中10个HXK基因[13]、玉米中9个HXK基因[14],其数量特征较为稳定,虽为基数较小的亚家族,但是不同物种之间却没有特别大的数量差异。同时发现该特征与同为单子叶的禾本科植物比较更为明显,可能是因为HXK是一种参与植物生命活动的关键基因,其始终伴随植物的生命形态变化及进化过程。
3.2 HXK基因染色体位置定位和顺式作用元件分析
在多数作物物种中,HXK基因家族成员的染色体分布均位于3-5条染色体上,例如拟南芥、水稻与玉米[26],而PMhxk具有相似的特征,其成员共分布于5条染色体中,且多位于染色体的上下两端。在顺式作用元件分析中,研究发现大部分成员都具有厌氧响应位点,这表明面对一些代谢损伤的胁迫环境,HXK家族与其相关的调节过程有密切关系。此外,大部分HXK基因启动子还具有生长素响应、水杨酸响应、脱落酸响应位点,这与其他植物中报道的一致。其中,谷子SIhxk家族成员中就含有大量与植物激素响应、光反应和逆境胁迫相关的作用元件[26]。
3.3 HXK基因motif分析
美洲狼尾草HXK基因家族中有5个成员具有9个外显子片段,这种外显子的数量特征与几种其他植物的HXK家族特征一致[13-14,26],在谷子中,除SIhxk3的所有SIhxk基因均含有9个外显子编码[26],这一特点再一次的说明HXK基因家族是一种关键基因,其在生命形态变化及进化过程中相当保守。同时本研究中的结构分析显示,PMhxk家族同一亚组内的外显子和内含子分布模式极为相似,其中Ⅳ亚组中所有成员的外显子具有相同的数量。在保守基序的分析过程中,结果显示仅含有一个motif结构的HXK成员均来自Ⅱ亚组,Ⅰ亚组和Ⅳ亚组的所有HXK蛋白结构中均出现了两个较为保守的连续motif结构,这表明具有保守功能结构的HXK基因可能行使相同方向的功能或是彼此协同作用共同调控。综上,在基因家族的常规分析中,本研究发现美洲狼尾草HXK基因保守且稳定的结构特征预示着该家族成员参与植物关键的功能调控过程,并且在进化关系上也趋于稳定,这进一步的体现HXK基因家族具有一定的研究价值。
3.4 非生物胁迫诱导HXK基因的表达分析
一些研究表明,HXK基因在植物不同组织间的表达量有所差异,对植物的各个器官起不同的调控作用[12,13]。水稻多数HXK在水稻的未成熟的种子、茎、叶片、花中均有表达;茶树CShxk大都在叶片中的高表达,在根组织和种子中低表达。本研究发现美洲狼尾草其成员表达量显著上调的事件主要发生在植物的穗组织中,而在种子和根组织中整体表现出一个明显的低表达量趋势,这表明该基因可能在美洲狼尾草籽实成熟过程发挥着重要作用。
此外,HXK广泛参与植物非生物胁迫响应过程,例如过表达拟南芥AThxk1和AThxk2可显著提高转基因植株对氧化胁迫的耐受性[11];茶树HXK面临高温、干旱等逆境时,将提高HXK的转录水平[16]。本研究也有类似的结果,即美洲狼尾草在盐和干旱胁迫处理后,发现美洲狼尾草HXK基因家族在面对干旱和高盐的环境压力时能够产生响应,大多数基因的相对表达量在不同非生物胁迫条件下均会上调,其中干旱处理下,在根组织中PMhxk-2、PMhxk-4、PMhxk-9均在48 h时显著上调,在叶片中有4个PMhxk基因在144 h时上调表达。在盐处理下,美洲狼尾草叶片中的PMhxk-5、PMhxk-1、PMhxk-8,根中的PMhxk-7、PMhxk-3、PMhxk-6、PMhxk-11、PMhxk-12、PMhxk-4、PMhxk-9、PMhxk-2在几乎每一个处理时间下相对表达量均上调。根据PMhxk基因在这两种胁迫诱导下的差异表达表明PMhxk基因可能在美洲狼尾草耐旱耐盐的机制中有一定的贡献。
4 结论
本文利用生物信息学方法对美洲狼尾草HXK基因家族进行了分析,鉴定出12个美洲狼尾草PMhxk基因成员,得到两个较为保守的motif片段,发现基因成员集中表达于抽穗期的穗组织中,部分PMhxk成员在干旱胁迫和盐胁迫中出现表达上调。综上,本研究为美洲狼尾草HXK基因家族进一步的功能研究提供了有力参考。