小麦CBL 4基因密码子使用特征分析
2018-09-11陈文烨焦义然杨军峰刘永伟董福双王海波杜进民
陈文烨,焦义然,杨军峰,刘永伟,杨 帆,董福双,王海波,杜进民,周 硕*
(1.河北科技大学 生物科学与工程学院,河北 石家庄 050000;2.河北省农林科学院 遗传生理研究所/河北省植物转基因中心,河北 石家庄 050051; 3.河北旺丰种业有限公司,河北 邢台 054900)
小麦是我国主要的粮食作物之一,小麦产量的提高对于保障我国粮食安全具有重要的意义。低温、干旱和病虫害等逆境胁迫是造成小麦产量降低的重要因素[1]。其中,土壤盐渍化作为一种影响农作物产量和质量的主要环境因素,对农业的发展也存在阻碍作用[2]。类钙调磷酸酶B亚基蛋白(Calcineurin B-like protein,CBL)在植物非生物逆境应答和Ca2+信号介导过程中发挥重要作用[3]。CBL蛋白能感受细胞中Ca2+浓度并能与丝/苏氨酸蛋白激酶(CBL-interacting protein kinase,CIPK)互作对下游基因进行调控,从而对逆境胁迫进行应答反应[4-5]。李刚波等[6]研究发现,杜梨CBL4基因编码蛋白由212个氨基酸残基组成,且与拟南芥CBL4基因亲缘关系最近,推测杜梨CBL4基因可能对Ca2+浓度的感受和传递具有调控作用,以此来进行逆境胁迫应答反应。拟南芥CBL4基因与水稻CBL4基因同样存在较高的同源性,两者在盐响应信号途径(Salt overly sensitive,SOS)中具有类似的信号系统,即主要在植物根部调控耐盐性[7]。小麦抗干旱、低温和高盐胁迫等逆境的研究一直备受关注,尤其是CBL蛋白在其信号转导过程中发挥的关键作用已成为研究的热点、重点。
CBL4基因与其编码蛋白的关系是通过三联密码子来建立的。在自然界存在61种密码子,上述密码子可编码成20种氨基酸,这就会产生同义密码子,即一种或多种密码子编码同一种氨基酸的现象[8],并且每种密码子的使用频率存在差异[9-10],出现频率较高的密码子为最优密码子,说明基因存在密码子偏好性[11]。密码子偏好性分析不仅可以为植物基因功能和进化差异研究提供理论依据[12],而且基因表达水平的高低与其相对同义密码子使用度(RSCU)密切相关[13]。因此,研究植物CBL4基因密码子偏好性,对了解CBL4基因及其基因家族的进化规律、转录和翻译的调控及提高基因表达水平均具有参考价值。但目前还未出现关于小麦CBL4基因密码子偏好性的报道。为此,采用CodonW和Usage Codon软件分析小麦CBL4基因密码子偏好性,并将其与其他17种不同目植物CBL4基因密码子偏好性进行比较,以期为小麦CBL4基因改良以提高对干旱、低温和盐胁迫等逆境的抗性提供理论依据。
1 材料和方法
1.1 数据来源
小麦及其他17种不同目植物CBL4基因核苷酸序列来源于NCBI的核苷酸数据库。
1.2 方法
利用MEGA软件分析CBL4基因碱基序列分布比例。使用Usage Codon在线软件(http://www.geneinfinity.org/sms/sms_codonusage.html)计算18种植物CBL4基因的密码子所占的比例和频率。使用CodonW软件计算18种植物CBL4基因的RSCU、ENc(有效密码子数)、GC(GC含量)、GC3s(密码子第3位的GC含量)、CBI(密码子偏爱指数)和FOP(最优密码子使用频率)、Gravy(蛋白质亲水性)和Aromo(芳香族氨基酸比例)。通过SPSS软件分析上述影响密码子偏好性指标间的相关系数。利用Bioedit软件比对不同植物CBL4基因编码区核苷酸序列,再由MEGA软件的最小进化法进行系统发育树构建,该系统发育树的可靠性经1 000次重复的自举检验法来检验。
2 结果与分析
2.1 小麦等18种植物CBL4基因碱基序列分析
如表1所示,小麦等18种不同目植物CBL4基因核苷酸序列长度不一致,小麦CBL4基因序列全长为657 bp,天门冬最短,全长324 bp,芝麻最长,全长678 bp,两者相差354 bp,但两者的碱基占总序列比例变化不大。小麦CBL4基因编码区核苷酸序列中T所占比例最小,G和C所占比例较大,G+C所占比例达58.0%。马铃薯与小麦相反,主要由A和T组成,A+T所占比例达66.2%,高于其他17种植物,除小麦外的其他16种植物的碱基占比情况与马铃薯类似。小麦CBL4基因的ENc低于其他17种植物,而萝卜的ENc最高;小麦的GC、GC3s、FOP和CBI均高于其他17种植物,而马铃薯的GC和GC3s均最低,香瓜的FOP和CBI均最低。小麦的G+C所占比例达58.0%,其中以第3位GC含量为主,提示GC含量对小麦CBL4基因密码子偏好性具有重要的影响,而马铃薯与小麦形成鲜明的对比。
2.2 小麦CBL4基因密码子偏好性分析
小麦CBL4基因共由219个密码子组成,如表2所示,小麦CBL4基因偏好使用的密码子依次是CUC、AGG、UAA、AUC、GUG、GCG、ACG、UGC和GGC,上述密码子的RSCU≥2。其中,终止密码子是UAA;而CUA、GUU、CUA、UCU、CCA、ACU、GCU、UGU、CGU、CGA、AGA、GGU、UAG和UGA这14个密码子的RSCU为0,表明小麦CBL4基因在蛋白质合成过程中对密码子的使用具有明显的偏好性。
表1 CBL4基因编码区碱基分布比例和部分偏性指标
表2 Usage Codon和CodonW程序分析小麦CBL4基因的密码子偏好性
注:标下划线处为大于1.5的RSCU,下同。
2.3 除小麦外的17种植物CBL4基因密码子使用偏性指标及其影响因素
除小麦外的17种不同植物CBL4基因的RSCU如表3所示,多数植物对UUG、CUU、AUU、GUU、CCU、CCA、ACU、ACA、GCA、UAU、AGA、AGG密码子的使用具有较强的偏好性。对于终止密码子,不同植物的使用频率不同。不同植物CBL4基因密码子偏好性影响因素分析如表4所示,其中GC3s和GC均与CBI呈极显著正相关,而Gravy和Aromo均与CBI呈负相关,但不显著;ENc与GC3s、GC、Aromo均呈负相关,与Gravy呈正相关,但均不显著。结果显示,GC3s和GC是引起不同植物CBL4基因密码子偏好性的主要因素,Gravy和Aromo对其密码子使用有一定的影响,但不是主要因素。
表3 17种植物CBL4基因的RSCU
续表3 17种植物CBL4基因的RSCU
表4 偏性指标与影响因素的相关系数
注:**表示在0.01水平上极显著相关。
2.4 小麦等18种植物CBL4基因的系统发育分析
对18种不同植物CBL4基因的系统发育分析如图1所示,小麦与向日葵之间的亲缘关系最近,但两者与其他16种植物的亲缘关系最远,与小麦密码子使用特征差异最大的马铃薯与香瓜亲缘关系最近,而香瓜的FOP和CBI与小麦相差最大,说明密码子偏好性结果与聚类分析得出的亲缘关系结果一致。
图1 小麦等18种植物CBL4基因编码区的系统发育树
3 结论与讨论
目前,对植物CBL蛋白的研究已经从拟南芥这种模式生物发展到粮食作物、蔬菜和果树等植物[14-19]。植物CBL基因在生物、非生物逆境应答和脱落酸(Abscisic acid,ABA)信号转导中均发挥重要作用[20]。模式生物拟南芥CBL1、CBL2、CBL3、CBL4和CBL9基因均参与低钾信号转导途径[21]。刘明毓等[22]推测,甜瓜CBL4基因参与盐、冷、干旱等胁迫应答和ABA信号转导途径。余义和等[23]发现,葡萄CBL4基因启动子活性在干旱、低温和盐胁迫处理后显著提高,且其转录本在这些胁迫处理后也能快速响应。董凤丽等[24]发现,甘菊CBL4基因可能也参与盐、干旱等逆境胁迫的应答。
本研究发现,不同植物CBL4基因核苷酸序列长度存在差异,小麦CBL4基因含有657个碱基,编码219个氨基酸,其中CUC、AGG、UAA、AUC、GUG、GCG、ACG、UGC和GGC密码子为其最优密码子,CUA、GUU、CUA、UCU、CCA、ACU、GCU、UGU、CGU、CGA、AGA、GGU、UAG和UGA密码子的使用频率为0,说明小麦是一种极其偏爱使用G/C结尾密码子的植物,不偏爱使用A/U结尾的密码子。小麦CBL4基因的终止密码子为UAA(TAA),有研究表明,使用TAA作为终止密码子的生物多为低复杂度的真核生物(如酵母、非脊柱动物),而使用TAG作为终止密码子的生物也较少,使用TGA作为终止密码子的生物主要是脊柱动物[25]。但植物CBL4基因所使用的终止密码子不均是TAA,TAG和TGA终止密码子的使用也较多,且无规律性,这可能与其碱基长度有关。
对小麦CBL4基因密码子偏性指标进行分析发现,其ENc在18种植物中最低,但GC、GC3s、FOP和CBI均最高,与小麦不同的是,萝卜的ENc最高,马铃薯的GC和GC3s最低,香瓜的FOP和CBI均最低,模式生物拟南芥的密码子使用特征最接近萝卜。有研究表明,拟南芥CBL4基因与玉米和番茄CBL4基因同源[26],都存在类似的耐盐性特征[27]。本研究的密码子偏好性结果与聚类分析得出的亲缘关系结果一致,即与小麦密码子使用特征差异最大的马铃薯与香瓜亲缘关系最近,表明密码子偏好性结果有利于揭示植物CBL4基因的进化规律。小麦等植物CBL4基因密码子使用偏好性的揭示,可以为选择最优密码子来对抗干旱、低温和盐胁迫等逆境,以及人工合成基因序列提高目标蛋白表达水平等提供理论依据。