陆地棉GhNHX7基因特征及表达的生物信息学分析
2019-03-02周丽容谭新
周丽容,谭新
(新疆阿拉尔市十六团农业技术推广站,新疆阿拉尔843018)
棉花是世界上主要的天然纤维作物。中国是世界棉花的主产区,新疆是中国最大的棉花种植区[1]。尽管棉花是盐碱地的先锋作物,新疆土壤次生盐碱化仍然严重制约棉花生产,影响中国棉花生产安全。尽管科学家投入了大量的工作研究棉花耐盐机理、选育耐盐棉花品种,但对于棉花盐胁迫的调控机理尚不清晰。前人研究发现,拟南芥中位于质膜上的钠氢交换蛋白NHX7/SOS1(Sodium/hydrogen exchanger 7//salt overly sensitive 1)参与Na+/H+转运,维持胞内Na+和K+稳态,是响应盐胁迫响应的必需基因[2]。SOS1蛋白通过与一系列蛋白SOS2、SOS3等组成SOS(Salt-overly-sensitive SOS)信号途径来维持离子稳态和调节盐胁迫响应[2-5]。拟南芥AtNHX7/SOS1基因结构复杂,含有23个外显子和22个内含子,编码区序列长度为3 438 bp,编码包含1 146个氨基酸残基的蛋白质。该蛋白分子量为127 kD,其N端高度疏水,C端高度亲水,包含12个跨膜结构区域[6]。目前,尚未在陆地棉中鉴定并分析GhNHX7基因。棉花基因组序列的测定与发表[7-10]为我们挖掘盐胁迫响应基因、分析相关基因功能提供了资源。我们通过在陆地棉基因组中扫描获得了2个GhNHX7基因。通过基因、蛋白及启动子序列分析,了解该基因的特征。对盐胁迫下GhNHX7基因的表达进行分析,表明该基因参与盐胁迫的响应。本研究为进一步探讨GhNHX7基因在棉花盐胁迫响应中的功能奠定基础。
1 材料与方法
1.1 GhNHX7基因鉴定及启动子序列获取和基因结构分析
在UNIPROT(https://www.uniprot.org/)数据库中检索并下载拟南芥AtNHX7/SOS1基因。用AtNHX7/SOS1(ID:Q9LKW9)序列作为探针,通过同源性搜索BLASTP软件检索陆地棉基因组(Gossypium hirsutumGenome NAU-NBI Assembly v1.1 &Annotation v1.1,https://www.cottongen.org/node/2068581)蛋白注释文件[11]。在棉花基因组中提取GhNHX7基因起始密码子ATG上游2 000 bp(base pair,碱基对)序列作为该基因的启动子。根据基因序列和CDS序列,利用Gene Structure Display Server(GSDS)2.0[12](http://gsds.cbi.pku.edu.cn/)软件展示GhNHX7基因结构。利用MCScanX[13]软件分析GhNHX7基因的复制类型。
1.2 GhNHX7蛋白结构域、保守基序分析
用Pfam数据库和NCBI CD search tool检索GhNHX7蛋白保守结构域;用MEME(http://memesuite.org/)数据库检索GhNHX7蛋白中的基序,识别数设置为10。
1.3 GhNHX7基因启动子中顺式作用元件分析
利用植物启动子序列顺式作用元件识别数据库PLACE[14](http://www.dna.affrc.go.jp/PLACE/signalscan.html)检 索AtNHX7/SOS1,GhNHX7a和GhNHX7b的启动子序列中的顺式作用元件。
1.4 GhNHX7基因表达分析
GhNHX7基因表达数据来自于NCBI数据库中Gossypium hirsutumTM-1的RNA测序数据数据,登陆号为PRJNA248163(https://www.ncbi.nlm.nih.gov/bioproject/PRJNA248163)。
2 结果与分析
2.1 GhNHX7基因鉴定
通过同源性检索,在陆地棉基因组中鉴定出与拟南芥AtNHX7/SOS1相似性最高的2个基因Gh_A03G0996(相似度63%),Gh_D02G1385(相似度63%),分别命名为GhNHX7a和GhNHX7b(表1)。GhNHX7a和GhNHX7b分别位于A03和D02的染色体的中部区域。通过MCScanX分析发现,GhNHX7a和GhNHX7b基因随着全基因组/片段复制事件的发生而扩增。GhNHX7a和GhNHX7b分别包含22个和21个外显子,与AtNHX7/SOS1外显子数目相近。GhNHX7a和GhNHX7b基因的编码区序列长度分别为3 549 bp和3 555 bp,GC含量均为41%。GhNHX7a和GhNHX7b分别编码包含1 182和1 184个氨基酸残基的蛋白质,分子量分别为131.437 kD和132.242 kD。
表1 GhNHX7基因鉴定及特征
2.2 GhNHX7基因结构特征
利用GSDS 2.0软件可视化AtNHX7、GhNHX7a和GhNHX7b基因结构(图1)。GhNHX7a和GhNHX7b分别包含有22和21外显子,21个和20个内含子。GhNHX7a和GhNHX7b与AtNHX7的外显子特征较为相似,但内含子长度差异较大,可见其基因的长度差异是内含子区序列扩张引起的。
2.3 GhNHX7蛋白结构特征
如图2所示,通过在Pfam数据库中检索发现GhNHX7a/b基因都具有钠氢交换区(Na_H_exchanger)结构域(PF00999)。这个结构域在N端具有10~12个跨膜结构,在C端具有1个大的胞质区(亲水区)。第3~12跨膜区相比其他Na_H_Exchanger家族成员较为一致。其中第6和第7跨膜区高度保守,被认为是转运Na+和H+的区域。在NCBI CD-search Tool中检索发现GhNHX7a、GhNHX7b和AtNHX7/SOS1基因除了具有PF00999结构域外,还具有环化核苷酸结合区(Cyclic nucleotide-binding,cNMP-binding)结构域(PF00027)。
图1 AtNHX7、GhNHX7a和GhNHX7b基因结构
图2 AtNHX7、GhNHX7a和GhNHX7b蛋白特征
2.4 GhNHX7基因启动子区顺式作用调控元件分析
利用植物启动子序列顺式作用元件识别数据库PLACE检 索AtNHX7/SOS1,GhNHX7a和GhNHX7b的启动子序列的顺式作用元件。如表2所示,AtNHX7/SOS1,GhNHX7a和GhNHX7b的启动子序列具有较多相同的高度富集顺式作用元件,其中MYC、ARR1-binding element和Dof是重要的胁迫响应元件。推测GhNHX7a和GhNHX7b参与了陆地棉胁迫响应进程。
表2 GhNHX7基因启动子区顺式作用调控元件类型及数目
2.5 GhNHX7a/b基因在盐胁迫后和不同组织的表达分析
为了解GhNHX7a/b在棉花生长发育和响应盐胁迫中的潜在功能,我们研究了GhNHX7a/b盐胁迫的叶片中和在生长发育过程不同棉花组织中的表达量。与0 h相比,盐胁迫后1 h、3 hGhNHXT7a在棉花叶片中表达量无变化;在盐胁迫处理后6 h和12 h表达量提高(图3A),即GhNHX7在处理中期(处理后6~12 h)参与了盐胁迫响应调控。由图3B可以看出,GhNHX7a/b基因在萼片、叶、花、雌蕊、根、雄蕊、茎和花托中的均表达;GhNHX7a基因在茎中的表达量最高,GhNHX7b基因在各个组织中的表达差异不大。
3 讨论与结论
随着我国棉产区西进东移战略的进行,新疆成为我国棉花主产区,但新疆地区土壤盐渍化严重[15]。因此,通过基因工程提高棉花盐胁迫抗性、选育耐盐品种对保障棉花生产安全非常重要。因棉花基因组的复杂性,研究陆地棉盐胁迫响应机理,挖掘耐盐基因较为困难。采用同源性检索等生物信息分析的方法,在棉花基因组中查找其他物种中已经明确的盐胁迫响应基因,是1种较为快速的探索棉花耐盐机理的方法。
图3 GhNHX7a和GhNHX7b基因在盐胁迫下及不同组织中的表达
拟南芥的SOS(salt-overly-sensitive)信号网络,是第一个发现的非生物胁迫响应网络[16]。在前人不断的研究探索下[2-5,17-19],SOS信号网络被证实并完善。这个信号网络主要包括3个重要的组分:SOS1,SOS2,SOS3。其中SOS1是定位于质膜上的Na+/H+逆向转运蛋白,能够调节细胞内的Na+含量,受到SOS2和SOS3基因的调控。拟南芥的AtNHX7基因在根、茎和叶中均表达,且在根中表达水平比茎中高[20]。在本研究中,通过同源性检索的方法,在陆地棉基因组中检索到了2个GhNHX7基因,分别命名为GhNHX7a和GhNHX7b。这2个基因具有与SOS1基因相似的结构,分别具有22和21个外显子。同时发现GhNHX7a/b蛋白具有与SOS1同样的Na_H_Exchanger和cNMP_binding结构域。保守基序分析发现,SOS1和GhNHX7a/b的保守基序一致。GhNHX7a/b的生物信息分析表明其可能具有与SOS1基因相同的功能。启动子区顺式作用元件分析发现,SOS1和GhNHX7a/b具有大量相同的顺式作用元件,例如MYC、ARR1-binding element和Dof是重要的胁迫响应元件。推测在陆地棉中,GhNHX7a/b基因是胁迫响应基因。基因表达分析发现GhNHX7a/b基因在盐胁迫后表达水平升高,可见其可能参与了棉花盐胁迫响应。该研究为棉花耐盐基因GhNHX7a/b挖掘与利用提供了依据,为深入研究陆地棉耐盐机理,利用基因工程技术进行耐盐棉花的选育提供了资源。