APP下载

谷子抗旱相关蛋白激酶基因家族鉴定及表达分析

2020-03-04武懿茂樊武哲李红英李雪垠

关键词:蛋白激酶基序外显子

武懿茂,樊武哲,李红英*,李雪垠*

(1.山西农业大学 农学院,山西 太谷 030801;2.山西农业大学 生命科学学院,山西 太谷 030801)

谷子(Setariaitalica(L.) P. Beauv.)是禾本科狗尾草属二倍体(2n=2X=18)一年生草本植物[1]。谷子起源于中国[2],是一种传统的粮食作物,主要生长在中国黄河流域中上游的干旱和半干旱地区[3],有着8700多年的栽培历史[4],其在中国农产品中占据着重要地位。谷子基因组较小(约510 Mb)[5]、生育期短[6]、与其它主要粮食作物亲缘关系较近,已逐渐成为禾本科C4植物基因组学研究的理想模式作物[7]。

随着全球变暖、地下水位下降、地表水源不足,干旱已经成为制约农业生产的重要因素之一[8],发掘作物抗旱基因、开展抗旱育种迫在眉睫。众所周知,谷子具有耐旱、耐瘠薄和适应性强等特点,是节水减肥的理想作物[9]。因此,研究谷子抗旱机制对发掘抗旱基因、提高作物抗旱性、发展节水农业,进而保证作物产量具有重要意义[10]。

蛋白激酶(Protein Kinase, PK)是一类催化蛋白质磷酸化反应的酶,广泛存在于植物体中[11]。蛋白激酶的催化亚基是高度保守的,在催化结构域的中心存在保守的天冬氨酸,对酶催化活性起关键作用[12]。蛋白激酶参与调控植物信号转导、生长发育和抗逆等多种生理反应,在调节作物抗旱方面起着重要作用[13]。蛋白激酶主要包括PKc、CDPK、SnRK等家族,其中PKc通过调节二酰基甘油(DAG)或钙离子(Ca2+)浓度,在信号转导中起重要作用[14]。钙依赖蛋白激酶(CDPK)参与植物非生物胁迫响应,研究表明转AtCDPK1基因马铃薯植株抗旱性显著增强[15];在水稻中过表达OsCDPK7能显著增强转基因植株的耐旱性[16]。SnRK2家族成员在脱落酸(ABA)信号通路和介导植物干旱胁迫信号中发挥重要作用[17]。SnRK2C也可介导信号转导,调节一系列干旱胁迫响应基因,使得拟南芥的耐旱性增强[18];MpSnRK2.10过表达可以提高转基因拟南芥和苹果的抗旱性[19]。

目前,谷子中抗旱相关蛋白激酶家族基因的研究报道较少,本研究通过抗旱品种勾勾母鸡咀(GG)和干旱敏感品种晋汾16(JF16)在干旱条件下的转录组数据,筛选并鉴定谷子抗旱相关蛋白激酶基因,对其进行生物信息学和基因表达分析,旨在为谷子抗旱相关蛋白激酶基因的发掘与功能鉴定奠定理论基础。

1 材料和方法

1.1 谷子抗旱相关蛋白激酶基因鉴定及染色体定位分析

勾勾母鸡咀(GG)为抗旱谷子品种,晋汾16(JF16)为干旱敏感品种。为了鉴定谷子抗旱相关蛋白激酶基因,我们从干旱处理条件下勾勾母鸡咀和晋汾16的转录组测序数据中筛选差异表达基因,筛选标准为P值<0.05、FDR值<0.05。从谷子基因组数据库(Phytozome V12.1, https://phytozome.jgi.doe.gov/pz/portal.html)中获取谷子抗旱相关蛋白激酶基因的染色体位置信息,利用Tbtools[20]工具对谷子抗旱相关蛋白激酶基因的染色体定位进行可视化分析。

1.2 谷子抗旱相关蛋白激酶基因基本信息和理化性质分析

利用谷子基因组数据库(Phytozome V12.1)查找抗旱相关蛋白激酶基因的基本信息,并利用ExPASY-ProtParam在线工具(https://web.expasy.org/protparam/)分析谷子抗旱相关蛋白激酶的等电点和分子量。

1.3 谷子抗旱相关蛋白激酶家族系统进化树构建

利用Clustal X2软件对谷子蛋白激酶基因的氨基酸序列进行多序列比对分析,并通过邻位相连法(Neighbor-Joining, NJ)构建系统进化树,BootStrap参数设置为1 000,其它参数选择默认。

1.4 谷子抗旱相关蛋白激酶家族基因结构分析

利用在线软件Gene Structure Display Server(GSDS, http://gsds.cbi.pku.edu.cn/)分析谷子抗旱相关蛋白激酶家族基因的外显子-内含子(exon-intron)结构。

1.5 谷子抗旱相关蛋白激酶保守基序及保守结构域分析

利用MEME在线软件(http://meme-suite.org/tools/meme)对谷子抗旱相关蛋白激酶进行保守基序分析,利用TBtools工具绘制谷子抗旱相关蛋白激酶基因的motif示意图,分析谷子抗旱相关蛋白激酶氨基酸序列的保守性。将谷子抗旱相关蛋白激酶基因的氨基酸序列提交至NCBI-CDD数据库(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi),并利用TBtools工具绘制谷子抗旱相关蛋白激酶保守结构域。

1.6 谷子抗旱相关蛋白激酶基因启动子分析

选取谷子抗旱相关蛋白激酶基因起始密码子上游1 500 bp序列作为启动子区域,将序列提交到PlantCARE(http://bioinformatics.psb.gent.e/eboolslantcare/html)数据库,分析启动子顺式作用元件。

1.7 谷子抗旱相关蛋白激酶基因表达分析

基于干旱条件下勾勾母鸡咀和晋汾16的转录组数据,对谷子抗旱相关蛋白激酶基因进行基因表达分析。从Phytozome数据库(V12.1) 下载谷子抗旱相关蛋白激酶基因的表达数据,分析其组织表达特异性。利用TBtools工具绘制基因表达热图。

2 结果与分析

2.1 谷子抗旱相关蛋白激酶基因鉴定及染色体定位

对干旱条件下勾勾母鸡(GG)和晋汾16(JF16)的转录组测序数据进行差异表达基因筛选,得到1 300个表达差异性显著的基因,通过功能注释鉴定出35个谷子抗旱相关蛋白激酶基因。上述基因的染色体分布情况如图1所示,根据基因在染色体上的位置,将谷子35个蛋白激酶基因分别命为SiPK1~SiPK35。谷子抗旱相关蛋白激酶基因分布在8条不同染色体上,5号染色体上最多(9个),7号染色体上最少(2个),6号染色体没有分布。

2.2 谷子抗旱相关蛋白激酶基因基本信息及理化性质

35个谷子抗旱相关蛋白激酶基因基本信息及理化性质见表1。谷子抗旱相关蛋白激酶基因长度在732~12 356 bp之间,其中SiPK10的CDS序列最长(4 890 bp),SiPK11的CDS序列最短(261 bp);SiPK12外显子数目最多(20个),SiPK2、SiPK16、SiPK30外显子数目最少(仅有1个);氨基酸序列的平均长度为580 aa;蛋白质等电点介于4.50(SiPK15)和9.68(SiPK3)之间,其中有13个基因编码的蛋白质呈酸性,22个基因编码的蛋白质显碱性;蛋白质相对分子质量范围37 114~178 473 Da,平均值为63 605 Da。

图1 谷子抗旱相关蛋白激酶基因染色体定位Fig.1 Chromosomal location of protein kinase genes related to drought resistance in foxtail millet

表1 谷子抗旱相关蛋白激酶基因基本信息及理化性质Table 1 Basic information of protein kinase genes related to drought resistance in foxtail millet

续表1

2.3 谷子抗旱相关蛋白激酶系统进化及基因结构分析

基于谷子蛋白激酶基因的氨基酸序列构建系统进化树(图2左)。谷子35个蛋白激酶可以划分为4个亚族,同一亚族内成员亲缘关系较近。亚族间外显子数目差异较大,第Ⅰ组外显子数目最多,第Ⅳ组外显子数目相对较少,而亚族内成员基因结构差异较小(图2右)。由图1可知,亲缘关系较近的蛋白激酶的基因结构也较为相近,SiPK6、SiPK34基因亲缘关系较近,外显子数目相同;SiPK23、SiPK29基因亲缘关系较近,外显子数目也相同。

外显子-内含子结构分析显示,多数基因包含有外显子和内含子结构,呈现断裂基因特征,其中以SiPK12基因尤为明显,含有20个外显子;而SiPK11基因只含有2个外显子;SiPK2、SiPK16、SiPK30基因结构简单,外显子数目最少,仅有1个外显子,没有内含子结构。

2.4 谷子抗旱相关蛋白激酶保守基序及保守结构域

对谷子抗旱相关蛋白激酶的氨基酸序列进行保守基序分析(图3)。谷子抗旱相关蛋白激酶家族共包含8种保守基序,将其分别命名为motif 1~8,结果显示绝大多数谷子抗旱相关蛋白激酶含有这8种保守基序,表明谷子抗旱相关蛋白激酶中的保守基序具有较强的保守性。值得一提的是,13个谷子抗旱相关蛋白激酶都含有相同的基序并且排列顺序一致,基序的保守性表明这些蛋白激酶很可能具有功能上的相似性。

保守结构域分析结果(图4)显示,谷子抗旱相关蛋白激酶共包含14个保守结构域,所有蛋白激酶都含有PKc结构域。13个抗旱相关蛋白激酶基因至少含有2个结构域,其中SiPK10具有5个结构域,即2个ANK、1个PKc、1个RING_Ubox和1个Ank_2保守结构域,表明该基因可能具有多种功能。SiPK16、SiPK19含有相同的保守域,即都含有1个PKc和1个AMPKA_C保守结构域,且其位置较为相似,它们可能具有相似的生物学功能。

2.5 谷子抗旱相关蛋白激酶基因启动子顺式作用元件

启动子顺式作用元件分析结果(表2、表3)显示,谷子35个抗旱相关蛋白激酶基因启动子中与干旱胁迫响应相关的元件主要有:ABA响应元件(ABRE)、MeJA响应元件(CGTCA-motif、TGACG-motif)、干旱诱导响应元件(MBS)以及 MYB结合位点元件(MRE、CCAAT-box)等。除SiPK13、SiPK14基因以外,其他33个谷子抗旱相关蛋白激酶基因启动子区域都含有ABA响应元件,其中SiPK21基因含有ABA响应元件的数目最多,高达19个。多数基因都含有干旱诱导响应元件(MBS),其中SiPK1、SiPK24基因含有干旱诱导响应元件(MBS)的数目最多,同时SiPK24基因含有MYB结合位点(MRE)数量也最多,表明它们可能参与调控谷子干旱胁迫响应。此外,不同基因的调控元件种类、数目也不同,SiPK21基因的顺式调控元件最多,高达44个,SiPK27基因最少,仅含有5个;一些基因还具有赤霉素(GA)、水杨酸(SA)、生长素(auxin)、低温、胁迫响应相关的元件。

图2 谷子抗旱相关蛋白激酶基因系统进化及外显子-内含子结构分析Fig.2 Phylogenetic and exon-intron structure analyses of protein kinase genes related to drought resistance in foxtail millet

2.6 谷子抗旱相关蛋白激酶基因表达分析

谷子抗旱相关蛋白激酶基因在干旱胁迫条件下的表达情况如图5A所示,SiPK4、SiPK20、SiPK27等基因在不同品种和处理间的表达量都较高;SiPK25、SiPK30等基因在不同品种和处理间都有表达,但表达量较低。在同一品种勾勾母鸡咀中,SiPK1、SiPK4、SiPK5、SiPK27基因在干旱处理后表达量明显上调,说明该基因可能参与谷子干旱胁迫响应。

组织特异性表达结果如图5B所示,SiPK8、SiPK28、SiPK29等基因在各组织中表达量较高,SiPK11、SiPK17、SiPK26等基因在各组织中表达量较低。SiPK20和SiPK25基因表现出显著的组织特异性表达模式,SiPK20在叶(高光照、两周一叶期)中表达量较高,SiPK25在根(尿素处理)中表达量较高。

图3 谷子抗旱相关蛋白激酶氨基酸序列保守基序Fig.3 Conserved motifs in the amino acid sequences of protein kinases related to drought resistance in foxtail millet

图4 谷子抗旱相关蛋白激酶基因保守结构域分析Fig.4 Conserved domains of protein kinases related to drought resistance in foxtail millet

表2 谷子抗旱相关蛋白激酶基因启动子顺式作用元件数目Table 2 The numbers of promoter cis-acting elements in protein kinase genes related to drought resistance in foxtail millet

3 讨论与结论

谷子是禾本科狗尾草属二倍体C4植物,有9条染色体[21]。谷子基因组测序于2012年完成[22],其基因组较小,约510 Mb。谷子具有耐旱、耐瘠薄的特点,是理想的抗旱模式作物。

本研究鉴定了35个谷子抗旱相关蛋白激酶基因,它们分布于除6号染色体外的其余8条染色体上。聚类分析显示,它们可以分为4个亚家族,其中第Ⅰ亚家族成员最多。基因结构分析显示,多数基因包含有外显子和内含子结构。保守基序分析显示,谷子抗旱相关蛋白激酶基因家族成员共有8个保守基序。保守结构域分析表明,谷子抗旱相关蛋白激酶共包含14个保守结构域,所有蛋白激酶都含有PKc结构域。上述结果表明,多数亲缘关系较近的基因的外显子-内含子结构、保守基序、保守结构域较为相似,它们可能具有功能上的相似性,如SiPK6、SiPK34亲缘关系较近,在基因结构、保守基序、保守结构域都表现出较强的相似性,它们可能具有相似的生物学功能。

表3 谷子抗旱相关蛋白激酶基因启动子顺式作用元件功能Table 3 Functions of promoter cis-acting elements in protein kinase genes related to drought resistance in foxtail millet

A:谷子抗旱相关蛋白激酶基因在干旱胁迫条件下2个品种中的表达分析;B:谷子抗旱相关蛋白激酶基因在不同处理条件下14个组织中的表达分析A:Experession analyses of protein kinase genes related to drought resistance in two varieties of foxtail millet under drought stress;B:Expression analyses of protein kinase genes related to drought resistance in 14 tissues of foxtail millet under different treatments图5 谷子抗旱相关蛋白激酶基因表达分析Fig.5 Expression analyses of protein kinase genes related to drought resistance in foxtail millet

基因表达分析显示,在抗旱品种勾勾母鸡咀(GG)中,干旱处理后SiPK1和SiPK4基因表达量显著上升,并且SiPK1、SiPK4启动子区域都含有干旱诱导响应元件(MBS)[SiPK1基因含有MBS的数目最多],该元件是MYB结合位点并参与植物干旱诱导,说明SiPK1和SiPK4极有可能参与谷子干旱胁迫响应。组织特异性表达分析显示,SiPK4和SiPK25在各组织中均有表达,且在根中表达量较高,它们可能与根部发育密切相关,而根系在植物响应干旱胁迫反应中具有重要作用[23],这表明SiPK4可能通过调控谷子根部发育参与根部对干旱胁迫的应答反应。综上,SiPK4基因很可能与谷子的干旱胁迫应答密切相关,可作为抗旱相关的候选基因。

谷子是耐旱性极强的作物[24],研究其抗旱机理对小麦、水稻等作物的抗旱改良具有极其重要的意义。本研究结果表明,谷子蛋白激酶基因SiPK4很可能参与干旱胁迫响应,可作为谷子抗旱机制研究的候选基因。本研究为谷子抗旱相关蛋白激酶基因的进一步鉴定与功能研究奠定了理论基础,为后续谷子抗旱机制的解析提供了思路。

猜你喜欢

蛋白激酶基序外显子
龙眼全基因组和转录本序列SSR位点的鉴定
基于蛋白激酶的喉癌预后预测模型的构建与评估
带TRS基序突变的新型冠状病毒威胁更大
外显子组测序助力产前诊断胎儿骨骼发育不良
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
解析参与植物胁迫应答的蛋白激酶-底物网络(2020.2.11 中国科学院)
植物抗逆胁迫相关蛋白激酶的研究进展
人类组成型和可变外显子的密码子偏性及聚类分析
基于流式微球分析技术的超高灵敏度蛋白激酶活性分析