APP下载

小麦半胱氨酸蛋白酶抑制剂基因家族的鉴定与表达分析

2023-05-26范永胜程相杰董彦琪马华平蒋志凯

种子 2023年3期
关键词:半胱氨酸蛋白酶元件

范永胜, 程相杰, 董彦琪, 马华平, 蒋志凯

(河南省新乡市农业科学院, 河南 新乡 453003)

半胱氨酸(Cystatin,Cys)蛋白酶抑制剂是广泛存在于各种动植物体内的一类蛋白[1]。Cys的主要功能是通过直接与半胱氨酸蛋白酶(Cysteine proteinase,CP)活性位点结合来发挥抑制CP活性的作用,一般情况下这个过程是可逆的[2]。在植物中的半胱氨酸蛋白酶抑制剂被命名为PhyCys(Phytocystatins),大多数PhyCys已被证明其主要抑制C 1 A家族CP的水解活性[3]。PhyCys属于小分子蛋白,其分子量一般在11~16 kD之间,除此之外一部分PhyCys的分子量在23~30 kD之间,这是因为它们C端较长,有研究表明这类PhyCys不仅能抑制C 1 A类CP的活性,还可以抑制C 13类CP的活性[4]。

PhyCys在植物中发挥的功能是多样的,如参与植物生长的调控[5]、参与生物胁迫防御反应[6]、响应非生物胁迫[7-8]等。PhyCys在模式植物拟南芥中进行了较为深入的研究,在拟南芥发生超敏反应(Hypersensitivity,HR)时AtCYS1的表达量迅速上升,在烟草中异位过表达AtCYS1时,可以明显发现坏死斑面积的减少,说明AtCYS1的表达可以有效抑制HR的发生[9];ABA处理萌发过程中的拟南芥种子后,AtCYS6的表达量显著增加,导致拟南芥种子萌发延迟,AtCYS6缺失突变体和过表达植株则分别表现为萌发提前与萌发延迟,种子萌发快慢与AtCYS6的表达量负相关[10]。大白菜Cys基因在拟南芥中进行异位过表达后同样表现出种子延迟萌发的表型[11]。AtCYS除了参与拟南芥生长发育与防御的调控外,还参与响应非生物胁迫的过程,AtCYSa与AtCYSb的过表达植株对冷、干旱、高盐环境的抵抗力显著增强[12]。在玉米中,玉米瘤黑粉病侵染植株后半胱氨酸蛋白酶抑制剂基因CC9高度表达,CC9通过抑制半胱氨酸蛋白酶的活性来抑制水杨酸(SA)介导的防御通路从而影响HR的产生,CC9基因沉默植株对瘤黑粉病抗病性大幅提高[13]。在水稻中,将水稻半胱氨酸蛋白酶抑制剂基因OC-I在烟草中异位表达后,显著提高植株对烟草蚀纹病毒与马铃薯病毒的抗性[14]。对从杨树品种河北杨中克隆的半胱氨酸蛋白酶抑制剂基因进行体外表达后,发现其能够有效抑制天牛的生长发育,抑制程度与半胱氨酸蛋白酶抑制剂的浓度呈正相关[15]。以上研究结果表明,PhyCys在植物的生长发育、参与生物胁迫的防御反应、响应非生物胁迫发挥着举足轻重的作用。

PhyCys被证实已在多种植物中发挥着重要的作用[16],但尚未见到有关小麦TaCys家族相关基因深入的研究。本研究在小麦全基因组水平上,对TaCys的基因结构、染色体定位、启动子顺式作用元件及在生物与非生物胁迫下的基因表达进行了详细的探讨,为现代生物技术改良小麦品种与创新种质提供理论基础,对提高小麦产量与抵抗病虫害能力具有重要意义。

1 材料与方法

1.1 小麦TaCys基因家族的鉴定

在Ensembl plant (http://plants.ensembl.org/index.html)网站下载小麦基因组序列文件(Triticum_aestivum.IWGSC.dna.toplevel.fa)、GFF 3文件(Triticum_aestivum.IWGSC.49.gff 3),蛋白序列文件 (Triticum_aestivum.IWGSC.pep.all.fa)。通过Pfam蛋白家族数据库(http://pfam.xfam.org/)获取Cys基因家族隐马氏模型文件(PF 00031),利用Hummer search软件在小麦全基因组水平上鉴定获得TaCys基因家族候选基因(E-value<1×10-5)。以水稻半胱氨酸蛋白酶抑制剂(OC)蛋白序列为参考序列,利用TBTools的Blastp功能在小麦全基因组水平上鉴定TaCys候选基因。将Hummer search与Blastp获取的候选基因去除冗余后,在NCBI-CDD(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)与SMART(http://smart.embl.de/smart/batch.pl)网站手动鉴定Cys结构域的完整性,最终获得TaCys家族基因。将小麦TaCys蛋白序列上传到Expasy(https://web.expasy.org/protparam/)预测小麦TaCys蛋白的等电点与分子量,在Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)预测小麦TaCys基因的亚细胞定位。

1.2 小麦TaCys蛋白的系统发育进化树分析

在Ricedate(https://www.ricedata.cn/gene/)网站获得水稻OC家族的蛋白序列文件,利用MAGA 7.0软件中的Clustal W工具,将水稻OC蛋白序列与新鉴定的小麦TaCys蛋白序列进行比对,采用邻接法(Neighbor-joining,NJ)构建系统发育进化树(参数Bootstrap为1000),并利用iTOL在线工具(https://itol.embl.de/)对进化树进行美化。

1.3 小麦TaCys基因结构与保守motif分析

将小麦TaCys蛋白序列上传到meme (http://meme-suite.org/),对TaCys蛋白的保守基序进行鉴定(默认参数)。利用小麦gff 3文件通过TBtools软件对小麦TaCys基因结构可视化。

1.4 小麦TaCys染色体定位

从IWGSC RefSeq V 1.0数据库(https://urgi.versailles.inra.fr/)获得TaCys基因的物理和染色体位置。根据各基因的起始位置和染色体长度,利用TBTools软件绘制染色体定位图谱。

1.5 小麦TaCys基因启动子顺式作用元件分析

利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)网站对小麦TaCys基因ATG上游2 000 bp的序列进行分析,对获取的数据进行整理后利用TBTools软件可视化。

1.6 小麦TaCys基因在不同小麦组织中的表达预测

利用小麦表达数据库expVIP(http://www.wheat-expression.com/),获得了TaCys家族基因在小麦植物根、叶、穗粒组织中的表达模式,预测了TaCys基因在不同阶段的表达情况。利用Tbtools软件绘制TaCys基因表达的热图。

1.7 小麦TaCys基因在生物与非生物胁迫下的表达预测

利用Genevestigator(https://genevestigator.com/)软件获取本研究所利用的生物与非生物胁迫下的小麦转录组数据,本地分析后进行可视化。

2 结果与分析

2.1 TaCys基因家族的鉴定及分类

将Hummer search与BlastP search 两种方法获取的候选蛋白序列进行比对后,去除冗余的序列,通过NCBI-CDD数据库对Cys结构域的完整性进行手动确认,最终获得了70个含有完整Cys结构域的小麦半胱氨酸蛋白酶抑制剂基因TaCys,分别将其命名为TaCys1-A~TaCys42-D(表1)。对TaCys基因家族蛋白的理化性质分析后发现:TaCys基因家族蛋白的氨基酸长度区间在113~248 aa;其蛋白分子量在Expasy进行计算后发现,大部分TaCys的蛋白分子量在11~19 kD之间,只有TaCys10-A、TaCys 10-B、TaCys 10-D的分子量达到了26 kD左右,这是因为它们有较长C端[4];蛋白质等电点在4.72~10.16之间;亚细胞定位预测所有的TaCys蛋白都定位于细胞质中。

表1 TaCys基因家族的特性Table 1 The characteristics of TaCys gene family

小麦与水稻都是禾本科单子叶作物。本研究对70个小麦、8个水稻的Cys家族蛋白序列进行了比对,构建了系统进化树。根据前人对水稻半胱氨酸蛋白酶抑制剂基因的研究结果,TaCys可以被分为三大类:Group A、GroupB、Group C。Group C含有最多的成员,包含42个基因,Group A与Group B则含有相同的成员数,都包含14个基因(图1)。

图1 小麦、水稻Cys家族系统进化树分析Fig.1 The phylogenetic tree of the Cys family of wheat and rice

2.2 保守基序(motif)与基因结构分析

本研究利用在线网站MEME对TaCys的motif进行预测,结果如图2所示。同一组且进化关系较近的基因的基序结构基本相似,motif基本按照9-7-3-1-2-6-4-5-10的顺序分布。motif 1、motif 4、motif 5极其保守,几乎出现在所有的TaCys中。为深入探究TaCys的基因结构特征,利用TBtools软件对70个TaCys的基因结构进行可视化(图2)。同一组内基因的外显子和内含子数量基本相同,TaCys基因包含0~3个内含子和1~4个外显子。A组中TaCys基因所含内含子与外显子的数量总体最多,其中TaCys10-A、TaCys10-B、TaCys10-D均含有3个内含子和4个外显子,在所有已鉴定到的TaCys中数量最多。TaCys9-A、TaCys9-B、TaCys9-D的数量则次之,含有2个内含子和3个外显子。B组与C组中除了TaCys21-B与TaCys4-D含有2个内含子外,其他TaCys只有1个外显子。内含子的数目与长度决定了小麦半胱氨酸蛋白酶抑制剂基因的大小。

图2 TaCys基因家族的保守motif与基因结构Fig.2 Conservation motifs and gene structure of TaCys gene family

2.3 TaCys基因在小麦染色体上的分布

TaCys基因分布在小麦的19条染色体上(图3),其物理位置如表1所示。70个TaCys基因在染色体上呈现出不均匀分布的情况,绝大部分分布在染色体的两端,只有TaCys11-A、TaCys11-D分布在染色体的着丝粒处。其中1 A、6 B、7 B、6 D染色体上有1个基因成员;4 A、7 A、1 B、7 D染色体上有2个基因成员;3 A、5 A、4 B上有3个基因成员。TaCys基因在2 A、3 B、3 D、3 D、4 D、5 D染色体中的分布相对平衡,在2 B染色体上含有最多的基因成员达到13个。基因的串联重复是基因家族增大的机制之一[17],本研究鉴定到9组串联重复基因簇,分别是TaCys3-A/TaCys7-A/TaCys8-A/TaCys19-A;TaCys15-A/TaCys17-A;TaCys27-B/TaCys28-B/TaCys29-B/TaCys30-B/TaCys31-B/TaCys32-B/;TaCys8-B/TaCys7-B/TaCys3-B/TaCys24-B/TaCys25-B/;TaCys23-B/TaCys21-B/TaCys21-B/TaCys22-B/;TaCys38-D/TaCys3-D/TaCys7-D/TaCys8-D;TaCys35-D/TaCys36-D/TaCys37-D;TaCys39-D/TaCys40-D/TaCys5-D;TaCys15-D/TaCys17-D/TaCys33-D/TaCys12-D,这可能是TaCys基因家族成员数量多于其他植物Cys基因家族的原因。

图3 TaCys基因家族在小麦染色体上的分布Fig.3 Distribution of TaCys gene family on chromosomes

2.4 TaCys的启动子顺式作用元件分析

植物通常通过调控自身的转录速率来适应胁迫[18]。基因的顺式作用元件是激活或抑制转录因子的结合位点[19],一些启动子顺式作用元件是许多基因所共有的,比如光响应作用元件。本研究发现,每个TaCys都含有大量的光响应元件(图4),其中,TaCys10-B、TaCys24-B、TaCys25-B、TaCys37-D、TaCys2-D、TaCys4-D、TaCys19-A含有20个以上的光响应元件,说明这些基因可能在光响应通路发挥着关键作用。TaCys还含有大量的激素相关作用元件,ABA可以抑制种子的萌发,AtCys6上含有大量的ABA相关的顺式作用元件,ABA处理过的种子,种子萌发延迟,AtCys6的表达量上调,半胱氨酸蛋白酶活性降低[10]。TaCys10-B、TaCys10-D、TaCys24-B、TaCys4-D都含有10个以上的ABA响应通路相关作用元件,它们可能发挥与AtCys6相似的功能,与小麦种子的萌发有关。外施MeJA能够诱导植物中半胱氨酸蛋白酶抑制剂的分泌且诱导植物防御基因的表达,表现出对病害的抗性作用[20-21]。TaCys10-A、TaCys10-B、TaCys10-D、TaCys15-D、TaCys21-B、TaCys22-B、TaCys34-D、TaCys37-D、TaCys4-D、TaCys8-A、TaCys10-B、TaCys16-B、TaCys26-B含有10个以上的MeJA通路相关的作用元件,它们可能在小麦面对生物胁迫时发挥重要作用。TaCys除含有光响应作用元件与激素相关作用元件外,还含有植物生长发育与非生物胁迫相关的作用元件,说明TaCys在小麦中发挥的功能可能是多样的。

图4 TaCys基因家族启动子区顺式作用元件分析Fig.4 Analysis of cis-acting elements in promoter region of TaCys gene family

2.5 TaCys在小麦组织中表达模式分析

本研究利用现有的小麦RNA-seq数据库expVIP,分析了TaCys基因在小麦不同发育阶段(幼苗期-Seedling-S、营养生长期-Vegetative-V、生殖生长期-Reproductive-R)的不同组织(根、叶、穗和粒)中的表达模式(图5)。A组中,除TaCys15-A、TaCys15-D、TaCys17-A、TaCys17-D外,有10个TaCys(TaCys9-A、TaCys9-B、TaCys9-D、TaCys10-A、TaCys10-B、TaCys10-D、TaCys33-D、TaCys34-D、TaCys14-B、TaCys14-D)在小麦不同组织的不同发育阶段中均表现为持续高表达,表明他们可能在小麦生长发育的各个阶段都发挥着功能。B组与C组中,TaCys1-A、TaCys1-D在小麦不同组织的不同发育阶段中表达,TaCys11-A、TaCys11-B、TaCys11-D在根与幼苗期的叶子中表达,26个TaCys(TaCys18-A、TaCys20-B、TaCys23-B、TaCys35-D、TaCys37-D、TaCys2-D、TaCys3-A、TaCys3-B、TaCys3-D、TaCys6-A、TaCys6-B、TaCys6-D、TaCys7-B、TaCys8-A、TaCys8-B、TaCys8-D、TaCys12-A、TaCys13-A、TaCys13-D、TaCys19-A、TaCys26-B、TaCys27-B、TaCys31-B、TaCys32-B、TaCys39-D、TaCys41-D)只在生殖生长期籽粒中表达,在根、叶、穗中基本不表达,说明这些基因可能与籽粒灌浆有关。

图5 TaCys基因在不同发育阶段不同组织中的表达分析Fig.5 Expression analysis of TaCys genes in different tissues at different developmental stages

2.6 生物与非生物胁迫下TaCys的表达谱分析

本研究利用公共基因表达数据分析系统Genevestigator对生物与非生物胁迫下TaCys的表达谱进行了分析,包括6种处理:小麦白粉病病原菌(B.graminis)、小麦赤霉病病原菌(F.graminearum)、激发子Flg 22与Chitin、干旱、冷、热(图6)。在接种小麦白粉病后,14个TaCys(TaCys9-A、TaCys9-B、TaCys9-D、TaCys10-A、TaCys10-B、TaCys10-D、TaCys33-D、TaCys34-D、TaCys14-B、TaCys14-D、TaCys9-B、TaCys1-A、TaCys1-B、TaCys1-D)的表达量上调,其中TaCys34-D对小麦白粉病的响应最为强烈。在接种小麦赤霉病后,4个TaCys(TaCys23-B、TaCys35-D、TaCys37-D、TaCys1-D)的表达量明显上调,TaCys35-D与TaCys37-D对小麦赤霉病的响应最为强烈。激发子能够激活植物的免疫反应PTI过程(病原相关分子模式触发的免疫)[22],小麦在chitin和flg 22诱导下,5个TaCys(TaCys23-B、TaCys35-D、TaCys37-D、TaCys1-A、TaCys41-D)持续高表达,这证明它们可能参与植物免疫中PTI的过程。在非生物胁迫中,6个TaCys(TaCys9-A、TaCys9-B、TaCys9-D、TaCys17-A、TaCys17-D、TaCys34-D)在冷、热胁迫下都表现为下调;5个TaCys(TaCys10-A、TaCys10-B、TaCys10-D、TaCys14-B、TaCys14-D)在冷、干旱胁迫下都表现为上调;4个TaCys(TaCys11-A、TaCys11-B、TaCys11-D、TaCys41-D)在干旱胁迫下表现为持续下调。这些数据表明,TaCys可能在小麦生长发育和面对不同胁迫时都发挥着重要作用。

图6 不同胁迫处理下TaCys的表达水平Fig.6 Expression level of TaCys under different stress treatments

3 讨论与结论

了解TaCys基因的生物学功能及其对生物与非生物胁迫响应的分子机制,有助于培育多抗高产小麦新品种。Cys基因在许多物种中都有报道,然而,由于小麦基因组的复杂性,对小麦Cys基因家族的研究还不够深入。

本研究共鉴定了70个TaCys基因,并将其分为3组。C组是小麦家族中最大的群体,占家族成员总数的50%,且C组成员的基因结构中都含有多个内含子,B组与C组中几乎所有成员只含有1个内含子,这与拟南芥[9]、水稻[1]等物种中Cys基因家族中的结果一致,说明Cys在不同物种进化中具有保守性,不同物种的Cys同源基因在植物生长发育调控和面对胁迫响应时可能发挥着相同的作用。基因串联复制事件被认为是增加基因家族多样性的关键机制[17]。本研究将TaCys基因的染色体定位进行了可视化,70个TaCys被定位到19条小麦的染色体上。在植物进化过程中,基因串联复制事件经常发生,导致基因家族的扩展。如果一个200 kb以内的染色体区域包含2个或2个以上的基因,则该区域的基因被认为是串联重复事件的结果[23]。9个串联重复事件共包含35个TaCys基因,结果表明,TaCys基因家族的扩增是进化过程中基因串联复制事件发生的结果。

基因表达受到许多顺式作用元件的调节,先前的研究已经证实,PhyCys基因对不同的诱导都有响应,如寒冷、ABA、干旱和光照诱导[8,12,24],然而,对TaCys基因启动子顺式作用元件的研究很少。对TaCys基因的启动子分析揭示了各种应激响应元件的存在,如ABA、干旱响应、防御和应激响应以及厌氧诱导元件等。结合本研究中对TaCys在非生物胁迫下表达谱分析的结果,TaCys10-A、TaCys10-D、TaCys14-B可能在植物冷与干旱逆境胁迫下发挥着重要的作用。

病原菌在侵染植物时能引起PhyCys基因表达上调,暗示PhyCys与植物抗病防御有关[25]。植物半胱氨酸蛋白酶抑制剂通过抑制菌丝生长起到抗病的作用,其机理可能是抑制真菌半胱氨酸蛋白酶的活性[26]。本研究中对TaCys响应小麦白粉病(活体营养型病原菌)与赤霉病(死体营养性致病菌)的表达情况进行了分析(图5),TaCys在病原真菌侵染后,可通过抑制病原真菌体内的半胱氨酸蛋白酶活性来达到抗病的作用,14个TaCys只在接种白粉病后表达上调,4个TaCys只在接种赤霉病后表达上调,说明TaCys在防御不同营养型病原菌入侵时具有特异性。TaCys35-D、TaCys37-D不仅在赤霉病诱导下表达上调,flg 22与chitin也能诱导它们的表达,这可能是小麦感染赤霉病后TaCys35-D、TaCys37-D能激活PTI反应,增强小麦的抗病性。

TaCys在小麦中发挥不同生物学功能的机制尚不清楚,深入研究并揭示其潜在机制能够更加全面地认识小麦生长发育与抗病害的机制。因此,明晰TaCys在植物中的表达调控机制,有助于后期利用分子育种等手段创新种质与培育高产高抗小麦品种。

猜你喜欢

半胱氨酸蛋白酶元件
思乡与蛋白酶
西安地区同型半胱氨酸参考区间的初步建立
多胚蛋白酶 高效养畜禽
QFN元件的返工指南
IgA蛋白酶在IgA肾病治疗中的潜在价值
在新兴产业看小元件如何发挥大作用
宝马i3高电压元件介绍(上)
同型半胱氨酸与慢性心力衰竭合并肾功能不全的相关性分析
86例同型半胱氨酸与脑梗死相关性分析
冷却猪肉中产蛋白酶腐败菌的分离鉴定