芫荽NPR1-like家族全基因组鉴定及分析
2022-07-29王葆生刘晓蕊刘湘萍
王葆生, 庞 杰, 廉 勇, 刘晓蕊, 扈 顺, 刘湘萍
(内蒙古自治区农牧业科学院蔬菜花卉研究所,内蒙古呼和浩特 010031)
(nonexpressor of pathogenesis-related genes 1)最初是在拟南芥()的突变体中发现的,因该突变基因使得系统获得性抗性标志基因PR的表达量很低甚至不表达而得名。随着拟南芥全基因组测序的完成,在拟南芥中又发现5个like基因,分别为、、、和。拟南芥NPR1-like家族成员在进化上可分为3个亚组,亚组Ⅰ中的AtNPR1和AtNPR2是拟南芥水杨酸(SA)的受体蛋白,在水杨酸介导的植物免疫反应中发挥正调控作用,同时也是低温调控的重要因子;在亚组Ⅱ中,AtNPR3和AtNPR4也都是水杨酸的受体蛋白,在系统抗性(SAR)中发挥负调节作用;AtNPR5和AtNPR6在亚组Ⅲ中,蛋白C端不含NPR1_like_C结构域,主要在拟南芥叶片和花生长发育方面发挥重要作用。近年来,随着高通量测序技术的发展和应用,在鳄梨、油菜、棉花和小麦等植物中也进行了like基因家族的鉴定。
芫荽(L.),伞形科芫荽属草本植物,别名胡荽、香荽,具有强烈的特殊香气,是常见的调味蔬菜,别称香菜。芫荽原产于欧洲地中海地区,汉代时引入我国,我国大部分省份均有栽培。芫荽富含维生素C、胡萝卜素、维生素B和B。芫荽中维生素C的含量很高,摄入7~10 g/d的芫荽叶子就可以满足人体所需。芫荽叶片中含有的胡萝卜素浓度比番茄、豆类和黄瓜高10倍以上。芫荽同时还具有药用价值,根、茎、叶及种子均可入药,在中东和欧洲被用于预防失眠、焦虑,治疗糖尿病,辅助治疗风湿病等,芫荽还具有抑菌、抗氧化、抗炎及抗糖尿病功效,对缓解某些食物中毒也有一定的作用。此外,芫荽的茎、叶、根和果实全株都可用于提取精油,芫荽精油可应用于食品、化工以及医药等行业。
本试验依据已发表的芫荽全基因组测序数据,对芫荽like基因家族成员进行鉴定和分析,以期为进一步开展对伞形科其他植物该基因家族的功能和进化研究提供参考,同时为基因工程手段调控伞形科蔬菜生长发育和改良抗逆性状奠定基础。
1 材料与方法
1.1 材料
本试验的研究对象是芫荽,芫荽的全基因组数据文件来源于Coriander Genome Database(http://cgdb.bio2db.com/);拟南芥基因组数据文件来源于TAIR 10(https://www.arabidopsis.org/);NPR1-like基因蛋白序列下载自NCBI(https://www.ncbi.nlm.nih.gov/),拟南芥AtNPR1~6的登录号分别是At1g64280、At4g26120、At5g45110、At4g19660、At2g41370、At3g57130,水稻()OsNPR1~3和OsNPR5的登录号分别是ABE11614、ABE11615、ABE11618、ABE11622,大麦()HvNPR1的登录号是CAJ19095,二穗短柄草()BdNPR1的登录号是XP_003564857,玉米()ZmNPR1的登录号是NP_001354806,小麦()wNPR1的登录号是AGH18701,香蕉()MNPR1A/B的登录号分别是ABI93182、ABL63913,唐菖蒲()GhNPR1的登录号是AIM54370,百合()LhSorNPR1的登录号是APG55777,芥菜()BjNPR1的登录号是ABC94642,桑树()MuNPR1/4的登录号分别是AGI03909、AGL61506,烟草()NtNPR1的登录号是AAM62410,棉花()GhNPR1的登录号是ABV68572,大豆()GmNPR1-1/1-2的登录号分别是ACJ45013、ACJ45015,海棠()MpNPR1的登录号是ACC77697,葡萄()VvNPR1.1/1.2的登录号是XP_002281475、XP_003633057,番茄()LeNPR1的登录号是APY24056,可可树()TcNPR1/3的登录号分别是ADI24348、AGC39275,番木瓜()CpNPR1的登录号是AAS55117,甘薯()IbNPR1的登录号是ABM64782,杨树()PtNPR1.1的登录号是AEY99652,沙梨()PpNPR1-1的登录号是ABK62792,鳄梨()PaNPR1~5的登录号分别是AKH61407、AKH61408、AKH61409、AKH61410、AKH61411。
1.2 芫荽NPR1-like家族的鉴定
鉴定芫荽基因组中like基因家族成员采用BLASTp和HMMER相结合的方式进行搜索。首先,从Pfam(http://pfam.xfam.org/)数据库中下载基因保守结构域模型PF12313,利用HMMsearch3.1(http://hmmer.org/)程序对芫荽蛋白质数据进行搜索,获得候选相似蛋白序列;利用TBtools软件,以AtNPR1~6蛋白序列为查询序列对芫荽全基因组蛋白数据进行本地BLASTp搜索(-value设置为1×10),获得候选蛋白序列。将2种检索方法获得的蛋白序列合并,将去除冗余的序列提交到SMART(http://smart.embl-heidelberg.de)和PROSITE(http://us.expasy.org/prosite)数据库中进行蛋白结构分析,剔除不含完整的N端BTB/POZ结构域和中间区域ANK锚蛋白重复结构域的序列,剩余序列即为芫荽基因组中的like基因家族成员。
1.3 生物信息学分析
利用在线工具ExPASy(http://web.expasy.org/compute_pi/)预测芫荽NPR1-like蛋白的等电点和分子量,利用TBtools软件分析基因结构(包含内含子和UTR),利用MEME在线工具(http://meme.nbcr.net/meme/)分析保守基序。利用ClustalX进行多重序列比对。利用Tbtools工具,从芫荽基因组中提取like基因起始密码子ATG上游2 000 bp的核酸序列,用在线分析工具PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对序列的顺式作用元件进行分析预测,预测结果用TBtools进行展示。
1.4 基因家族系统进化树构建
利用MEGA 7.0软件中的Clustal W程序对芫荽和其他物种的NPR1-like蛋白序列进行多重序列比对(空位开放罚分设置为10,空位延伸罚分设置为0.2),利用比对结果构建进化树。进化树构建选用邻接法(neighbor joining,NJ),检验方法选用步长检验法(bootstrp method),检验次数设置为 1 000 次,计算模型选用距离模型(p-distance),空位处理模式选用成对删除(pairwise deletion)。
1.5 表达模式分析
从CGDB(http://cgdb.bio2db.com/)下载芫荽like家族成员基因在芫荽根、茎、叶、花和播种后30、60、90 d的表达数据,将FPKM值取对数值后利用TBtools软件绘制热图。
2 结果与分析
2.1 芫荽NPR1-like基因家族鉴定与分析
将BLASTp和HMMER搜索的结果去除冗余和不含保守结构的序列,最终在芫荽基因组中鉴定得到7个like基因家族成员,参考拟南芥同源基因,根据蛋白序列相似性及系统进化关系分别将这7个芫荽like基因命名为~。~及定位在芫荽的Chr03、Chr04、Chr06、Chr08和Chr09染色体上,而和的位置未知。这7个like基因的开放阅读框长度为1 089~1 788 bp,编码的氨基酸序列长度为362~595个,相应的蛋白分子量为39.52~66.24 ku,等电点在5.26~8.56之间(表1)。
表1 芫荽NPR1-like家族基因信息
2.2 多重序列比对及系统发育分析
为研究like基因家族同源基因之间的亲缘关系和进化模式,利用7个芫荽、6个拟南芥、4个、5个鳄梨及已从其他物种中通过克隆得到的like基因蛋白序列构建了系统进化树。由图1可知,芫荽like基因家族明显地分成3个进化分支,分别是Clade Ⅰ、Clade Ⅱ和Clade Ⅲ。其中,Clade I(AtNPR1/2亚家族)中包含、、、、等,Clade Ⅱ(AtNPR3/4亚家族)中包含、、和等,Clade Ⅲ(AtNPR5/6亚家族)中包含、和。系统发育分组可为理解like基因家族的功能多样性提供参考。
结合多重序列比对(图2)和SMART在线分析结果发现,7个都存在BTB/POZ和锚蛋白重复结构域,这2个结构域在芫荽和拟南芥中较为保守,并且在每个亚组的组内成员之间保守程度更高。此外,Clade Ⅰ和Clade Ⅱ亚家族的~的C端含有NPR1_like_C-terminal结构域,而~不含该结构域,该结构域包含核定位信号NLS。序列比较分析结果显示,在至的蛋白序列中,等位基因突变体的氨基酸序列突变位点(His334Tyr)、(Cys150Tyr)和(His300Tyr)高度保守;而(Arg432Lys)突变位点只在Clade Ⅰ和Clade Ⅱ亚家族的~中保守。此外,在寡聚物-单体相互转变过程中发挥至关重要的作用的3个半胱氨酸残基(Cys82、Cys155和Cys216)在7个CsNPRs中完全保守。
2.3 芫荽NPR1-like家族成员基因结构分析
利用在线分析工具MEME对芫荽和拟南芥NPR1-like蛋白序列进行保守结构域分析,在预测出的10个保守基序中,motif1、motif2和motif3为BTB/POZ结构域的保守基序,motif5和motif6为Ankyrinrepeats结构域保守基序,motif8、motif9和motif10为NPR1_like_C保守基序。在CladeⅠ和Clade Ⅱ中,除CsNPR3只含有motif2~8之外,其余芫荽和拟南芥的NPRs序列中都含有motif1~10;而在CladeⅢ中,因C端缺少NPR_Like_C结构域,除CsNPR7只含有motif1~5、缺少motif6~10之外,其余芫荽和拟南芥的NPRs序列中只含有motif1~7,缺少motif8~10(图3-A、图3-B)。
根据基因结构分析发现,在Clade I和Clade Ⅱ中,除外,芫荽和拟南芥-like家族基因序列都含有4个外显子和3个内含子,且芫荽的内含子长度明显大于拟南芥;在Clade Ⅲ中,所有成员序列中都含有2个外显子和1个内含子,且外显子和内含子的大小基本相同(图3-C)。
由此可见,-like家族成员3个亚族在结构域和基因结构上都具有相似的特点,说明它们在进化上存在相当的保守性。
2.4 芫荽NPR1-like基因启动子元件分析
通过分析芫荽like基因上游2 000 bp的启动子区域进行顺式作用元件分析发现,所有like基因都含有基本的CAAT-box和TATA-box保守元件。7个启动子区域还鉴定出TCT-motif、TCCC-motif、Sp1、GT1-motif、GA-motif等光调控元件,启动子区域含有的数量最多,达到22个(图4)。启动子区域还鉴定出茉莉酸甲酯响应元件TGACG-motif和 CGTCA-motif、水杨酸响应元件as-1和TCA、脱落酸响应元件ABRE、赤霉素响应元件P-box、生长素响应元件TGA和乙烯响应元件ERE等植物激素响应元件,其中在7个启动子区域都鉴定到水杨酸响应元件,数量在1~5个不等,其余激素响应元件并未出现在所有7个中,、启动子区域中分别含有8、4个茉莉酸甲酯响应元件,和启动子区域都含有6个乙烯响应元件,启动子区域含有4个脱落酸响应元件。此外,启动子区域还鉴定出防御和胁迫响应元件TC-rich和W-box、低温响应元件LTR、胁迫响应元件STRE、MYBr和MYCr、干旱响应元件MBS、脱水响应元件DRE、厌氧诱导元件ARE、机械损伤响应元件WUN等逆境胁迫相关的响应元件,且总体数量较多。此外,在个别中还鉴定出数量不多的植物生长发育调控相关的分生组织表达与激活元件CAT-box和玉米醇溶蛋白代谢调控元件O2-site。
以上分析结果表明,芫荽like基因家族成员可能在植物激素响应、逆境胁迫和植物生长发育过程中发挥重要作用。
2.5 芫荽NPR1-like基因表达模式分析
为探讨基因在芫荽生长发育过程中的作用,对芫荽根、茎、叶、花以及生长30、60、90 d的表达模式进行分析。结果表明,~在各组织中都有表达,其中和在4种组织中的表达量均较高;和在根和叶中表达量较高,茎中其次,花中的表达量最低;和在根中的表达量较高,其余组织中表达量很低;在4种组织中的表达量都很低(图5-B)。在芫荽生长过程中,和的表达量最高,其次为和,而和的表达量很低,基本没有表达。、、在3个生长时期的表达量呈现出轻微的先上升后下降趋势,在生长后60 d的表达量最高;而的表达量持续上升,在生长后90 d的表达量最高(图5-A)。上述结果可能暗示基因家族成员在调控芫荽不同组织和不同时期发育过程中发挥了不同作用。
3 讨论与结论
like基因家族已经在多种单子叶和双子叶植物中被鉴定和研究,研究方向多集中在和参与植物应对生物及非生物胁迫的抗性响应上,它们被认为是SA受体,共同调控植物免疫。正向调节SA介导的植物免疫,而的主要功能是作为植物防御的负向调节因子。基因组信息不足和落后的生物技术极大限制园艺物种中R基因的发现,而关键同源物的鉴定和应用已被证明是产生抗病转基因植物的有效方法,在园艺作物如番茄、胡萝卜和柑橘中异源表达,显示出具有增强的广谱疾病和害虫抗性的转基因植物的潜力。因此,对芫荽-like基因家族的鉴定和分析将有助于伞形科科和其他植物物种的抗病育种。
本研究在最新发表的芫荽高质量基因组中搜索like基因家族成员,最终鉴定到7个芫荽-like成员,这个数量与拟南芥(6个)和鳄梨(5个)等植物中like基因家族成员的数量类似。进化和结构分析都将7个分为明显3组,该聚类方式与拟南芥like基因家族成员的聚类方式相同,且在2个介导蛋白-蛋白相互作用的必需结构域,即BTB/POZ蛋白的N末端和锚蛋白重复结构域的中心区域,在芫荽和拟南芥中都很保守,并且在内含子和外显子数量和结构方面具有极大的相似性。
在通常状态下,以分子间二硫键形成多聚体的形式存在于细胞质中。当受到生物和非生物胁迫时,SA等诱导基因表达并促进的构象变化,以单体形式转移至细胞核中,单体在细胞核中积累并激活防御基因表达。单体间二硫键的形成在Cys82和Cys150、Cys155、Cys 160、Cys216这几个保守的半胱氨酸残基之间形成,~的保守结构域中的这些位点与拟南芥相比完全保守。NLS基序与AtNPR1/2的核定位有关,它在的部分碱性氨基酸(在图5中用圆点标记)中高度保守。此外,、和中的基序也存在于~中,其与对SA的敏感性十分重要。综上,聚类在同一进化分枝的拟南芥和芫荽-like家族成员具有相似的基因结构、保守结构域类型和位置排列,并且在关键氨基酸位点和功能基序上高度保守,说明属于同一分支的芫荽NPR蛋白可能以相似的方式展现生物学功能。
存在于基因启动子或上游区域的独特顺式元件是转录因子的结合位点,也是基因调控的关键因素。越来越多的证据表明,病原体或水杨酸诱导基因的启动子包含更多的防御相关顺式元件,~的顺式元件中防御相关顺式元件的富集程度非常高(图4)。其中,7个基因的启动子区域均含有2个与SA信号途径相关的元件,即CAAT-box和TATA-box。除了,其余6个基因启动子区域都含有受水杨酸间接调控的顺式作用元件as-1(activation sequence-1)。此前研究表明,启动子区域含有W-box(TTGACC)序列,其为转录因子特异性识别的DNA结合位点。同样,W-box元件也存在于、和基因的启动子区域中,这预示着当芫荽受到生物逆境胁迫时,可能具有与拟南芥基因类似的自我诱导调控机制。
本研究对芫荽-like基因家族成员进行生物信息学和表达分析,不仅为更好地研究芫荽生长发育和抗病机制提供一定的参考,同时也为伞形科园艺作物的抗病改良提供重要的基因资源。