APP下载

朝仓花椒DIR基因家族的鉴定及分析

2020-11-09陈炳竹王润英赵懿琛赵德刚

山地农业生物学报 2020年2期

陈炳竹 王润英 赵懿琛 赵德刚

摘要:本研究通過NCBI的BLAST比对分析,最终从朝仓花椒转录组数据库筛选出28条朝仓花椒Dirigent(DIR)蛋白家族的编码基因序列。利用 MEGA、MEME、DNAMAN 等软件对该蛋白家族进行生物信息学分析,结果显示:从朝仓花椒转录组中获得的28个DIR基因,经过鉴定,在进化上分

为6个小组,每个小组的基因数量分别为7、5、1、0、5、10。该家族的蛋白等电点均小于7,均偏酸性,且多数属于稳定蛋白。多基因序列比对比发现,该家族蛋白均具有一个高保守性的DIR结构域。空间结构的分析预测ZpDIR 蛋白多为多链线性折叠卷曲蛋白,且以线性无链非规则多链卷曲蛋白为主。

关键词:朝仓花椒;DIR基因家族;生信分析

中图分类号:Q811.4

文献标识码:A

文章编号:1008-0457(2020)02-0021-06国际DOI编码:10.15958/j.cnki.sdnyswxb.2020.02.003

Identification and analysis of DIR Gene Family in Zanthoxylum piperitum

DC.var.inerme Makino

CHEN Bingzhu1,WANG Runying1,ZHAO Yichen1*,ZHAO Degang1,2

(1.College of Life Sciences/College of Tea  Sciences, Guizhou University, Key Laboratory of Germplasm Innovation for

Conservation and Protection of Mountain Plant Resources, Guizhou Key Laboratory of Agricultural Biological Engineering, Guiyang, Guizhou 550025, China;2.Guizhou Academy of Agricultural Sciences/Guiyang Branch of National DUS Center,  Guiyang, Guizhou  550006, China)

Abstract:

In this study, 28 coding gene sequences of the Zanthoxylum piperitum DC.var.

inerme Makino Dirigent (DIR) protein family from Z. piperitum DC.var.

inerme Makino transcriptome database were screened via GenBank National Center for Biotechnology Information (NCBI) Basic Local Alignment Search Tool (BLAST). Bioinformatics analysis of the protein family was carried out using MEGA, MEME, DNAMAN and other softwares. This research through the NCBI BLAST ratio analysis, finally from the Zanthoxylum  piperitum DC.var.inerme Makino transcriptome database selected article 28 at the Zanthoxylum piperitum DC.var.inerme Makino Dirigent(DIR) protein family encoding gene sequences using the MEGA, MEME, DNAMAN software such as bioinformatics analysis, carried out on the protein familyThe results showed that the 28 DIR genes obtained from Z. piperitum DC.var.inerme Makino transcriptome were identified and belonged to 6 subfamilies in evolution, according to the results of identification from the Zanthoxylum piperitum DC.var.inerme Makino transcriptome of 28 DIR genes in evolutionary points belong to 6 family, The number of genes in each subfamily was 1, 20, 3, 1, 2, and 1, respectively.each family of the number of genes of 20, 3, 1, 2, 1 respectively. The isoelectric points of the proteins ofin this family arewere all less than 7, all of themwhich are acidic, and most of them belong to  the stable proteins polygene sequence ratio. The results of multiple gene sequence comparisons showed that the family proteins all had a highly conserved DIR domain. The analysis of spatial structure predicts that most ZpDIR proteins were multi-chain linear folded coiled proteins, and mainly linear non-chain irregular multi-chain coiled proteinsIt was found that the proteins of this family all have a highly conserved DIR domain spatial structure.

Keywords:Zanthoxylum piperitum;

DIR gene family; bioinformatics analysis

木脂素激酶是分布广泛的一类植物次生细胞代谢活性物质,具有一定抗菌抗病特性,参与很多植物机体抗病生长过程,Dirigent(DIR)蛋白参与木脂素的合成,是木脂素合成途径的重要蛋白[12]。对小麦、杨树、拟南芥和水稻等植物的

DIR基因家族进行鉴定发现,DIR蛋白相对比较保守,大多数DIR基因含有一个DIR结构域,该结构域是DIR蛋白的主要组成结构域[3]。DIR蛋白不仅在植物次生代谢产物合成过程中发挥作用,还参与植物抗逆性,在植物抵御非生物胁迫、生物防御应答中起重要作用。

花椒(Zanthoxylum bungeanum Maxim)作为我国常用的药食两用作物,具有较高的生态价值和经济价值。除此之外,已有研究发现花椒还具有很好的抗菌能力,其对包括炭疽杆菌、金黄色葡萄球菌、枯草杆菌在内的革兰氏阳性菌以及大肠杆菌、变形杆菌、霍乱弧菌等多种革兰氏阴性菌有很好的抑制作用[4]。朝仓花椒(

Zanthoxylum piperitum DC.var.inerme Makino)也称山椒,为芸香科(Rutaceae)花椒属

(Zanthoxylum L.)落叶灌木[5],具有高产、优质、精油含量高等特点。本实验室前期针对朝仓花椒在抗菌方面的分子机制展开了相关研究,目前已成功克隆得到一个朝仓花椒几丁质酶类似基因ZaCHIT1-like[6]。本研究主要对朝仓花椒中具有抗菌活性的DIR蛋白家族进行鉴定和生物信息学分析,以期对朝仓花椒抗菌调控机制的研究提供理论基础。

1材料与方法

1.1材料

从朝仓花椒转录组数据库中提取的31条朝仓花椒DIR蛋白家族的编码基因序列作为本研究的实验材料。

1.2朝仓花椒DIR基因家族的鉴定

本研究基于前期获得的朝仓花椒转录组数据库注释信息,从朝仓花椒转录组中初步筛选获得31条DIR蛋白的编码序列,并通过与NCBI(http://www.ncbi.nlm.nih.gov/) 数据库中BLAST比对和保守结构域分析[7],最终鉴定出28条朝仓花椒的DIR家族基因序列。

1.3朝仓花椒DIR蛋白基本性质

采用ProtParam(https://web.expasy.org/protparam/)在线分析工具[8]预测分析朝仓花椒DIR蛋白家族的理化性质。

1.4进化关系分析

利用朝仓花椒DIR家族序列在BLAST程序上比对出3个同源性较高的物种:蒺藜苜蓿(

Medicago truncatula)、拟南芥(

Arabidopsis thaliana L.)、甜橙(

Citrus sinensis)。并从基因序列下载网站(https://phytozome.jgi.doe.gov/pz/portal.html#)中下載蒺藜苜蓿、拟南芥和甜橙已经发表了的DIR蛋白氨基酸序列,利用MEME软件构建DIR基因系统进化树。

1.5ZpDIR蛋白结构分析

采用SOPMA在线工具完成蛋白质二级结构的预测分析[9],采用SWISS-MODEL在线分析软件完成蛋白质空间结构的预测[10]。

1.6ZpDIR多序列比对和保守基序分析

利用DNAMAN序列分析软件对得到的28条序列进行多序列比对[11],在线分析软件MEME(http://meme-suite.org/tools/meme)定位各条DIR蛋白序列的保守基序[12]。

2结果与分析

2.1ZpDIR基因家族的鉴定

通过朝仓花椒的转录组数据的注释信息和NCBI数据库的比对结果,对初步筛选得到的31个DIR候选基因的蛋白保守结构域进行预测,最终鉴定获得28条朝仓花椒DIR家族基因,并将其命名为

ZpDIR1~ZpDIR28(表1)。利用ExPASy在线软件,对该家族的28个蛋白分别进行理化性质的分析,结果显示,该家族基因在分子大小上具有显著差距,其中基因编码长度最短的为

ZpDIR27, 其长度为120 bp,基因编码长度最长的基因为

ZpDIR28, 其编码基因总长度为1209 bp,两者差距近10倍。由此可知其对应的蛋白大小相差较大,28个蛋白的相对分子量在28.39 kDa~101.39 kDa之间,其中蛋白分子量最小的为

ZpDIR11, 最大的为ZpDIR28

。对其蛋白质理化性质预测显示,该家族蛋白虽然在大小上差异显著,但均为偏酸性蛋白,等电点范围在

5.03~5.42。

2.2ZpDIR 蛋白进化关系分析

为研究ZpDIR的进化关系,使用MEGA软件构建朝仓花椒与蒺藜苜蓿、拟南芥和甜橙的DIR家族系统进化树,根据进化树的分枝,可将朝仓花椒DIR家族(ZpDIR1-ZpDIR28)与蒺藜苜蓿DIR家族(MtDIR1~MtDIR45)、拟南芥DIR家族(TpDIR1~TpDIR25)和甜橙DIR家族(CsDIR1~CsDIR33)家族分成6个小组(I~VI),其中I组中包括7个ZpDIR成员:ZpDIR1、ZpDIR8、ZpDIR10、ZpDIR12、ZpDIR13、ZpDIR23、ZpDIR24,而ZpDIR14、ZpDIR17、ZpDIR19、ZpDIR25、ZpDIR28属于II组,共5个,III组只包含1个ZpDIR成员,即ZpDIR11,VI组中不包含ZpDIR成员,V组中也包括了5个ZpDIR成员:ZpDIR7、ZpDIR18、ZpDIR21、ZpDIR26、ZpDIR27,VI组包含的ZpDIR最多,分别为ZpDIR2、ZpDIR3、ZpDIR4、ZpDIR5、ZpDIR6、ZpDIR9、ZpDIR15、ZpDIR16、ZpDIR20、ZpDIR22共10个成员(图1) 。

2.3ZpDIR蛋白高级结构预测分析

为深入研究ZpDIR蛋白空间结构上的相似性,对ZpDIR家族蛋白进行二级结构预测分析(表2)。结果显示,该蛋白家族在二级结构上的特征略有差异,其中ZpDIR蛋白α螺旋的比例最大的值为32.26%,而最大值却是8.18%,β折叠比例最大值为8.26%,最小值则是2.04%,由此可知ZpDIR蛋白的α螺旋与β折叠比例差异大,最大最小之间差距约为4倍。延伸链的比例范围在18.41%~39.56%,无规则卷曲比例偏高,范围是31.19~至61.45%,延伸链与无规则卷曲最大最小的比例差距较小一些,约为2倍。对ZpDIR蛋白三级(空间)结构进行预测,发现各蛋白三级结构模型大致相似(图2),除ZpDIR11、ZpDIR24、ZpDIR25的三级结构较为简单以外,其余蛋白在三级模型上相差不大。对蛋白空间模型的预测分析发现ZpDIR蛋白属于多链线性折叠卷曲蛋白,绝大多数是线性无链非规则多链卷曲蛋白。

2.4ZpDIR家族蛋白结构域序列比对

利用DNAMAN软件对筛选得到的28条朝仓花椒DIR蛋白的保守结构域序列进行多序列比对,发现朝仓花椒DIR家族DIR结构域多个氨基酸位点维持保守不变,因此具有较高保守性(图3)。

2.5ZpDIR家族蛋白结构保守基序分析

使用在线软件MEME对28条氨基酸序列的保守基序进行预测分析(见图4),除ZpDIR27蛋白由于保守结构域序列过短,没有找到保守基序以外,其余大多氨基酸保守结构域序列都拥有5种保守基序,这再一次证明了DIR结构域是高度保守的。

3结论与讨论

DIR蛋白是植物木脂素生物合成途径中的重要参与者之一,调控着植物木脂素的合成,并参与植物对生物和非生物胁迫的抵御。该家族蛋白结构均含有一个典型的

DIR结构域,  少数成员含有两个串联的DIR结构域。有些DIR蛋白还含有其他结构域, 比如C端融合的木菠萝素类凝集素(Jacalin-related lectin, JRLs)结构域, 该结构域是JRL类凝集素蛋白的典型结构域,同抗病、抗虫等植物防御体系有密切关系[13]。已有研究基于基因

组或转录组数据对小麦[3]、毛竹[14]、

水稻[15]和丹参[16]的

DIR基因家族成员进行鉴定分析,结果表明,不同物种的DIR家族在成员数量上、结构域数量以及类型上和进化模式上都存在着差异。

朝仓花椒是一种重要的经济作物,本实验室前期对朝仓花椒雌株结果期幼芽的转录 组进行测序,经拼接比对后,获得了62150个表达序列标签,以及68315个注释基因[17]。在前期研究的基础上,本研究通过注释比对,从转录组数据库中筛选得到28条DIR蛋白的序列。通过生物信息学分析可知,朝仓花椒的DIR蛋白家族均含有保守的DIR結构域,且多个氨基酸位点相对稳定,蛋白家族的蛋白质三级结构相对保守,且结构相似。然而,该家族编码基因大小差异显著,开放阅读框最小为120 bp,最大为1209 bp,由此可知朝仓花椒中的

DIR蛋白兼具专一化与多样化的特征。以朝仓花椒、蒺藜苜蓿、拟南芥和甜橙DIR家族共同构建的进化树将其分成6个小组(I~VI),其中ZpDIR主要集中位于I与VI组,而2、3组主要包含的是MtDIR与CsDIR。有研究显示,I组被归为DIR-a亚家族[18],它包含了朝仓花椒、蒺藜苜蓿、拟南芥以及甜橙4个物种的DIR

基因,其中拟南芥DIR成员最多,为11个,而朝仓花椒、蒺藜苜蓿、以及甜橙的

DIR成员数量分别为7、4、4个。本研究通过对朝仓花椒

DIR基因家族进行鉴定和分析,对该家族蛋白的基本结构、生化性质以及进化关系等方面有了初步了解,为后期该基因功能的研究提供了理论基础。

参考文献:

[1]王玲. 杜仲Dirigent蛋白编码基因

EuDIR3克隆及遗传转化[D].贵阳:贵州大学, 2019.

[2]BURLA V, KWON M, DAVIN LB, et al. Dirigent proteins and dirigent sites in lignifying tissues [J]. Phytochemistry (Oxford), 2001, 57(6): 883897.

[3]宋敏. 小麦JRL和DIR基因家族的鉴定与分析[D].南京:南京农业大学, 2013.

[4]田代华. 实用中药词典[M].北京:人民卫生出版社,2002: 869873.

[5]陈锡, 曾晓芳, 赵德刚. 朝仓花椒叶水浸提物对白菜种子萌发及幼苗生长的影响[J].种子, 2016, 35(2):3741.

[6]刘雪薇, 赵懿琛, 赵德刚. 朝仓花椒几丁质酶类似基因的克隆及分析[J].基因组学与应用生物学, 2018, 37(4):15621569.

[7]李慧峰, 冉昆, 何平, 等.苹果生长素响应因子(ARF)基因家族全基因组鉴定及表达分析[J].植物生理学报, 2015, 51(7): 10451054.

[8]GASTEIGER E, HOOGLAND C, GATTIKER A, et al. Protein identification and analysis tools on the ExPASy server[M].New Jersey:Human Press,2005:571607.

[9]COMBET C, BLANCHET C, GEOURJON C, et al. NPS@: network protein sequence analysis

[J].Trends in biochemical science, 2000, 25 (3): 147150.

[10]KELLY LA, MEZULIS S, Y ATES CM, et al. The phyre2 web portal for protein modelling, prediction and analysis[J].

protocals, 2015, 10 (6): 845858.

[11]BAILEY TL, ELKAN C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers

[J].Proceedings.International conference on intelligent system for molecular biology,1994, 2: 2836.

[12]ELLIS CM, NAGPAL P, YOUNG JC, et al. Auxin response factor1 and auxin response factor2 regulate senescence and floral organ abscission in Arabidopsis thaliana[J].Development, 2005, 132 (20): 45634574.

[13]向陽, 杜才富, 马正强. Jacalin类凝集素研究进展[J].植物生理学报,2013, 49 (10): 10231029.

[14]陈家璐, 张智俊, 刘笑雨, 等. 毛竹

Dirigent基因家族的全基因组鉴定与分析[J].植物生理学报, 2019, 55(9):14061417.

[15]穰中文, 周清明. 水稻

dirigent基因家族生物信息学分析[J].湖南农业大学学报(自然科学版), 2013, 39(2):111120.

[16]马金洋, 杨瑾冬, 李卿, 等. 丹参Dirigent基因家族的发现与生物信息学分析[J].基因组学与应用生物学, 2017, 36(4):15941610.

[17]赵懿琛, 刘雪薇, 李岩, 等. 朝仓花椒幼芽转录组测序数据组装及基因功能注释[J].基因组学与应用生物学, 2016, 35 (7): 18051819.

[18]RALPH S G, JANCSIK S, BOHLMANN J. Dirigent proteins in conifer defense II: Extended gene discovery, phylogeny, and constitutive and stress-induced gene expression in spruce (Picea spp.) [J]. Phytochemistry (Amsterdam), 2007, 68(14): 19751991.