水稻ARAB1类似基因的电子克隆及生物信息学分析
2015-10-21鲍思元刘卫东李冬波
鲍思元 刘卫东 李冬波
摘要[目的]对水稻OsARAB1基因进行电子克隆,并对其进行生物信息学分析。[方法]以NP 174188.1为查询探针,通过电子克隆获得OsARAB1基因全长cDNA,用生物信息学软件对其核苷酸序列和蛋白质序列进行生物信息学分析。[结果]获得了OsARAB1基因全长cDNA,基因编码区序列(CDS)全长1 086 bp。电子定位于第五染色体基因组序列NC 008398.2核苷酸序列6 769 813~6 773 213 bp区域。OsARAB1蛋白属于亲水性的胞外蛋白,比较稳定,偏碱性。二级结构以α螺旋和无规则卷曲为主。具有2个功能结构域:SGNH水解酶型酯酶、GDSL脂肪酶。有21个磷酸化位点、7个糖基化位点。推定的活性位点的氨基酸残基为Ser34、Gly107、Asn167、Asp333、His336。與玉米酯酶亚型B4FM12亲缘关系最近。OsARAB1基因的表达对水稻的发育和形态发生起重要作用,与水稻抗稻瘟病有关。[结论]该研究为用试验方法克隆该基因和功能鉴定奠定了基础。
关键词水稻;脂肪酶;生物信息学;氨基酸序列;OsARAB1基因
中图分类号S188;Q943.2文献标识码A文章编号0517-6611(2015)31-038-07
In Silico Cloning and Bioinformatics Analysis of ARAB1like Gene from Rice
BAO Siyuan1, LIU Weidong2, LI Dongbo3
(1. College of Basic Medical, Hubei University of Science and Technology, Xianning, Hubei 437100; 2. School of Nuclear Technology and Chemistry & Biology, Hubei University of Science and Technology, Xianning, Hubei 437100; 3. Horticultural Research Institute, Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007)
Abstract [Objective] The aim of this study was to clone the OsARAB1 gene from rice in silico, and to analyze its biological information. [Method] Using NP 174188.1 as the probe, the fulllength cDNA sequence of OsARAB1 gene was obtained by in silico cloning; its nucleotide sequence and protein were analyzed by bioinformatics softwares. [Result] The full length cDNA of OsARAB1 gene was obtained, and the sequence of the gene encoding region (CDS) was 1086 bp, encoded a protein of 361 amino acid residues. OsARAB1 gene was located in the genome sequence NC 008398.2( 6 769 813—6 773 213 bp region) by in silico mapping. OsARAB1 protein belonged to hydrophilic extracellular protein, and it was relatively stable, partial alkaline. The secondary structure of this protein was mainly composed of alpha helix and random coil. It belonged to SGNH lipase, and had 21 phosphorylation sites, 7 OβGlcNAc glycosylation sites. The putative active sites of amino acid residues were Ser34, Gly107, Asn167, Asp333, His336. It had the closest relationship with the esterase isoform B4FM12 from maize. The expression of OsARAB1 gene played an important role in development and morphogenesis of rice, and had a relationship with the rice blast resistance. [Conclusion] This study laid a foundation for OsARAB1 gene clone and functional identification using experimental method.
Key words Rice; Lipase; Bioinformatics; Amino acid sequence; OsARAB1 gene
脂肪酶(EC 3.1.1.3)是一类水解酶,广泛分布于植物、动物、微生物中,催化多种生化反应,包括水解、醇解、酸解、酯化、酯交换、氨解。GDSL脂肪酶是一类重要的脂肪酶家族,具有一个GDSL模体(GXSXXXXG),活性位点的丝氨酸靠近多肽链的N端[1-2];而GXSXG模体的α/β折叠型水解酶超家族活性位点的丝氨酸位于多肽链的中间[3]。具有5块高度保守的同源序列[1],由于4个高度保守的残基:丝氨酸、甘氨酸、天冬氨酰、组氨酸分别位于块I、块II、块III、块V,GDSL脂肪酶被建议更名为“SGNH-hydrolases”[4]。GDSL脂肪酶的催化位置易于变构,因此该酶具有广泛的底物特异性[5]。然而,大多数GDSL脂肪酶的天然底物仍未知。
大量的细菌GDSL脂肪酶已被克隆,其功能已被研究清楚,一些GDSL脂肪酶的晶体结构已经构建[6-8]。植物GDSL脂肪酶也被发现,其特性和功能研究已成为非常有吸引力的课题。一些植物GDSL脂肪酶已被分离、克隆和表征,如拟南芥、萝芙木属、紫花苜蓿、橡胶树、穗看麦娘的几个候选基因[2,9-13]。Mayfield等[14]报道6个从拟南芥花粉表皮分离的胞外脂肪酶。Teissre等[15]从发芽后的向日葵种子中分离纯化了一个GDSL酶,并显示有脂肪酰基酯水解酶的活性。拟南芥GDSL脂肪酶GLIP1具有脂肪酶和抗微生物活性,能直接破坏真菌孢子的完整性;在乙烯信号传导的作用下,GLIP1在植物抗黑斑病过程中可能发挥关键作用[13]。到目前为止,这些已克隆或表征的GDSL脂肪酶主要参与植物发育、形态发生、次生代谢产物的合成和防御反应的调节。
搜索水稻数据库,发现水稻GDSL脂肪酶家族有114个成员[16-17],但只有几个GDSL酯酶/脂肪酶基因被研究。在水稻生产国,天然脂肪酶可以用来提高糙米、米糠油的质量,以及生产相关产品。目前,2个GDSL酯酶/脂肪酶基因GER1、WDL1被克隆,它们分别在苗期调节胚芽鞘伸长和植物生长[18-19]。笔者利用电子克隆的方法克隆了水稻OsARAB1基因,获得全长cDNA,预测其编码蛋白质的一级结构、二级结构、三级结构的特点,同时还利用电子表达分析技术对该基因的表达进行了分析,为用试验方法克隆该基因和功能鉴定奠定了基础。
1材料与方法
1.1氨基酸序列
拟南芥脂肪酶基因ARAB1蛋白质的氨基酸序列NP 174188.1下载自NCBI的蛋白质数据库。tr|B4FM12|、tr|Q6K4Z3|、tr|G7IKB1|、tr|A0A0B2QCD5|、tr|B9H2K5|、tr|A0A061GEQ6|、tr|D7MSQ0|、sp|Q9FJ45|下载自UniProtKB蛋白质数据库。
1.2水稻OsARAB1基因的电子克隆
以拟南芥脂肪酶基因ARAB1蛋白质的氨基酸序列为查询探针对水稻EST数据库进行tblastn同源性检索,获得与拟南芥脂肪酶基因ARAB1同源性较高的一系列水稻EST序列;从获得的水稻EST序列中挑选出同源性最高的EST序列作为种子序列,用种子序列对水稻EST数据库进行blastn检索,得到多条与之高度同源的水稻EST序列;找到部分重叠的EST序列用CAP3软件进行拼接,获得序列重叠群;以获得的重叠群反复对水稻EST数据库进行blastn检索、拼接,直到没有新的EST 可供拼接为止。最后,将可能的新基因序列在非冗余数据库中进行比对搜索,进行新基因确认。
1.3序列分析和系统发育树构建
用FGENESH软件进行基因预测[20];用ProtParam软件进行蛋白质的理化性质分析[21];用FoldIndex软件进行无序区域预测[22];用Pepinfo软件进行蛋白质疏水性/亲水性预测;用PREDATOR 软件进行蛋白质二级结构预测[23];用TargetP 1.1软件预测蛋白质的亚细胞定位[24-25];用SignalP 4.1软件预测信号肽[26];用TMHMM 2.0软件进行蛋白质跨膜螺旋预测[27];用NetPhos 2.0软件进行磷酸化位点预测[28];用YinOYang 1.2软件进行Oβ葡萄糖糖基化位点预测[29-30];用InterProScan 5软件进行蛋白质功能结构域预测;用ProtFun 2.2软件预测蛋白质的功能分类[31-32];用PSIBLAST软件进行序列相似性搜索;用DNAMAN V6软件进行氨基酸的多序列比对和系统发育树构建;用SWISSMODEL同源建模软件预测蛋白质的三维结构[33-35]。
1.4水稻OsARAB1基因的电子表达分析
以水稻OsARAB1基因的编码序列对水稻多个组织的EST数据库进行blastn,选取同源性较高的EST序列作为该基因的EST,对每条EST来源的cDNA进行分析,得到文库构建的详细情况,其中包括组织来源、发育阶段、胁迫类型等。根据这些EST序列的组织来源及其在不同组织中出现的频率以及来源于生物或非生物胁迫材料分析该基因的组织特异性表达和不同胁迫条件下的表达特性。
1.5数据处理
1.5.1总平均亲水性值(GRAVY)计算。所有氨基酸疏水性参数的总和与氨基酸数量的比值,负值越大表示亲水性越强,正值越大表示疏水性越强。
1.5.2水稻OsARAB1基因的电子表达分析。将水稻EST数据库中检索出的与OsARAB1基因有同源性的所有EST序列进行分类统计、分析,分别统计组织类型和胁迫类型的EST数量,并在Excel表格中根据统计数据作出柱状图。
2结果与分析
2.1水稻OsARAB1基因的电子克隆及序列分析
将NP 174188.1序列作为查询探针,利用tblastn工具对GenBank中水稻EST数据库进行同源性检索。从结果中选择与探针序列同源性最高的EST序列CT845802作为种子序列。用CT845802对水稻EST数据库进行blastn检索,得到多条与之高度同源的水稻EST序列,剔除冗余序列后找到2条对CT845802有延伸作用的EST序列CA758743.1、CR286331.1,用CAP3软件进行拼接。CAP3软件拼接结果显示CR286331.1不能拼接,CT845802.1和CA758743.1能拼接,获得一个长为1 555 bp的序列重叠群。以获得的序列重叠群对水稻EST数据库进行blastn检索,没有找到有延伸作用的新的EST序列,表明所得的序列重叠群已不能再延伸。
用FGENESH软件对序列重叠群进行基因预测,得到一个基因,含有一个外显子,位于160~1 245 bp,PolA开始位点位于1 295 bp处。起始密码子上游3位为A,下游+4位为G,符合Kozak规则。说明序列延伸得到的序列重疊群是水稻脂肪酶ARAB1类似基因的全长cDNA。将水稻脂肪酶ARAB1类似基因命名为OsARAB1,基因编码区序列(CDS)全长1 086 bp(图1),编码361个氨基酸残基的蛋白质(图2)。
安徽农业科学2015年
2.2OsARAB1基因的电子定位
以OsARAB1基因的编码区序列对GenBank水稻染色体数据库blastn,结果显示OsARAB1与水稻第五染色体基因组序列NC 008398.2的一致性达99%,查询覆盖度达100%,匹配区段5个。NC 008398.2全长30 039 014 bp,比对区域是6 769 813~6 773 213 bp,其中6 770 051~6 770 128、6 770 337~6 770 519、6 770 670~6 771 078、6 771 356~6 772 994 bp区段没有参与匹配。因此OsARAB1基因的编码序列位于第五染色体(基因组序列NC 008398.2 )6 769 813~6 773 213 bp区域,4个没有参与匹配的区段是该基因的4个内含子。Map Viewer显示OsARAB1基因临近区域存在多个基因,其中的2个基因Os05g0209600、Os05g0210100分别位于NC 008398.2 (6 769 736~6 773 472)、NC 008398.2 (6 806 624~6 809 353),参考状态为临时基因(PROVISIONAL gene),功能注释为SGNH植物脂肪酶。
2.3蛋白质的理化性质分析和蛋白质疏水性/亲水性预测
理化性质分析表明,OsARAB1编码一条361个氨基酸残基的多肽,分子量为38 902.5 Da,理论等电点(pI)为8.83,带负电荷的残基(Asp + Glu)总数为23个,带正电荷的残基(Arg + Lys)总数为31个,表明该蛋白为碱性蛋白质。分子式为C1744H2678N470O500S21。不稳定系数为28.56,表明该蛋白为稳定蛋白。脂肪族指数为81.11。无序区域预测表明该蛋白在243~268位残基处存在一个无序区域,该区域包含26个氨基酸残基,占總残基数的7.2%,因此这对OsARAB1蛋白折叠、表达水平干扰较小。
蛋白质的折叠主要由氨基酸的亲疏水性驱动,通过对亲疏性分布图的分析,可以反映蛋白质的折叠情况;蛋白质在折叠时形成疏水的内核和亲水的表面,同时潜在跨膜区会出现高疏水性结构域,据此可以判定跨膜结构域和蛋白质表面氨基酸分布。利用Pepinfo软件对蛋白质进行疏水性/亲水性分析,采用Kyte & Doolittle标度计算,其中正值为疏水性,负值为亲水性。结果显示,多肽链11位蛋氨酸疏水性参数最高,为3.100;308位天冬酰胺疏水性参数最低,为-2.400;N端存在一个较强的疏水性区,推测其N端可能含有信号肽;总平均亲水性值(GRAVY)为-0.015,说明OsARAB1蛋白为亲水性蛋白(图3)。
2.4蛋白质二级结构预测
蛋白质二级结构预测结果显示,该蛋白由3种二级结构构成,其中,25.21%的氨基酸残基构成α螺旋(Hh),14.40%的氨基酸残基构成延伸链(Ee),60.39%的氨基酸残基构成无规则卷曲(Cc)。α螺旋和无规则卷曲是OsARAB1蛋白的主要二级结构,延伸链散布于整个蛋白质中(图4)。
2.5亚细胞定位预测和蛋白质跨膜螺旋预测
亚细胞定位预测结果显示OsARAB1蛋白是一条含有22个氨基酸残基信号肽的分泌蛋白。信号肽预测结果显示OsARAB1蛋白含有信号肽,信号肽切割位点位于Ala22与Glu23之间。几个已知生物功能的GDSL脂肪酶,如来源于穗看麦娘的酯酶[11]、来源于龙舌兰属植物叶表皮的SGNH水解酶[36]、来源于萝芙木属的乙酰基萝芙木碱乙酰酯酶[12]、来源于甘蓝型油菜的GDSL脂肪酶[37],它们都是胞外蛋白,在细胞外发挥作用。
蛋白质跨膜螺旋预测结果显示,OsARAB1蛋白第一个氨基酸残基位于膜内,在2~21位氨基酸残基处存在一个跨膜螺旋,22~361位氨基酸残基位于膜外(图5)。由于前60个氨基酸跨膜螺旋中预期氨基酸数为18.816 13,远大于10,提示N端可能不是跨膜结构而是存在一个信号肽。结合疏水性∕亲水性预测、亚细胞定位预测、信号肽预测,可以推测OsARAB1蛋白N端存在一个信号肽。在信号肽酶切除信号肽后,OsARAB1蛋白进入内质网腔,通过分泌途径分泌到细胞外,在胞外参与脂类代谢。
2.6蛋白质功能结构域及蛋白质功能分类预测
蛋白质功能结构域预测结果表明,OsARAB1蛋白具有2个功能结构域:SGNH水解酶型酯酶(InterPro ID:IPR013830)、GDSL脂肪酶(InterPro ID:IPR001087)。SGNH水解酶型酯酶超家族SSF52266位于3个区域:28~44位残基处、72~86位残基处、325~351位残基处。GDSL脂肪酶功能结构域位于28~347位残基处。由此可推断OsARAB1蛋白为GDSL脂肪酶。
蛋白质功能分类预测结果表明,OsARAB1蛋白属于在细胞外具有激素作用的酶。Kiba等[38]、Cao等[39]发现GDSL脂肪酶参与与生长过程有关的激素途径。
2.7翻译后修饰位点预测
用NetPhos 2.0软件进行serine、threonine和tyrosine磷酸化位点预测,结果显示,Ser磷酸化位点12个,Thr磷酸化位点3个,Tyr磷酸化位点6个。Ser磷酸化位点分别位于30、34、70、91、110、144、247、248、257、318、321、344位氨基酸上。Thr磷酸化位点分别位于66、180、224位氨基酸上。Tyr磷酸化位点分别位于222、234、249、276、342、354位氨基酸上。说明磷酸化位点修饰对OsARAB1蛋白的功能可能非常重要,这些磷酸位点也可能参与该蛋白活性的调控。
Oβ葡萄糖糖基化位点预测结果表明,Ser糖基化位点有3个:Ser30、Ser91、Ser118;Thr糖基化位点有1个:Thr66;YinYang位点有3个: Ser30、Thr66、Ser91,这些位点在不同时期可逆地、动态地Oβ葡萄糖糖基化或磷酸化修饰。
2.8氨基酸的多序列比对和系统发育树分析
将OsARAB1蛋白氨基酸序列对蛋白质数据库UniProtKB进行PSIBLAST,结果显示,有500个GDSL蛋白质与其同源,一致性最大值为99%,最小值为43%。从不同植物种类中选取8个GDSL脂肪酶和ARAB1蛋白(sp|Q38894|)、OsARAB1蛋白进行氨基酸多序列比对和系统发育树构建(表1)。多序列比对结果表明,氨基酸序列一致性为59.48%,存在较多的同源序列,4个保守序列区域与SGNH水解酶保守序列块包含的氨基酸非常相似[5]。根据同源序列区域的相似性,推定OsARAB1蛋白活性位点的氨基酸残基为Ser34、Gly107、Asn167、Asp333、His336,Ser34靠近多肽链的N端(图5)。
在多序列比对分析的基础上用DNAMAN V6软件构建系统发育树(图6)。系统发育树显示OsARAB1蛋白与玉米酯酶亚型B4FM12亲缘关系最近,序列同源性最大,其次是粳稻脂肪酶Q6K4Z3;与可可脂肪酶A0A061GEQ6、杨树脂肪酶B9H2K5亲缘关系最远,序列同源性最小。这是因为水稻与玉米同属于禾本科植物,在进化上亲缘关系较近,粳稻是水稻的一个亚种。但OsARAB1脂肪酶与粳稻脂肪酶Q6K4Z3的亲缘关系不及玉米酯酶亚型B4FM12,这说明OsARAB1脂肪酶与玉米酯酶亚型B4FM12的功能更相似。
2.9三级结构预测为了更好地研究OsARAB1蛋白的功能,将OsARAB1蛋白氨基酸序列提交同源建模服务器SWISSMODEL进行三级结构预测,以在PDB晶体库中与OsARAB1蛋白氨基酸序列一致性高达21.09%的铜绿假单胞菌全长转运EstA的晶体结构(PDBid :1tibA)作为模板预测OsARAB1蛋白的三级结构(图7)。OsARAB1蛋白的三级结构特点是5个β折叠组成了一个平面,外部由6个α螺旋包围,整个结构呈球状。这个结构特点符合脂肪酶的结构特点,脂肪酶活性位点位于疏水口袋里,底物与酶接触时,α螺旋结构盖子打开[40]。
2.10OsARAB1基因的电子表达分析
blastn共搜索到154条高度同源的EST,分别来源于不同的cDNA文库(图8)。整合分析后表明,OsARAB1基因在水稻的愈傷组织、花、稻芽、幼苗叶片、感稻瘟病菌的成熟叶子、发芽种子的根和嫩芽、全株苗、发芽的种子、种子、开花后的穗中都表达,在茎、营养分生组织的cDNA文库中未发现EST序列,说明该基因的表达有组织和器官特异性特点。在愈伤组织中表达量最高,说明OsARAB1基因的表达在愈伤组织的分化中起重要作用。在叶子中表达量较高,在幼苗叶片cDNA文库中发现了9条EST序列,说明OsARAB1基因的表达与叶子的形态发生有重要关系;在感稻瘟病菌的成熟叶子cDNA文库中发现了3条EST序列,说明OsARAB1基因受稻瘟病菌的诱导而表达,与水稻抗稻瘟病有关。在发芽种子的根和嫩芽、开花后不同时期的穗cDNA文库中分别发现了6、7条EST序列,说明OsARAB1基因对水稻种子的萌发和穗的发育起重要作用。与拟南芥GDSL脂肪酶ARAB1基因在种子萌发过程中表达,行使水解酶活性的研究结论一致[2]。在NAA处理的愈伤组织中发现了2条EST序列,说明NAA可诱导OsARAB1基因的表达,而NAA可促进根的生长。NAA是一种植物激素,推测OsARAB1基因可能参与植物激素信号通路应答。
3讨论
电子克隆是依托现有的网络资源(EST数据库、核苷酸数据库、蛋白质数据库、基因组数据库等)采用生物信息学方法进行基因克隆的新策略,且伴随着基因组计划和EST计划的实施而逐渐兴起。利用电子克隆技术克隆基因不仅可以快速地发现新基因,更能为基因的结构研究和功能预测提供新思路[41-42]。电子克隆与传统的克隆方法相比,具有成本低、效率高、技术要求低和针对性强等优点[43]。但由于某些基因存在多种剪切方式,电子克隆获得的结果只能作为参考;另外由于生物大分子结构和功能的复杂性,许多分析软件的输出结果存在较大偏差,因此利用生物信息学进行“虚拟”克隆的结果必需回到实验室作进一步的试验验证。水稻是模式植物,基因组测序已完成,具有丰富的基因组序列和EST序列,截至目前,在NCBI 的EST 数据库中可以检索到1 695 551条水稻的EST序列,且这一数据量还将不断扩大,这为水稻基因的电子克隆提供了很好的生物信息学平台。该研究以NP 174188.1为查询探针,通过搜索水稻EST数据库和EST序列的拼接,用电子克隆的方法克隆了水稻脂肪酶基因OsARAB1。OsARAB1基因cDNA全长1 555 bp,基因编码区序列(CDS)全长1 086 bp,编码一个含有361个氨基酸残基的蛋白质。用生物信息学软件对OsARAB1蛋白的结构、功能、进化等进行了分析。OsARAB1蛋白N端具有信号肽,属于亲水性的胞外蛋白,比较稳定,偏碱性。二级结构以α螺旋和无规则卷曲为主,延伸链散布于整个蛋白质中。具有2个功能结构域:SGNH水解酶型酯酶、GDSL脂肪酶,因此OsARAB1蛋白属于SGNH脂肪酶。有21个磷酸化位点、7个糖基化位点,其中Ser30、Thr66、Ser91与OsARAB1蛋白的活性调控有关,在不同时期可逆地糖基化或磷酸化修饰。氨基酸多序列比对和系统发育树分析表明OsARAB1蛋白与其他物种GDSL脂肪酶的氨基酸序列具有较高的一致性;推定的活性位点的氨基酸残基为Ser34、Gly107、Asn167、Asp333、His336;与玉米酯酶亚型B4FM12亲缘关系最近,一致性达到82%,由此推断OsARAB1蛋白和玉米酯酶亚型B4FM12可能具有类似的生理功能。
电子表达分析是通过整合某物种中特定基因的所有相关表达序列标签信息,从而获得该基因表达相关信息的一种新型基因表达分析技术[44-45]。目前,电子表达分析常与电子克隆技术相结合,共同应用于新基因挖掘和基因功能分析,已被成功应用于多种植物目标基因的表达分析。White等[46]利用电子表达分析方法发掘了拟南芥中一批种子发育特异表达基因。Fei等[47]建立了一个包含15 000个非处理Unigene和6 000个规范化Unigene数据在内的番茄电子表达分析数据库。Mochida等[48]利用电子表达分析技术在小麦上鉴定了一批在抗旱和ABA处理中相应的基因。上官凌飞等[45]利用GenBank中大量葡萄EST序列,建立了基因电子表达分析的有效平台,并通过RTPCR技术对电子表达分析结果的准确性验证,结果显示电子表达分析结果与RTPCR分析结果高度一致。由此可见,电子克隆技术与电子表达分析方法可作为新基因挖掘与功能分析的有效手段。OsARAB1基因的电子表达分析表明,OsARAB1基因的表达有组织和器官特异性特点,但也受稻瘟病病原菌诱导表达,说明OsARAB1基因的表达对水稻的发育和形态发生起重要作用,在水稻受到稻瘟病感染时,成熟叶子中OsARAB1基因被诱导表达形成对稻瘟病菌的防御反应。已克隆的基因PR1和几丁质酶基因的表达也有组织和器官特异性,在辣椒受到病原侵染时表达增强构成防御反应[49-52]。
OsARAB1基因的編码区序列电子定位于第五染色体基因组序列NC 008398.2核苷酸序列6 769 813~6 773 213 bp区域,通过对匹配区段和4个没有参与匹配区段的分析可以推测该基因有5个外显子、4个内含子,4个内含子分别位于6 770 051~6 770 128、6 770 337~6 770 519、6 770 670~6 771 078、6 771 356~6 772 994 bp区段。该基因的编码区序列与临时基因Os05g0209600的染色体区域重叠,说明OsARAB1和Os05g0209600可能是同一个基因。因此,在克隆OsARAB1和研究OsARAB1功能时,可以参考临时基因Os05g0209600的资料,提高试验克隆和功能鉴定的效率。在该基因的附近还存在一个SGNH植物脂肪酶Os05g0210100,推测这2个基因可能由同一个脂肪酶基因经序列复制而产生,其后又在各个复制片段上逐渐积累了突变而形成现在这种基因结构[53]。
参考文献
[1]
UPTON C,BUCKLEY J T.A new family of lipolytic enzymes[J].Trends Biochem Sci,1995,20:178-179.
[2] BRICK D J,BRUMLIK M J,BUCKLEY J T,et al.A new family of lipolytic plant enzymes with members in rice,arabidopsis and maize[J].FEBS Lett,1995,377:475-480.
[3] BRENNER S.The molecular evolution of genes and proteins:A tale of two serines[J].Nature,1988,334(6182):528-530.
[4] MLGAARD A,KAUPPINEN S,LARSEN S.Rhamnogalacturonan acetylesterase elucidates the structure and function of a new family of hydrolases[J].Structure,2000,8(4):373-383.
[5] AKOH C C,LEE G C,LIAW Y C,et al.GDSL family of serine esterases/lipases[J].Prog Lipid Res,2004,43(6):534-552.
[6] CHEESEMAN J D,TOCILJ A,PARK S,et al.Structure of an aryl esterase from Pseudomonas fluorescens[J].Acta Crystallogr D Biol Crystallogr,2004,60(Pt 7):1237-1243.
[7] MATHEWS I,SOLTIS M,SALDAJENO M,et al.Structure of a Novel Enzyme that catalyzes acyl transfer to alcohols in aqueous conditions[J].Biochemistry,2007,46(31):8969-8979.
[8] VAN DEN BERG B.Crystal structure of a fulllength autotransporter[J].J Mol Biol,2010,396(3):627-633.
[9] PRINGLE D,DICKSTEIN R.Purification of ENOD8 proteins from Medicago sativa root nodules and their characterization as esterases[J].Plant Physiol Biochem,2004,42(1):73-79.
[10] ARIF S A,HAMILTON R G,YUSOF F,et al.Isolation and characterization of the early nodulespecific protein homologue (Hev b 13),an allergenic lipolytic esterase from Hevea brasiliensis latex[J].J Biol Chem,2004,279:23933-23941.
[11] CUMMINS I,EDWARDS R.Purification and cloning of an esterase from the weed blackgrass (Alopecurus myosuroides),which bioactivates aryloxyphenoxypropionate herbicides[J].Plant J,2004,39(6):894-904.
[12] RUPPERT M,WOLL J,GIRITCH A,et al.Functional expression of an ajmaline pathwayspecific esterase from Rauvolfia in a novel plantvirus expression system[J].Planta,2005,222(5):888-898.
[13] OH I S,PARK A R,BAE M S,et al.Secretome analysis reveals an Arabidopsis lipase involved in defense against Alternaria brassicicola[J].Plant Cell,2005,17:2832-2847.
[14] MAYFIELD J A,FIEBIG A,JOHNSTONE S E,et al.Gene families from Arabidopsis thaliana pollen coat proteome[J].Science,2001,292:2482-2485.
[15] TEISSERE M,BOREL M,CAILLOL B,et al.Purification and characterization of a fatty acylester hydrolase from postgerminated sunflower seeds[J].Biochim Biophys Acta,1995,1255:105-112.
[16] YOUENSCLARK K,BUCKLER E,CASSTEVENS T,et al.Gramene database in 2010:Updates and extensions[J].Nucleic Acids Res,2010,39:1085-1094.
[17] OUYANG S,ZHU W,HAMILTON J,et al.The TIGR Rice Genome Annotation Resource:improvements and new features[J].Nucleic Acids Res,2007,35:883-887.
[18] RIEMANN M,GUTJAHR C,KORTE A,et al.GER1,a GDSL motifencoding gene from rice is a novel early light and jasmonateinduced gene[J].Plant Biol (Stuttg),2007,9(1):32-40.
[19] PARK J J,JIN P,YOON J,et al.Mutation in Wilted Dwarf and Lethal 1 (WDL1) causes abnormal cuticle formation and rapid water loss in rice[J].Plant Mol Biol,2010,74(1-2):91-103.
[20] SOLOVYEV V V.Statistical approaches in Eukaryotic gene prediction[C]//BALDING D J,CANNINGS C,BISHOP M.Handbook of Statistical genetics.3d edition.Hoboken, NJ:WileyInterscience,2007:1616.
[21] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identification and analysis tools on the ExPASy server[C]//WALKER J M.The proteomics protocols handbook.Totowa,NJ:Humana Press,2005:571-607.
[22] PRILUSKY J,FELDER C E,RYDBERG E,et al.Foldlndex:A simple tool to predict whether a given protein sequence is intrinsically unfolded[J].Bioinformatics,2005,21(16):3435-3438.
[23] COMBET C,BLANCHET C,GEOURJON C,et al.NPS@:Network protein sequence analysis[J].TIBS,2000,25(3):147-150.
[24] EMANUELSSON O,NIELSEN H,BRUNAK S,et al.Predicting subcellular localization of proteins based on their Nterminal amino acid sequence[J].Mol Biol,2000,300:1005-1016.
[25] NIELSEN H,ENGELBRECHT J,BRUNAK S,et al.Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites[J].Protein Engineering,1997,10:1-6.
[26] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:Discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8:785-786.
[27] SONNHAMMER E L L,HEIJNE G V,KROGH A.A hidden Markov model for predicting transmembrane helices in protein sequences[C]//GLASGOW J,LITTLEJOHN T,MAJOR F,et al.Proc of Sixth Int Conf on Intelligent Systems for Molecular Biology.Menlo Park,CA:AAAI Press,1998:175-182.
[28] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structurebased prediction of eukaryotic protein phosphorylation sites[J].Journal of Molecular Biology,1999, 294(5):1351-1362.
[29] GUPTA R.Prediction of glycosylation sites in proteomes:From posttranslational modifications to protein function[D].CBS,2001.
[30] GUPTA R,BRUNAK S.Prediction of glycosylation across the human proteome and the correlation to protein function[J].Pac Symp Biocomput,2002,7:310-322.
[31] JUHL JENSEN L,GUPTA R,BLOM N,et al.Ab initio prediction of human orphan protein function from posttranslational modifications and localization features[J].J Mol Biol,2002,319:1257-1265.
[32] JENSEN L J,GUPTA R,STAERFELDT H H,et al.Prediction of human protein function according to Gene Ontology categories[J].Bioinformatics,2003,19(5):635-642.
[33] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISSMODEL:Modelling protein tertiary and quaternary structure using evolutionary information[J].Nucleic Acids Res,2014,42:252-258.
[34] ARNOLD K,BORDOLI L,KOPP J,et al.The SWISSMODEL workspace:A webbased environment for protein structure homology modelling[J].Bioinformatics,2006,22:195-201.
[35] BENKERT P,BIASINI M,SCHWEDE T.Toward the estimation of the absolute quality of individual protein structure models[J].Bioinformatics,2011,27:343-350
[36] REINA J J,GUERRERO C,HEREDIA A.Isolation,characterization,and localization of AgaSGNH cDNA:A new SGNHmotif plant hydrolase specific to Agave americana L.leaf epidermis[J].J Exp Bot,2007,58(11):2717-2731.
[37] LING H,ZHAO J,ZUO K,et al.Isolation and expression analysis of a GDSLlike lipase gene from Brassica napus L.[J].J Biochem Mol Biol,2006,39:297-303.
[38] KIBA T,NAITOU T,KOIZUMI N,et al.Combinatorial microarray analysis revealing Arabidopsis genes implicated in cytokinin responses through the His->Asp phosphorelay circuitry[J].Plant Cell Physiol,2005,46:339-355.
[39] CAO D,CHENG H,WU W,et al.Gibberellin mobilizes distinct DELLAdependent transcriptomes to regulate seed germination and floral development in Arabidopsis[J].Plant Physiol,2006,142:509-525.
[40] SVENDSEN A.Lipase protein engineering[J].Biochimica et Biophyscia Acta,2000,1543:223-238.
[41] 陈国强,孟鹏,刘李黎,等.高粱抗壞血酸过氧化物酶基因的电子克隆及序列分析[J].生物信息学,2011,9(2):125-130.
[42] 林立霞,郭海,黄少伟,等.火炬松DREB1基因的电子克隆与生物信息学分析[J].生物信息学,2010,8(1):43-46.
[43] FENG Y J,ZHANG H M,JIANG M G,et al.In silico cloning of full length cDNA of Cryphonectria parasitica ubiquitin conjugated enzyme gene (CpUBC) [J].Chinese J Bioinformatics,2004,2:5-9.
[44] 黄宁,张玉叶,阙友雄,等.甘蔗二氨基庚二酸异构酶基因的克隆与表达分析[J].热带作物学报,2013,34(11):2200-2208.
[45] 上官凌飞,王晨,房经贵,等.利用GenBank中大量葡萄 EST序列分离有效基因的电子表达分析平台[J].中国农业科学,2011,44(13):2748-2759.
[46] WHITE J A,TODD J,NEWMAN T,et al.A new set of Arabidopsis expressed sequence tags from developing seeds.The metabolic pathway from carbohydrates to seed oil[J].Plant Physiol,2000,124(4):1582-1594.
[47] FEI Z,TANG X,ALBA R,et al.Tomato Expression Database(TED):A suite of data presentation and analysis tools[J].Nucleic Acids Res,2006,34:D766-770.
[48] MOCHIDA K,KAWAURA K,SHIMOSAKA E,et al.Tissue expression map of a large number of expressed sequence tags and its application to in silico screening of stress response genes in common wheat[J].Molecular Genetics and Genomics,2006,276(3):304-312.
[49] KIM Y J,HWANG B K.Pepper gene encoding a basic pathogenesis-related 1 protein is pathogen and ethylene inducible[J].Physiol Plant,2000,108:51-60.
[50] LEE Y K,HIPPESANWALD S,LEE S C,et al.In situ localization of PR1 mRNA and PR1 protein in compatible and incompatible interactions of pepper stems with Phytophthora capsici[J].Protoplasma,2000,211:64-75.
[51] HONG J K,HWANG B K.Induction by pathogen,salt and drought of a basic class II chitinase mRNA and its in situ localization in pepper (Capsicum annuum)[J].Physiol Plant,2002,114(4):549-558.
[52] HONG J K,LEE S C,HWANG B K.Activation of pepper basic PR-1 gene promoter during defense signaling to pathogen,abiotic and environmental stresses[J].Gene,2005,356:169-180.
[53] 本杰明·盧因.基因 VIII[M].余龙,江松敏,赵寿元,主译.北京:科学出版社,2004:95-124.