毛竹甘油3-磷酸酰基转移酶(GPAT)基因家族成员的生物信息学分析
2020-12-07戴丽红柳丽霞傅志真华俊峰邓先俊
戴丽红 柳丽霞 傅志真 华俊峰 邓先俊
摘要: 以已知拟南芥、水稻的GPAT基因信息为基础,利用毛竹(Phyllostachys pubescens)基因组数据库分析了GPAT基因在毛竹中编码的相关酶类,确定了毛竹基因组中含有16个毛竹GPAT基因,并分析了这些基因的核苷酸序列长度、编码氨基酸的数量、蛋白分子量、基因结构和氨基酸序列保守结构域。
关键词: 毛竹; 甘油3-磷酸酰基转移酶(GPAT); 基因功能; 生物信息学
中图分类号: S 795. 7 文献标识码: A 文章编号:1001 - 9499(2020)06 - 0025 - 04
毛竹(Phyllostachys heterocycla)生长迅速、材质好且分布广泛[ 1 - 3 ],是我国经济价值高、栽培面积最广最重要的竹种,毛竹竹材韧性强,整体性好,可制成家具、农具、文具等多种工具和日用品。毛竹纤维含量高达30%~35%,纤维长度在1 500~
1 750 μm之間,这使其成为纤维和造纸工业的优良原料[ 4 ]。此外,竹笋味道鲜美,除鲜食外,还可制成各种干笋和蜜饯。不仅能够快速大幅增加林农收入,还可改善生态环境。然而,毛竹生长对水肥、气候条件要求高,即使在适宜毛竹生长的地区,也经常受到来自外部不良环境因素的干扰,如季节性干旱、冷害与冻害、土壤盐碱化等,这都会对毛竹的生长和成林产生威胁,造成竹材、竹笋的减产[ 5 - 6 ]。因此,提高毛竹的抗逆性、挖掘毛竹抗逆潜能对提高竹农收入,维持竹产业的高产、稳产具有重要意义。
利用分子生物学手段进行毛竹基因功能研究已成为毛竹生物学研究的热点。目前,中国竹类基因功能的鉴定和研究主要集中在与竹笋生理及竹子开花等相关的基因[ 7 - 8 ]。毛竹脂质代谢,特别是对生长发育、逆境信号应答起重要作用的磷脂分子PA的代谢过程研究还未开始。GPAT是生物膜中重要成分——磷脂酰甘油(PG)生物合成中的第一个酰基酯化酶,该酶在植物、微生物和动物中皆有报道[ 9 - 11 ]。植物GPAT不仅影响种子油脂合成,还会通过其下游产物参与植物的生长发育以及抗旱、抗寒和耐盐等生理过程[ 11 - 14 ]。本研究通过生物信息学分析确定毛竹基因组中GPAT成员,以及对应的核苷酸、氨基酸序列,为进一步探索GPAT在毛竹生长发育、逆境胁迫响应中的功能奠定基础。
1 材料与方法
1. 1 研究材料
已知模式生物拟南芥中有10个GPAT成员[ 11 ],在TAIR(http://www.arabidopsis.org/index.jsp)上输入拟南芥基因ID号得到它们核苷酸序列、氨基酸序列。在TIGR(http://rice.plantbiology.msu.edu/)上搜索关键词“Glycerol-3-phosphate acyltransferase”,发现模式生物水稻基因组含有17个成员。通过以上2个专业数据库网站的查找、搜索,获得拟南芥、水稻GPAT基因的核苷酸、氨基酸序列信息。
1. 2 研究方法
在毛竹基因组数据库网站(http://bioinformatics.
cau.edu.cn/bamboo/search.php)BambooNet,用已知的10个拟南芥基因的氨基酸序列和17个水稻基因的氨基酸序列,同时通过在线BlastP和拟南芥基因位点搜索两种方法,找到相似性或同源度高的毛竹序列,通过比较、删除两种方法中重复的基因,最终确定毛竹基因组中含有16个GPAT候选基因成员,记下它们的 ID号并在BambooNet网站上查询、下载相应的核苷酸、氨基酸序列。
在分子生物学网站(http://pfam.xfam.org/search#
tabview=tab0)输入拟南芥GPAT基因的氨基酸序列,获得这些氨基酸序列的蛋白保守结构域。
在https://www.predictprotein.org/网站进行毛竹基因的蛋白质亚细胞定位,确定该蛋白质处于特定亚细胞的位置,从而分析该序列在特定位置的功能。
2 结果与分析
2. 1 毛竹GPAT基因结构预测
根据已经得到的拟南芥GPAT家族中9个基因和水稻的17个GPAT成员的核苷酸序列、氨基酸序列信息,通过在线BlastP和拟南芥基因位点搜索,分析毛竹GPAT基因家族16个成员,它们的基因ID号分别是PH01001328G0270、PH010000
19G1720、PH01004026G0190、PH01002284G0240,PH01001208G0480、PH01001171G0080、PH01000
607G0640、PH01000773G0530、PH01001809G0320、PH01000632G0290、PH01000090G0730、PH01000
400G0030、PH01003665G0130 、PH01000276G0140、
PH01001272G0420、PH01000578G0740。在16个毛竹基因成员中,多数毛竹GPAT序列核苷酸长度在4 000~8 000 bp之间,氨基酸序列的编码区由1~13个外显子组成,编码150~870个氨基酸,蛋白质分子量大小在17.2 kD~97.20 kD之间,其中PH01000
632G0290核苷酸序列最长,编码9 176个碱基对;PH01004026G0190基因核苷酸序列最短,编码3 339个碱基对(表1)。
2. 2 毛竹GPAT基因蛋白保守结构域分析
通过对拟南芥的 GPAT 蛋白保守结构域的查找(http://www.ncbi.nlm.nih.gov/Structure/ lexington/
lexington.cgi?cmd=rps)和比较发现, 拟南芥GPAT基因家族的每个成员都具有一个活性酰基转移酶结构域,其中AtGPAT4 / 6/8具有一个包含糖类水解酶和磷水解酶的卤酸卤化酶样水解酶(HAD-like)域。在Pfam网站输入毛竹蛋白序列,得到这些序列的保守结构域,由毛竹GPAT基因序列蛋白结构域(表2)结果表明:这些成员均包含酰基转移酶蛋白结构域,个别成员还包含卤酸脱卤酶的保守结构域。不同毛竹GPAT的N端序列差异很大,但它们都具有相同的GPAT功能结构域。
2. 3 毛竹GPAT蛋白亚细胞定位
根据亚细胞定位、酰基化位点的差异,拟南芥GPAT可分为3类:质体GPAT(ATSI)、线粒体GPAT
(AtGPAT1~3)和内质网GPAT(AtGPAT4~8)[ 11 ],其中,只有ATSI为质体GPAT。不同的亚细胞定位具有不同的生化特性和生理功能。在16个毛竹序列中,有8条序列定位于线粒体,有2条预测定位于叶绿体,而4条预测定位于内质网中(图1),其中PH01002284G0240、PH01000773G0530共同定位于内质网和线粒体;PH01000090G0730共同定位于叶绿体和线粒体。
3 结论与讨论
本文通过生物信息学分析,确定毛竹基因组中含有16个GPAT基因成员,且16条氨基酸序列都具有酰基转移酶保守结构功能域,从亚细胞定位预测来看毛竹GPAT与拟南芥GPAT相似,主要分布在内质网、叶绿体和线粒体中。拟南芥质体定位的GPAT,ATSI通过脂酰种类影响PG分子sn-1位脂肪酸的不饱和度,影响种子含油量和植株的耐寒性[ 14 ]。拟南芥中GPAT1-3定位于线粒体中,3个成员仅有sn-2酰基转移酶活性,GPAT1在角果和花芽中表达高,GPAT2、GPAT3在各组织中均有表达,这些基因主要参与花器官角质合成[ 14 - 15 ]。定位在内质网中的拟南芥GPAT5参与角质合成和软木脂的合成,维持种皮和根表皮的正常结构,缺失GPAT5的突变体植株对盐的耐受性降低[ 14 ]。基于拟南芥已有研究结果和本文毛竹GPAT基因家族成员的保守结构域分析、亚细胞定位预测,我们推测16个毛竹GPAT成员在不同的细胞器中也会有底物选择性和酰基转移位点特异性,在毛竹抵抗逆境胁迫过程中行使着各异的生理功能。本文对毛竹中可能编码的GPAT基因做了初步的生物信息学分析,但它们的亚细胞定位在毛竹抗逆反应中发挥的生理、生化功能还有待进一步验证。
参考文献
[1] 江泽慧. 世界竹藤[M]. 沈陽: 辽宁科学技术出版社, 2002: 3 - 10.
[2] 金爱武. 毛竹定向培育技术视频图文版[M]. 北京: 中国农业出版社, 2019.
[3] 朱强根, 金爱武, 娄艳华, 等. 施肥对毛竹根系酸性磷酸酶及氮代谢的影响[J]. 福建林业科技, 2016, 043(001): 30 - 34.
[4] 鲁顺保, 丁贵杰, 彭九生. 立地条件与毛竹竹材密度和纤维形态关系初探[J]. 福建林业科技, 2008, 35(1): 55 - 58.
[5] 蔡凯. 毛竹SOD基因家族生物信息学与功能分析[D]. 浙江农林大学, 2018.
[6] 刘玉芳, 陈双林, 李迎春, 等. 竹子生理可塑性的环境胁迫效应研究进展[J]. 浙江农林大学学报, 2014, 31(3): 473 - 480.
[7] 石明旺, 庞延军, 王修强, 等. 竹类植物分子生物学研究进展及展望[J]. 经济林研究, 2006, 24(2): 63 - 68.
[8] 胡娇丽, 张岩, 汤定钦. 竹子基因组序列研究及应用[J]. 竹子研究汇刊, 2008, 27(1): 1 - 7.
[9] 尹航, 袁岚瑛, 俞凯, 等. 三角褐指藻GPAT生物信息学及表达差异分析[J]. 核农学报, 2019, 33(08): 1 483 - 1 489.
[10] 田增有, 李开济, 门秀丽, 等. 甘油-3-磷酸酰基转移酶(GPATs)的研究进展[J]. 生理科学进展, 2015, 46(2): 103 - 107.
[11] 刘聪, 肖旦望, 施春霖, 等.植物GPATs基因研究进展[J]. 遗传, 2013, 35(12): 1 352 - 1 359.