柑橘GGP基因家族生物信息学分析
2022-12-09王平柯甫志徐建国
王平,柯甫志,徐建国
(浙江省柑橘研究所,浙江 台州 318026)
抗坏血酸(ascorbic acid,AsA)是一类重要的次生代谢产物,其主要作用是作为抗氧化剂和辅酶因子参与氧化还原反应,同时参与表观遗传激活[1-2]。AsA是人体必需的营养物质,人体自身无法合成,主要从果蔬中摄取。柑橘品种资源丰富,鲜果供应时间长,可满足周年供应,已成为我国最大、全球第二大的消费水果,是人们日常生活获取AsA的重要来源[3]。
植物中存在4条AsA生物合成途径,拟南芥、番茄等植物突变体结果表明,L-半乳糖途径是主导途径[4-6]。GDP-L-半乳糖磷酸化酶(GDP-L-galactose phosphorylase,GGP),又名GDP-L-半乳糖转移酶(GDP-L-galactose transferase,GGT),催化GDP-L-半乳糖和L-半乳糖-1-磷酸之间的转化,被认为是AsA生物合成途径中的重要控制节点[7-9]。
GGP基因家族的全基因组鉴定与特点分析已在小麦中报道[10]。截至目前,GGP基因功能在柑橘中的研究仅局限于单个成员研究[3,11],整个GGP基因家族的生物信息学分析还未见报道。本文通过柑橘已公布的全基因组信息和转录组数据,分析柑橘GGP蛋白质理化性质、二级结构、启动子顺式作用元件和转录组表达,为进一步确定柑橘GGP家族基因的功能奠定基础。
1 材料与方法
1.1 染色体定位和序列分析
GGP基因家族序列、染色体定位信息来源于Phytozome数据库。
1.2 蛋白质理化性质分析和亚细胞定位
蛋白质理化性质分析采用在线软件(https://web.expasy.org/protparam/)进行。亚细胞定位分析采用在线软件(http://cello.life.nctu.edu.tw/)进行。
1.3 蛋白质二级结构分析
采用在线软件(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)分析蛋白质二级结构。
1.4 顺式作用元件分析
从NCBI数据库里获取克里曼丁橘GGP基因家族编码序列起始位点上游2 000 bp的序列,采用PlantCARE软件(http://bioinformatics.psb.ugent.be/webtools/plantcare/html)分析启动子区域顺式作用元件,预测基因功能。
1.5 转录组数据分析
柑橘GGP基因家族的转录组数据来自http://citrus.hzau.edu.cn在线数据库。
2 结果与分析
2.1 柑橘GGP基因家族染色体定位和序列分析
从Phytozome数据库公布的克里曼丁橘全基因组中鉴定到4个GGP家族成员,分别命名为CsGGP1~CsGGP4。通过染色体定位发现,CsGGP1、CsGGP2、CsGGP3和CsGGP4分别位于9号、1号、6号和2号染色体上,除了CsGGP1外,其他3个成员都是全长基因;4个成员的序列长度介于921~1 368 bp,内含子数4~6个(表1)。
表1 柑橘GGP基因家族染色体定位和序列分析
2.2 柑橘GGP基因家族蛋白信息
4个基因家族序列通过Expasy在线软件分析,蛋白质氨基酸个数在307~455个,相对分子量在35 021 440~50 540 620,等电点在 5.03~6.87;4 个成员均为不稳定蛋白质,不稳定指数在 41.35~53.20;脂溶指数89.14~96.19;4个家族成员的疏水性稍有差异,除CsGGP4为正值外,其他3个成员均为负值(表2)。
表2 柑橘GGP基因家族理化性质和亚细胞定位
亚细胞定位结果显示,柑橘GGP 4个家族成员存在差异,CsGGP1分布于细胞核,CsGGP2和CsGGP3位于细胞质,而CsGGP4分布于细胞膜。
蛋白质二级结构分析得出柑橘GGP基因家族主要的二级结构是无规则卷曲和α-螺旋,分别占39%以上和33%以上;其次是延伸链,占16%以上;最后是β-转角,占5%左右(表3)。
表3 柑橘GGP基因家族蛋白二级结构分析
2.3 柑橘GGP基因家族顺式作用元件分析
对柑橘 GGP基因家族启动子区上游2 000 bp的序列进行顺式作用元件分析,结果如表4显示,4个家族成员的启动子区域均含有与光响应、脱落酸和茉莉酸甲酯响应元件,其中光响应元件个数最多,最高达到20个;不同成员还具有水杨酸、赤霉素和生长素等其他激素信号传导、逆境胁迫(厌氧、低温等)与植物生长发育等结合位点。
表4 柑橘GGP基因家族顺式作用元件分析
2.4 柑橘GGP基因家族转录组分析
柑橘4个GGP基因家族成员在组织特异性、果皮发育和黄龙病(Huanglongbing,HLB)胁迫中表现不同(图1和图2)。4个成员中,CsGGP2在胚珠、果肉、叶片和须根等被测样品中均高表达,尤其在果肉中,但在须根中的表达量显著低于其他组织,不到果肉的1/10;CsGGP4成员在胚珠、叶片和须根中表达较高,尤其在须根中与CsGGP2表达量相当;CsGGP1和CsGGP3在被测样品表达量均很低。随着果皮发育,CsGGP2表达量呈现下降趋势。须根HLB感染后,CsGGP2和CsGGP4表达量均增加。
图2 柑橘4个GGP家族成员不同组织和HLB感染后的转录组表达
3 讨论
本研究在克里曼丁橘全基因组范围鉴定出 GGP 家族 4个成员,分别位于4条不同染色体上,亚细胞定位分布于细胞核、细胞质和细胞膜中。启动子顺式作用元件预测4个柑橘GGP基因家族成员均含有大量光响应相关的作用元件,尤其是CsGGP2和CsGGP4。研究显示,AsA作为电子载体或供体参与光合作用[12-13],且L-半乳糖生物合成途径与光合作用紧密相关[1];拟南芥AsA合成量和GGP表达均受高光逆境诱导[4,14],这些结果均表明,GGP基因家族涉及光响应。
转录组分析数据显示,CsGGP2成员表达量在被测组织均最高,表明CsGGP2是L-半乳糖生物合成途径中的主导成员;CsGGP2在果皮发育过程中呈现下降趋势,猜测CsGGP2参与柑橘果皮早期发育,这与L-半乳糖生物合成途径被认为在叶片、绿果等绿色组织中起主要作用的研究结果一致[3-4,15]。须根感染黄龙病后,CsGGP2和CsGGP4表达均增加,表明CsGGP2和CsGGP4参与黄龙病逆境胁迫。