苹果蔗糖转运蛋白基因的生物信息学分析
2019-06-19史鹏
史 鹏
(山西省林业科学研究院,山西太原030012)
苹果(Malus pumila)是蔷薇科苹果亚科苹果属植物,其与葡萄(Vitis vinifera)、柑橘(Citrus reticulat a Blanco.)和香蕉(Musa nana Lour.)并称为世界四大水果。苹果性味温和,富含矿物质、维生素和碳水化合物等营养物质,是一种“全方位的健康水果”,深受大众喜爱[1-3]。苹果树是山西省重要的水果经济林树种,2016 年山西省苹果树栽培面积33.23 万hm2,产量达到550.7 万t。提高苹果风味及品质,对于促进山西省国土增绿、林业增效、农民增收具有重要意义[4-5]。
蔗糖含量是决定苹果风味、品质的关键因素之一,蔗糖是植物光合作用产物储存、转运的关键物质之一。蔗糖转运蛋白(Sucrose transport protein,SUT 或sucrose carriers,SUC)通过偶联H+-ATP 酶形成膜电位差,实现蔗糖的跨质膜运输,因此,其也被称为蔗糖-H+共转运蛋白[6]。该蛋白在植物碳水化合物的长距离运输中扮演关键角色,并参与植物生长发育、能量运输与调节,可能与经济作物甜菜(Beta vulgaris)、苹果(Malus pumila)和甘蔗(Saccharum officinarum)等的产量与品质直接相关[7]。蔗糖转运蛋白属于易化扩散载体家族(Major facilitator superfamily,MFS),该蛋白家族成员通常含有12 个富含α- 螺旋的疏水跨膜结构域,面向细胞质的游离N- 端以及序列中段面向细胞质的亲水胞质环区域,该亲水胞质环区域序列较长,能将蔗糖转运蛋白分隔为前后2 个半区,每个半区含有6 个跨膜结构域[8]。根据氨基酸序列的相似性,植物蔗糖转运蛋白分为5 个家族,其中,双子叶植物含有SUT1,SUT2 和SUT4 家族;单子叶植物含有SUT2,SUT4,SUT3 和SUT5 家族[9]。
近年来,随着高通量测序技术的改进和多种重要植物基因组数据的公布,为植物蔗糖转运蛋白家族研究奠定了基础。研究者已从拟南芥(Arabidopsis thaliana)[10]、水稻(Oryza sativa)[11]、巴西橡胶树(Hevea brasiliensis)[12]、葡萄(Vitis vinifera L.)[13]基因组中分别鉴定出9,5,6,6 个蔗糖转移蛋白基因序列,但目前苹果的相关研究还相对较少。
本研究充分挖掘苹果基因组数据库,以苹果蔗糖转运蛋白为主要研究对象,从苹果基因组中鉴定蔗糖转移蛋白基因,并对其进行蛋白序列以及系统发育分析,旨在为利用蔗糖转运蛋白基因进行苹果分子育种和优良品种选育提供有益信息。
1 材料和方法
1.1 苹果蔗糖转运蛋白基因序列的获取
首先利用苹果全基因组cDNA 序列构建Blast本地数据库,以拟南芥蔗糖转运蛋白为种子序列,针对苹果基因组cDNA 序列执行本地Blast 搜索(使用默认参数)。对搜索得到的cDNA 序列进行去冗余后,再经过Blast X 软件(https://blast.ncbi.nlm.nih.gov/Blast.cgi)在线对比和注释后,得到苹果基因组中蔗糖转运蛋白的基因序列。
1.2 苹果蔗糖转运蛋白的系统发育分析
根据Blast X 软件在线比对结果,并结合DNA translate(https://web.expasy.org/translate/)软 件 预 测结果,将苹果蔗糖转运蛋白基因DNA 序列翻译为氨基酸序列。利用ClustalW 软件在默认参数下,将拟南芥蔗糖转运蛋白的氨基酸序列与苹果蔗糖转移酶蛋白的氨基酸序列进行多序列联配,将序列联配文件导入MEGA 7 软件,通过邻接法(Neighbor-Joining method,NJ)构建系统进化树(Bootstrap值为1 000)。
1.3 苹果蔗糖转运蛋白的生物信息学分析
采用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html),NetNGlyc 1.0(http://www.cbs.dtu.dk/services/NetNGlyc/#opennew w-indow),NetOGlyc 4.0 Server(http://www.cbs.dtu.dk/services/NetOGlyc/)和ProtParam(https://web.expasy.org/protparam/)等软件对苹果蔗糖转运蛋白的二级结构、糖基化修饰位点、蛋白分子量、理论等电点等参数进行在线预测。使用SignalIP 4.1 软件(http://www.cbs.dtu.dk/services/SignalP/) 和TMHMM 软 件(http://www.cbs.dtu.dk/services/TMHMM/)分别对该蛋白的信号肽和跨膜区结构进行预测。
2 结果与分析
2.1 苹果蔗糖转运蛋白基因序列的获取
从NCBI 数据库下载拟南芥9 个蔗糖转移蛋白基因序列(基因名称/ 登录号:SUC1/Q39232,SUC2/Q39231,SUC3/O80605,SUC4/Q9FE59,SUC5/Q9C8X2,SUC6/Q6A329,SUC7/Q67YF8,SUC8/AEC0 6318 和SUC9/Q9FG00),再利用上述序列针对苹果基因组cDNA 序列执行TBLASTX 搜索。结果显示,苹果基因组中含有7 个待定蔗糖转移蛋白基因序列,对应苹果基因组ID 号分别为MD05G1040000,MD10G1045900,MD15G1394000,MD08G1209900,MD16G1075900,MD13G1074600 和MD12G1059700(表1)。
表1 苹果基因组中蔗糖转运蛋白基因序列信息
2.2 苹果蔗糖转运蛋白基因的系统发育分析
进一步使用Blast X 软件将2.1 得到的7 个待定基因与Nr 数据库进行比对,结果显示,苹果蔗糖转移蛋白基因与来自中国白梨(Pyrus bretschneideri)的相应蔗糖转移蛋白序列最为相似(表1),其中,有6 个基因为全长序列,其cDNA 长度范围是1 667~2 635 bp,只有MD12G1059700 基因缺少5′- 端序列。使用ClustalW 软件,将拟南芥9 个蔗糖转移蛋白基因序列和苹果6 个蔗糖转移蛋白基因全长序列进行多序列联配,将联配结果导入MEGA 7软件,并构建NJ 系统发育树(图1),结果显示,隶属于SUT1 家族的7 个拟南芥蔗糖转移酶蛋白基因(AtSUC1,AtSUC2,AtSUC5,AtSUC6,AtSUC7,AtSUC8 和AtSUC9) 与苹果基因组MD05G1040000 和MD10G1045900 基因聚为一支;隶属于SUT4 家族的拟南芥蔗糖转移酶蛋白基因(AtSUC4)与MD15G1394000 和MD08G1209900 基因聚为一支;隶属于SUT2 家族的拟南芥蔗糖转移酶蛋白基因(AtSUC3)与苹果基因组MD16G1075900 和MD13G 1074600 基因聚为一支。基于系统发育结果,分别将苹果MD05G1040000 和MD10G1045900 基因命名为SUT1-like1 和SUT1-like2,将MD15G1394000和MD08G1209900 基因分别命名为SUT4-like1 和SUT4-like2,将MD16G1075900 和MD13G1074600基因分别命名为SUT2-like1 和SUT2-like2。
2.3 苹果蔗糖转运蛋白的序列分析
表2 苹果蔗糖转运蛋白氨基酸全长序列信息
6 个蔗糖转移蛋白全长基因对应的蛋白序列长度范围是507~612 个氨基酸,蛋白相对分子量范围是54.04~65.69 ku,理论等电点范围是6.46~9.72(表2)。
上述6 个全长序列均无信号肽和N- 糖基化位点,但存在1~8 个O- 糖基化位点。苹果蔗糖转移酶蛋白序列的中部亲水胞质环将该蛋白序列分为前后2 个半区,SUT1-like2 的前半区含有5 个跨膜区,后半区含有6 个跨膜区;SUT2-like1 和SUT2-like2 前半区含有5 个典型跨膜区和1 个疑似跨膜区(序列具有较高可能性,但未达阈值),后半区含有6 个跨膜区;而SUT1-like1,SUT4-like1 和SUT4-like2 的前、后半区均含有6 个跨膜区(图2)。上述6 个蛋白二级序列中,α- 螺旋占比最大(42.56%),无规则卷曲次之(38.15%),β- 折叠占比相对较少(15.35%),β- 转角占比最少(3.95%)(表3)。
表3 苹果蔗糖转运蛋白二级结构信息
3 讨论
根据植物SUT 基因序列的同源性,可将SUT分为5 个家族,其中,双子叶植物SUT 可分为SUT1,SUT2 和SUT4 家族;而单子叶植物SUT 可分为SUT2,SUT3,SUT4 和SUT5 家族,其中SUT2 和SUT4家族为单子叶和双子叶植物所共有[14-15]。以拟南芥为代表的双子叶植物,SUT 蛋白功能相对清晰[10]。SUT1 家族的蔗糖转运蛋白具有高亲和—低转运能力;沉默烟草SUT1 基因后,烟草叶片光合作用产生的碳水化合物就不能有效运输至其他组织,导致植株整体生长受到抑制。SUT4 家族的蔗糖转运蛋白具有低亲和—高转运能力;已知的SUT4 家族蔗糖转运蛋白主要位于植物细胞液泡膜上,负责将液泡储存的蔗糖转运至细胞质中。并可能在暗反应条件下进行韧皮部装载。SUT2 家族的蔗糖转运蛋白具有低亲和—高转运能力或具有蔗糖信号感应能力。SUT2 家族蛋白主要在韧皮部SE/CC 复合体表达,在种皮、根尖、花粉和防卫细胞中也有高水平表达。
与拟南芥等模式植物相比,苹果蔗糖转移蛋白基因研究相对薄弱[16-17]。LI 等[18]从苹果基因组中筛选得到5 个蔗糖转运蛋白基因;而魏晓钰[19]报道,苹果基因组中有9 个蔗糖转运蛋白基因。本研究表明,苹果基因组中有7 个蔗糖转运蛋白基因,造成苹果蔗糖转移蛋白基因数量差异的原因可能有2 点:一是在研究工作中,蔗糖转移酶基因搜索方案、种子序列来源、Blast 程序搜索参数乃至基因鉴定阈值均存在差异;二是基因筛选研究工作分别基于不同品种苹果的基因组。如LI 等[18]和魏晓钰[19]的研究是基于2010 年意大利米开来农业研究所公布的苹果基因组(https://www.rosaceae.org/analysis/14),其DNA测序文库基于嘎啦苹果(Malus×domestica Borkh)[20]。而本研究基于2017 年法国Bucher 实验室公布的苹果基因组(https://iris.angers.inra.fr/gddh13/),其DNA测序文库基于金冠苹果(Golden delicious)[21]。由于近年来高通量测序技术的高速发展,金冠苹果的测序质量远高于嘎啦苹果基因组的测序质量,具有较高的可靠性。
4 结论
本研究从苹果基因组中搜索获得7 条蔗糖转移蛋白待定cDNA 序列。其中,6 条cDNA 序列被鉴定为全长序列,cDNA 长度范围是1 667~2 635 bp,对应编码507~612 个氨基酸,包含11~12 个跨膜结构域。系统发育结果显示,上述6 个蔗糖转移酶蛋白分别属于SUT1,SUT2 和SUT4 家族,可能具有与拟南芥蔗糖转移酶相似的生物学功能。本研究结果将为利用蔗糖转运蛋白基因进行苹果分子育种和优良品种选育提供有益信息。