APP下载

烟草丙酮酸脱羧酶家族生物信学分析

2020-05-13王天龙梁永标何俊龙李江美李春荣高文佑官崇植苏家恩

湖南农业科学 2020年3期
关键词:生物信息学聚类分析烟草

王天龙 梁永标 何俊龙 李江美 李春荣 高文佑 官崇植 苏家恩

摘 要:为研究烟草丙酮酸脱羧酶家族特性,运用ProtScale、CDD、Interpro、Muscle、phyml和TreeDyn等工具分析烟草丙酮酸脱羧酶家族各成员的亲疏水性、结构域和进化树。结果表明:NtPDC_1和NtPDC_2具有亲水性,属于可溶性蛋白,NtPDC_3,NtPDC _4,NtPDC_5和NtPDC_6具有疏水性,为非可溶性蛋白;烟草丙酮酸脱羧酶属于硫胺素焦磷酸(TPP)依赖性酶超家族,各成员均含有3组结构域,分别为N-末端TPP结构域、中心域和C-末端TPP结构域;烟草、拟南芥、水稻、薏苡和玉米的丙酮酸脱羧酶聚类为4组,其中烟草丙酮酸脱羧酶主要聚集在Ⅰ组和Ⅱ组,其进化相对保守。

关键词:烟草;丙酮酸脱羧酶;蛋白特性;聚类分析;生物信息学

中图分类号:Q557.9文献标识码:A文章编号:1006-060X(2020)03-0004-04

Abstract: In order to study the characteristics of pyruvate decarboxylase family in tobacco, we used Protscale, CDD, Interpro, Muscle, PhyMl and TreeDyn tools to read the data of water affinity, domain and evolution tree of each member of pyruvate decarboxylase family in tobacco. The results show that NtPDC_1 and NtPDC_2 are hydrophilic and belong to soluble protein. NtPDC_3, NtPDC_4, NtPDC_5 and NtPDC_6 are hydrophobic and insoluble protein. Tobacco pyruvate decarboxylase belongs to the thiamine pyrophosphate (TPP) dependent enzyme superfamily, each member contains three groups of domains: N-terminal TPP domain, central domain and C-terminal TPP domain. Pyruvate decarboxylase clusters of tobacco, Arabidopsis, rice, Coix, maize are divided into four groups, among which tobacco pyruvate decarboxylase mainly gathers in group I and group II, and its evolution is relatively conservative.

Key words: tobacco; pyruvate decarboxylase; protein characteristics; cluster analysis; bioinformatics

丙酮酸脱羧酶可通过催化丙酮酸在非氧化条件下形成乙醛,为可再生能源乙醇的生成提供重要的底物[1]。此外,丙酮酸脱羧酶在植物遇到生物或非生物的逆境胁迫时可提供一定的生存保障,如高盐、无氧和ABA处理等[2-4]。目前,关于丙酮酸脱羧酶的研究主要集中在丙酮酸脱羧酶分子的空间结构组成及运动、丙酮酸脱羧酶的催化过程及机理,以及丙酮酸脱羧酶的应用等方面[5],关于丙酮酸脱羧酶家族特性的研究较少。烟草作为重要的模式作物,且具有特定的蛋白序列库,数据丰富[6]。为此,笔者以烟草为材料,研究丙酮酸脱羧酶的家族特性,为烟草丙酮酸脱羧酶的应用研究提供依据。

1 材料与方法

1.1 烟草丙酮酸脱羧酶家族序列的获取

以NCBI数据库(https://www.ncbi.nlm.nih.gov/)为基础,获取烟草丙酮酸脱羧酶家族成员的序列登录号,其代码依次为NP_001312861、XP_016495723、XP_016467254、XP_016508504、XP_016454960和XP_016508505,分别命名为NtPDC_1、NtPDC_2、NtPDC_3、NtPDC_4、NtPDC_5和NtPDC_6。

1.2 分析方法

采用ProtScale(http://web.expasy.org/protparam/)、CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)、Interpro(https://www.ebi.ac.uk/interpro/)、Muscle(http://www.phylogeny.fr/one_task.cgi?task_type=clustalw)、phyml(http://www.phylogeny.fr/one_task.cgi?task_type=phyml)和TreeDyn(http://www.phylogeny.fr/one_task.cgi?task_type=treedyn)工具[7-12],对烟草丙酮酸脱羧酶家族的疏水性、结构域和进化树进行分析。

2 结果与分析

2.1 烟草丙酮酸脱羧酶家族的亲疏水性分析

通过对烟草丙酮酸脱羧酶家族的亲疏水性分析,结果如图1所示。NtPDC_1的测试结果最小值为-2.444,位于第366位,最大值为2.833,位于第583位,平均亲疏水性为-0.065,说明NtPDC_1具有亲水性;NtPDC_2的测试结果最小值及其位点与NtPDC_1一致,而最大值与NtPDC_1相同,但位置不同,位于第557位,平均亲疏水性为-0.047,说明NtPDC_2具有亲水性;NtPDC_3的测试结果最小值為-2.411,位于第144位,最大值与NtPDC_1相同,但位置不同,位于第572位,平均亲疏水性为0.020,说明NtPDC_3具有疏水性;NtPDC_4的测试结果最小值为-2.578,位于第8位,最大值为2.944,位于第594位,平均亲疏水性为0.005,说明NtPDC_4具有疏水性;NtPDC_5的测试结果最小值为-2.789,位于第377位,最大值为2.322,位于第109位,平均亲疏水性为0.033,说明NtPDC_5具有疏水性;NtPDC_6的测试结果最小值及其位点与NtPDC_4一致,最大值为2.322,位于第156位,平均亲疏水性为0.028,说明NtPDC_6具有疏水性。由于NtPDC_1和NtPDC_2属于亲水性蛋白,说明该蛋白易与水分子结合,由此可推断NtPDC_1和NtPDC_2可能位于细胞的细胞质中,而NtPDC_3和NtPDC_4、NtPDC_5和NtPDC_6可能主要在亚细胞结构中发挥作用。

2.2 烟草丙酮酸脱羧酶家族的结构域分析

通过CDD工具对烟草丙酮酸脱羧酶家族成员进行整体性分析,获取序列中丙酮酸脱羧酶、TPP依赖性2-氧代脱羧酶、硫胺素焦磷酸(TPP)、丙酮酸脱羧酶(PDC)和吲哚丙酮脱羧酶(IPD)亚家族等结构域及硫胺素焦磷酸酶N-末端TPP结构域的特异位点(包括TPP结合位点、PYR / PP接口和二聚体界面)。根据以上分析将烟草丙酮酸脱羧酶家族成员划分为PLN02573、PDC1和TPP_enzyme_PYR超家族。为进一步确定其家族性和结构域,采用Interpro工具进行分析,结果如表1所示。烟草丙酮酸脱羧酶属于硫胺素焦磷酸(TPP)依赖性酶超家族,且各成员均含有三组结构域,即:N-末端TPP结构域、中心域和C-末端TPP结构域;但各成员结构域所在位置有所差异。NtPDC_1内的结构域分别位于26~200位、224~351位和441~585位;NtPDC_2内的结构域分别位于26~200位、224~351位和405~559位;NtPDC_3内的结构域分别位于41~215位、239~374位和424~574位;NtPDC_4内的结构域分别位于63~237位、261~394位和446~596位;NtPDC_5内的结构域分别位于16~190位、214~337位和402~549位,此外NtPDC_5还含有一组低复杂度域,位于344~358位;NtPDC_6内的结构域分别位于63~237位、261~395位和444~520位。

2.3 烟草丙酮酸脱羧酶家族的进化树分析

运用phyml方法将烟草与拟南芥、水稻、薏苡和玉米的丙酮酸脱羧酶进行序列比对,并构建进化树,结果如图2所示。这些丙酮酸脱羧酶被聚类为4组,Ⅰ组成员所占比例为16%,其成员均为烟草中的丙酮酸脱羧酶,包括NtPDC_3、NtPDC_4、NtPDC_5和NtPDC_6;Ⅱ组成员所占比例为24%,其成员包括烟草中的NtPDC_1和NtPDC_2,拟南芥中的NP_195752、OAO91142、NP_195033和BAD94479,其中烟草成员与拟南芥成员的相似度为74%;Ⅲ组成员所占比例为20%,其成员包括水稻中的XP_015631876、AAA90948和XP_015646176,玉米中的NP_001105052和XP_008654188;Ⅳ组成员所占比例为40%,其成员包括水稻中的XP_025881666、XP_015637741、AAA68290和XP_015615261,玉米中的AQK94418、NP_001105422、PWZ09677、CAA35589和NP_001105645,薏苡中的ABE57121。聚类分析结果表明,烟草丙酮脱羧酶的氨基酸序列在进化过程中较为稳定。由此推测,在整个进化环境中,烟草丙酮脱羧酶的功能发挥受环境影响较小,进而维持较为保守的功能,且与拟南芥较为相似。

3 结论与讨论

蛋白质序列中的亲水性和疏水性氨基酸可通过排列分布影响其空间结构的折叠,因此对烟草丙酮酸脱羧酶家族成员进行亲疏水性分析有利于探明其空间结构,便于后续分析。研究表明,烟草丙酮酸脱羧酶家族成员的亲疏水性有一定的规律,即在序列的250~350位氨基酸之间主要以疏水性氨基酸为主。NtPDC_1和NtPDC_2具有亲水性,NtPDC_3,NtPDC _4,NtPDC_5和NtPDC_6具有疏水性,这与王昭玉等[13]认为NtPDC_1和NtPDC_2属于可溶性蛋白的结论相一致。烟草丙酮酸脱羧酶主要属于硫胺素焦磷酸(TPP)依赖性酶超家族,具有N-末端TPP结构域、中心域和C-末端TPP结构域,且NtPDC_5含有一组低复杂度域,说明NtPDC_5的功能具有一定的特异性。聚类分析结果显示,烟草丙酮酸脱羧酶家族成员聚类为Ⅰ组和Ⅱ组,其中Ⅰ组所有成员均为烟草丙酮酸脱羧酶,Ⅱ组成员为烟草和拟南芥的丙酮酸脱羧酶,由此推测烟草丙酮酸脱羧酶进化相对保守,与拟南芥的亲缘关系较近,且NtPDC_1和NtPDC_2成员与拟南芥丙酮酸脱羧酶的功能相似[14]。

参考文献:

[1] 朱碧云,李浩明. 丙酮酸脱羧酶及其应用研究[J]. 生命科学,2010,22(11):1184-1191.

[2] Dolferus R,Jacobs M,Peacock W J,et al. Differential interactions of promoter elements in stress responses of the Arabidopsis adh gene[J]. Plant Physiology,1994,105(4):1075-1087.

[3] Tadege M,Dupuis I I,Kuhlemeier C. Ethanolic fermentation:new functions for an old pathway[J]. Trends in Plant Science,1999,4(8):320-325.

[4] Hwang S Y, VanToai T T. Abscisic acid induces anaerobiosis tolerance in corn[J]. Plant Physiology,1991,97(2):593-597.

[5] 段文凱,吕美巧,江 蕾,等. 丙酮酸脱羧酶的催化机制及应用研究进展[J]. 科技通报,2007,23(6):816-819.

[6] Sayers E W, Agarwala R, Bolton E E,et al. Database resources of the national center for biotechnology information[J]. Nucleic Acids Research,2019, 47(D1):D23-D28.

猜你喜欢

生物信息学聚类分析烟草
烟草产品展厅设计
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
一地烟草,半世孤独
全国首次青少年烟草调查