APP下载

青天葵PAL基因序列特征和表达分析

2016-02-06黄琼林詹若挺

河南农业科学 2016年2期
关键词:苯丙氨酸结构域测序

黄琼林,何 瑞,詹若挺

(1.广东医学院,广东 湛江 524023; 2.广州中医药大学 中药资源科学与工程研究中心,广东 广州 510006;3.岭南中药资源教育部重点实验室,广东 广州 510006)

青天葵PAL基因序列特征和表达分析

黄琼林1,何 瑞2,3*,詹若挺2,3

(1.广东医学院,广东 湛江 524023; 2.广州中医药大学 中药资源科学与工程研究中心,广东 广州 510006;3.岭南中药资源教育部重点实验室,广东 广州 510006)

在前期完成的青天葵(Nerviliafordii)转录组测序数据的基础上,采用生物信息学方法对3个青天葵PAL基因家族成员(NfPAL1、NfPAL2 和NfPAL3)的cDNA序列及其编码蛋白质的氨基酸序列进行特征分析,并计算这些基因在青天葵叶片和球茎中的表达量。结果表明,从转录组数据中获得的3个青天葵PAL基因家族成员cDNA序列长度为1 743~2 091 bp,编码581~697个氨基酸。这些PAL基因编码包含苯丙氨酸解氨酶多功能域,并且不含跨膜结构域、信号肽和转运肽的亲水性稳定蛋白。3个青天葵PAL基因在青天葵中的表达呈组织特异性,其中,NfPAL1和NfPAL3在球茎中的表达量较高,而NfPAL2在叶片中具有较高的表达水平。

苯丙氨酸解氨酶; 青天葵; 序列特征; 表达; 生物信息学

黄酮类化合物是植物苯丙烷类代谢途径中的次生代谢产物,苯丙氨酸解氨酶(phenylalanine ammonia-lyase,PAL)催化该途径的第一步反应,将L-苯丙氨酸催化生成反式肉桂酸,再生成香豆酸、芥子酸等中间产物,随后中间产物在不同酶的催化作用下经不同分支衍生成黄酮、木质素和酚类等次生代谢产物,而且PAL引导途径中碳素的流向。因此,PAL被认为是苯丙烷类代谢途径中的第1个限速关键酶[1]。研究表明,提高PAL活性可以促进黄酮类成分的积累[2-3]。目前,PAL基因已从甜荞[4]、山药[5]、龙眼[6]等多种植物中克隆出来。

青天葵为“十大广药”之一,来源于兰科芋兰属多年生草本植物毛唇芋兰[Nerviliafordii(Hance) Schltr.]的全草或叶片,具有清肺止咳、清热解毒、散瘀消肿的功效,对治疗肺部疾病和小儿呼吸道疾病有显著疗效[7]。由于人类的过度开采以及自身萌发条件的苛刻,青天葵野生资源已经基本灭绝。目前,不少研究者致力于通过人工栽培[8]和组织培养[9]来提高青天葵的产量,但这2种途径分别面临着种苗稀缺和“炼苗下田”等瓶颈,根本不能生产足够的青天葵来满足临床和市场需求。

植物化学和药理研究表明,黄酮类化合物是青天葵发挥药用功效的主要物质基础。例如,青天葵山奈酚-7-甲醚能够明显地抑制白血病细胞株L1210和P388D1、宫颈癌细胞株Hela、人胃癌细胞株SGC7901、黑色素瘤细胞株B16、神经性肿瘤细胞株NG108-15和人肝癌细胞株Hele7404的生长,被认为是青天葵抗肿瘤的活性成分之一[10]。青天葵甲基鼠李素-3-O-β-吡喃葡萄糖基-4′-O-β-6‴-乙酰基葡萄糖苷能显著降低LPS诱导的RAW264.7细胞中NO、PEG2、IL-6、TNF-α的含量,抑制iNOS和COX-2蛋白的表达,表明该成分具有抗炎作用[11]。在化学成分比较明确的情况下,通过植物基因工程调控PAL等黄酮类生物合成功能酶基因的表达,从而提高青天葵的药效成分含量及其药用质量,是缓解青天葵资源匮乏的可考虑途径之一。

本研究在青天葵RNA-seq高通量转录组测序数据的基础上,采用生物信息学分析青天葵PAL基因家族成员的序列特征及其在青天葵不同组织中的表达差异,为后续青天葵PAL基因的功能研究以及利用其调控青天葵黄酮类成分的生物合成奠定理论基础。

1 材料和方法

1.1 青天葵等植物PAL基因序列的获取

前期研究中,广州中医药大学中药资源科学与工程研究中心课题组以生长旺盛期的青天葵叶片和球茎为材料,采用Illumina RNA-seq高通量测序平台进行全转录组测序,共获得142 220个基因。本研究以“phenylalanine ammonia-lyase”为主题词检索转录组数据中编码青天葵苯丙氨酸解氨酶的unigene及其cDNA序列,并从National Center of Biotechnology Information(NCBI)的GenBank公共数据库下载铁皮石斛(Dendrobiumcandidum)等14种植物的PAL基因cDNA序列。

1.2 青天葵PAL基因的系统发育分析

采用ClustalX 1.86软件对所有PAL基因序列进行多重比对,并将比对结果保存为.aln格式。把.aln多重比对文件导入MEGA 4.0软件中,构建基于Kimura 2-Parameter双参数模型和Neighbor-Joining邻接法的系统发育树(1 000次重复bootstrap检验各分支的支持率)。

1.3 青天葵PAL蛋白的序列特征分析

通过OMIGA软件将PAL基因的cDNA序列翻译成氨基酸序列,以备后续分析。利用ExPASy Protparam和Protscale在线软件计算和分析PAL蛋白的理化参数和亲/疏水性等基本性质;采用NCBI的Conserved Domains Database (http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)完成保守功能域预测;运用TMHMM (http://www.cbs.dtu.dk/ ser-vices/ TMHMM-2.0/)预测跨膜结构域;使用TargetP 1.1 (http://www.cbs.dtu.dk/ services/TargetP/) 分析信号肽、转运肽信息;应用SOPMA在线工具(http://npsa-pbil.ibcp.fr/cgi-bin/ npsa_automat.pl? page=npsa_sopma.html)分析编码蛋白质的二级结构。

1.4 青天葵PAL基因的表达量分析

在对转录组高通量测序数据的处理中,RPKM(Reads Per Kb per Million reads)法对测序长度和基因长度均作了归一化,使得不同长度的基因在不同测序深度下得到的基因表达水平估计值具有可比性[12]。本研究采用RPKM法计算青天葵PAL基因家族成员在叶片和球茎中的表达量,计算公式为:RPKM(PAL)=(106C)/(NL/103)。设RPKM(PAL)为编码青天葵PAL基因的unigene的表达量,则C为唯一比对到编码青天葵PAL基因的unigene的读数,N为唯一比对到所有unigene的总读数,L为编码青天葵PAL基因的unigene的碱基数。

2 结果与分析

2.1 青天葵PAL基因cDNA及氨基酸序列特征分析

通过在青天葵转录组测序数据中检索和比对,共获得3个编码青天葵PAL的基因及其序列,分别将它们命名为NfPAL1、NfPAL2和NfPAL3(表1)。这些PAL基因cDNA序列长度在1 743 bp到2 091 bp之间,编码581~697个氨基酸,等电点均稍大于6。青天葵3个PAL基因编码蛋白质的不稳定指数均小于40,属于稳定性蛋白质。这些PAL蛋白的多肽链整体表现为亲水性,没有包含明显的疏水区域。

表1 青天葵PAL基因cDNA及氨基酸序列特征

2.2 系统发育分析

将3个青天葵PAL基因以及从GenBank下载的铁皮石斛(Dendrobiumcandidum)等14种植物PAL基因序列分别导入ClustalX软件进行多重比对,并采用MEGA 4.0软件构建系统发育树。如图1所示,17条PAL基因序列主要聚成两大分支,青天葵3个PAL基因之间的序列相似度在73%以上,并与铁皮石斛等其他单子叶植物来源的PAL基因聚集在一起;而其他双子叶植物来源的PAL基因则聚成另外一个分支。其中,青天葵PAL基因与铁皮石斛的同源性最高,可达78%。青天葵PAL基因与其他植物来源的PAL基因的保守度较高,推测它们的功能具有高度的一致性。

Cucumis sativus黄瓜; Dendrobium candidum铁皮石斛; Fagopyrum esculentum荞麦; Gossypium hirsutum陆地棉; Jasminum sambac茉莉;Epimedium sagittatum箭叶淫羊藿; Musa acuminata小果野芭蕉; Pleioblastus maculosoides丽水苦竹; Phyllostachys prominens高节竹;Prunella vulgaris夏枯草; Prunus persica碧桃; Prunus salicina李; Scutellaria viscidula粘毛黄芩; Zea mays玉米图1 不同植物PAL基因的系统发育树

2.3 保守功能域分析

通过预测编码蛋白的保守功能域,可以明确青天葵PAL基因的功能和分类。如图2所示,NfPAL3编码的蛋白质有多个活性位点(active sites)和四聚物表面(tetramer interface)区域,包含1个PAL-HAL保守功能域,归属于裂解酶Ⅰ超级家族,具有苯丙氨酸解氨酶多功能位点,说明NfPAL3蛋白具有苯丙氨酸解氨酶的功能,NfPAL3为青天葵苯丙氨酸解氨酶的编码基因。NfPAL1和NfPAL2蛋白的保守功能域分析也得到相同的结果,它们同样归属于裂解酶Ⅰ超级家族,并且具有苯丙氨酸解氨酶多功能位点。以上结果表明,NfPAL1、NfPAL2和NfPAL3均为苯丙氨酸解氨酶家族成员。

2.4 跨膜结构域、信号肽和转运肽分析

跨膜结构域是蛋白质与细胞膜的膜脂结构结合的区域,可起到在细胞膜上“锚定”的功能[13]。跨膜结构域的预测可以掌握青天葵PAL蛋白的亚细胞定位等信息。TMHMM软件分析结果(图3)显示,NfPAL3蛋白的全部多肽链均位于细胞膜外,不包含任何跨膜结构域。对NfPAL1和NfPAL2蛋白也进行了跨膜结构域分析,它们同样不存在跨膜结构域。上述结果表明青天葵PAL蛋白在细胞质基质中执行功能。

图2 青天葵PAL蛋白保守功能域预测

图3 青天葵PAL蛋白跨膜结构域预测

信号肽、转运肽位于蛋白质的N端,前者指导分泌性蛋白到内质网上合成,后者指引在细胞质基质游离核糖体上合成的前体蛋白转运至叶绿体基质中发挥作用[13]。因此,信号肽和转运肽分析同样对蛋白质的亚细胞定位具有重要意义。通过TargetP 1.1软件分析3个青天葵PAL基因编码的蛋白质序列,发现它们均不含有信号肽和转运肽,表明它们在细胞质中合成以及发挥催化功能,也不属于分泌性蛋白质。

2.5 二级结构分析

如图4所示,NfPAL3蛋白二级结构由α-螺旋、随意卷曲、β-转角和延伸链等元件组成,各元件所占比例分别为51.08%、27.55%、8.46%和12.91%。从蛋白质的整体结构来看,α-螺旋和随意卷曲是NPAL3最大量的结构元件,而延伸链和β-转角则相对分散于整条多肽链中。NfPAL1和NfPAL2蛋白的二级结构分析结果与NfPAL3蛋白类似,均以α-螺旋和随意卷曲为主要组成元件。因此,NfPAL蛋白为混合型结构的蛋白质。

图4 青天葵PAL蛋白二级结构模拟

2.6 表达量分析

基于RPKM法计算的青天葵PAL基因表达量如图5所示,NfPAL1和NfPAL3在球茎中的表达量远远高于在叶片中的表达量,而NfPAL2表达量较低,并且在叶片中的表达水平比在球茎中的表达水平略高,表明青天葵PAL的表达存在组织差异性。

图5 青天葵PAL基因在叶片和球茎中的表达差异

3 结论与讨论

PAL是连接初级代谢和次生代谢,催化苯丙烷类代谢途径第1步反应的关键酶和限速酶,与类黄酮、木质素和酚类等苯丙烷类代谢途径终产物的积累有着密切的关系。关巍等[2]发现,在彩色马铃薯整个发育期间,在PAL活性较高的器官中花青苷含量也较高,两者呈现线性正相关。郭肖等[3]通过检测不同产地水芹中黄酮含量和PAL活性的变化趋势,也得到水芹黄酮合成与PAL活性呈密切正相关的结论。由此可见,提高PAL基因的表达量,增加PAL活性,可以促进植物黄酮类成分的积累。

本研究从青天葵转录组数据中获取3个青天葵PAL编码基因,系统发育分析表明,这些PAL基因与其他植物来源PAL基因同源性较高,具有苯丙氨酸解氨酶的功能,其他生物信息学分析也说明它们与前人所报道的PAL蛋白特性相符[4-6]。植物PAL基因家族通常包括2~5个成员,不同成员在植物黄酮类成分的生物合成中发挥的功能也有所不同,本研究获得的青天葵PAL基因家族3个成员的功能仍需后续的试验探讨。

植物PAL基因家族各成员的表达通常具有物种、组织和时间的特异性。柳树PAL1、PAL2和PAL3在根中都能大量表达,并远高于在嫩叶、茎、成熟叶、木质部、韧皮部等器官中的表达量;但PAL4在以上部位的表达量均很低[14]。甘蔗PAL基因在根中表达量是叶中表达量的66倍[15]。蝴蝶兰PAL基因在组织培养过程中第1、8、12天表达量急剧增加,第12天表达量达到最大值,随后总体表达量呈现降低趋势[16]。本研究也发现,青天葵PAL基因家族3个成员的表达呈现组织特异性,NfPAL1和NfPAL3在地下部位球茎中的表达量远高于在地上部位叶片中的表达量,而NfPAL2在2个部位的表达量均较低,并且在叶片中的表达量稍高于在球茎中的表达量,这可能与它们在青天葵中执行不同的功能有关。

本研究从青天葵RNA-seq转录组数据挖掘到植物重要的次生代谢途径之一——苯丙烷类代谢途径第1步关键酶PAL的基因家族成员,通过系统发育、保守功能域和蛋白质特征位点分析等明确了它们的序列特征和分子功能,并探讨了这些基因在青天葵不同组织中的表达差异。本研究结论可为青天葵PAL基因家族的克隆和功能鉴定,进而通过植物基因工程提高青天葵黄酮类药效成分含量奠定良好的基础。

[1] Yu O,Jung W,Shi J,etal.Production of the isoflavones genistein and daidzein in non-legume dicot and monocot tissues[J].Plant Physiology,2000,124(2):781-794.

[2] 关巍,石瑛,王凤义.彩色马铃薯PAL活性与花色苷积累的相关性研究[J].吉林农业科学,2014,39(1):74-79.

[3] 郭肖,孔德章,曹玉洪,等.不同产地水芹黄酮含量及PAL酶活性的差异研究[J].长江蔬菜,2014(2):32-34.

[4] 李成磊,蒙华,张晓伟,等.甜荞苯丙氨酸解氨酶基因PAL的克隆及序列分析[J].食品科学,2011,32(7):255-257.

[5] 周生茂,王玲平,向珣,等.山药PAL基因全长cDNA序列的克隆、表达与分析[J].核农学报,2008,22(6):781-788.

[6] 郑洁红,邱栋梁.龙眼叶片PAL基因的克隆与表达研究[J].热带作物学报,2012,33(1):79-83.

[7] 陈蔚文.岭南本草(二)[M].广州:广东科技出版社,2010:326-351.

[8] 杜勤,徐鸿华,王振华.人工种植青天葵生长状况的初步调查[J].中药材,2005,28(10):869-870.

[9] 张晓丽,梁凌玲,詹若挺,等.岭南道地药材青天葵的组织培养与植株再生[J].北方园艺,2012(19):140-142.

[10] 甄汉深,周燕园,袁叶飞,等.青天葵中黄酮类化合物的体外抗肿瘤实验研究[J].中国实验方剂学杂志,2008,14(3):36-38.

[11] 焦扬,邱莉,谢集照,等.青天葵黄酮F的抗炎作用[J].中国医药工业杂志,2014,45(2):143-146.

[12] 王曦,汪小我,王立坤,等.新一代高通量RNA测序数据的处理与分析[J].生物化学与生物物理进展,2010,37(8):834-836.

[13] 黄琼林,蔡春.不同植物黄酮醇合成酶FLS的生物信息学分析[J].广东农业科学,2014,41(13):140-143,151.

[14] de Jong F,Hanley S J,Beale M H,etal.Characterisation of the willow phenylalanine ammonia-lyase(PAL) gene family reveals expression differences compared with poplar[J].Phytochemistry,2015,117:90-97.

[15] 宋修鹏,黄杏,莫凤连,等.甘蔗苯丙氨酸解氨酶基因(PAL)的克隆和表达分析[J].中国农业科学,2013,46(14):2856-2868.

[16] 赵和文,崔金腾,周田田.基于实时荧光定量PCR技术的蝴蝶兰PPO和PAL基因表达分析[J].中国农学通报,2015,31(7):125-130.

Sequence and Expression Analysis ofPALGenes fromNerviliafordii

HUANG Qionglin1,HE Rui2,3*,ZHAN Ruoting2,3

(1.Guangdong Medical University,Zhanjiang 524023,China; 2.Research Center of Chinese Medicinal Resource Science and Engineering,Guangzhou University of Chinese Medicine,Guangzhou 510006,China;
3.Key Laboratory of Chinese Medicinal Resource from Lingnan,Ministry of Education,Guangzhou 510006,China)

In this study,the sequence features and expression levels in corm and leaf of threePALgenes annotated fromNerviliafordiitranscriptome data were analyzed using bioinformatics methods.The results revealed that the cDNA sequence length of threeNfPALgenes ranged from 1 743 bp to 2 091 bp,and encoded 581 to 697 amino acids.The NfPAL proteins were stable and hydrophilic,which also contained a phenylalanine ammonialyase functional domain,and no transmembrane region,signal peptide and transport peptide.Additionally,the expression of threeNfPALgenes was tissue-specific,NfPAL1 andNfPAL3 showed higher expression levels in corm,whileNfPAL2 expressed higher in leaf.

phenylalanine ammonia-lyase;Nerviliafordii(Hance) Schltr.; sequence features; expression; bioinformatics

2015-08-20

国家自然科学基金项目(30701090);广东省自然科学基金博士启动项目(2015A030310519)

黄琼林(1986-),男,广东湛江人,讲师,主要从事医学生物化学研究。E-mail:perfecthql@163.com

*通讯作者:何 瑞(1972-),女,广东广州人,研究员,博士,主要从事中药资源可持续利用研究。E-mail:ruihe@gzucm.edu.cn

S567.23

A

1004-3268(2016)02-0104-05

猜你喜欢

苯丙氨酸结构域测序
2009~2019 年吉林省新生儿高苯丙氨酸血症的发病率及治疗效果分析
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
蛋白质结构域划分方法及在线服务综述
基因测序技术研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨
固定化苯丙氨酸脱氨酶拆分D,L-苯丙氨酸制备D-苯丙氨酸
苯丙氨酸解氨酶印迹交联酶聚体的制备及部分催化性能研究
单细胞测序技术研究进展