APP下载

基于全基因组的穿心莲NRAMP 基因家族鉴定与生物信息学分析

2023-08-30范潘慧武立伟邢建永宋经元

亚热带植物科学 2023年3期
关键词:穿心莲进化树拟南芥

范潘慧,武立伟,孙 伟,王 瑀,高 巍,邢建永,宋经元,5,姚 辉,5*

(1. 中国医学科学院北京协和医学院药用植物研究所国家中医药管理局中药资源保护重点研究室,北京 100193;2. 中国中医科学院中药研究所,北京 100700;3. 华润三九(六安)中药材产业发展有限公司,安徽 六安 237000;4. 华润三九现代中药制药有限公司,广东 惠州 516000;5. 中药资源教育部工程研究中心,北京 100193)

土壤是植物重金属的主要来源之一[1],随着全球工业化的进程以及人口的快速增长,废弃物的排放使得重金属污染进一步加剧,导致植物从土壤环境中吸收过量的重金属离子。金属转运蛋白在植物对重金属的摄取、吸收和转运过程中发挥着重要的作用。自然抗性相关巨噬细胞蛋白(Natural resistance-associated macrophage protein, NRAMP)基因家族编码多个膜定位的金属转运蛋白,参与Cd、Pb 等多种重金属的吸收和转运[2—3]。目前,拟南芥Arabidopsisthaliana[4]、水稻Oryzasativa[5]、烟草Nicotianatabacum[6]、大麦Hordeumvulgare[7]、大豆Glycinemax[8]等植物的NRAMP基因家族均被挖掘报道。拟南芥中AtNRAMP6参与Cd 的转运[3]。水稻中OsNRAMP5参与Cd、Pb 的转运[2,9],其过表达减少了Cd 从根向芽的转移,从而降低水稻籽粒的Cd 含量[10];OsNRAMP1的敲除可降低水稻籽粒Cd 含量[5]。此外,药用植物黄连Coptischinensis中的NRAMP4和NRAMP5基因被证明参与Cd 的吸收[11—12]。这些研究表明,在植物对重金属的吸收和转运中,NRAMP基因家族起着至关重要的作用。

穿心莲Andrographispaniculata为爵床科Acanthaceae 穿心莲属一年生草本植物,广泛分布于热带、亚热带区域,20 世纪50 年代引种于我国广东、广西、福建和海南等地区[13]。传统中医药理论认为穿心莲具有清热解毒、凉血、消肿等作用[14],现代药理研究表明其主要活性成分为穿心莲内酯,具有抗炎、抑菌、抗肿瘤等多种作用[15],因此又被称为“中药抗生素”[16]。在新冠肺炎流行期间,穿心莲被用作抗病毒治疗的有效药物而需求激增[17]。然而,由于种植过程中的农药化肥滥用等问题,导致穿心莲中重金属含量超标问题频出[18]。目前对于穿心莲的重金属污染问题的相关研究报道较少[19—20],对穿心莲重金属吸收转运分子机制解析的研究较为欠缺。

本研究基于穿心莲参考基因组数据[21],筛选鉴定得到7 个穿心莲NRAMP基因家族成员,并对其基因结构、编码蛋白的理化性质及进化关系等方面进行系统的生物信息学分析,为进一步探讨穿心莲NRAMP基因家族成员对重金属胁迫响应的具体功能提供理论和实践基础。

1 材料与方法

1.1 穿心莲基因组数据来源及其NRAMP 基因家族成员的鉴定

穿心莲的全基因组数据(ASM980555v1)来源于NCBI 数据库(https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_009805555.1/)[21],以已知模式物种拟南芥的NRAMP基因家族蛋白序列为索引,利用本地Blastp 在穿心莲全基因组的蛋白数据中进行比对分析,选取E≤10–10的序列;并通过SMART(http://smart.embl-heidelberg.de/)和NCBI Conserved Domains(https://www.ncbi.nlm.nih.gov/cdd/)对Blastp 比对得到的候选序列进行检索筛选和确认。最终,在穿心莲全基因组中共鉴定获得7 个ApNRAMPs 基因,并用于后续分析。

1.2 ApNRAMPs 基因编码的蛋白序列的基本理化性质分析

将所获穿心莲ApNRAMPs 基因家族的蛋白序列上传至在线网站 ProtParam(http://web.expasy.org/protparam/)和ExPASy(https://web.expasy.org/protscale/)对其编码蛋白质的长度、分子量、理论等电点和亲水性等基本理化性质进行分析[22];并通过在线网站WoLF-PSORT(https://wolfpsort.hgc.jp/)对其亚细胞定位进行预测分析。

1.3 ApNRAMPs 蛋白的系统进化、基因结构和保守基序分析

将穿心莲、拟南芥及水稻的NRAMP 蛋白序列导入MEGA 11 软件进行多序列比对,而后采用邻接法(Neighbor-joining,NJ 法)构建系统进化树,并用Bootstrap 法评估系统进化树,其中重复次数(Replications)设定为1000[23]。

根据ApNRAMPs 基因的CDS 序列及其基因组的DNA 序列,利用GSDS(http://gsds.gao-lab.org/)网站绘制ApNRAMPs基因家族成员的外显子和内含子结构模式图[24],通过NCBI CD-search 功能预测ApNRAMPs蛋白结构域。通过MEME(https://meme-suite.org/)网站完成ApNRAMPs 蛋白序列的保守基序分析[25]。

1.4 ApNRAMPs 蛋白空间结构分析预测

通过在线网站 SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)预测分析ApNRAMPs 蛋白二级结构[26];利用SWISSMODEL(https://swissmodel.expasy.org/)在线分析网站对ApNRAMPs 蛋白的三维空间结构进行预测[27],并通过PyMOL 优化所预测蛋白质的三级结构[28]。

2 结果与分析

2.1 穿心莲NRAMP 基因家族成员的鉴定及其编码蛋白的理化性质分析

以模式植物拟南芥中已知的6 个NRAMP 蛋白序列为参考,共鉴定获得7 条穿心莲NRAMP 蛋白序列,确定其为NRAMP基因家族成员,命名为ApNRAMP1~ApNRAMP7。对ApNRAMPs 基因编码的氨基酸序列进行理化性质分析,发现ApNRAMPs氨基酸长度与分子量均十分接近,分别为513~553 aa 和56.00~60.54 kD (表1)。ApNRAMPs 蛋白均有10~12 个跨膜结构域,所有成员的亚细胞定位均为细胞膜(表1),表明穿心莲NRAMP基因家族成员可能均参与植物体内重金属的跨膜转运[9]。

表1 ApNRAMPs 基因家族成员编码蛋白的理化性质Table 1 The physical and chemical properties of the proteins encoded by ApNRAMPs family members

2.2 穿心莲NRAMP 基因家族成员进化分析

将7 个ApNRAMPs 编码的蛋白序列与模式物种拟南芥中6 个AtNRAMPs 和水稻中7 个OsNRAMPs编码的蛋白序列进行多序列比对,采用邻接法构建系统进化树。穿心莲、拟南芥和水稻的NRAMP基因家族,共计20 条序列被分为2 个亚组:GroupⅠ和GroupⅡ(图1)。其中穿心莲ApNRAMP1/2/7 属于GroupⅠ,并包含有拟南芥AtNRAMP1/6 和水稻OsNRAMP1/3/4/5/6;而穿心莲ApNARMP3/4/5/6 和拟南芥、水稻中的其余NRAMP 成员聚类于GroupⅡ。此外,从进化树来看,ApNRAMP1 和ApNRAMP2聚为一支,ApNRAMP5 和ApNRAMP6 聚为一支,展现出较短的进化距离。

图1 穿心莲、拟南芥和水稻NRAMP 基因家族成员系统进化树Fig. 1 Phylogenetic tree of NRAMP gene family members among Andrographis paniculata, Arabidopsis and Oryza sativa

2.3 穿心莲NRAMP 基因结构分析

通过分析穿心莲ApNRAMPs 基因的保守结构域,发现该基因家族的所有成员均含有完整的Nramp 结构域,具有极强的保守性。在穿心莲的7个ApNRAMPs 基因中,ApNRAMP3~ApNRAMP6均含有3 个内含子,而ApNRAMP1、ApNRAMP2、ApNRAMP7则含有12 个内含子(图2)。

图2 ApNRAMPs 基因的内含子和外显子结构Fig. 2 Gene structure of ApNRAMPs

2.4 穿心莲NRAMP 基因家族编码蛋白的保守基序分析

为进一步分析穿心莲NRAMP基因家族成员在编码蛋白水平的差异,本研究采用MEME 在线分析工具对7 个ApNRAMPs 基因编码蛋白的保守基序进行分析,共获得16 个Motif (图3)。不同ApNRAMPs基因的基序数量相近,12~14 个不等。所有穿心莲NRAMP 家族成员蛋白质序列均包含Motif 1~8 和Motif 13。ApNRAMP1、ApNRAMP2、ApNRAMP7均含有Motif 12 和Motif 13,而ApNRAMP4、ApNRAMP5、ApNRAMP6 含有Motif 11,这与系统进化树中,ApNRAMP1/2/7 属于 Group Ⅰ,而ApNRAMP4/5/6 属于GroupⅡ一致。

图3 ApNRAMPs 蛋白保守基序分析Fig. 3 Conservative motifs of ApNRAMPs proteins

2.5 穿心莲NRAMPs 蛋白结构预测

在ApNRAMPs 蛋白的二级结构中,α-螺旋及无规则卷曲占比最大,分别占比49.17%~60.23%和25.93%~31.80%,延伸链和β-折叠的氨基酸数目最少,分别占比10.53%~15.71%和2.71%~4.07%(表2)。使用SWISS-MODEL 在线模拟ApNRAMPs蛋白的三级结构,并使用Pymol 对预测得到的ApNRAMPs 蛋白的三级结构进行优化。结果显示,ApNRAMPs 蛋白的三级结构极为相似,并主要由α-螺旋所构成(图4)。

图4 ApNRAMPs 蛋白三级结构预测Fig. 4 The 3D structures analysis of ApNRAMPs proteins

表2 穿心莲NRAMP 家族蛋白质二级结构主要构件占比Table 2 The percentage of secondary structure of NRAMP family proteins in Andrographis paniculata

3 结论与讨论

作为中医药的发源地,中国是中药资源大国,但中医药的发展受到中药安全问题的困扰,其中重金属污染问题尤为严重[29]。作为南药大品种之一的穿心莲,由于其抗炎、抗菌等明确的疗效,近年来市场需求递增[13]。为了降低重金属污染,提高穿心莲品质,了解重金属在穿心莲体内的吸收和转运机制十分重要。NRAMP 是一类分布极为广泛的膜转运蛋白质家族,在进化过程中极度保守,并在重金属的吸收和转运中发挥关键性作用[30]。通过对穿心莲ApNRAMPs 进行深入分析,可以较为全面地了解该基因家族成员的特征,阐明其功能,为阻断穿心莲对有害重金属的吸收和转运提供思路,对推动其无公害种植具有重要的现实意义。

在模式植物中,NRAMP基因家族参与重金属吸收、转运的功能已有较为深入的研究,为药用植物响应重金属胁迫的机制研究提供了很好的借鉴。水稻的OsNRAMP1定位于细胞膜上,被认为参与水稻根系对Cd 的吸收[5];OsNRAMP5则对根系吸收Cd和Pb 发挥重要作用[2,31]。拟南芥AtNRAMP3定位于液泡膜上,参与液泡中Cd 的外排[32];AtNRAMP6参与胞内Cd 的转运[3]。在药用植物中,参与重金属胁迫响应的基因研究才刚刚起步,甘草Glycyrrhiza uralensis和黄连的NRAMP基因家族已被鉴定挖掘[11—12,33]。黄连在受到Cd 胁迫时,定位于液泡膜上的CcNRAMP3基因在须根中首先大量表达而后逐渐下降,这与植物中金属吸收转运的规律一致,推测其可能与Cd 转运相关[11]。

本研究从穿心莲基因组中共鉴定到 7 个NRAMP基因,命名为ApNRAMP1~ApNRAMP7,对其蛋白理化性质进行分析,发现该家族成员的氨基酸序列长度相近,均定位于细胞膜上,含有10~12 个跨膜结构域。植物NRAMP 蛋白的跨膜结构域不仅将其锚定到生物膜上,还发挥了维持生物学功能的作用[34]。系统进化树显示,NRAMP基因家族可分为2 个亚家族(图1),穿心莲和水稻、拟南芥等植物的NRAMP基因家族具一致的进化方向。此外,ApNRAMPs 家族成员的基因结构显示,在系统进化树被分为两个不同亚家族的成员在保守基序和基因结构上也存在显著差异,这与拟南芥、水稻和大豆中的NRAMP基因结构相近[6],暗示植物的NRAMP基因家族可以较为明显的分为两个类群以及该家族基因结构的保守性。ApNRAMPs 蛋白的二级结构主要由α-螺旋和无规则卷曲构成,所有成员的三级结构高度相似。上述结果有助于更加深入地了解穿心莲ApNRAMPs 的结构和功能,为后续抗性品种筛选奠定基础。未来可通过转基因等生物技术手段获得低Cd 吸收的穿心莲新品种,实现穿心莲的无公害种植[13,29]。

猜你喜欢

穿心莲进化树拟南芥
拟南芥:活得粗糙,才让我有了上太空的资格
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
穿心莲内酯滴丸
尿黑酸对拟南芥酪氨酸降解缺陷突变体sscd1的影响
穿心莲内酯固体分散体的制备
两种LED光源作为拟南芥生长光源的应用探究
艾草白粉病的病原菌鉴定
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
消炎止咳片穿心莲中脱水穿心莲内酯含量的HPLC分析