番茄4CL基因家族鉴定和氮素处理下的表达分析
2022-06-09马馨馨许洋赵欢欢火兆燕王树彬钟凤林
马馨馨 许洋 赵欢欢 火兆燕 王树彬 钟凤林
(福建农林大学园艺学院,福州 350002)
番茄(Solanum lycopersicum L.)深受人们喜爱,但在种植过程中,各种生物胁迫及干旱、盐碱、肥料等非生物胁迫都会对番茄的生长发育造成不良影响,进而影响番茄的品质和产量。在实验室前期的研究中发现不同浓度的氮素处理下番茄叶片苯丙烷生物合成通路的最终产物多酚、类黄酮和木质素等物质含量具有显著性差异。氮素处理下,飞机草[1]、小麦[2]、香蕉[3]等作物的木质素、类黄酮等均会发生相应的变化,从而进一步影响植株生长与防御以及不同次生代谢物合成途径之间的分配,以此来增加病虫害的抵御能力[4-5]。苯丙烷代谢途径是植物体内重要的次生代谢途径之一,每个细胞中至少有20% 的代谢途径以此为基础,其最终可以生成参与植物防御反应的酚类、类黄酮、和生物碱等,使植物对外界环境具有一定的抵抗性[6-9]。4香豆酸辅酶A连接酶(4CL)是苯丙烷生物合成通路中起关键作用的催化酶,作用于苯丙烷生物合成途径的最后一步,将各种羟基肉桂酸(香豆酸、咖啡酸和阿魏酸)催化为相应的硫酯,进一步调控木质素、类黄酮、多酚等次生代谢物质的合成[10-13]。因此,对苯丙烷生物合成途径的关键基因4CL基因家族进行生信分析,初步探究番茄4CL基因家族成员的作用机理至关重要。
本研究通过生信分析,对番茄4CL基因家族成员进行蛋白结构域、基因结构、蛋白保守基序、启动子顺式作用元件以及进化树的分析,以期阐明番茄4CL家族成员的理化性质与基本功能,同时在不同浓度氮素处理下检测其家族成员的表达量,进一步探究不同浓度氮素对4CL基因家族成员表达量的影响,为苯丙烷生物合成通路关键基因4CL响应氮素调控提供理论依据。
1 材料与方法
1.1 材料
供试材料为‘Micro Tom’番茄。采用穴盘育苗,待幼苗长至5叶1心时,进行水培缓苗,缓苗3 d后采用霍格兰营养液配方进行水培,其中控制氮素的浓度分别为:5.6 mg/L、22.4 mg/L、112 mg/L(正常氮素浓度)、224 mg/L、336 mg/L,每3 d更换一次营养液,在第9天进行相关试验。
1.2 方法
1.2.1 数据下载与番茄4CL基因家族成员鉴定与命名 利用番茄转录组数据获取4CL基因家族成员,将所获成员与Ensembl数据库官网下载的番茄数据库进行比对,最终确定番茄4CL基因家族成员。文中所使用的拟南芥数据和水稻数据均从UniProt数据库官网(https://www.uniprot.org/)下载。参考已公布的其他物种对4CL基因的命名方式,本研究将这类基因统称为“4CL”,其前缀加上代表物种的特异性字母,根据基因座位置将番茄4CL基因命名为“Sl4CL”。
1.2.2 番茄4CL基因家族成员理化性质分析 利用在线网站对番茄4CL基因家族成员进行理化性质分析。其中Expasy网站(https://web.expasy.org)分析氨基酸分子量、等电点、不稳定指数、亲疏水性、原子总数;NovoPro网站(https://www.novopro.cn)进行蛋白信号肽的预测;Cell-PLoc 2.0(www.csbio.sjtu.edu.cn)进行亚细胞定位的预测。
1.2.3 番茄4CL基因家族成员二级结构、三级结构预测 利用Prabi(https://npsa-prabi.ibcp.fr)进行二级结构预测,利用Swiss-model(https://swissmodel.expasy.org)进行三级结构预测。
1.2.4 番茄4CL基因家族成员染色体定位分析 利用Ensembl数据库官网获得番茄4CL基因家族成员的位置信息,利用Tbtools进行作图。
1.2.5 番茄4CL基因家族成员基因结构分析 利用Tbtools软件分析番茄4CL基因家族成员的基因结构(内含子和外显子)信息,利用NCBI的Batch CD-Search获取Moain进行蛋白结构域的分析,利用MEME网站(https://meme-suite.org)设定搜索15个Motif,获取番茄4CL不同成员氨基酸序列的Motif,利用Tbtools工具进行作图。
1.2.6 番茄4CL基因家族成员的进化树分析 利用MEGA7软件对番茄、拟南芥、水稻的4CL基因家族做多序列比对,采用临近法(NJ)Boostrap=1 000进一步构建进化树,利用iTOL网页(https://itol.embl.de/itol.cgi)进行进化树的美化。
1.2.7 番茄4CL基因家族成员启动子顺式作用原件分析 利用Tbtools从番茄基因组数据库中获取启动子(ATG)上游2 000 bp的序列,利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)获取启动子TF结合位点的信息,利用PlantTFDB(http://planttfdb.gao-lab.org/prediction.php)获得启动子顺式作用元件信息,最后利用Excel进行统计和作图。
1.2.8 番茄4CL基因家族成员在氮素胁迫下的表达分析 在水培第9天分别取样进行RNA的提取、逆转录、荧光定量的测定。对番茄叶片进行RNA提取的试剂盒购于上海普洛麦格生物产品有限公司;逆转录试剂盒购买于天根生化科技(北京)有限公司;荧光定量试剂盒购买于诺唯赞生物科技股份有限公司。引物(表1)由福州尚亚生物技术有限公司合成。以Actin为内参基因对氮素处理下的4CL基因的表达量进行验证,每个处理3个重复,根据单内参算法2-ΔΔCt计算4CL基因的相对表达量,运用Microsoft Excel 2010和GraphPad Prism 8.0.2软件对数据进行统计分析。
表1 PCR所用到的引物Table 1 Primers for PCR
1.2.9 番茄Sl4CL03过表达载体的构建 利用DANMAN8软件设计基因上下游引物,加上pCAMBIA-1302载体接头(F:GGACTCTTGACCATGG;R:CTTCTCCTTTACTAGT),进行目的基因片段扩增,反应体系为 25 μL:2×Phanta Max Buffer 12.5 μL;dNTP Mix 0.5 μL ;Phanta Max Super Fidelity DNA Polymerase 0.5 μL ;上游引物和下游引物各 1 μL ;cDNA 1 μL;ddH2O 8.5 μL。PCR反应程序:95℃预变性3 min;95℃变性15 s,58℃退火15 s,72℃延伸1 min 40 s,共35个循环;72℃延伸5 min,将PCR产物进行胶回收。利用赛默飞世尔科技公司的NcoI和BcuI酶将pCAMBIA1302质粒进行双酶切,利用诺唯赞生物科技股份有限公司的ClonExpress® II One Step Cloning Kit试剂将其与pCAMBIA1302线性化载体进行连接,转入DH5α大肠杆菌感受态,涂板倒置37℃培养12 h,挑单克隆菌落进行菌液PCR,将阳性菌落大摇提质粒送福州铂尚生物技术有限公司进行测序。将重组质粒通过冻融法转入农杆菌GV3101感受态细胞。
1.2.10 番茄Sl4CL03蛋白的亚细胞定位 将农杆菌菌液在5 000 r/min离心3 min,去掉上清,用一定体积的重悬液重悬沉淀,使OD600nm=0.6-0.8,静置3 h,用1 mL注射器轻轻抵在烟草叶片背部,避开叶脉进行注射,避光12 h,24 h后用激光共聚焦显微镜观察荧光。用含有pCAMBIA1302空载的农杆菌作为对照。
2 结果
2.1 番茄4CL基因家族成员鉴定和理化性质分析
蛋白的理化性质分析可以了解蛋白质的特性,对番茄4CL基因家族进行基本理化性质分析,结果如表2所示,6个家族成员氨基酸个数在538和957之间,分子量为58 930.46-102 255.02,有5个氨基酸的等电点小于7,为酸性氨基酸,仅有Sl4CL05为碱性氨基酸。6个基因的不稳定指数均小于40,均为稳定蛋白,且在6个基因中均无检测出信号肽。此外,6个基因中有4个为疏水氨基酸,在亚细胞定位中预测到6个基因均在过氧化物酶体中表达,但Sl4CL01除了在过氧化物酶体外还可以在叶绿体中表达。6个家族成员均无信号肽。
表2 番茄4CL基因家族蛋白理化性质Table 2 Physico-chemical properties of 4CL family proteins in tomato(Solanum lycopersicum)
2.2 番茄4CL基因家族二级结构与三级结构分析
蛋白质的序列结构可以反映蛋白的功能,为蛋白三级结构模式奠定基础,对番茄4CL蛋白的二级结构预测分析(表3)发现,番茄4CL蛋白二级结构均由α-螺旋、延伸链、β-转角和无规则卷曲四部分构成,其中α-螺旋和无规则卷曲所占比例最大,分别为30.67%-41.69%和34.8%-42.28%,接下来依次为延伸链(15.57%-20.71%)和β-转角(6.84%-9.01%)。在二级结构分析的基础上进一步分析三级结构(图1),结构表明Sl4CL01、Sl4CL02、Sl4CL03、Sl4CL05和Sl4CL06均以5bsr.1.A为模型,其相似度 分 别 为 63.02%、89.29%、91.13%、40.68%和81.48%,仅Sl4CL04以5bsw.1.A为模型,相似度为37.07%。
图1 番茄4CL基因家族三级结构Fig.1 Tertiary structure of tomato 4CL gene family
表3 番茄4CL基因家族二级结构Table 3 Secondary structure of tomato 4CL gene family
2.3 番茄4CL基因家族成员系统发育分析
为更好的探究番茄4CL基因家族的发展,用番茄4CL基因家族的6条基因,拟南芥的20条基因,水稻的7条基因构建系统发育树(图2),结果显示33条4CL基因共分为三大亚族,番茄4CL基因均在第Ⅲ亚族,番茄Sl4CL01与拟南芥At1g65060、水稻Os02g46970亲缘性较近,Sl4CL05与At4g05160,Sl4CL04与At4g19010均具有较近的亲缘关系,Sl4CL01、Sl4CL02和Sl4CL06与拟南芥的At3g21240、At1g51540亲缘性较近,且三者相互之间具有较高的同源性,而第 I和第 II亚族的水稻、拟南芥和番茄4CL的亲缘关系较远。
图2 番茄、拟南芥和水稻4CL基因家族成员系统发育树Fig.2 Phylogenetic tree of 4CL gene family in Solanum lycopersicum,Arabidopsis thaliana and Oryza sativa
2.4 番茄4CL基因家族成员染色体定位分析
对番茄4CL基因家族进行染色体定位分析,结果如图3所示:6条基因共分布到5条染色体上,数量最多的是3号染色体,共有2条基因,分别为Sl4CL01和Sl4CL02。剩余4条基因分别位于6号、8号、11号、12号染色体上。在染色体的定位图上可以发现4CL基因多分布于染色体的3′端,且所有的染色体上均无基因簇存在。
图3 番茄4CL基因家族成员染色体定位Fig.3 Localization of 4CL in chromosomes of tomato
2.5 番茄4CL基因家族成员基因结构分析
为进一步分析番茄4CL基因家族的基因结构特征,了解其生物学功能,对番茄的6条基因进行相关内含子、外显子的分析。结果如图4所示,所有4CL基因的核苷酸序列基本可以分为3个部分:内含子、外显子以及UTR区。所有基因序列的第一个内含子均位于成熟编码序列内部,有利于区别信号序列和编码序列。番茄4CL基因家族中4个成员具有5个内含子,Sl4CL02和Sl4CL04分别有6个内含子和11个内含子,且Sl4CL02无3′端UTR。利用MEME网页,采用15个Motif对基因序列进行蛋白质保守基序分析,6个家族成员里Motif的个数为 11-14,且 Sl4CL01、Sl4CL02、Sl4CL03和Sl4CL06的Motif排列顺序较为固定,均为Motif5、7、11、12、3、13、8、10、6、4、1、2, 但 是 在Sl4CL02的3′端具有Motif15,说明其均有高度的保守性。Sl4CL04的5′端具有Motif15基序,3′端缺少了Motif9,在Motif7和Motif3之间缺少了Motif11和Motif12,由Motif14代替了Motif6,在Sl4CL05的Motif7和Motif12之间缺少了Motif11,Motif3和Motif8之间缺少了Motif13,同时和Sl4CL04一样由Motif14代替了Motif6。但是在所有的成员中均发现了AMP-binding enzyme。番茄4CL家族成员中共有5个结构域,其中PLN02246最多,分别存在于Sl4CL01、Sl4CL02、Sl4CL03和Sl4CL06中,但只有Sl4CL02的3′端有2个IBR结构域。Sl4CL04的结构域为AFD-class-I superfamily,Sl4CL05的结构域为4CL。此外,我们发现,4CL基因家族中的结构域成员为单个结构域的占66.7%(4条),通过上述结果,我们猜测番茄4CL基因家族具有较高的胁迫响应机制。
图4 番茄4CL基因家族基因结构、保守结构域分布分析Fig.4 Gene structure and conserved domain analysis of 4CL gene family in tomato
2.6 番茄4CL基因家族成员启动子顺式作用元件分析
获取番茄4CL基因家族成员起始密码子ATG上游2 000 bp序列对启动子转录起始位点进行预测以及对环境胁迫和激素调控的TF结合位点分析,鉴定参与多重胁迫的顺式作用元件,结果(图5)显示4CL家族共检测出19种核心启动子原件,分别为AP2、ARF、BBR-BPC、bHLH、bZIP、C2H2、CPP、Dof、E2F/DP、GATA、HD-ZIP、HSF、MIKC_MADS、MYB、MYB_related、NAC、NF-YB、Trihelix和WRKY,其中MYB的含量最多,共有80个,占所有作用元件的36.1%,接下来分布最多的依次是Dof、MIKC_MADS,分别为49个和20个,HDZIP、HSF、MYB_related和Trihelix次之,数量均为2个。数量最少的为ARF、BBR-BPC、CPP、E2F/DP、GATA和NF-YB,均为1个。对番茄4CL基因家族进行顺式作用元件分析发现4CL基因家族在光照、干旱、防御和应激反应、昼夜节律、厌氧诱导;脱落酸、生长素、赤霉素、茉莉酸;胚乳表达、玉米醇溶蛋白代谢等方面均可以产生响应,6个基因家族成员均可以对光照进行响应,且在Sl4CL03中具有9个光响应的元件,防御和应激反应在Sl4CL01发现,响应水杨酸的元件仅在Sl4CL02中发现,胚乳表达仅在Sl4CL03中发现,昼夜节律控制仅在Sl4CL04中发现,玉米醇溶蛋白代谢仅在Sl4CL05中发现,其他顺式作用元件则会在2个以上基因中发现。
图5 番茄4CL基因家族启动子顺式调控元件类型和数量Fig.5 Type and number of cis-regulatory elements in the promoter of tomato 4CL gene family
2.7 氮素处理下番茄4CL基因的表达量分析
由图6可知,6个4CL基因在不同浓度的氮素处理下均呈现出差异表达,其中Sl4CL01、Sl4CL03、Sl4CL04和Sl4CL05随着氮素浓度的升高而升高,四者均在氮素浓度224 mg/L时表达量最高,到氮素浓度为336 mg/L时显著下降,但与其他3个处理存在明显的差异,说明Sl4CL02基因在氮素浓度过高时能促进其表达,对氮素胁迫具有较强的抵抗能力。Sl4CL06基因在低氮(22.4 mg/L)和高氮(224 mg/L)处理下表达量均显著高于5.6 mg/L、112 mg/L和336 mg/L,说明其基因在受到高、低浓度的氮素胁迫均能够提高表达量。以上分析表明6个番茄4CL基因对苯丙烷生物合成有显著的影响。
图6 番茄4CL基因在不同浓度氮素下的表达模式Fig.6 Expression patterns of tomato 4CL genes under different concentrations of nitrogen
2.8 Sl4CL03蛋白的亚细胞定位分析
以番茄叶片cDNA为模板,扩增得到Sl4CL03的CDs全长1 683 bp(图7-A),将目的基因胶回收后与pCAMBIA1302线性化载体进行连接转化,挑选单克隆菌落利用基因上游引物和载体下游引物进行PCR鉴定,结果符合试验预期,说明载体构建成功。将含有重组载体的农杆菌注射烟草叶片观察亚细胞定位,结果(图8)表明:转入pCAMBIA1302空载的对照组GFP荧光信号在细胞膜和细胞核上均可观察到,pCAMBIA1302-35S-Sl4CL03-GFP融合蛋白可以在过氧化物酶体、细胞膜中进行表达,此外,绿色荧光信号与叶绿体自发产生的红色荧光信号重叠,说明Sl4CL03还可以在叶绿体中进行表达。
图7 Sl4CL03基因的克隆(A)及Sl4CL03基因大肠杆菌菌液PCR(B)Fig.7 Cloning of Sl4CL03 gene(A)and Escherichia coli bacteria liquid PCR of Sl4CL03 gene(B)
图8 Sl4CL03蛋白在烟草叶片细胞的亚细胞定位Fig.8 Subcellular localization of Sl4CL03 in Nicotiana tabacum leaf cells
3 讨论
3.1 番茄4CL基因家族成员的分子特性
随着基因组学的发展,4CL基因家族成员已在毛竹[14]、龙眼[15]、苎麻[16]、柑橘[17]、烟草[18]、梨[19]、苜蓿[20]、陆地棉[21]等作物中有一定的研究,砀山酥梨4CL基因家族被鉴定出29个成员,陆地棉基因组中被鉴定到34个成员,龙眼体胚被鉴定出43个成员,烟草中被鉴定出20个成员,但是在番茄的转录组中仅鉴定出6个4CL基因家族成员,这说明了在不同物种间4CL基因家族数目确实存在较大差异。一个物种中4CL基因家族核酸的分化有效地防止了交叉杂交,特异性表达模式和低信使丰度有效地阻止了基因家族的鉴定,甚至人们几乎知道拟南芥全部基因组序列,但4CL基因家族的真正范围仍未可知[22]。
根据4CL基因家族所编码蛋白的功能可以将其分为两组:Class I和Class II,其中Class I与木质素合成有关,Class II与类黄酮的生物合成有关[23],将番茄的4CL基因家族与拟南芥、水稻的进行进化树构建发现番茄的6个家族成员均在同一大类中,说明其6个成员在番茄的生长发育过程中可能存在功能冗余但并不明晰其所编码蛋白的功能。对蛋白Motif进一步分析表明,所有的成员中都发现了Box I(AMP-binding enzyme结构域),所有已知的4CL氨基酸序列中BoxI(SSGTTGLPKGV)在4CL蛋白质序列中绝对保守,编码AMP-binding enzyme结构域的基序是决定这些蛋白功能的主要结构域,同时Box I作为底物结合区域(SBP)参与了底物的识别[22]。此外,所有成员中也发现了作为酶催化位点的BoxII,多肽序列BoxII(GEICIRG)在所有4CL中绝对保守,其中心的Cys残基被认为直接参与催化,说明4CL家族成员均可以直接参与催化反应。
3.2 番茄4CL基因家族功能的分析
4CL基因在植物的生长发育中起着至关重要的作用,在植物的不同部位以及不同时期具有不同的表达模式。有研究表明boxP(CCTTCACCAACCCCC)、boxA(CCGTTC)、boxL(TCTCACCAACC) 这3个是决定木质部特异性定位表达所必须的调控元件,在对番茄4CL基因家族启动子顺式作用元件分析时发现,Sl4CL02中含有boxL(TCTCACCAACC)的结合位点MYB,Sl4CL03中含有boxA(CCGTTC),而在进化树中发现这两个成员的同源性较近,因此,推测这两个基因可能会在木质部特异性表达。沈晚霞[17]对柑橘的3个4CL家族成员研究发现其均在细胞质中进行表达,灰毡毛忍冬的两个4CL基因分别在内质网和叶绿体类囊体进行表达,马铃薯中的4CL主要分布在叶绿体的类囊体膜上,说明4CL基因在不同植物中可以在不同部位进行表达[24-25]。亚细胞定位预测结果表明,所有番茄4CL家族成员在过氧化物酶体中进行表达,通过烟草瞬时转化对Sl4CL03蛋白进行亚细胞定位验证,发现除了在过氧化物酶体还可以在细胞质和叶绿体中进行表达。过氧化物酶体存在于一切真核细胞内,含有丰富的酶类,可以调节氧浓度、氧化脂肪酸、参与氮物质的代谢,这很好的说明了番茄4CL可以对氮素进行响应,在不同浓度氮素的处理下,4CL基因家族成员表达量均发生明显的差异,同时定位于叶绿体也表明Sl4CL03蛋白在番茄中可以进行光响应,这与启动子顺式作用元件的结果相一致。
番茄4CL基因家族成员具有不同种类和数目的作用元件,从而导致不同成员间功能的差异性和复杂性。该家族可以响应多种植物激素元件、光响应元件,这些对植物的生长发育和生殖发育具有调控作用,汤崴[26]、王星淇[27]、Park 等[28]分别对葡萄、非洲菊、柳树进行研究,结果均表明4CL基因在不同部位具有不同的表达量。此外,番茄4CL基因家族还有较多的防御和应激作用元件,这与植物抵抗非生物胁迫能力有着直接或间接的关系。Muna Alariqi[29]研究发现,Gh4CL3超表达株系对真菌的抗性增强,Sun Shichao的研究发现陆地棉Gh4CL7基因在耐干旱胁迫中起着积极的作用,拟南芥At4CL基因的表达也可被创伤、紫外线、致病菌感染等胁迫所激活[21,30-31]。在本试验中不同浓度氮素处理下4CL家族成员产生了显著的变化表明4CL基因家族可以对氮素胁迫进行响应。
4 结论
从番茄全基因组中共鉴定出6个番茄4CL家族成员,不同成员间具有较高的同源性。在不同浓度氮素处理下,所有成员表达量均具有显著性差异,对Sl4CL03蛋白进行亚细胞定位发现其可以在过氧化物酶体、叶绿体和细胞质中进行表达,4CL基因家族在番茄的生长发育过程中具有重要的作用。