APP下载

基于转录组的漆树MYB转录因子的筛选及分析

2021-01-26谢冬冬王武萍何学高黄晓华

西北林学院学报 2021年1期
关键词:漆树基序拟南芥

谢冬冬,王武萍,何学高,黄晓华*

(1.西北农林科技大学 林学院,陕西 杨陵 712100;2.中华全国供销合作总社 西安生漆涂料研究所,陕西 西安 710000)

转录因子是真核生物细胞内通过与特定基因启动子结合以调控下游基因的表达的一类蛋白[1]。通常含有寡聚化位点(oligomerization site)、转录激活区(activation domain)、DNA结合区(DNA-binding domain)以及核定位信号区(nuclear localization signal)等功能区域[2]。植物中转录因子类型多样,常见的有WRKY类、ERF类、MYB类等,而MYB类转录因子是植物转录因子中数量较多的家族之一,其功能多样[3]。MYB-DNA结合结构域(MYB-binding domain)是一段含有50~53个氨基酸残基的不完全保守肽段[4]。该结构域中分布有3个起疏水核心作用的相对保守的色氨酸残基(彼此间隔18或19个氨基酸残基),维持MYB转录因子的构型[5]。MYB转录因子通常含有1~4个串联的MYB-DNA 结合结构域,依据MYB转录因子含有的结合结构域数目的差异可将其分为4类,R1-MYB、R2R3-MYB、R1R2R3-MYB和R4-MYB[6]。其中R2R3类转录因子中R3结构域的第一个色氨酸残基通常被亮氨酸、异亮氨酸或苯丙氨酸等所取代[7]。在植物中发现的第一个MYB转录因子是玉米穗基因C1编码的参与花青素代谢合成的C-MYB-like[8]。现发现MYB类转录因子对植物的整个生命过程都具有重要的意义,包括形态建成[9]、生长发育[10]、对生物和非生物胁迫的应答[11-12]以及植物初生和次生代谢等[13]。

漆树(Toxicodendronvernicifluum)为漆树科(Anacardiaceae)漆属(Toxicodendron)落叶乔木或小乔木,属亚热带区系,新生代第三纪古老孑遗树种[14],雌雄同株或异株,变异类型多,历经7 000多万a的演化,弥足珍贵[15]。但由于漆树种植的存活率偏低和过度利用,我国目前保存的漆树资源稀少,下降趋势明显,发展前景堪忧[16]。生漆是漆树乳汁道中所分泌的次生代谢产物,是一种优良的天然涂料,生漆的产生和贮存的主要部位是漆树各器官的韧皮部,以主干树皮韧皮部为主要合成部位[17]。M.Zhaoetal[18]用光学显微镜(LM)和透射电子显微镜(TEM)研究了漆树分泌细胞的结构和原始分泌物,发现高尔基体可以产生带有单层膜的分泌颗粒并将其运输到质膜中与细胞膜融合,结合细胞扩散到漆汁道并聚集形成生漆。生漆的主要成分漆酚占生漆含量的40%~80%,属类黄酮类物质[19]。植物中类黄酮类物质是苯丙酸合成途径的一个分支,其合成途径主要受一些酶基因和转录因子的调控,参与植物黄酮类化合物生物合成的转录因子主要有MYB、bHLH和WD40重复蛋白[20]。因此,研究漆树漆酚生物合成路径,筛选并鉴定调控漆酚代谢的转录因子,有利于对漆树的进一步开发和利用。MYB转录因子参与植物次生代谢调控,对漆树MYB转录因子进行研究,有助于了解漆酚这一漆树次生代谢产物的合成及调控机制。

1 材料与方法

1.1 材料

漆树材料采自西北农林科技大学漆树园。漆树MYB转录因子源于实验室已构建的漆树转录组数据库(登录号:PRJNA587830)。从拟南芥信息资源(TAIR)数据库(https://www.arabidopsis.org)下载拟南芥MYB转录因子家族氨基酸序列。

1.2 漆树MYB转录本筛选

高通量测序工作由北京组学生物科技有限公司完成,综合Pacbio SMRT三代技术和IlluminaX Ten二代测序技术的优点获得漆树转录组,经初步筛选获得89条MYB基因序列,氨基酸序列的获取通过基因ID进行搜索,然后在ORF Finder在线软件(https://indra.mullins.microbiol.washington.edu/sms2/orf_find.html)的辅助下分析预测开放阅读框(ORF)并获得具有全长氨基酸序列的漆树MYB转录因子家族蛋白基因序列。最后,将上述含有MYB功能域的序列提交至PlantTFcat(http://plantgrn.noble.org/PlantTFcat/)进行比对分析,进一步验证其是否属于MYB类转录因子[21]。

1.3 漆树MYB转录因子的分类与结构域基序分析

运用在线软件SMART(http://smart.embl.de/)将验证正确的MYB蛋白序列进行批量搜索并分类[22],分类标准为其所含有的DNA-binding domain的数目。利用MEGA 5.1对漆树中的R2R3-MYB类蛋白序列进行比对并保存比对结果。删除不保守区域,利用weblogo(http://weblogo.berkeley.edu/logo.cgi)对R2R3-MYB的DNA domain进行结构域特征分析[23]。

1.4 漆树MYB转录因子保守基序分析

运用The MEME Suite4.12.0(http://meme-suite.org/tools/meme)程序分析漆树MYB家族蛋白的基序[24],基序宽度最小值设定为6、最大值为50,基序数量设为10,其余参数为默认值。

1.5 漆树MYB转录因子蛋白的结构分析

选择具有全长氨基酸序列的漆树 MYB 转录因子家族蛋白,利用在线工具ProtParam(http://web.expasy.org/protparam/)对蛋白进行一级结构和理化性质分析。蛋白二级结构特征采用在线软件SOPMA进行分析(https://npsaprabi.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html)[25]。

1.6 漆树MYB转录因子的GO注释分析

使用WEGO在线注释软件(http://wego.genomics.org.cn/)对筛选获得的漆树MYB 转录因子进行功能注释分析[26]。

1.7 漆树MYB转录因子家族进化分析

为进一步探究漆树MYB转录因子的功能,运用MEGA 5.1软件采用邻近法(Neighbor-Joining)构建包含125个拟南芥MYB转录因子及45个漆树MYB转录因子(其中有3条序列由于同源性相差太大,剔除)的系统进化树。其中Model设置为p-distance,Bootstrap值设为1 000,其他参数为默认值。最后,用在线软件iTOL (https://itol.embl.de/)对构建好的进化树进行优化。

1.8 漆树MYB转录因子表达分析

基于漆树根、茎和叶3个组织的转录组数据,取MYB基因家族各基因FPKM(fragments per kilobase of transcript per million mapped reads)值,采用工具ClustVis(https://biit.cs.ut.ee/clustvis/)对48个MYB转录因子在各组织中的表达量进行分层聚类及表达模式分析[27]。

2 结果与分析

2.1 漆树MYB家族成员的获得

经初步筛选,从漆树转录组数据库中获得89条MYB基因序列,片段大小在555~5 226 bp。通过ORF预测全长氨基酸序列,具有完整ORF的序列有48条,序列平均长度为1 344 bp。其中,最长的序列由5 226个碱基组成(PB_c0_g11314),共编码1 742个氨基酸;最短的序列含555个碱基(PB_c0_g2870),编码185个氨基酸。

2.2 漆树MYB蛋白序列的分类与结构域特征分析

对获得的48条漆树MYB蛋白序列运用SMART进行批量搜索,将不含或含有不完整 MYB-DNA binding结构域的序列以及冗余转录本序列舍去,分类依据为其所含有的DNA binding domain的数目。分别得到1条R3-MYB 序列,21条R2R3-MYB序列和26条R1-MYB序列。R2和R3是MYB识别DNA序列所必需的,氨基酸出现频率越大在图中对应位点的字母长度越高,表明氨基酸残基越保守[1]。利用weblogo在线分析软件对漆树中的R2R3-MYB类转录因子的DNA结合结构域进行特征分析(图1),结果表明,在长度约为51个氨基酸残基的R2结构域中含有3个高度保守的色氨酸残基(分别位于第4位、24位和44位),且每个色氨酸残基有18~19个氨基酸相间隔。总体来看,漆树MYB的R2R3结构域序列同已鉴定出的拟南芥、玉米和森林草莓等的序列高度相似,均具有特征性的氨基酸,R2和 R3结构域中存在大量保守氨基酸残基,这些保守氨基酸残基可能在构成MYB蛋白螺旋-转角-螺旋(HTH)结构以及特异的DNA结合位点方面起着重要作用。

图1 漆树R2R3-MYB转录因子高度保守的DNA binding结构域Fig.1 Highly conserved DNA binding domain of T.vernicifluum R2R3-MYB transcription factors

2.3 漆树MYB转录因子基序分析

通过MEME软件分析了48个漆树MYB转录因子的10个基序(图2),结果表明,除PB_c0_g15467和PB_c0_g9179外,其他均具有基序1,具有基序2的有47个MYB蛋白。从漆树MYB转录因子各自的基序及进化关系来看,同一进化分支的漆树MYB蛋白保守基序种类相同或相近且位置大体一致,而不同进化分支中的漆树MYB蛋白的保守基序和位置的差异则较大,同一进化分支的转录因子其功能可能相似。

图2 漆树MYB转录因子基序分析Fig.2 Motifs analysis of T.vernicifluum MYB tanscription factors

2.4 漆树MYB家族蛋白理化性质分析

ProtParam和SOPMA对漆树MYB家族蛋白的理化性质分析结果(表1)表明,漆树MYB家族蛋白平均氨基酸数目为447,最长的是PB_c0_g11314编码蛋白,由1 741个氨基酸组成,最短的由184个氨基酸组成,即PB_c0_g4405编码蛋白。48个漆树MYB家族蛋白的平均相对分子质量为49 546.39。平均等电点(PI)为7.76,最大值为PB_c0_g4315编码蛋白的10.05,最小值为PB_c0_g12918编码蛋白的4.5,其中14个MYB家族蛋白平均等电点<7,偏酸性,剩余的34个等电点>7,偏碱性,说明漆树MYB家族蛋白整体表现为偏碱性。漆树MYB家族蛋白中,有44个蛋白为疏水性蛋白,平均疏水性值<-0.5,仅PB_c0_g8053、PB_c0_g7850、PB_c0_g2492和PB_c0_g4251编码的蛋白>-0.5,具有一定的亲水性。通过SOPMA对漆树48个MYB家族蛋白进行二级结构预测,结果表明,在这48个MYB家族蛋白中,除PB_c0_g15467编码蛋白外,其余47个均表现为无规则卷曲含量最高,其次是α螺旋和延伸链,β转角的含量最低,故无规则卷曲和α螺旋是漆树MYB家族蛋白二级结构的主要成分。

表1 漆树MYB家族蛋白理化性质Table 1 Physicochemical properties of T.vernicifluum MYB family proteins

2.5 漆树MYB转录因子的GO注释分析

GO注释分析表明(图3),漆树48条MYB转录因子序列富集为27个功能类别,分别有27、37条和29条注释到细胞组分、分子功能和生物过程。细胞组分中,细胞部分(26个)、细胞(26个)和细胞器(26个)包含的序列较多,含蛋白质复合物(5个)和细胞器部分(4个)所含序列较少,膜部分、膜和膜封闭腔均只含有1个序列。分子功能中,具有结合活性的序列最多,为37个,其次为含12个序列的转录调节活性功能类别,而催化活性所含序列最少,仅有2个。生物过程中,代谢过程(27个)、生物调节过程(22个)、细胞过程(29个)、生物调节(22个)、刺激反应(11个)功能组中所含序列较多,细胞成分组织或生物发生(7个)、生物过程的正调节(4个)、免疫系统过程(2个)、信号(2个)、发育过程(2个)、生殖过程(2个)、再生产(2个)、多细胞生物过程(2个)、生物过程的负调节(4个)、节律过程(4个)、多细胞生物过程(2个)功能组中所含序列较少。从注释结果来看,细胞部分在细胞组分中表现为主要富集,分子功能集中富集在结合活性上,生物过程主要富集在细胞过程。漆树MYB转录因子发挥相应调控功能的方式是同 DNA 区域相结合,参与植物的细胞过程、代谢过程和生物调节等过程。

图3 漆树MYB转录因子功能注释Fig.3 Function annotation of T.vernicifluum MYB tanscription factors

2.6 漆树MYB转录因子的聚类分析

根据预测到的漆树MYB蛋白和125个拟南芥MYB各亚家族蛋白质保守结构域氨基酸序列的相似性,系统发育树利用MEGA 5.1采用Neighbor-Joining法进行构建。参考拟南芥MYB家族转录因子的亚家族分类方法[28],将漆树MYB蛋白序列分为8个亚家族。由图4可以看出,漆树和拟南芥的部分MYB蛋白聚在同一亚组,高度同源。漆树MYB家族蛋白中多数与拟南芥的MYB蛋白聚集在不同亚组,说明漆树MYB家族蛋白与拟南芥MYB蛋白均具有较高的保守性。模式植物拟南芥R2R3-MYB家族蛋白中第S4、S5、S7亚族参与调控拟南芥的次生代谢产物生物合成过程,故与S4、S5、S7同一亚组的PB_c0_g6437、PB_c0_g6508和PB_c0_g7378、PB_c0_g4405、PB_c0_g12918和PB_c0_g13021编码的漆树MYB蛋白也可能参与调控漆树的次生代谢过程。此外,有28个漆树MYB转录因子单独聚为1族,可能是在进化过程及环境选择过程中产生了在序列上与拟南芥有较大差异的MYB转录因子,这些转录因子可能参与漆树种某些特有的生物学过程的调控。漆酚是一种具有15~17个碳原子的不同饱和度长侧链的单元酚、邻苯二酚和间苯二酚的混合物,是儿茶酚的衍生物,可能通过简单苯丙烷类化合物与长链脂肪酸反应得到[29]。拟南芥MYB家族蛋白中,AtMYB30、AtMYB60和AtMYB96在响应非生物胁迫中起着一定作用,且AtMYB30可通过调节长链脂肪酸的合成来响应病原体的侵袭[28],故同AtMYB30聚在同一亚组的漆树MYB蛋白PB_c0_g6010、PB_c0_1517和PB_c0_g4337可能通过调节长链脂肪酸的合成进一步促进漆酚的形成。拟南芥MYB蛋白AtMYB11、AtMYB12和AtMYB111可调控类黄酮类物质的生物合成[30],故同这些蛋白处于同一分支的漆树MYB蛋白PB_c0_g4405、PB_c0_g12918和PB_c0_g13021可能在黄酮类物质漆酚的生物合成中发挥重要调控作用。

注:At代表拟南芥基因,PB代表漆树基因。图4 漆树与拟南芥MYB家族蛋白聚类分析Fig.4 Cluster analysis of MYB protein from T.vernicifluum and Arabidopsis thaliana

2.7 漆树MYB转录因子基因表达分析

基于漆树转录组数据我们获得了漆树MYB转录因子在根、茎、叶各个组织中的基因表达量,以进一步了解漆树MYB转录因子的生物学功能,应用ClustVis在线软件对漆树MYB转录因子在不同组织中的表达进行了聚类分析并绘制热图(图5)。有11个MYB在叶片组织中的表达量较高,如PB_c0_g13130(28.27)、PB_c0_g6062(139.71)、PB_c0_g6437(64.15)、PB_c0_g6508(13.12)、PB_c0_g6908(51.43)、PB_c0_g7378(22.35)等;21个在茎中的表达量较高,其中表达量>10的有15个,PB_c0_g16578和PB_c0_g17062基因的表达量分别高达117.81和158.41,且PB_c0_g17062在3个组织中表达量都比较高,在茎中的表达量是所测基因中表达量最高的;16个MYB转录因子在根中表达上调,其中除PB_c0_g4481外各基因表达量均>10,而且基因PB_c0_g1517、PB_c0_g4337和PB_c0_g4437表达量分别高达95.53、151.03和93.88。以上不同MYB基因在不同组织中的差异表达情况表明MYB转录因子可能参与调控漆树各个组织的发育。

注:R.根;S.茎;L.叶。图5 漆树不同组织中MYB基因的表达谱Fig.5 Expression profiles of MYB genes between different tissues in T.vernicifluum

3 结论与讨论

MYB转录因子是植物中最大的转录因子家族之一,在植物生长发育、次生代谢调控、胁迫应答等生命活动中起着调控作用[5]。拟南芥[31]、水稻[32]、玉米[33]、草莓[34]和桃[35]等植物中均已鉴定出MYB蛋白,且在基因组水平上对MYB家族基因进行了深入分析。

目前,转录组测序已成为研究植物形成与发育的分子机制的一种重要方法。姜福星等[36]应用高通量测序技术对泸定百合的鳞茎进行了转录组分析,共获得43 412条Unigene,为探究泸定百合鳞茎形成和发育的分子机制、药用成分以及百合的分子育种和研究开发提供了参考和依据。为培育品质优良的花椒无刺品种,筛选控制皮刺分化的关键基因,蒋弘刚等[37]基于二代高通量测序对花椒皮刺起始分化的茎尖节点组织进行转录组测序,最终获得45 057条转录本序列,为寻找花椒皮刺分化的关键基因提供了丰富、可靠的基础信息。本研究通过对漆树转录组进行搜索,最终筛选鉴定出48个MYB转录因子,氨基酸数目为184~1 741,可能与可变剪切导致的不同基因编码区和非编码区在基因全长的比例呈现多态性有关[38]。对漆树R2R3-MYB类转录因子的保守结构域分析表明其含有MYB家族典型的DNA-binding domain,包含102个左右的氨基酸残基,与银杏[1]R2R3结构域氨基酸残基数目一致,而森林草莓的R2R3结构域包含107个左右的氨基酸残基[34],大豆则包含104个左右的氨基酸残基[5]。二级结构预测表明,无规则卷曲和α螺旋构成了漆树MYB家族蛋白二级结构的主要成分。系统进化分析结果显示,预测得到的漆树48个MYB转录因子和拟南芥MYB转录因子被分为15个亚家族,漆树28个MYB蛋白序列没有与拟南芥的任何MYB亚家族聚到一起,这可能是漆树进化过程中产生的调控其特有生物过程的转录因子。郭亚飞等[39]发现CsMYB123参与调控茶树花青素的合成,该基因在各组织中均表达,且在新梢中高水平最高。田爱梅等[40]克隆了白芨MYB类转录因子PAP1基因并就该基因在白芨不同组织中的表达特征进行了分析,结果表明,基因BsPAP1在花中表达量较高,在块根状假鳞茎和嫩萌果中的表达较弱。李志根等[41]利用RACE技术从葡萄风信子花瓣中克隆了MYB转录因子基因MaMYB2并分析了其在不同组织部位中的表达模式,研究发现,MaMYB2可能参与葡萄风信子花青素积累的转录调控,且该基因在花中的表达高于根、茎和叶。月季‘红胜利’花青素苷相关R2R3-MYB蛋白基因RhMYBs4-1和RhMYBs6-1在花瓣中高水平表达,在叶片和花药中表达水平均较低[42]。对漆树不同组织MYB的表达模式进行分析表明,漆树MYB基因在各组织中均有表达且具有明显的组织特异性,也有几个基因在3种组织中表达水平相近,表明大部分漆树MYB基因在特定组织中才会发挥作用,而有些基因在所有组织中均能发挥作用。

本研究在漆树根、茎和叶转录组数据的基础上,筛选鉴定得到48个MYB转录因子,对漆树MYB转录因子家族的理化性质、蛋白功能结构域、系统进化关系以及不同组织的表达模式进行分析,初步鉴定了漆树MYB转录因子家族。分析结果表明,漆树MYB转录因子家族蛋白保守,R2R3-MYB类蛋白高度保守,且MYB转录因子在漆树不同组织中表达模式各异。漆树7 000万a的生活史使其在生命进化过程中具有独特的历史地位,所产的生漆为自然界唯一的天然高分子涂料,环保,无污染。本研究为进一步探讨漆树MYB转录因子的生物学功能奠定了基础。

猜你喜欢

漆树基序拟南芥
漆树
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
福贡县漆树产业发展问题和对策
鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
富天冬酰胺蛋白增强拟南芥辐射抗性的研究
悲伤的事(外一首)
漆树的眼泪
两种LED光源作为拟南芥生长光源的应用探究