陆地棉转录因子WRKY29的鉴定及表达分析
2023-12-14刘文豪余渝王旭文田琴吴珂马麒赵福相孔宪辉
刘文豪 余渝 王旭文 田琴 吴珂 马麒 赵福相 孔宪辉
摘要
[目的]揭示WRKY29基因表達机理,为分子辅助育种创新种质提供基因资源。[方法]以WRKY家族成员中的WRKY29为目标,通过生物信息学方法分析陆地棉WRKY29转录因子的理化性质、系统进化关系、亚细胞定位建模和染色体分布定位、基因的组织特异性表达。[结果]生物信息学分析表明,陆地棉WRKY29转录因子含有279个氨基酸残基,理论等电点为6.08,具有典型的WRKY保守结构域,属于不稳定蛋白。蛋白质二级结构以α螺旋和无规卷曲为主。系统进化关系分析得知WRKY29与同为锦葵目的物种聚类在同一进化分支,亚细胞定位预测WRKY29转录因子分布在细胞核,而染色体定位发现WRKY29转录因子分布在A02染色体40~48 Mb区域内。WRKY29转录因子具有正调控功能,组织表达模式发现在根部具有显著性表达。[结论]陆地棉转录因子WRKY29的鉴定及表达分析为棉花生长发育过程中的抗逆研究提供了重要线索。
关键词 WRKY29;转录因子;生物信息学;育种
中图分类号 S 562 文献标识码 A 文章编号 0517-6611(2023)23-0085-05
doi:10.3969/j.issn.0517-6611.2023.23.020
Identification and Expression Analysis of Transcription Factor WRKY29 in Gossypium hirsutum L.
LIU Wen-hao, YU Yu, WANG Xu-wen et al
(Cotton Research Institute, Xinjiang Academy of Agricultural and Reclamation Science/Northwest Inland Region Key Laboratory of Cotton Biology and Genetic Breeding, Ministry of Agriculture and Rural Affairs/State Key Laboratory of Cotton Biology, Shihezi, Xinjiang 832000)
Abstract [Objective]In the early stage, our research team identified a WRKY29 gene in upland cotton, and revealed the mechanism of gene expression through analysis, hoping to provide genetic resources for molecular-assisted breeding innovative germplasm.[Method]This study targeted WRKY29, a member of the WRKY family, and analyzed the physicochemical properties, phylogenetic relationships, subcellular location modeling and chromosome distribution location, and tissue specific expression of WRKY29 transcription factors in Gossypium hirsutum L. by bioinformatics methods.[Result]Bioinformatics analysis showed that the upland cotton WRKY29 transcription factor contains 279 amino acid residues, the theoretical isoelectric point is 6.08, and has a typical WRKY conserved domain, which is an unstable protein. The secondary structure of WRKY29 was mainly α-helix and random coil. Phylogenetic analysis showed that WRKY29 and mallow species clustered in the same evolutionary branch. Subcellular localization predicted that WRKY29 was located in the nucleus, chromosome mapping showed that WRKY29 transcription factor was distributed in the 40-48 mb region of A02 chromosome. WRKY29 transcription factor has a positive regulatory function, and the tissue expression pattern was found to be significantly expressed in the roots.[Conclusion]Identification and expression analysis of transcription factor WRKY29 in upland cotton provide important clues for the study of resistance to stress during the growth and development of cotton.
Key words WRKY29;Transcription factor;Bioinformatics;Breeding
基金项目 国家重点研发计划项目“西北内陆优质机采棉新品种培育-机采优异育种资源的创制”(2017YFD0101601);兵团重点领域创新团队建设计划项目“机采棉遗传育种与高效栽培创新团队”(2017CB011);棉花生物学国家重点实验室开放课题“缩节胺拌种对棉花生长发育转录组分析”(CB2022A27)。
作者简介 刘文豪(1992—),男,安徽界首人,助理研究员,硕士,从事棉花育种研究。
*通信作者,研究员,从事棉花育种研究。
收稿日期 2022-07-15
WRKY基因家族是含有WRKY保守结构域的转录因子家族,其广泛存在于植物体中,并且在植物生长发育、逆境胁迫应答和代谢调控等一系列生理生化过程中发挥重要作用[1]。基于全基因组的WRKY基因家族结构和功能分析在许多已测序的物种中得到了广泛应用[2]。目前已完成拟南芥[3]、水稻[4]、萝卜[5]、小麦[6]和毛果杨[7]等多个物种的WRKY基因家族分析。棉花是我国重要的经济作物之一,我国是世界上最大的棉花生产国和消费国,总产和单产均居世界首位[8],2020年全国棉花播种面积为316.99万hm2。因此,保持我国棉花产业的健康稳定发展,对于促进农业增效,农民增收及农村经济稳定具有重要意义。但是,近年来棉花病害较为严重,危害日益增加,而且缺少抗逆的高产优质棉花主推品种。因此,对抗病、抗逆优良品种的研究至关重要。优质棉的培育是解决问题的根本途径,分析关键基因的调控网络、差异表达及理化性状具有重要意义。
有研究表明,WRKY转录因子家族成员不仅在植物的生物胁迫和非生物胁迫中起重要作用,还参与碳水化合物的合成、次生代谢产物的合成、植株的衰老和发育[9]。WRKY蛋白能与目标基因启动子中的W-box(TGACC(A/T))结合,激活或抑制下游基因的表达,调节其应激反应。此外,WRKY蛋白可以与其他转录因子相互作用,调节植物的防御反应[10]。Chen等[11]的研究表明,拟南芥Ⅲ类WRKY转录因子WRKY46、WRKY54和WRKY70都参与植物甾体激素(BR)调控植物生长和干旱反应。Duan等[12]研究发现,毛白杨PtrWRKY73在植物对生物营养型病原菌的抗性中起著积极作用,但在对坏死营养型病原菌的抗性中起着消极作用。目前很多研究都集中在WRKY基因的功能鉴定上,但是对WRKY基因生物学许多领域的认识有限。如棉花中WRKY基因的系统发育特征、整体表达模式、调控表达的分子机制和途径等都没有得到很好的描述[13]。
迄今为止,很多陆地棉WRKY家族的成员被分析研究,但是陆地棉WRKY29转录因子尚未被综合分析,其在陆地棉对生物和非生物胁迫的反应过程中发挥着的作用尚未得知,其涉及的调控网络及差异表达尚不清楚。笔者以陆地棉标准系TM-1基因组数据库[14]和转录组数据库PRJNA248163进行WRKY29转录因子的序列获取及差异表达分析,使用多类型生物信息学工具进行理化性质、亚细胞定位、调控网络等相关的分析,以期为基因功能研究及生物技术培育优质棉花新品种奠定理论基础。
1 材料与方法
1.1 GhWRKY29蛋白理化性质分析
以拟南芥AtWRKY29(AT4G23550)为探针,从陆地棉标准系TM-1基因组数据库获取GhWRKY29基因的cds和蛋白序列,在NCBI网站(https:∥www.ncbi.nlm.nih.gov/)进行比对,SMART网站(http:∥smart.embl.de/)进行结构域的预测分析。使用ProtParam网站(https:∥web.expasy.org/protparam/)分析氨基酸数、分子量、理论等电点、带正负电荷的氨基酸残基、分子式、总原子数、不稳定系数、脂肪指数、亲疏水性等。
1.2 GhWRKY29蛋白的结构、系统进化关系和序列比对分析
SOPMA网站(https:∥npsa-prabi.ibcp.fr/)输入氨基酸序列分析GhWRKY29蛋白的二级结构,包括α螺旋、β转角、延伸链和无规卷曲。在线网站SWISS-MODEL(https:∥swissmodel.expasy.org/)分析GhWRKY29蛋白的三级结构。NCBI获取不同物种的WRKY29蛋白序列和登录号,使用MEGA 7.0软件进行系统进化关系分析,用EvolView(http:∥evolgenius.info/)进行系统发育树的编辑。
1.3 GhWRKY29蛋白亚细胞定位和染色体图谱绘制
在线网站Predict Protein(https:∥www.predictprotein.org)进行GhWRKY29蛋白的亚细胞定位分析。从陆地棉标准系TM-1基因组数据库获取GhWRKY29的基因信息,使用在线网站MG2C(http:∥mg2c.iask.in/mg2c_v2.1/)进行染色体定位的图谱绘制,chromosome,chromosome id,gene lines,gene id等指标仅变动字体格式,其他均为默认参数。
1.4 GhWRKY29基因的表达模式分析
从NCBI网站下载陆地棉TM-1标准系转录组数据包(PRJNA248163),结合
陆地棉转录组数据库,对数据进行矩阵转换,获取GhWRKY29
基因在不同组织表达的FPKM值,进一步分析
GhWRKY29基因
的特异表达情况。使用TB-Tools软件的Super HeatMap
Browser功能进行绘制基因差异表达热图,Adobe Illustrator 2019软件对图片进行完善。
2 结果与分析
2.1 GhWRKY29蛋白理化性质
以拟南芥AtWRKY29(AT4G23550)为探针,在陆地棉TM-1标准系基因组数据库中搜索得到相对应的Gh_A04G1042的蛋白序列和CDS序列。SMART网站结构分析该序列含有分布在第133~193氨基酸区域的WRKY结构域(圖1),该结构域是一个含有60个氨基酸的区域,由一个保守的氨基酸序列WRKYGQK在其N端定义,并带有一个新颖的锌指状基序[15]。根据基因组数据库注释信息和NCBI的Blast比对数据确定为GhWRKY29。ProtParam分析结果表明,氨基酸数为279个,分子量为31 899.58,理论等电点为6.08,带负电荷的氨基酸残基(Asp+Glu)有41个,带正电荷的氨基酸残基(Arg+Lys)有36个。分子式为:C1413H2168N398O434S7,总原子数是4 420,不稳定系数为51.41,是不稳定蛋白。脂肪指数是60.07,亲水性的平均值(GRAVY)是-0.814。
2.2 GhWRKY29蛋白的二级结构和三级结构
SOPMA分析发现(图2),GhWRKY29的蛋白质序列含有279个氨基酸,而在这些氨基酸的分布排列中α螺旋68个,占比为24.37%;β转角15个,占比为5.38%;延伸链27个,占比为9.68%;无规卷曲169个,占比为60.57%。基于结构基因组学,把WRKY29的蛋白序列输入在线网站SWISS-MODEL,通过搜索序列结构模型相同的模板建立骨架,优化模型,得到该蛋白的三级结构的Cartoon模型,而这个模型的氨基酸排列顺序与二级结构预测基本相符,进一步验证了WRKY29蛋白结构的准确性(图3)。
2.3 GhWRKY29蛋白进化关系及序列结构
从NCBI网站获取不同物种WRKY29蛋白的氨基酸序列和登录号,分别是甘草GgWRKY29(QFI57424.1)、拟南芥AtWRKY29(OAO99222.1)、岷江百合LrWRKY29(QRX38926.1)、核桃JrWRKY29(ALU11217.1)、芜青BrWRKY29(AHB33835.1)、麻风树JcWRKY29(AGQ04217.1)、烟草NaWRKY29(OIT33212.1)、甜樱桃PaWRKY29(XP_021820806.1)、木槿HsWRKY29(XP_039015885.1)、榴莲DzWRKY29(XP_022737617.1)和梨PuWRKY29(KAB2632799.1)。通过系统
发育进化树对陆地棉WRKY29蛋白进行聚类分析(图4),结果显示,该聚类分析分为Group A和Group B两部分,Group A包括陆地棉GhWRKY29、木槿HsWRKY29和榴莲DzWRKY29 3个物种,Group B包括甘草GgWRKY29、拟南芥AtWRKY29、岷江百合LrWRKY29、核桃JrWRKY29、芜青BrWRKY29、麻风树JcWRKY29、烟草NaWRKY29、甜樱桃PaWRKY29和梨PuWRKY29 5个物种。
通过DNAMAN软件对不同物种的蛋白序列进行比对分析,结果表明,陆地棉WRKY29与同属锦葵科的木槿序列一致性最高,为65.56%;与锦葵目木棉科的榴莲序列一致性次之,为58.18%;与大戟科的麻风树序列一致性最低,为15.12%。结构域分析结果显示,在N端含有WRKYGQK七肽段序列的结构域,而在C端含有1个C2H2类型的锌指结构
2.4 GhWRKY29蛋白的亚细胞和染色体定位
亚细胞定位是研究基因功能的一种重要技术手段。为准确了解GhWRKY29蛋白在表达调控中所具有的功能,该研究使用GhWRKY29蛋白的氨基酸序列,在网站Plant-mPLoc进行亚细胞定位预测,结果表明,该蛋白定位在细胞核。PredictProtein网站预测结果同样表明该蛋白定位在细胞核中(图6A)。从基因组数据库查询到该基因位于A02染色体上,依据该基因的序列起始位置和终止位置信息,用MG2C网站预测在染色体上的具体分布情况(图6B)。这将有助于了解GhWRKY29基因在染色体上的位置和所具有生理功能之间的关系。
2.5 GhWRKY29基因的表达模式
利用陆地棉转录组数据库PRJNA248163对GhWRKY29基因进行表达模式分析(图7),转录组检测组织分别为根、茎、叶。根据FPKM值分析GhWRKY29基因的表达模式,图7a为对照植株,图7b是该基因在根、茎、叶中的表达情况。GhWRKY29基因在陆地棉植株的根、茎、叶的表达模式存在显著差异,在根中的表达量最高,其次是叶片,在茎中的表达量相对最低。陆地棉根系具有吸收养分、水分及固定地上部分的功能,而且还具有向土壤输入有机质和感知根部周边环境变化的作用。GhWRKY29基因在根部具有高表达量,推测其可能在根系响应逆境胁迫的调控网络中具有重要功能。
3 讨论
植物在长期进化过程中形成了生长发育和逆境响应的调控网络,转录因子家族在该过程中起到重要作用[16]。WRKY转录因子家族参与干旱、盐渍、高温、冷冻、枯黄萎病和虫害等多种环境胁迫的响应。Gu等[17]研究发现,棉花GhWRKY27通过减少叶绿素含量及提高衰老相关基因的过表达促进了叶片的衰老;Wang等[18]研究表明,棉花GhWRKY33介导植物对干旱胁迫的反应,并参与ABA信号通路;Chu等[19]推测GhWRKY41通过调节活性氧(ROS)清除和抗氧化剂基因的表达来增强植物对逆境的耐受性。陆地棉WRKY家族的部分成员被分析研究,而WRKY29基因的综合研究报道较少。早期的系统发育研究主要基于生物的表型特征,通过表型比较来研究物种之间的进化关系。然而,利用表型特征进行系统发育分析存在很大的局限性。该研究以生物信息学方法从基因组数据库获得GhWRKY29转录因子的cds序列和蛋白序列,经过Blast比对、数据库筛选及SMART网站结构分析确定了基因身份。生物信息学分析结果表明,GhWRKY29的蛋白质序列含有279个氨基酸,属于不稳定蛋白。对该蛋白的二级序列和三级结构预测有助于了解蛋白质的生物功能。从NCBI获取其他11个物种的WRKY蛋白序列及登录号与GhWRKY29蛋白进行聚类分析,得知陆地棉GhWRKY29蛋白与同为锦葵目的木槿HsWRKY29和榴莲DzWRKY29在同一进化分支,而非锦葵目的其余9个物种的WRKY29蛋白聚类在Group B的其他分支。在Group A中发现,陆地棉GhWRKY29蛋白与同为锦葵科的木槿HsWRKY29亲缘关系更近,与木棉科榴莲的亲缘关系相对较远,说明物种的进化具有保守性,这些分析增强了对自然选择在不同物种WRKY29进化过程中所起作用的了解。亚细胞定位预测GhWRKY29定位在细胞核,参与核基因的转录调控。由染色体位置图谱可知,GhWRKY29基因分布在基因组A亚组的第2条染色体的40~48 Mb,有助于了解GhWRKY29基因在染色体上的位置和生理功能之间的关系,也可用于判断其在遗传图谱上的相对距离。GhWRKY29基因的表达模式分析了其在根、茎、叶中的差异表达,结果表现为根部的表达量>叶部的表达量>茎部的表达量。转录因子和植物激素在控制根发育的根基因调控网络方面起着关键的调节作用[20]。GhWRKY29基因在根部大量表达可能涉及蛋白质运动和基因表达调控的机制。前人研究发现,拟南芥细胞核AtWRKY29与AtBAG7相互作用有助于应对胁迫及增加错误折叠蛋白质的积累,最终维持细胞的稳态[21]。WRKY29在小麦中的异位表达导致矮小和抽穗早,增强了对镰刀菌赤霉病的抗病性[22]。该研究结果为进一步GhWRKY29基因克隆提供了必要的条件,为后续研究GhWRKY29基因在生物和非生物胁迫应答过程中的功能奠定了基础。
参考文献
[1] 伍林涛,杜才富,张敏琴,等.WRKY转录因子的结构及其在植物抗逆境胁迫中的功能[J].分子植物育种,2013,11(4):634-638.
[2] 任媛,赵玉洁,张心慧,等.石榴WRKY基因家族全基因组鉴定与表达分析[J].西北植物学报,2020,40(2):218-231.
[3] WANG Q S,WANG M H,ZHANG X Z,et al.WRKY gene family evolution in Arabidopsis thaliana[J].Genetica,2011,139(8):973-983.
[4] RAMAMOORTHY R,JIANG S Y,KUMAR N,et al.A comprehensive transcriptional profiling of the WRKY gene family in rice under various abiotic and phytohormone treatments[J].Plant Cell Physiol,2008,49(6):865-879.
[5] KARANJA B K,FAN L X,XU L,et al.Genome-wide characterization of the WRKY gene family in radish(Raphanus sativus L.)reveals its critical functions under different abiotic stresses[J].Plant Cell Rep,2017,36(11):1757-1773.
[6] GUPTA S,MISHRA V K,KUMARI S,et al.Deciphering genome-wide WRKY gene family of Triticum aestivum L.and their functional role in response to abiotic stress[J].Genes Genomics,2019,41(1):79-94.
[7] HE H S,DONG Q,SHAO Y H,et al.Genome-wide survey and characterization of the WRKY gene family in Populus trichocarpa[J].Plant Cell Rep,2012,31(7):1199-1217.
[8] 喻樹迅.我国棉花生产现状与发展趋势[J].中国工程科学,2013,15(4):9-13.
[9] JIANG J J,MA S H,YE N H,et al.WRKY transcription factors in plant responses to stresses[J].J Integr Plant Biol,2017,59(2):86-101.
[10] 张凡,尹俊龙,郭瑛琪,等.WRKY转录因子的研究进展[J].生物技术通报,2018,34(1):40-48.
[11] CHEN J N,NOLAN T M,YE H X,et al.Arabidopsis WRKY46,WRKY54,and WRKY70 transcription factors are involved in brassinosteroid-regulated plant growth and drought responses[J].Plant Cell,2017,29(6):1425-1439.
[12] DUAN Y J,JIANG Y Z,YE S L,et al.PtrWRKY73,a salicylic acid-inducible poplar WRKY transcription factor,is involved in disease resistance in Arabidopsis thaliana[J].Plant Cell Rep,2015,34(5):831-841.
[13] DOU L L,ZHANG X H,PANG C Y,et al.Genome-wide analysis of the WRKY gene family in cotton[J].Mol Genet Genomics,2014,289(6):1103-1121.
[14] ZHANG T Z,HU Y,JIANG W K,et al.Sequencing of allotetraploid cotton(Gossypium hirsutum L.acc.TM-1)provides a resource for fiber improvement[J].Nat Biotechnol,2015,33(5):531-537.
[15] 田云,卢向阳,彭丽莎,等.植物WRKY转录因子结构特点及其生物学功能[J].遗传,2006,28(12):1607-1612.
[16] 卜华虎,王晓清,任志强,等.植物WRKY转录因子家族基因研究进展[J].山西农业科学,2020,48(7):1158-1163.
[17] GU L J,DOU L L,GUO Y N,et al.The WRKY transcription factor GhWRKY27 coordinates the senescence regulatory pathway in upland cotton(Gossypium hirsutum L.)[J].BMC Plant Biol,2019,19(1):1-14.
[18] WANG N N,XU S W,SUN Y L,et al.The cotton WRKY transcription factor(GhWRKY33)reduces transgenic Arabidopsis resistance to drought stress[J].Sci Rep,2019,9(1):1-13.
[19] CHU X Q,WANG C,CHEN X B,et al.The cotton WRKY gene GhWRKY41 positively regulates salt and drought stress tolerance in transgenic Nicotiana benthamiana[J].PLoS One,2015,10(11):1-21.
[20] PETRICKA J J,WINTER C M,BENFEY P N.Control of Arabidopsis root development[J].Annu Rev Plant Biol,2012,63:563-590.
[21] LI Y R,WILLIAMS B,DICKMAN M.Arabidopsis B-cell lymphoma2(Bcl-2)-associated athanogene 7(BAG7)-mediated heat tolerance requires translocation,sumoylation and binding to WRKY29[J].New Phytol,2017,214(2):695-705.
[22] SAROWAR S,ALAM S T,MAKANDAR R,et al.Targeting the pattern-triggered immunity pathway to enhance resistance to Fusarium graminearum[J].Mol Plant Pathol,2019,20(5):626-640.