茶树CsIQD基因家族的鉴定和表达模式分析
2021-10-14练珊珊张宝会姚新转吕立堂
练珊珊,张宝会,姚新转,吕立堂,※
[1.贵州大学茶学院,贵阳,550025贵州 贵阳550025;2.贵州大学生科科学院学院,农业生物工程研究院山地植物资源与种质创新重点实验室(教育部),贵州 贵阳550025]
IQD家族蛋白质构成了一大类植物特有的钙调素和钙调素类蛋白(CAM/CML),广泛特异性地存在于不同种属的高低等植物当中[1]。在自然界中,植物的生长和发育离不开钙离子(Ca2+)的信号调节,钙离子能够协调促进植物体一系列的生长发育,同时根据外界自然环境的变化进行有助于植物自身的调节反应[2]。CAM/CML能动态调节植物细胞内的钙离子浓度,通过复杂的钙离子依赖和非依赖性的互作方式[3,4],控制了一个广泛的下游靶蛋白的多样生化活动,这些生化活动包括蛋白质-钙信号形成、酶与代谢途径的信号级联反应和能够控制基因表达的核因子等[5],所以IQD家族蛋白是Ca2+信号传导的重要感受器。IQD家族蛋白有一个植物特异性中心结构域(IQ67),由67个氨基酸残基组成,IQ67结构域内含3个基序,分别是1-8-14基序、IQ基序和1-5-10基序,同时这3个基序都有1~3个重复[6]。IQD家族不是单一基因,它是一个多基因家族,组成其家族的成员众多,在多种植物中表达,因此推测IQD基因家族的成员能在植物中发挥广泛的作用。IQD家族最早发现于拟南芥和水稻当中[6],水稻包含29个IQD基因,拟南芥中包含了33个IQD基因,这33个IQD被分为Ⅰ、Ⅱ、II和Ⅳ四个亚家族。IQD1是在拟南芥中发现的第一个IQD家族的基因,IQD1基因主要功能是能够编码CaM结合核蛋白,对硫代葡萄糖苷代谢相关的多个基因的表达都有影响,同时IQD1基因过表达能够使拟南芥的硫代葡萄糖表达量升高并提高防御能力[7]。拟南芥中发现的第二个IQD家族成员IQD22,它的表达受GA的抑制,但却能被DELLA基因诱导表达,证明了IQD22在DELLA基因下游的GA3反应的负反馈调节中发挥作用[8]。将小麦的IQD基因在拟南芥中过表达后,拟南芥的子叶变细长[9],后来在玉米、番茄、二穗短柄草、大豆和杨树等作物中IQD蛋白也有陆续报道。值得注意的是,关于IQD蛋白的克隆和功能研究主要集中在拟南芥和水稻等模式植物中,在茶树中未有报道。
茶树作为我国农业中重要的特色经济作物,其品质的好坏尤为关键。而茶树生长过程中,良好的适生环境就是保证茶叶品质优良的重要因素。在茶树生长发育的整个阶段,难免会遭受到干旱、盐碱及高低温等自然灾害影响,严重影响其产量和品质的形成。IQD蛋白在植物的生长发育中影响重大,但目前的报道中,关于茶树的IQD家族基因的分析和其逆境胁迫下的相关研究较少。因此,本研究基于安徽农业大学Xia等研究人员所测的茶树基因组数据[10,11],结合生物信息学分析方法,明确了茶树IQD基因家族的理化性质等基本特征,同时还分析了其在茶树不同组织和逆境胁迫下的表达模式,为进一步研究茶树的生长发育调控机制奠定了理论基础。
1 材料与方法
1.1 茶树IQD家族基因的筛选
茶树和拟南芥的全基因组数据、DNA、CDS、启动子序列和染色体定位信息等从茶树基因组数据库[10,11](http://tpia.teaplant.org/)和拟南芥基因组数据库[12](https://www.arabidopsis.org/)中下载。首先从茶树蛋白数据库Pfam(http://pfam.xfam.org) 中搜索IQD基因特有的保守结构域模型(PF06203),利用该模型在茶树蛋白数据库中进行BLASTP比对,设定阈值为E<1e-5,获得假设的茶树IQD基因。利用第一次鉴定到假设茶树IQD基因序列重新构建关于茶树的IQD基因的隐马尔可夫模型,进行第二次搜索鉴定获得假设的茶树IQD基因。将第二次获得的茶树假设IQD基因蛋白序列提交至NCBI-CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)、SMART(http://smart.emblheidelberg.de/)以及Pfam(http://pfam.xfam.org/)进行鉴定,确定保守结构域,去掉多余的氨基酸序列,获得最后的茶树IQD基因序列。另外对茶树IQD蛋白的分子大小、等电点、氨基酸长度和染色体位置和不稳定系数等进行确认,通过TBtools和perl脚本进行分析。
1.2 系统进化树、基因结构和蛋白质保守基序分析
为了分析茶树、拟南芥和水稻IQD蛋白序列的差异,通过Muscle软件进行多序列比对分析,同时通过该软件上的功能将比对结果进行邻接法(neighbor joining,NJ)(Boostrap=1000)分析构建序列进化树。茶树IQD蛋白序列通过利用Muscle软件多序列比对分析后,使用MEGA X软件通过最大似然数法(Boostrap=1 000)构建出系统进化树。将CsIQD基因组DNA序列和编码区基因序列上传到TBtools软件,对基因结构进行分析,登录MEME(http://meme-suite.org/)网站进行motif分析,其中motif参数数目设定为15,氨基酸长度设置为6~50 aa。使用TBtools对茶树IQD基因的发育进化树、保守结构域、motif和基因结构进行可视化。
1.3 染色体分布和启动子顺式作用元件分析
通过TBtools软件给出茶树基因组注释信息确定CsIQD基因在染色体上的起始位置,然后将染色体定位利用TBtools工具进行可视化,并通过PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)网站对CsIQD基因上游2000bp基因顺式作用元件进行分析,通过GSDS 2.0(http://gsds.ebi.pku.edu.en)进行可视化。
1.4 表达模式分析
根据鉴定出的茶树CsIQD基因的编号,在TPIA(http://tpia.teaplant.org) 数据库上下载Xia 2017上传的转录组数据[10,11],分别是茶树不同组织(顶芽、嫩叶、成熟叶、老叶、花、茎和根)、盐胁迫及PEG诱导的干旱胁迫后的TPM值,利用TopHat和Cufflinks软件分析将转录组阅读框的全基因组映射,同时算出每一个CsIQD基因的FPKM值,找出差异表达的基因,通过R语言将结果制作成热图。
2 结果与分析
2.1 茶树IQD基因家族成员鉴定及理化性质预测
将基因序列比对搜索后,登录SMART、Pfam和NCBI-CDD站上传比对的候选基因,在线进行保守域的结构验证,最后获得了38个茶树IQD基因序列,并按照基因在染色体上的位置和它们之间的同源性进行命名。对茶树IQD基因编码的蛋白质进行理化性质分析见表1,结果显示,最长的茶树IQD蛋白CsIQD21基因有927个氨基酸残基,最短的CsIQD11氨基酸残基有306个;相对MW为34.3kD(CsIQD11)~101.3kD(CsIQD21)之间;理论PI值为5.58(CsIQD21)~11.35(CsIQD4)范围内,同时发现等电点大于7的CsIQD超过了94%(36个),由此得出CsIQD蛋白大多数含有碱性氨基;CsIQD的不稳定系数在44.93~77.56之间,都属于不稳定蛋白质;脂肪族氨基酸指数反应了蛋白质的热稳定性,该家族的脂肪族氨基酸指数分布在50.11~81.58之间,说明热稳定性差异较大;蛋白质的总平均亲水性得分均小于0,说明CsIQD家族蛋白均为亲水性蛋白质。
表1 茶树CsIQD基因家族基因的特征Table 1 The characteristics of the genes in the CsIQD gene family of Camellia sinensis
续表1
2.2 茶树IQD系统进化、基因结构和保守结构域分析
对鉴定出的38个茶树IQD基因家族成员进行一个分类,并通过比对将34个拟南芥IQD蛋白序列和25个玉米IQD蛋白序列及38个茶树的IQD蛋白序列一起构建进化树。通过进化树可以看出,茶树和拟南芥、玉米的IQD蛋白序列非常相似,同源性高。根据拟南芥和玉米在进化树中同源蛋白的分类,将茶树IQD家族能够分为4个亚家族,分别为Ⅰ、Ⅱ、Ⅲ和Ⅳ(图1)。这些分析结果都表明IQD在物种进化过程中具有高保守性,同时猜测这3个物种在系统进化分析上的相似,使得茶树、玉米和拟南芥的IQD基因在生物学功能上可能也具有一致性。
图1 茶树、玉米和拟南芥IQD基因家族的系统进化树Fig.1 The phylogenetic tree of Camellia sinensis,maize and Arabidopsis IQD gene family
本研究还对茶树IQD家族基因的38个基因的DNA序列和CDS区基因结构进一步分析(图2),通过MEME软件分析茶树CsIQD基因的保守基序,共鉴定出保守基序10个,按1~10依次对这10个保守基序进行命名;观察其保守基序的组成,可以看出在系统进化上显示归于同一亚组的CsIQD基因保守结构域大致相同。保守结构域具有重要的功能,这种同亚组间保守结构域的相似性,可能使得不同茶树CsIQD基因在生物学功能上也具有相似性。在所有38个CsIQD基因中,发现的基序2是最常见的,随后是基序1、基序3和5。除了CsIQD34和CsIQD32两个基因外,在其他CsIQD基因中都有出现保守基序2,表明它可能承担着重要且相似的功能。除了基序2,还检测到一些亚家族特异性基序,例如,保守基序8只在亚家族Ⅰ和亚家族Ⅱ中存在;仅在亚家族Ⅰ中同时检测到保守基序2和保守基序3。这些亚家族特异的基序都可能导致IQD基因在茶树中的功能差异。
图2 茶树IQD基因的系统进、保守功能结构域、基本基因结构Fig.2 The systematic progress,conserved functional domains,and basic gene structure of Camellia sinensis IQD gene
2.3 染色体分布和启动子顺式作用元件分析
按照软件给出的茶树基因组染色体信息,对CsIQD基因染色体定位进行分析(图3),结果显示,除了CsIQD1、CsIQD3、CsIQD15、CsIQD25、CsIQD38这5个CsIQD基因定位不到染色体上外,其余的33个CsIQD基因都能不均等地定位到不同的染色体上,其中01号、02号、03号、15号染色体有4个CsIQD基因,相比其他染色体所包含的基因数更多,而06号染色体不含CsIQD基因。此外,茶树不同染色体组中基因的分布同样不均等,12号染色体有3个CsIQD基因,04、05、07、09、14号染色体有2个CsIQD基因,08、10、11、13号染色体只包含了1个CsIQD基因。这些结果都表明CsIQD基因在茶树在进化过程中可能发生了基因的复制或丢失。
图3 茶树CsIQD基因的染色体分布Fig.3 The chromosome distribution of CsIQD gene in Camellia sinensis
对茶树CsIQD基因上游2 000 bp的基因组序列 进行顺式作用元件分析。结果显示(图4),其启动子序列中所包含的顺式作用元件数量和种类众多。有与激素响应调控相关的,如响应脱落酸的ABRE、ABRE2和ABRE4等,响应赤霉素调控的GARE-motif和TATCbox顺式作用元件,响应生长素的元件TGA-element、MeJA有关的元件CGTCA-motif和TGACG-motif以及水杨酸相关元件TCA-element等;还有与光调控和生长发育相关的顺式作用元件,如CAT-box、AT-rich、G-box和MRE等。在CsIQD3、CsIQD38、CsIQD9、CsIQD25和CsIQD28等基因启动子上还发现了CGTCA-motif、WUN-motif、W-box和WRE3这些响应生物胁迫的顺式作用元件,这些元件的富集都与茶树的生物防御相关。IQD基因与植物的非生物胁迫关系更为密切,在对IQD基因启动子顺式作用元件进行分析时,发现大量的与环境相关的响应元件在CsIQD上富集,如响应盐胁迫的MBS,环境胁迫相关的ABRE、MYB、MYC、STRE、TCA和TGACG-motif等。通过对茶树38个CsIQD基因启动子的顺式作用元件分析可以看出,CsIQD在激素调节、光调控和生长发育以及胁迫响应等都有涉及,表明CsIQD基因家族参与了茶树的整个生长发育和逆境胁迫响应过程。
图4 CsIQD基因中的顺式作用元件分析Fig.4 The analysis of cis-acting elements of CsIQD gene
2.4 CsIQD基因在茶树中的不同组织表达分析
为了分析CsIQD基因在茶树不同部位的表达量,进一步明确CsIQD在茶树中的表达模式。本研究从茶树TPIA数据库中下载了38个CsIQD基因在茶树8个不同组织(顶芽、嫩叶、成熟叶、老叶、根、茎、花和果)的转录组TPM表达量数据,通过分析显示(图5),CsIQD在茶树不同组织中具有表达特异性,如在顶芽中,有一半以上的CsIQD基因表达量都较高,CsIQD5、CsIQD31和CsIQD38的表达水平最高,CsIQD4和CsIQD35几乎不表达;CsIQD24、CsIQD28只在嫩叶中表达量高,CsIQD1、CsIQD2、CsIQD6、CsIQD9、CsIQD14和CsIQD30也有表达,在其余组织中表达量低甚至几乎不表达;在根中,只有CsIQD33表达量高,其余CsIQD基因表达水平都较低;在茎中,CsIQD11、CslQD12、CsIQD22、CslQD25、CsIQD32、CslQD36和CsIQD37的表达量高;在花中CsIQD4、CsIQD9、CslQD13、CsIQD3、CsIQD15、CsIQD30、CslQD29和CsIQD34的表达量高;在老叶中,只有CsIQD4、CsIQD5的表达量高;在果实中除了CsIQD19,其余表达量都很低;在成熟叶中CsIQD7表达量高,其余几乎不表达。以上结果表明,不同CsIQD基因可能参与茶树的不同生长发育过程。
图5 不同组织中茶树CsIQD基因表达形式Fig.5 Tea plant CsIQD gene expression patterns in different tissues of Camellia sinensis
2.5 CsIQD基因在干旱胁迫和盐胁迫下的表达模式
对CsIQD基因在干旱胁迫处理(0 h、24 h、48 h和72 h)、盐胁迫处理(0 h、24 h、48 h和72 h)后的表达数据进行分析(图6)。结果显示,在干旱胁迫下,与其他基因的表达水平相比,CsIQD3、CsIQD4、CsIQD15、CsIQD36和CsIQD37的表达量较高;CsIQD17、CsIQD1、CsIQD2、CsIQD33、CsIQD35、CsIQD13、CslQD31、CsIQD5和CsIQD38等基因的表达量在干旱胁迫下被抑制,其中CsIQD36、CsIQD37基因在48 h时上调表达,CsIQD21在72 h时基因略呈上调表达,CslQD3、CslQD15在干旱胁迫下呈下调表达趋势,CsIQD1、CsIQD2、CsIQD4和CsIQD33等基因不受干旱胁迫处理的调控。在盐胁迫下,与其他基因的表达水平相比,CslQD4、CsIQD3、CslQD15、CslQD36和CslQD37的表达量较高,CslQD19的表达量在盐处理24h时被显著诱导上调,而在48 h时下调,总体基本呈先升高后降低的趋势,CslQD36、CslQD37的表达量也在盐处理24 h有略微上调,而72 h后恢复,CslQD2、CslQD4、CslQD33和CslQD35等基因不受盐胁迫处理的调控。
图6 不同胁迫下茶树CsIQD基因表达形式(a.干旱胁迫;b.盐胁迫)Fig.6 CsIQD gene expression under different stresses of Camellia sinensis(a.drought stress;b.salt stress)
3 讨论
基因家族已在多个物种中被鉴定,其中玉米IQD基因家族含有26个成员[13],番茄IQD基因家族含有33个成员[14],大豆IQD基因家族含有67个成员[15],杨树IQD基因家族含有67个成员[16],二穗短柄草IQD基因家族含有12个成员[17]。随着各物种全基因组的公布,对IQD基因家族的研究也越来越深入。本研究在全基因组水平上共鉴定到茶树CsIQD基因38个。CsIQD基因等电点范围为5.58~11.35,大于94%的茶树CsIQD蛋白都是碱性,猜测其会在碱性亚细胞环境发挥其功能,和玉米CsIQD成员的蛋白性质大体相似[13]。系统进化分析将38个茶树IQD基因分成了4个亚家族,其中Ⅰ、Ⅱ亚家族分别包含13个IQD成员,Ⅲ、Ⅳ亚家族分别包含6个IQD成员,符合植物中CsIQD基因在不同亚家族的分布特征。在对茶树IQD基序分析时,其中每个基因结构中包含不同种类的基序,最多的包含10个基序,最少的则仅含有3个基序,从进化的角度上可以看出,进化关系较近的CsIQD基因无论从基序的种类还是长度都较为相似,这可能是这些基因在不同的组织中发挥作用并经过长期的进化和功能的选择造成的,形成各自不同的基序。一些结构较短的基因,如CsIQD8所含较少数量的基序,若在以后的功能研究中发现具有钙信号传导的相关作用,那么这个基因所含有的基序可能就是发挥其作用的必要基序。
IQD蛋白是钙离子信号传导的下游靶点,在植物对环境信号的响应中起着重要作用。因此,近年来对植物IQD基因家族的研究逐渐增多,发现IQD基因参与到植物生长发育的整个过程以及对胁迫响应的基础防御反应中,并且少数IQD的功能也得到初步验证[18]。例如:AtIQD1影响了芥子油苷代谢相关基因的表达,抑制拟南芥中芥子油苷的产生,同时刺激拟南芥的防御机制[19]。IQD22参与了GA响应下游RGA功能的负反馈调节[20]。番茄IQD12的过表达,导致了其形态的变更,影响了子叶、叶、花等器官和叶脉的形状[21]。本实验发现在茶树老叶中CsIQD35基因表达量高,根部CsIQD33基因表达高,嫩叶中CsIQD24和CsIQD28基因表达高,说明CsIQD基因在茶树的不同组织表达具有特异性,不同组织中有不同CsIQD基因发挥功能。非生物逆境表达模式分析发现,茶树CsIQD基因还参与干旱和盐胁迫等。不同胁迫下CsIQD4基因的表达量都是最高的,其次是CsIQD3、CsIQD13、CsIQD36和CsIQD37,这些基因的启动子上也富集了许多环境胁迫相关的顺式作用元件。这些转录组数据结果都表明茶树的CsIQD基因有与其它物种中IQD相似的功能,响应非生物逆境胁迫和植物防御反应,广泛的参与到茶树的整个生长发育过程中。
茶树作为我国特色农业的重要经济作物,一旦遭遇干旱、土壤盐碱化等自然灾害和环境胁迫都会影响其生长发育,导致其产量和品质的下降,造成经济损失[22]。本研究通过对茶树CsIQD基因家族鉴定和表达模式分析,发现CsIQD基因是影响茶树生长发育和响应多种激素调节的关键因素,也参与了茶树响应不同胁迫的过程。填补了在木本植物中的研究缺失,为进一步深入了解CsIQD基因参与茶树生长发育和品质形成及基础防御机制等方面奠定了基础。但关于CsIQD基因家族对激素和逆境的响应,都只是基于基因组和转录组的相关数据进行分析了解,其具体作用机理和确切功能还需要进一步实验对其进行深入探究。