拟南芥C2H2型转录因子AtIDD5结构和功能的生物信息学分析
2024-01-22徐晓东张国斌李林倩陈健鑫于德嘉董萍萍殷伊君郭丽红杨红玉
徐晓东,张国斌,李林倩,陈健鑫,于德嘉,董萍萍,殷伊君,郭丽红,杨红玉
(1.昆明学院农学与生命科学学院,昆明 650214;2.云南农业大学植物保护学院,昆明 650201;3.西南林业大学生物多样性保护学院/云南省高校森林灾害预警控制重点实验室,昆明 650224;4.曲靖师范学院生物资源与食品工程学院,云南 曲靖 655011)
【研究意义】转录因子(Transcription factor, TF)是一类能够与真核基因启动子区域上的顺式作用元件特异性互作的蛋白,能调节靶基因在特定时间与空间上表达,为植物生长发育以及形态建成过程中重要的调控因子,在植物响应生物和非生物逆境应激反应也具有重要作用[1-2]。锌指蛋白(Zinc-finger protein, ZFP)是真核生物重要的转录因子之一,以Zn2+作为结合中心,在短距离内与其他几种特定的氨基酸链螯合,并折叠形成“手指”构型的多肽结构蛋白。在经典的锌指结构中,Zn2+作为结合中心通过疏水作用与重复的组氨酸(His)和半胱氨酸(Cys)多种排列组合形成稳固的四面体结构[3],根据His和Cys位置和数量的不同可分为C2H2、C2HC5、C2HC、C3H、C3HC4等类型。【前人研究进展】Indeterminate domain(IDD)家族是植物特有的转录因子,这些蛋白包含4个锌指(C2H2、C2H2,C2H、C2HC)基序,形成ID domain[4]。对IDD的研究起源于玉米的ID1,ZmID1调节玉米从营养生长向开花转变[5]。随后在拟南芥中发现有16个IDD家族成员[5],其中,AtIDD1、AtIDD8和AtIDD14参与种子成熟和植物发育过程的调控;AtIDD2与赤霉素信号转导有关;AtIDD3、AtIDD6、AtIDD9和IDD10参与根系的发育;AtIDD4与根系的发育有关;AtIDD11与叶片极性有关;AtIDD15和AtIDD16参与茎的向重力性、器官形态发生的调控过程[6-12]。研究者对AtIDD5表达量下降的突变体idd5进行显微观察,发现idd5叶绿体中的淀粉粒不仅形态发生改变,而且淀粉粒的数量也减少,idd5中淀粉合酶 4(Starch synthase 4,SS4)的 mRNA 转录本明显下降[13],说明AtIDD5通过正调控SS4活性参与了糖代谢。Yoshida等[14]认为AtIDD5基因可能作为一种DNA结合的转录支架,与REPRESSOR of ga1-3 (RGA)结合。RGA蛋白的N端具有一个结构域,它含有5个氨基酸:天冬氨酸(D)、谷氨酸(E)、亮氨酸(L)、亮氨酸(L)和丙氨酸(A),被称为“DELLA蛋白”。形成DELLA/IDD复合物调节其下游靶点SCL3的表达,以调控GA信号通路。目前,生物信息学分析已成为新基因功能研究首选和必用方法,具有方便快捷和经济等优点。研究者往往可以从中得到与基因功能有关的重要信息,初步推测基因的可能功能,制定出进一步的实验研究方案。王新亮[15]通过探索苹果热激转录因子(Heat shock transcription factor,Hsf)家族的生物学信息与功能,预测了苹果Hsf家族成员可能在调控盐碱胁迫响应中发挥重要作用。戴晶等[16]利用生物信息学软件对木薯编码锌指转录因子的基因MeDi19-1进行分析,发现该基因主要在叶、叶中脉和储藏根中发挥调控作用,其编码的蛋白在木薯组织中作为转录因子参与调节多项生理活动。【本研究切入点】前期通过构建花椰菜花叶病毒强启动子CaMV 35S与AtIDD5基因融合表达载体获得转基因阳性植株,将过量表达AtIDD5基因的植株种子垂直培养10 d后发现其根长与野生型有显著差异,说明AtIDD5基因可能以负调控方式参与植物的根生长。【拟解决的关键问题】利用生物信息学方法分析AtIDD5蛋白的理化性质、系统进化关系、亚细胞定位、基因启动子结构以及AtIDD5基因的调控与被调控基因。为进一步研究AtIDD5基因在植物生长发育中的作用机制提供参考。
1 材料与方法
1.1 AtIDD5蛋白理性化性质推断
使用Uniprot分析AtIDD5的CDS(NC_003071.7)序列、氨基酸种类及数量。使用TMHMM2.0分析蛋白结构域。使用MEGA7.0 进行多序列比对[17],构建拟南芥AtIDD5蛋白和其他物种同源蛋白的系统发育树。同源蛋白通过NCBI/BLAST进行比对,获得同源性最高的蛋白序列。
1.2 AtIDD5蛋白在植物组织中的表达
在TAIR(The Arabidopsis Information Resource)网搜寻拟南芥AtIDD5蛋白表达模式预测图。
1.3 亚细胞定位
通过在线软件uniprot对AtIDD5蛋白进行亚细胞定位分析。
1.4 蛋白互相作用网络构建
将蛋白质名称输入STRING数据库分析可构建出蛋白互相作用网络,利用分析功能可得网络统计数据,以及GO基因富集等相关分析结果。
1.5 启动子顺式作用元件分析
拟南芥AtIDD5基因起始密码子(ATG)前622 bp的启动子序列在TAIR网中下载,使用在线工具 Plant CARE预测和分析启动子调控元件[18]。
2 结果与分析
2.1 AtIDD5蛋白理性化性质推断
2.1.1AtIDD5基因的CDS序列分析 从TAIR网下载AtIDD5基因的CDS序列,序列分析表明,拟南芥AtIDD5基因的CDS长度为1809 bp,经ProtParam在线软件分析得出,AtIDD5蛋白含有602个氨基酸,根据所含元素的数量推算其分子式C1475H2273N469O528S12,分子量为35 408.82,等电点为6.08。由于其不稳定指数为56.63(56.63>40),因此属于不稳定蛋白,N末端为脯氨酸。在所含氨基酸中、丝氨酸(Ser)占比最高为17.5%,其次为甘氨酸(Gly)、天冬酰胺(Asn)等(图1)。
2.1.2 AtIDD5氨基酸亲水性/疏水性预测及跨膜结构域预测 经在线软件Prot Scale分析得出,图形的高峰值(正值)的区域表示疏水的区域,而负值的“低谷”区域是亲水区域。由图2-A可看出,负值峰大于正值峰,AtIDD5蛋白表现为亲水性。
通过TMHMM2.0软件对拟南芥AtIDD5蛋白序列是否存在跨膜结构进行分析(图2-B),结果显示,该蛋白不含有跨膜结构,不属于跨膜蛋白。
2.1.3 AtIDD5转录因子结构域分析 Uniprot和Prot Param分析显示,AtIDD5蛋白含有4个锌指结构,属于典型的C2H2型转录因子。其锌指结构见表1。
图1 AtIDD5各氨基酸的种类及含量推断Fig.1 Inference of amino acids types and contents in AtIDD5
A:AtIDD5氨基酸序列的疏水性/亲水性预测;B:AtIDD5蛋白序列的跨膜结构域预测。A: Prediction of hydrophobicity/hydrophilicity of AtIDD5 sequences; B: Transmembrane domain prediction ofAtIDD5 sequences.图2 AtIDD5蛋白理性化性质推断Fig.2 Inference of the rationalization properties of the AtIDD5 protein
表1 AtIDD5蛋白锌指结构
2.1.4 AtIDD5同源蛋白系统进化分析 将AtIDD5蛋白序列在NCBI网中进行比对。通过MEGA7构建AtIDD5同源蛋白序列系统发育树,结果氨基酸序列相似度大于60%的其他物种有6个,分别是亚麻芥(Camelinasativa)XP_010496946.1,盐芥(Eutremasalsugineum)XP_006395814.1,白芥(Sinapisalba)KAF 8047379.1,油菜(Brassicanapus)XP_048596659.1,萝卜(Raphanussativus)XP_018434643.1,芝麻菜(Erucavesicariasubsp)CAH 8354801.1。利用GeneDOC进行同源蛋白序列比对,它们的氨基酸序列有很高的相似度,尤其是在4个锌指结构部分(图3-A)。根据氨基酸序列的相似性构建系统发育进化树(图3-B)。
2.2 AtIDD5基因表达模式预测图
TAIR网中AtIDD5(At2g02070)表达模式预测图表明,AtIDD5基因在茎、叶、花、角果和种子中均有所表达,其中在叶片中的转录本丰度最高,其次为角果和花(图4)。表明AtIDD5为组成型表达基因,预示着它可能参与叶片、角果和花器官形态发育的调控。
2.3 AtIDD5蛋白的亚细胞定位
从BAR(The Bio-Analytical Resource for Plant Bio)数据库中搜索AtIDD5基因,对AtIDD5蛋白的亚细胞定位进行预测,发现AtIDD5蛋白主要定位于细胞核和叶绿体中,在细胞核的定位预测与其转录因子的性质相符(图5)。
2.4 AtIDD5蛋白互作网络
通过 STRING数据库分析AtIDD5蛋白与其他蛋白互作的网络,结果显示互作节点数为20(图6)。以 AtIDD5 为中心存在多个与之相互作用的蛋白分子。预测与AtIDD5直接互作的蛋白约有10个,其分子功能多与DNA结合的转录因子活性相关,这些蛋白大多是高迁移率族蛋白(High mobility group protein, HMG),HMG蛋白在染色质结构与功能及基因表达调控过程中均发挥着重要作用,揭示了AtIDD5 蛋白广泛参与生物体生长发育过程中基因表达的调控过程。
2.5 启动子顺式作用元件分析
从TAIR网获得AtIDD5基因的启动子序列,通过Plant CARE在线软件分析AtIDD5基因启动子序列分析发现,AtIDD5基因启动子序列全长622 bp。腺嘌呤(A)占35%、胸腺嘧啶(T)占40%、胞嘧啶(C)占15%、鸟嘌呤(G)占10%。AtIDD5启动子共计含有12种不同种类的作用元件。其中核心元件TATA-box、CAAT-box数量最多,这些核心元件通过与上游基因结合,参与AtIDD5基因的表达调控。启动子上还含有光响应元件GT1-motif、TCT-motif、G-box以及赤霉素、乙烯、防御响应等元件,这些响应元件有可能通过光、激素等有关信号,影响AtIDD5基因的表达,继而影响AtIDD5蛋白对靶基因的调控(表2,图7)。
A:AtIDD5同源蛋白序列比对;B:AtIDD5系统发育树。A: Sequence alignment of AtIDD5 homologous proteins; B: Phylogenetic tree of AtIDD5.图3 AtIDD5系统进化分析Fig.3 Analysis of AtIDD5 phylogenetic tree
图4 AtIDD5(At2g02070)表达模式预测Fig.4 Precidition of AtIDD5(At2g02070) expression pattern
图5 AtIDD5蛋白的亚细胞定位Fig.5 Subcellular localization of AtIDD5 protein
3 讨 论
锌指蛋白最早在非洲爪蛙的卵母细胞中发现,因其特殊的指状结构而得名[19],继第一个植物特异的C2H2型蛋白 ZPT2-1 (EPF1)在矮牵牛中被发现后[20],这一类转录因子被报道广泛参与植物的生长发育,响应各种胁迫[21]。至今为止,分别在重要的农作物水稻[22]、烟草[23]、番茄[24]、大豆[25]、小麦[26]和马铃薯[27]等植物中检测到189、211、118、321、122、79个C2H2型锌指蛋白,其中在拟南芥中有176个C2H2型锌指蛋白[28]。有研究报道,AtIDD5基因表达量显著下降的突变体idd5植株的叶绿体比野生型的小且薄;叶绿体内的淀粉粒长、宽和数量均明显小于野生型[13],预示AtIDD5蛋白对叶绿体发育、淀粉粒的形成起正调控作用。组织表达模式预测AtIDD5基因在叶片中表达量最高,且亚细胞定位于叶绿体中,与其对叶绿体发育调控功能的试验结果相符。另外,本研究预测AtIDD5蛋白位于细胞核中,与其与SCL3启动子结合调控SCL3转录的转录因子功能相符。但迄今没有关于AtIDD5蛋白定位的试验报道,相关试验还需要通过免疫荧光法或融合报道基因定位法等进行研究。本研究通过构建花椰菜花叶病毒强启动子CaMV 35S与AtIDD5基因融合表达载体,利用花浸法[29]转入野生型拟南芥植株中,获得了过量表达植株。AtIDD5基因过表达种子垂直培养10 d后观察根生长情况,发现根长明显短于野生型的根长,说明与调控叶绿体的发育不同,AtIDD5蛋白以负调控方式参与植物的根生长。
图6 AtIDD5互作蛋白网络Fig.6 Interaction protein network map of AtIDD5
表2 AtIDD5基因启动子顺式作用元件分析
刘萌萌等[30]利用生物信息软件对陆地棉GhSDP1的启动子分析发现,该基因启动子上含有低温、盐、干旱以及光响应元件,进一步利用qRT-PCR分析GhSDP1基因在棉花幼苗不同胁迫处理下的表达谱。在低温处理、NaCl胁迫、15% PEG胁迫后,GhSDP1的表达量均上调,表明GhSDP1能够通过自带的响应元件,接收环境信号变化,调整表达量。本研究对拟南芥AtIDD5基因启动子分析发现该基因启动子上含有光(GT1-motif、TCT-motif、G-box)响应元件、乙烯(ERE)响应元件、转录因子MYB(V-myb avian myeloblastosis viral oncogene homolog)响应元件及赤霉素(TATC-box)响应元件,说明AtIDD5基因在植物光响应、激素及胁迫响应中可能行使重要功能。启动子中含有MYB响应元件,MYB是真核生物体内最大的转录因子家族之一,其成员在植物的生长发育、次生物质代谢、生物及非生物胁迫应答等多种生理过程中发挥重要作用[31]。因此,AtIDD5基因启动子结构分析可为进一步研究AtIDD5上游靶基因提供线索。
图7 AtIDD5基因启动子顺式作用元件分析Fig.7 Analysis of cis-acting elements in the AtIDD5 gene promoter
目前蛋白互作网络分析预测方法较多,包括STRING、ChiPPI[32]、ePlant等。本研究采用STRING蛋白互作分析软件对AtIDD5蛋白展开研究,STRING通常只能预测正常的蛋白,而对融合蛋白(Fusion proteins)互作却很少涉及。STRING和ePlant所得结果在节点数和互作蛋白上存在一定的差异,有待于今后通过酵母双杂交、烟草瞬时表达等相关分子生物学试验进一步验证。有研究表明AtIDD5蛋白识别并结合SCL3启动子序列5′-AGACAA-3′,从而调控SCL3的表达,SCL3属于GRAS家族,是一类植物特有的转录调控因子,在植物的生长发育[33]和逆境胁迫响应中发挥重要的作用[34]。本文预测与AtIDD5蛋白互作的RCD1属于一种WWE蛋白,可调节脱落酸(ABA)、乙烯(ET)和茉莉酸甲酯(MeJA)反应。rcd1突变体植株对百草枯表现出明显的抗性,对臭氧表现出敏感性[35-36]。互作的WLM2a属于LIM蛋白,LIM为肌动蛋白束家族,在拟南芥中广泛表达[37]。与AtIDD5蛋白互作的RPL21a蛋白属于翻译蛋白SH3家族,是核糖体的结构成分,其参与转录翻译,亚细胞定位于胞浆核糖体、核糖体、核仁、叶绿体中。组织器官表达模式显示RPL21a主要在保卫细胞和幼叶中表达[38],预示AtIDD5基因在植株生长发育、激素调节和逆境胁迫响应中发挥着重要作用。 本研究对AtIDD5蛋白的功能预测分析,为C2H2型转录因子功能研究增添理论知识,并为植物生长发育分子调控网络提供新的候选基因。
4 结 论
拟南芥AtIDD5基因编码602个氨基酸,属于不稳定的亲水非分泌蛋白,与亚麻芥和盐芥的进化关系最近,在白芥、油菜、萝卜和芝麻菜中存在同源基因。表达模式预测显示AtIDD5为组成型表达基因,亚细胞定位于细胞核和叶绿体中。蛋白互作分析推定有10个蛋白为AtIDD5直接互作的候选蛋白。启动子结构分析表明AtIDD5中存在光响应、激素和胁迫响应元件,分析揭示AtIDD5基因广泛参与了植物生长发育和逆境胁迫反应的调控。