谷子NF-YB 基因家族的鉴定与生物信息学分析
2019-11-21樊武哲武懿茂赵文京俞飞越李雪垠
樊武哲,武懿茂,赵文京,陈 强,俞飞越,李雪垠
(山西农业大学生命科学学院,山西太谷030801)
谷子(Setaria italica) 起源于我国北方黄河流域,至今已有7 000 余年的栽培历史,是我国北方重要的杂粮作物[1-3]。近年来,随着对植物的深入研究,越来越多与逆境相关的转录因子被发现。转录因子(transcription factor,TF),也称反式作用因子,能有序地结合在目标基因启动子序列中的特殊位点,启动基因的转录和控制基因的转录效率,在植物的逆境适应过程中,发挥着重要的调控作用[4-5]。
核转录因子Y 是一个与CCAAT- box 顺式作用元件结合进而调节靶基因表达的转录因子,普遍存在于酵母、动植物等真核生物中,也被称为CCAAT 盒结合因子(CCAAT- binding factor,CBF)或亚铁血红素激活蛋白(heme activator protein,HAP)[6-8]。它是由3 个(NF- YA、NF- YB 和NF- YC)不同的亚家族组装成的异源三聚体,结合到启动子CCAAT 盒上,调控众多基因的表达,在植物胚胎发育、个体生长及逆境胁迫响应等方面发挥重要的作用[9-11]。研究发现,在拟南芥和小麦中,NF- YA 家族均包含10 个成员,NF- YB 家族分别包含13,11 个成员,NF- YC家族分别包含13,14 个成员[12-13],它们在调控胚发育、胚成熟、花发育过程以及非生物胁迫应答中起着重要的作用[14-16]。
NF- YB 家族包含一个与核心组蛋白H2B 中的组蛋白折叠基序保守域极其相似的中心结构域,在蛋白质—DNA,蛋白质—蛋白质的相互作用中发挥着重要的作用[17]。已有研究表明,NF- YB 基因家族能调控非生物胁迫,如干旱、高盐、冷害、热害等方面。鉴于NF- YB 基因家族在植物抗逆方面的重要作用,且并未发现谷子NF- YB 基因家族的详细报道。
本研究利用生物信息学手段鉴定和分析谷子NF- YB 基因家族,预测并统计谷子NF- YB 基因家族各蛋白的理化性质、保守基序、保守结构域、系统进化等,旨在为进一步探索NF- YB 基因家族的功能提供理论基础。
1 材料和方法
1.1 试验材料
利用植物转录因子数据库PlantTFDB 在线搜索并下载谷子NF- YB 基因家族的氨基酸序列;选用Phytozome 数据库下载谷子NF- YB 基因家族成员的基因组序列和CDS 序列。
1.2 谷子NF-YB 基因家族的定位
利用Perl 编程语言,将谷子NF- YB 基因家族成员在染色体上的位置进行整理,通过MapInspect程序显示每个基因在染色体上的位置,得到各个基因在染色体上的分布情况,并绘制谷子NF- YB 基因家族成员在染色体上的物理分布图,对谷子NF- YB 家族基因进行可视化分析。
1.3 谷子NF-YB 基因家族基本信息和理化性质分析
利用谷子基因组Phytozome 数据库查找NF- YB 基因家族基本信息,并利用EXPASY- Prot-Param 在线工具(https://web.expasy.org/protparam/)分析谷子NF- YB 基因家族等电点和相对分子质量。
1.4 谷子NF-YB 基因家族的系统进化树构建和基因结构分析
为了明确谷子基因组中鉴定出的NF- YB 基因家族成员的进化关系,利用Clustal X2.1 和MEGA 4.0 软件进行氨基酸序列聚类和进化分析,采用邻接法(Neighbor- Joining,NJ)构建系统进化树,进行1 000 次Bootstrap 抽样自检,其他参数选择默认。并利用在线软件Gene Structure Display Server(GSDS,http://gsds.cbi.pku.edu.cn/)分析谷子NF- YB 基因家族基因的外显子- 内含子(exon- intron)结构。
1.5 谷子NF-YB 基因家族保守基序及保守结构域分析
利用MEME 软件(http://meme- suite.org/tools/meme) 对谷子NF- YB 基因家族进行保守基序分析,并利用TBtools 工具绘制谷子NF-YB 基因的Motif示意图,分析谷子NF-YB 氨基酸序列的保守性。
将谷子抗旱相关蛋白激酶基因的氨基酸序列提交至NCBI- CDD 数据库(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi),并利用TBtools工具绘制谷子NF-YB 基因保守结构域。
1.6 谷子NF-YB 基因家族启动子分析
利用PlantCARE 软件在线分析谷子NF- YB 基因家族启动子区顺式作用元件,选取鉴定出的谷子NF-YB 基因起始密码子上游1 500 bp 序列作为启动子区域,将序列提交到PlantCARE(http://bioinformatics.psb.gent.e/eboolslantcare/html)数据库,分析启动子顺式作用元件。
1.7 谷子NF-YB 基因家族表达分析
从Phytozome 数据库下载谷子NF- YB 基因家族的表达数据,分析其组织表达特异性,并利用R语言函数绘制基因表达热图。
2 结果与分析
2.1 谷子NF-YB 基因家族成员的鉴定及染色体定位
谷子共有9 条染色体,根据谷子NF- YB 基因家族成员所在染色体的信息,对获得的16 个谷子NF- YB 基因家族成员命名,分别命名为SiNFYB1~SiNF-YB16。基因的染色体分布情况如图1所示。由图1 可知,谷子NF- YB 基因家族成员分布在7 条不同染色体上,4 号染色体上最多,9 号染色体上最少,7,8 号染色体上没有分布。
2.2 谷子NF-YB 基因家族成员的基本信息和理化性质分析
16 个谷子NF- YB 基因家族成员的基本信息及理化性质列于表1。从表1 可以看出,谷子NF- YB 基因家族成员序列长度在516~3 967 bp,其中,SiNF-YB15 的CDS 序列最长,SiNF-YB7 的CDS 序列最短;蛋白最长有300 个氨基酸,最短的有115 个氨基酸;SiNF-YB11、SiNF-YB15 的外显子数目较多,而SiNF-YB4、SiNF-YB12、SiNF-YB13、SiNF-YB14、SiNF-YB16 的外显子数目较少;蛋白质等电点介于5.00(SiNF-YB3)~8.38(SiNF-YB10),其中有3 个基因编码的蛋白质呈碱性,13 个基因编码的蛋白质显酸性;蛋白质相对分子质量在12 589.38~33 890.02 u。
表1 谷子NF-YB 家族基因的基本信息
2.3 谷子NF-YB 基因家族成员系统进化及基因结构分析
基于谷子NF- YB 基因家族成员的氨基酸序列构建的系统进化树和基因结构如图2 所示,谷子16个NF- YB 基因家族成员可以划分为3 个亚族,同一亚族内成员亲缘关系较近。不同的亚族之间进化关系差距较大,推测谷子NF- YB 基因家族在演化过程中发生了变化,在谷子的生长发育及抗逆过程中起着不同的调控作用。
谷子NF- YB 基因家族成员的结构分析结果如图3 所示,多数基因包含有外显子和内含子结构,呈现断裂基因特征,其中,以SiNF-YB11 和SiNFYB15 基因最为明显,含有5 个外显子;而SiNFYB4、SiNF-YB12、SiNF-YB13、SiNF-YB14 和SiNFYB16 基因结构比较简单,外显子数目最少,只含有1 个外显子。
2.4 谷子NF-YB 基因家族成员保守基序及保守结构域分析
对谷子NF- YB 基因家族成员的氨基酸序列进行保守基序分析,结果如图4 所示。谷子NF- YB 基因家族共包含5 种保守基序,将其分别命名为Motif 1~5,结果显示,谷子NF- YB 基因家族都含有Motif1这种保守基序,说明Motif 1 是核心基序。而对于Motif 4、Motif 5 这2 种保守基序来说,分别仅分布于3,2 个家族基因中,说明这2 种基序在进化中分化程度很低。
从图5 可以看出,谷子NF- YB 基因家族成员共包含2 个保守结构域(CBFD_NFYB_HMF 和H4 superfamily)。每个谷子NF- YB 基因家族成员都含有1 个结构域。SiNF-YB4、SiNF-YB5 和SiNF-YB8、SiNF-YB9 含有相同的保守域,即都含有1 个CBFD_NFYB_HMF 保守结构域,且其位置相似,所以,推测它们可能具有相似的生物学功能。
2.5 谷子NF-YB 基因家族成员启动子序列分析
基于PlantCARE 软件工具在线分析谷子NFYB 基因启动子顺式作用元件,结果表明,谷子16个NF-YB 基因启动子中与抗逆相关的顺式作用调控元件主要有:ABA 响应元件(ABRE)、低温诱导响应元件(LTR)、MeJA 响应元件(CGTCA- motif、TGACG- motif) 以及生物与非生物胁迫响应元件(TC- rich repeats)等(表2)。多数谷子NF-YB 基因启动子区域都含有干旱诱导响应元件,这表明NFYB 基因参与谷子干旱胁迫响应的调控。此外,研究发现不同基因的调控元件种类、数目也不同,另外一些NF-YB 基因还具有水杨酸、生长素、赤霉素、低温等非生物胁迫响应相关的元件,这也进一步表明了NF- YB 基因家族成员在抵抗逆境过程中的重要作用。
表2 谷子NF-YB 基因家族成员启动子顺式作用元件功能
2.6 谷子NF-YB 基因家族成员表达分析
基于Phytozome 数据库检索并鉴定出的16 个谷子NF- YB 基因家族成员,通过Phytozome 数据库,统计整理出NF- YB 基因家族成员在各个组织中的表达量,并利用R 语言内部的Heatmap 函数绘制热图,组织表达情况如图6 所示,结果发现,SiNF-YB11 基因在根中的表达量最高,在穗中的表达量较高;SiNF-YB15 在根中也有较高的表达量。此外,SiNF-YB1、SiNF-YB2、SiNF-YB7、SiNF-YB8、SiNF-YB9、SiNF-YB10 基因不参与谷子根、茎、叶和穗等组织表达。NF- YB 基因家族不同成员在谷子不同组织中的表达量存在显著差异。
3 结论与讨论
植物NF- YB 基因家族是植物抗逆境胁迫的关键基因,通过生物信息学手段对谷子NF- YB 基因家族进行分析,可为深入研究谷子NF- YB 基因家族抗逆境胁迫奠定基础。
本研究鉴定了16 个谷子NF-YB 基因,它们分布于除7,8 号染色体外的其余7 条染色体上。聚类分析显示,它们可以分为3 个亚家族,这与将水稻、拟南芥和大豆中的NF- YB 基因家族分成I、II、III等3 类类似。基因结构分析显示,多数基因包含有外显子,却没有内含子结构,这是由于NF- YB 基因家族在进化过程中承受较强的选择压力,许多基因的内含子丢失[18]。保守基序分析显示,谷子NF- YB基因家族成员共有5 个保守基序,其中,Motif 1 是核心基序,分布于每一个谷子NF- YB 基因家族内。保守结构域分析表明,谷子NF- YB 基因家族共包含2 个保守结构域。NF- YB 基因家族成员的保守域大多数位于NF-YB 基因的内部,这种位置保守性是依赖于核转录因子异源三聚体蛋白空间构象决定的。NF- YB 蛋白与NF- YC 蛋白通过彼此的保守域,采用头尾相接的方式形成异源二聚体互作平台,吸引NF- YA 蛋白与其结合形成具有活性的异源三聚体核转录因子。核转录因子通过NF- YA 亚基上的DNA 结合域结合到靶基因启动子部分CCAAT 盒,激活或抑制转录[19-20]。基因表达分析显示,SiNF-YB 基因在谷子根、茎、叶和穗中表达量有较大差异,说明不同的NF- YB 基因家族成员在植物的生长发育过程中有各自独特的作用。上述结果表明,多数亲缘关系较近的基因的外显子- 内含子结构、保守基序、保守结构域较为相似,它们可能具有功能上的相似性,如SiNF-YB8、SiNF-YB9 亲缘关系较近,在基因结构、保守基序、保守结构域都表现出较强的相似性,所以,推测它们可能具有相似的生物学功能。
综上,对谷子NF- YB 基因家族成员的研究将加深对谷子NF- YB 基因家族调控转录机制的理解,深入探索NF- YB 基因家族在非生物逆境时发挥的重要作用,可为后续进一步探索NF- YB 基因家族的功能提供理论基础。