谷子LAC 基因家族的鉴定及分析
2021-04-19薛佳丽任晓庆郄倩茹申慧芳高建华
薛佳丽,任晓庆,郄倩茹,段 明,申慧芳,高建华
(1.山西农业大学基础部,山西太谷030801;2.山西农业大学生命科学学院,山西太谷030801;3.山西农业大学实验教学中心,山西太谷030801)
漆酶(LAC)是一种含铜离子的酚类氧化酶,属于铜蓝氧化酶蛋白家族,其最初是从漆树(Rhus ver-nicifera)的漆液中发现,之后在一些真菌、细菌中也发现了漆酶的表达[1]。在植物中,漆酶主要参与木质素的合成,而在真菌中,其则与木质素降解有关[2]。木质素作为植物生长发育中的一种次生代谢物,在植物生长发育和抗性方面具有重要的生物学功能。在对植物木质化过程的研究中,植物漆酶备受关注[3]。
近年来,随着植物基因组序列的发布和生物信息学技术对相应数据的挖掘,极大加速了植物基因家族的筛选和鉴定[4]。目前,已报道多种植物的漆酶家族,其中,拟南芥(Arabidopsis thaliana)中含有17 个AtLAC基因[5];水稻(Oryza sativa)基因组含有30 个OsLAC基因,且大部分在根中高表达[6];亚麻(Linum usitatissimum)中鉴定出45 个LuLAC基因[7];甜高粱(Sorghum bicolor)中鉴定出27 个SbLAC基因[8];二穗短柄草(Brachypodium distachyon)中鉴定出29 个BdLAC基因[9];甘蔗(Saccharumspp.)中鉴定出12 个SpLAC基因[10]等。由此可见,不同植物中漆酶基因家族成员存在较大差异。研究发现,植物漆酶主要参与根、茎细胞壁的木质化过程[11]。在拟南芥中,lac4或lac17缺失突变导致茎秆中木质素含量降低约20%,而lac4和lac17双突变体的木质素含量降低40%,且木质部表型不规则,lac17恢复表达能够使木质部剖面结构恢复正常[12]。研究二穗短柄草中LAC5[9]和毛竹中克隆的2 个LAC基因[13]在茎的木质化中也发挥着重要作用。杨树LAC3基因表达对其木质部纤维的正常细胞壁结构和完整性至关重要[14]。此外,漆酶的活性与酚酸类物质的抗性呈正相关,LAC基因的表达增强了植物抗性[15]。
谷子(Setaria italica)属禾本科,由野生近亲狗尾草(Setaria viridis)驯化而来,在我国北方地区已有超过8 700 a 的历史[16]。其具有抗干旱、耐贫瘠、适应性广等特性。另外,谷子为二倍体,基因组小,如最早发布的豫谷1 号基因组约500 Mb[17],张杂谷基因组约420 Mb[18],晋谷21 超早熟突变体xiaomi的基因组约430 Mb[19]。近缘物种狗尾草的漆酶基因已通过生物信息学方法进行筛选[20],而谷子漆酶的研究相对较少。
本研究利用生物信息学方法筛选鉴定谷子LAC(SiLAC)基因家族,并对其染色体的分布、基因结构、启动子顺式作用元件及在不同组织的表达谱进行分析,旨在为谷子木质素合成途径的研究和种质资源创新及利用奠定基础。
1 材料和方法
1.1 SiLAC 基因家族成员的鉴定
为了鉴定谷子LAC基因家族成员,本研究通过文献获取狗尾草的LAC(SvLAC)基因家族成员[20],并利用Pfam(http://pfam.xfam.org/)数据库的Sequence Search 功能下载符合LAC基因家族的隐马尔可夫模型(Hidden Markov Model,HMM)[21]。
从Phytozome V12 数据库(https://phytozome.jgi.doe.gov/pz/portal.html)[22]中分别获取水稻(Osativa_323_v7.0.protein.fa)、谷子(Sitalica_312_v2.2.protein.fa)、拟南芥(Athaliana_447_Araport11.protein.fa)和狗尾草(Sviridis_500_v2.1.protein.fa)的蛋白质数据,通过HMMER 软件中的hmmsearch 命令对4 个物种全基因组蛋白质数据进行检索,筛选阈值E <1e-20的结果为候选基因。利用MEGA X 软件对谷子、狗尾草、水稻和拟南芥的LAC家族蛋白进行多序列比对(Clustal W 法),采用邻接法(Neighbour Joining Tree,NJ)绘制系统发育树,Bootstrap 设置为1 000,其他参数默认[23]。为了防止遗漏,利用获得的谷子LAC基因家族氨基酸序列,重构HMM模型,并使用该模型重新检索谷子蛋白质数据库,最终确定谷子LAC基因家族成员。
1.2 SiLAC 基因家族染色体定位分析及命名
利用Phytozome 数据库中下载的谷子基因组注释gff3 文件,用TBtools[24]对筛选到的基因进行位置信息的提取。利用在线工具MapGene2Chromosome V2(http://mg2c.iask.in/mg2c_v2.0/)[25]对基因定位的结果进行分析,绘制染色体定位图,并命名。
1.3 SiLAC 蛋白理化性质及亚细胞定位分析
利用ProtParam 工具(https://web.expasy.org/protparam/)预测SiLAC基因家族成员编码蛋白质的氨基酸数目、分子质量、理论等电点和亲疏水性等理化性质。利用在线软件PSORT(http://psort1.hgc.jp/form.html)对SiLAC基因编码的蛋白质进行亚细胞定位预测。
1.4 SiLAC 启动子顺式作用元件分析
利用TBtools 中Gtf/gff3 Sequences Extractor 选项获取SiLAC上游2 000 bp 的基因组序列,将所获取的序列提交至PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行启动子顺式作用元件分析,最后通过TBtools 对常见功能元件进行可视化展示。
1.5 SiLAC 基因家族基因结构及motif 分析
通过MEME 预测SiLAC基因家族的保守基序,保守位点宽度设置为≥10 和≤100,最大保守序列鉴定数目设置为10。利用TBtools 绘制SiLAC基因家族基因结构和保守基序图。
1.6 SiLAC 基因家族特异性表达分析
为了进一步分析SiLAC基因家族成员在谷子不同组织中的表达情况,在Phytozome 数据库下载公布的豫谷1 号转录组双端测序数据,筛选SiLAC基因在光下生长10 d 的根、7 d的茎、14 d的旗叶、第一阶段穗的表达量[17]。基于各基因在植物组织各器官的表达差异构建表达热图,并利用可视化软件TBtools 展示。
2 结果与分析
2.1 SiLAC 基因家族的鉴定与进化关系
亲缘关系分析结果显示(图1),52 个SiLAC 蛋白可分为5 组(Ⅰ~Ⅴ),其中,Ⅴ亚家族包含33 个SiLAC 蛋白,Ⅳ亚家族包含6 个SiLAC 蛋白,Ⅰ和Ⅱ亚家族均包含5 个SiLAC 蛋白,Ⅲ亚家族数量最少,包含3 个SiLAC 蛋白,这与SvLAC 的分类相符[20]。与拟南芥相比,谷子与水稻的LAC 同源性较高,这可能是因为拟南芥为双子叶植物,而谷子和水稻同属禾本科单子叶植物。
对豫谷1 号中共鉴定的52 个SiLAC家族成员,按照其在染色体上的位置(图2),命名为SiLAC1~SiLAC52,其中,SiLAC1~SiLAC51分布在谷子1、3、4、5、7、8、9 号染色体上,5 号和8 号染色体上该基因拷贝数较多,形成基因簇,5 号染色体有8 个紧密串联(SiLAC13~SiLAC20),8 号染色体有25 个紧密串联(SiLAC25~SiLAC49);SiLAC52基因序列尚未定位,不在谷子的9 条染色体上。
对SiLAC 蛋白进行理化性质和亚细胞定位预测结果显示(表1),除SiLAC38基因仅编码271 个氨基酸外,其余SiLAC基因编码氨基酸序列长度在472~651;等电点范围在5.33~9.49,其中,等电点大于9 的基因有4 个,分别为SiLAC4、SiLAC8、SiLAC24、SiLAC29,小于6 的基因有19 个;52 个漆酶中酸性氨基酸有40 个,碱性氨基酸有12 个,表明不同漆酶工作环境pH 差异较大。SiLAC家族44 个成员的总平均亲水性(GRAVY)为负值,为疏水性蛋白,且所有的成员脂肪系数均小于100,故均为脂溶性蛋白;52 个SiLAC 蛋白定位于细胞外,均属于分泌型蛋白。
表1 SiLAC 基因家族成员及理化性质
续表1
2.2 SiLAC 基因家族启动子顺式作用元件分析
为了探究SiLAC基因家族启动子在转录水平的调控功能,对其基因上游2 000 bp 的序列进行顺式作用元件预测,结果共鉴定了11 类顺式作用元件(图3),包括参与茉莉酸甲酯、脱落酸、水杨酸、赤霉素响应、低温响应、分生组织表达调控、胚乳表达调控、参与干旱胁迫、防御应激反应的顺式作用元件以及光响应和黄酮类化合物合成调控的3 个MYB 结合位点。其中,SiLAC50包含的响应元件种类最多(8 种),而SiLAC47包含的顺式响应元件最少(1 种)。从组成类型特异性来看,除了SiLAC6、SiLAC8、SiLAC20、SiLAC40、SiLAC41、SiLAC47以外,其余都含有茉莉酸甲酯响应元件;除SiLAC7、SiLA20、SiLAC31、SiLAC47以外,其余均包含脱落酸响应元件;SiLAC47包含的启动子区顺式元件最少,仅参与低温响应;约1/2 基因的启动子序列中包含干旱胁迫下MYB 转录因子结合位点,还有部分参与光响应胁迫下MYB 转录因子结合位点,可见,SiLAC家族可能受MYB 转录因子调控,通过改变细胞壁木质化程度,提高抵抗逆境胁迫的能力。这些结果表明,SiLAC基因不仅在植物生长发育过程中起作用,而且在干旱、低温等逆境响应中也发挥着重要作用。
2.3 SiLAC 家族的基因结构分析
SiLAC基因家族成员的基因结构分析结果显示(图4),52 个SiLAC基因均为断裂基因,包含2~6 个外显子,以6 个外显子为主,但是不同基因的基因结构存在一定的差异。其中,SiLAC2、SiLAC3、SiLAC4、SiLAC5、SiLAC10、SiLAC20、SiLAC21、SiLAC31、SiLAC52不含非翻译区(UTR),其余都具有5′端和3′端非翻译区。保守结构域分析显示(图4),GroupⅤ亚区中,SiLAC5不包含motif 1、motif 3 和motif 9;SiLAC38不包含motif 4、motif 5、motif 8 和motif 10;其余该区基因均包含motif 1~motif 10,且排列顺序基本一致。Group I~IV 中,Group Ⅰ的SiLAC10、SiLAC22、SiLAC23和SiLAC50包含motif 10;Group Ⅱ的SiLAC2不包含motif 3,其余Ⅰ~Ⅳ区中SiLAC基因均含有motif 1~motif 9,且排位基本一致。说明LAC 蛋白家族成员基本结构相对比较保守。
2.4 SiLAC 基因家族特异表达分析
为了进一步分析SiLAC基因在谷子不同组织中的表达情况,对豫谷1 号不同组织转录组数据的FPKM值进行了分析,结果表明(图5),SiLAC13、SiLAC25、SiLAC28在生长10 d 的根中表达量极高(FPKM>30),具有组织表达特异性;SiLAC51在第一阶段穗子中表达量最高,达到27.149;在茎中,SiLAC37、SiLAC18表达量高于其他基因,FPKM 值分别为20.803 和16.408。此外,SiLAC基因家族在生长14 d 的旗叶中不表达或低表达(FPKM<5),可能是因为叶的木质化程度较低。
3 结论与讨论
本研究通过对豫谷1 号中的52 个LAC基因进行生物信息学分析发现,SiLAC基因家族可分为5 个亚家族,其中,Ⅴ亚家族包含33 个基因成员,占63.46%。家族成员多分布于5 号和8 号染色体上,这与狗尾草中鉴定的52 个LAC基因家族的聚类和分布情况相似[20]。Ⅴ亚家族成员的高占比主要是由第V 分支内的多个基因串联重复引起的。与拟南芥相比,谷子SiLAC与水稻OsLAC亲缘关系更近,可能与同属禾本科单子叶植物有关。木质素是细胞壁的主要组成成分,在拟南芥生长发育过程中,AtLAC17、AtLAC4和AtLAC11等漆酶基因都被证明参与木质素合成[5,12,26]。亚细胞定位预测表明,SiLAC蛋白均为分泌型蛋白,符合谷子漆酶参与木质素的合成预期。赵晶等[27]在陆地棉(Gossypium hirsutum)漆酶的分析中也发现,其83 个GhirLAC 蛋白都属于分泌蛋白。
本研究表明,豫谷1 号SiLAC基因家族在叶中几乎不表达,而少量基因在根、茎等木质化程度较高的部位中表达活跃。在多种植物中也观察到类似的现象,比如拟南芥[28]、亚麻[9]等。本研究进一步分析发现,SiLAC25、SiLAC13和SiLAC28基因的表达主要集中在根部,而SiLAC37和SiLAC18基因主要在茎部表达,这些基因可能是参与谷子木质化的关键基因。在水稻中,OsLAC主要在胚乳、根、茎和花中表达,多数基因在根中(包括营养和生殖生长阶段)表达量较高[29]。在拟南芥中,AtLAC1、AtLAC3、AtLAC7、AtLAC8和AtLAC15在根和生殖器官中表达[5]。有研究表明,microRNA857 可以通过靶向AtLAC7来调节拟南芥茎中次生木质部的形态发生和木质素积累,而不会影响木质素生物合成基因的表达[28]。这些结果表明,AtLAC7在拟南芥茎木质部细胞木质素聚合中起关键作用。
本研究进一步分析根中的3 个高表达基因可发现,SiLAC13在5 号染色体的基因簇中,SiLAC25和SiLAC28在8 号染色体的基因簇中,基因串联重复可使在同一染色体上的基因具有相似的功能。对SiLAC启动子顺式作用元件预测分析,发现谷子SiLAC启动子区含有茉莉酸甲酯、脱落酸、水杨酸、赤霉素反应等激素应激响应元件,而这3 个高表达基因启动子中均含有茉莉酸甲酯、脱落酸反应等激素响应元件,推测SiLAC的表达可能受激素影响。这与刘彦英等[30]在香蕉(Musa paradisiaca)漆酶基因(MaLAC)中的发现相似,在香蕉MaLAC启动子区也含有茉莉酸甲酯、脱落酸、赤霉素、水杨酸等激素应激响应元件。其次,谷子是耐旱作物[31],结果表明,SiLAC28、SiLAC25、SiLAC13分别包含了4、2、2 个参与干旱诱导的MYB 转录因子结合位点相关的作用元件,因此,认为这3 个基因可能参与谷子抗旱调控,通过MYB 转录因子调控,改变细胞壁木质化程度,从而提高抵抗逆境胁迫的能力。再者,有60%左右的基因还包含1~2 个与MYB转录因子结合位点相关的作用元件,这些MYB结合位点参与光反应、干旱诱导、黄酮合成基因调控,因此,这些基因可能参与了谷子生长发育过程中种子成熟和色素合成,这与龙眼(Dimocarpus longanLour.)中漆酶基因的部分启动子元件功能一致,预测谷子漆酶可能高度参与了谷子生长发育调控或相关防御应激反应[32]。
本研究基于谷子基因组和转录组数据,鉴定了52 个SiLAC基因。通过染色体定位分析发现,5 号和8 号染色体出现SiLAC基因串联重复,其中,位于5 号染色体的SiLAC13、位于8 号染色体的SiLAC25和SiLAC28在根部组织中特异表达,这3 个基因均含有与激素响应相关的启动子顺式作用元件,预测SiLAC的表达可能会受激素影响。此外,SiLAC启动子序列还包含与植物生长发育调控、逆境响应相关的顺式作用元件,表明在谷子生长发育过程中漆酶基因家族发挥重要作用。本研究结果可为进一步分析谷子LAC基因家族的功能、解析其在谷子生长过程中表达调控机制提供参考。