棉花基因组中SABATH甲基转移酶基因家族的查找与分析
2018-10-11狄佳春陈旭升
赵 亮, 狄佳春, 陈旭升
(江苏省农业科学院经济作物研究所/农业部长江下游棉花与油菜重点实验室,江苏南京 210014
甲基化作用广泛存在于生物体内,由甲基转移酶(methyltransferases,简称MTs)依赖S-腺苷-L-甲硫氨酸(S-adenosine-L-methionine,简称SAM)作为甲基供体催化形成相对应的甲基化形式产物[1]。在植物次生代谢中甲基化是一个非常普通的酶修饰反应,几乎所有的植物次生代谢途径都会发生甲基化,例如氨基酸、生物碱、苯丙素类、糖、嘌呤、甾醇类、硫醇类和黄酮类。甲基转移酶可根据甲基转移到受体分子上不同的原子而分为C、N、S和O位甲基转移酶[2]。
SABATH甲基转移酶是属于O位甲基转移酶(O-methyltransferase,简称OMTs),该家族催化一些小分子羧基和生物碱的甲基化,这个家族在最初发现鉴定的3个酶的基础上共同命名为SABATH甲基转移酶(SABATH-MTs)。这3个酶分别是水杨酸羧基甲基转移酶(salicylic acid carboxyl methyltransferases,简称SAMT)、苯甲酸羧基甲基转移酶(benzoic acid carboxyl methyltransferases,简称BAMT)和可可碱合酶(theobromine synthase)[3-7]。对SABATHMTs基因序列分析表明,在拟南芥中存在24个该家族基因成员。功能研究清楚的有茉莉酸羧基甲基转移酶(jasmonic acid carboxyl methyltransferase,简称JMT)[8]、苯甲酸/水杨酸羧基甲基转移酶(benzoic/salicylic acid carboxyl methyltransferases,简称BSMT)[9]、吲哚乙酸羧基甲基转移酶(indole-acetic acid carboxyl methyltransferase,简称IAMT)[10]、法尼烯酸羧基甲基转移酶(farnesoic acid carboxyl methyltransferase,简称FAMT)[11]、赤霉素羧基甲基转移酶(gibberellin acid carboxyl methyltransferase,简称GAMT)[12]。棉花基因组数据的公开发表,为SABARH-MTs基因家族的全基因组分析提供了便利的条件。本研究利用生物信息学的方法,从棉花基因组数据库中查找可能的SABATH-MTs基因家族成员,并对这些成员进行结构、进化及表达上的分析。
1 材料与方法
1.1 数据库来源
陆地棉遗传标准系TM-1的基因组数据库来源于http://mascotton.njau.edu.cn;棉花二倍体D基因组雷蒙德氏棉(G.Raimondii)的基因组数据库来源于http://www.phytozome.net;棉花二倍体A基因组亚洲棉的基因组数据来源于http://cgp.genomics.org.cn/page/species/index.jsp;拟南芥GAMT基因来源于拟南芥信息资源(the arabidopsis information resource,简称TAIR)数据库(http://www.arabidopsis.org)。
1.2 基因注释
GAMT注释根据Sonnhammer等[13]的方法,HMMER软件版本为3.0;GAMT种子文件来自于蛋白质家族的集合数据库(Pfam数据库,http://pfam.sanger.ac.uk/),种子编号为PF03492。蛋白质的氨基酸序列保守结构域的分析采用在线的SMART(http://smart.embl-heidelberg.de)进行检测。
1.3 序列比对及进化树构建
利用MEGA 5.05[14]构建进化树,构建方法利用最大似然函数,Bootstrap实行1 000次重复。序列比对利用 Clastal 1.83 完成,比对结果及处理利用GENDOC软件来完成。
1.4 基因表达分析
基因表达分析采用高通量的陆地棉遗传标准系TM-1营养组织(根、茎、叶)、花瓣、花药及纤维发育时期[开花当天(0 day post-anthesis,简称0 DPA)、开花后10天(10 DPA)、开花后20天(20DPA)]的RNA-seq数据库[15]。基因表达水平利用Log2(FPKM)的数值进行评估,其结果利用Cufflinks软件(http://cufflinks.cbcb.umd.edu)进行处理。
2 结果与分析
2.1 基因组数据库中SABATH-MTs基因的注释
由于SABATHMTs家族基因的蛋白结构中含有一个Methyltransf_7的蛋白结构域,该结构域在Pfam数据库中的种子文件编号为PF03492。通过HMMER 3.0中的hmmsearch程序及种子文件,在陆地棉遗传标准系TM-1基因组中共查找到37个基因,其中At亚组中有16个基因,Dt亚组中有19个,还有2个基因的染色体信息不清楚;二倍体D基因组雷蒙德氏棉中查找到22个基因;二倍体A基因组亚洲棉中查找到24个基因,这些基因在染色体上呈现不均匀的分布。以陆地棉TM-1为例,在查找到的37个基因不均匀的分布在19条染色体上,其中9条染色体属于At亚组,10条染色体属于Dt亚组;A10、D10和D13上的分布的基因最多,分别预测到4个基因(图1)。
2.2 SABATH-MTs基因系统进化分析
根据已经报道具有已知功能的SABATH-MTs基因,从美国国立生物技术信息中心(national center for biotechnology information,简称NCBI)上下载其对应的蛋白序列与棉花基因组中预测的基因进行系统进化分析。结果表明,在总计预测到的83个基因(四倍体中有37个;二倍体D组中有22个;二倍体A组中有24个)中,有34个基因能够与已知功能的SABATH-MTs基因聚到同一分支(图2)。这34个基因中有8个基因来自于二倍体A组,9个基因来自于二倍体D组;17个基因包括At亚组9个、Dt亚组8个。进一步分析表明,来源二倍体A组和D组的基因在四倍体中都能够找到其相应的同源基因(表1)。
2.3 SABATH-MTs基因表达分析
在陆地棉TM-1中预测到的37个SABATH-MTs基因在其根、茎、叶、花瓣、花药及3个纤维发育时期(0、10、20 DPA)的转录组中的表达分析表明,共有20个基因在至少1个转录组数据库中能够检测到表达[Log2(FPKM)>1]。其中有10个基因只在1个转录组数据库中能够检测到表达。Gh_D02G2159、Gh_A10G1598、Gh_A13G0249和Gh_D13G0266只在根的转录组中检测到有表达;只在茎的转录组中检测有表达的为Gh_D13G2235和Gh_D09G0289;Gh_A05G1642在叶的转录组中专化表达;Gh_D10G1851和Gh_D11G1755在花药的转录组中专化表达;Gh_A01G0661在0 DPA的胚珠中专化表达。花瓣、10 DPA和20 DPA的纤维中没有找到专化表达的基因(图3)。
3 结论与讨论
甲基化在许多生物进程中发挥着关键的修饰作用,它包括基因和代谢的调控。在植物中,甲基化也有着广泛的作用。与其他已知的甲基转移酶比较发现,SABATH家族在几个方面都是独特的。首先,除了保守的SAM结合序列,SABATH-MTs与其他MTs没有序列的相似性[2];再者,SABATH基因家族的蛋白能够催化O位和N位2个位置的甲基化,而其他的MTs只能执行1种类型的甲基化[3,5,7]。拟南芥基因组中包含24个SABATH家族蛋白成员,其中一些蛋白具有明显的特征。例如,茉莉酸羧基甲基转移酶(JMT)、苯甲酸嘌呤/水杨酸羧基甲基转移酶(BSMT)、吲哚乙酸甲基转移酶(IAMT)、法尼烯酸羧基甲基转移酶(FAMT)及赤霉素羧基甲基转移酶(GAMT)等[8-9,11-12,16-18]。而根据生物信息学的分析,在四倍体陆地棉中预测了37个SABATH-MTs家族成员;在二倍体亚洲棉中预测了24个;在二倍体雷蒙德氏棉中预测了22个。这些家族成员通过进化分析,有部分成员能够与已经报道的具有特定功能的SABATH-MTs基因聚集到同一分支。四倍体陆地棉TM-1中预测到的37个基因中,有20个基因能够在转录组数据库中检测到表达,另外的17个基因未能检测到表达。这些未能检测到表达的基因有可能是以假基因的形式存在于基因组中, 或者在其他组织部位及纤维发育时期专化表达而未能检测到。通过进化及表达分析的结果,为今后对于棉花中SABATH-MTs家族成员的功能研究起到了一定的指导作用。
表1 通过进化分析具有特定功能的SABATH-MTs基因