APP下载

水稻IBR基因家族生物信息学分析

2023-08-31廖嘉仪廖芷依

种子 2023年6期
关键词:泛素分支结构域

廖嘉仪, 廖芷依, 王 兰

(华南农业大学农学院, 广州 510642)

E3连接酶是蛋白泛素化修饰的关键酶之一,蛋白泛素化修饰过程由泛素激活酶(E1,Ubiquitin-activating enzyme,UBA)、泛素结合酶 (E2,Ubiquitin-conjugating enzyme,UBC) 和泛素连接酶 (E3,Ubiquitin ligase)组成[1-2]。在蛋白泛素化修饰过程中,E3连接酶决定了泛素化的特异性,并在泛素介导的蛋白质降解选择中发挥核心作用[3]。E3连接酶可分成3种主要类型:含锌结合结构域蛋白(Really Interesting New Gene,RING) 型 (包括含U-box 结构域蛋白)、E6-AP的羧基端同源蛋白 (Homologous to E6-associated protein C Terminus,HECT) 型和RBR(RING Between RING fingers)型[4-6]。RBR型E3连接酶包含3个结构域:与装载了泛素的E2结合的RING1结构域,通过半胱氨酸残基催化硫代酯化反应并从RING1接收泛素的RING2结构域,以及In-between-RING(IBR)结构域[7]。IBR结构域编码一种E3泛素连接酶,被报道参与许多植物生长和发育等重要的生理过程[8-9]。解析IBR基因家族的特性有利于更好地研究该家族基因的功能,完善IBR基因的调控网络,为水稻分子育种提供理论依据。

IBR(In-between-RING fingers)结构域是一个富含半胱氨酸的锌指结构域,它含有两个结合锌离子,结合到C4和C2HC配体上,这是所有IBR同源物中最保守的残基[10]。IBR家族与LAP(Leukemia-associated Protein)/PHD(Plant Homeo Domain),LIM(Lin11,Isl1,and Mec3)和RING(Really Interesting New Gene)finger家族并列,都属于锌指蛋白一类[11-12]。锌指蛋白(ZFPs,Zinc Finger Proteins)是一个具有锌离子结合指样(ZnF,Zinc Finger)结构域的大型调控蛋白家族,能够与RNA、DNA、多聚ADP-核糖、蛋白质和脂质相互作用。“锌指”已经被广泛用于描述几乎任何围绕一个或多个结构锌构建的小蛋白质结构域。目前,已有30多种不同类型的ZFPs被描述,它们涉及多种细胞过程,包括转录调节、染色质重塑、蛋白质稳态、信号转导以及细胞增殖和分化[13-16]。IBR家族结构模型为C-X4-C-X(14-30)-C-X(1-4)-C-X4-C-X2-C-X4-H-X2-C,其中,C代表Cys(半胱氨酸),H代表His(组氨酸),X代表任意一种氨基酸残基。结构域包括处于特定位点的7个半胱氨酸和一个组氨酸残基,以及其他氨基酸。与锌结合的配位基为C=半胱氨酸,H=组氨酸。IBR结构域通常出现在一对RING finger结构域之间,也被称为C6HC(Cys(6)-His-Cys)或者DRIL(double RING finger linked)结构域[11]。在植物中,许多RING finger蛋白被报道可以增强耐旱性和耐盐性[17]。这3个结构域的顺序和距离具有保守性,表明这种空间组织具有重要的功能,因此又把这3个结构域看作一体,命名为RBR/TRIAD(for two RING fingers and a DRIL)结构域[11]。RBR连接酶可通过连接子域连接子的灵活性实现3个子域彼此间的重排,从而在多步反应中转移泛素[18]。每种RBR连接酶都进化出了特定的理化性质,以适应其调节的生物过程[19]。已有研究显示,SCF(SKP1-CUL1-F-box)连接酶可与ARIHI(一种RBR型E3连接酶)形成E3-E3超级组装,从而将F-box蛋白上的不同底物泛素化[20]。此外,也有研究发现RBR连接酶与底物之间存在直接结合相互作用[21]。目前关于水稻基因组中IBR基因家族的研究尚未见报道。

本研究围绕IBR基因家族的特性,从IBR基因家族氨基酸序列的结构特点、物种之间的进化关系以及代表性基因的结构域情况等进行系统的描述,研究结果为深入阐述IBR基因家族的分子功能和调控网络提供理论依据。

1 材料与方法

1.1 基因组调查

通过NCBI中的蛋白数据库,搜索到水稻基因组中的含有IBR结构域的基因。通过SMART/PFam(http://smart.embl.de/smart/set_mode.cgi?GENOMIC=1或http://pfam.xfam.org/)对搜索到的IBR蛋白逐个核实其是否冗余。通过NCBI蛋白数据库搜索IBR和物种关键词,再通过分类群(Taxonomic Groups)筛选得到IBR蛋白氨基酸序列。

1.2 水稻中IBR基因家族系统发生分析

根据邻近法推断IBR进化历史[22],得到分支长度总和为11.13的最优树。通过p-distance的方法[23]以及每个单元中氨基酸差异位点的数量计算得到进化距离。此次分析包括了124个氨基酸序列,所有低于50%覆盖率的位点(即低于50%的对位空隙、空缺数据、歧义碱基被允许出现在任何的位点)都被清除。最终数据结果一共比对了226个位点,通过MEGA7软件进行进化分析[24]。

IBR结构域氨基酸序列比对通过软件MEGA7中ClustalW功能实现。无根的系统发生树采用软件MEGA7中进化树(Phylogeny)模块中的邻近法,根据氨基酸序列的对位比较结果而建成。参数设置中,Number of Bootstrap Replications为5 000,即反复计算5 000次,用来检验所计算的进化树分支可信度;Bootstrap value>70时认为分支可靠。

1.3 其他植物中含有IBR结构域的基因

水稻、高粱、玉米、大豆、拟南芥这5个物种的基因组大小数据,来自于NCBI中的genome数据库(https://www.ncbi.nlm.nih.gov/genome/)。

通过邻近法推断IBR进化历史[22],得到分支长度总和为22.78的最优树。通过p-distance的方法[23]以及每个单元中氨基酸差异位点的数量计算得到进化距离。此次分析包括了这5个物种共234个氨基酸序列。所有低于50%覆盖率的位点(即低于50%的对位空隙、空缺数据、歧义碱基被允许出现在任何的位点)都被清除。最终数据结果一共比对了120个位点,通过MEGA7软件进行进化分析[24]。

1.4 水稻中IBR基因家族结构分析

保守结构域的预测通过PROSITE数据库(https://prosite.expasy.org/)实现。结构域的作图通过在线作图网站(http://ibs.biocuckoo.org/online.php)实现。基因功能的预测通过NCBI中的BLAST功能(https://blast.ncbi.nlm.nih.gov/Blast.cgi)实现。

1.5 水稻中IBR蛋白亚细胞定位

水稻IBR蛋白的亚细胞定位通过Plant-PLoc server(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)实现。

1.6 水稻中IBR基因家族的表达分析

水稻含IBR结构域基因表达情况的分析通过网站(https://ricexpro.dna.affrc.go.jp/category-select.php)实现。

2 结果与分析

2.1 基因组调查

为了深入了解IBR基因家族的特性,本研究在NCBI数据库中共找到184条预测为IBR结构域的水稻蛋白质序列。对这些蛋白质进行冗余分析,发现其中一些蛋白被同一基因编码。另外,使用SMART的PFam domain分析功能,发现有些蛋白序列中含有IBR结构域,有些蛋白质序列则不包含IBR结构域。最终确定水稻基因组中没有冗余且含有IBR结构域的基因共124个。

2.2 水稻中IBR基因家族系统发生分析

使用MEGA7软件对上述124个蛋白序列进行多序列对位排列,结果表明,其基因两侧都存在RING finger结构域,不存在只有单独的IBR结构域或只有一侧有RING finger结构域的情况。

对水稻家族中124个IBR基因进行系统进化分析,结果表明,水稻124个IBR基因被分为A、B两个组,A组包括79个基因,B组包括45个基因。每一组又被进一步分为两个亚族,其中A1、A2分别包含75个和4个基因;B1、B2分别有22个和23个基因(图1)。

注:“★”表示被选出分析保守结构域。图1 124个IBR基因家族成员在水稻中的系统进化关系Fig.1 Phylogenetic relationships for the 124 members of IBR gene family in rice

2.3 其他植物中含有IBR结构域的基因

为了进一步了解其他物种IBR基因家族的进化情况,本研究选取了模式植物拟南芥(Arabidopsisthaliana)和常见的农作物玉米(Zeamays)、大豆(Glycinemax)、高粱(Sorghumbicolor),对其IBR基因家族进行分析。和水稻IBR基因家族的搜索方法一样,首先在NCBI数据库中找到含IBR结构域的蛋白,然后对这些蛋白进行冗余分析,再通过SMART的PFam domain分析功能确定含IBR保守域的蛋白。最终确定了模式作物中含IBR结构域的蛋白分别有:高粱44个、玉米44个、大豆43个、拟南芥39个。利用MEGA7的邻近法建树算法,把所确认的这些物种IBR蛋白与水稻的64个IBR蛋白的氨基酸序列进行系统发生分析,并建立系统发生进化树。

结果表明,玉米、大豆、高粱、拟南芥中的IBR蛋白嵌合到水稻系统发生树的4个分支内。其中,高粱中大多数IBR家族基因被分到了A组;A2分支中仅包含水稻和高粱的IBR家族基因;除A2分支外,以上5个物种的IBR家族基因在其他3个分支(即A1、B1、B2分支)中均有分布(图2和表1)。

图2 拟南芥、玉米、大豆、高粱和水稻5个物种的IBR家族基因系统进化关系Fig.2 Phylogenetic relationships for the IBR gene family in five species of arabidopsis (At),maize (Zm),soybean (Gm),sorghum (Sb),and rice (Os)

表1 5种植物中IBR家族基因在系统发生进化树中不同分支的分布Table 1 The distribution of IBR family genes in the phylogenetic tree of five crops

2.4 水稻中IBR基因家族结构分析

从水稻系统发生进化树的不同分支中选取9个IBR家族基因进行蛋白结构域的分析(图3),其中A1分支选取4个基因(OsJ_29388、OSIGBa0101B20.22、OSIGBa0101B20.26、OSJNBa0006A01.8),A2分支选取1个基因(Os07g0621500),B1分支选取2个基因(LOC_Os03g42790、LOC_Os03g13100),B2分子选取2个基因(OJ990528_30.1、Os08g0540300)。结果表明,这9个含有IBR结构域的基因,除了包含IBR结构域之外,还包含其他的保守功能结构域,例如:RING、ZF_RANBP2、ZF_BBOX、RWD、C2H2、2FE2S_FER结构域。ZF_RANBP2、ZF_BBOX、C2H2这3个结构域都属于锌指结构域家族;RWD结构域在PROSITE数据库中,预测到的α螺旋/β折叠可能为与泛素结合酶的结构域有关;2FE2S_FER结构域,即铁氧化还原结合型铁硫结合蛋白,通常在代谢酶的结构域中发现。

图3 水稻中9个IBR家族基因蛋白结构分析Fig.3 Analysis on protein structure of 9 IBR family genes in rice

通过GenBank数据库中的BLAST对上述9个IBR家族基因的氨基酸序列进行同源性分析,分别预测它们的功能。结果显示,水稻中与这9个基因同源性高(query cover>90%)的氨基酸序列都被预测为E3泛素连接酶,且在不同的水稻品种中都被预测具有E3泛素连接酶的功能。被预测的E3泛素连接酶的类型有6种,分别为E3 ubiquitin-protein ligase RNF144A-B、RNF14、ARI1、ARI2、ARI3、ARI8。

2.5 水稻中IBR蛋白质亚细胞定位

对水稻中的124个IBR蛋白,用Plant-PLoc server[21]软件进行亚细胞定位预测。结果显示,这些IBR蛋白主要被定位到细胞核、高尔基体、叶绿体等亚细胞结构内(表2)。其中,120个被定位在细胞核,占96.8%;2个被同时定位在细胞核和高尔基体;1个被同时定位在细胞核和叶绿体;1个被定位在高尔基体。

2.6 水稻中IBR基因家族的表达分析

从水稻表达谱数据库RiceXPro搜索到23个含IBR结构域的水稻基因,分析其在幼苗、幼穗及愈伤组织中的RNA表达情况,发现这些基因在不同组织或器官中检测到的表达水平不同。在23个含IBR结构域的水稻基因中,有15个至少在一个组织或器官中表达(FPKM>1);12个基因的表达水平较高(FPKM>3),其中,基因Os08g0540300在幼苗和愈伤组织中表达水平最高,基因LOC_Os12g43560在幼穗中表达水平最高。

在高表达的12个基因中,有6个属于A1分支,1个属于A2分支,2个属于B1分支,3个属于B2分支。

3 结论与讨论

水稻是我国的主要粮食作物之一,也是世界上食用人口最多的农作物,对水稻基因家族的研究有利于更好地了解这些家族基因的特性,从而挖掘一些优异基因应用于水稻分子育种[26]。在高等植物中,IBR基因家族普遍存在,甚至在细菌、病毒中也广泛存在。IBR基因家族是一个相对较古老的基因家族[16],但对该基因家族特性却很少被系统地报道。

根据水稻基因组精确测序结果,水稻基因组大小为389 Mb,预测编码大约32 000个基因[27]。其他单子叶植物的基因组更大,高粱泛基因组大小为954.8 Mb,其中核心基因组序列占比62%,非核心基因组序列占比38%[28];玉米基因组大小约为2 191 Mb[29]。然而,本研究发现没有冗余的含有IBR结构域的基因中,水稻、玉米、高粱分别有124个、44个和44个;水稻的基因组最小,但其IBR家族基因最多。表明IBR基因家族在水稻中进化得更快,且与基因组的大小无关。

通过多序列比对和进化分析发现,水稻IBR结构域两侧都存在RING finger结构域,这与Ngwa等[16]的研究成果相符合。但是水稻IBR结构域两侧RING finger结构域具有不同于已报道的典型RING finger结构域的特点[30]。结合IBR结构域的研究成果[31-32],推测这种变化可能是为了配合IBR结构域实现细胞代谢中的某些功能,如调控诱导信号通路或参与葡萄糖代谢等途径。进一步分析发现,IBR结构域N末端的RING finger结构域的结构十分保守,与Sun等[30]的研究结果相比,推测水稻含有IBR结构域的基因中N末端RING finger结构域的保守性可能与结合某种E2泛素结合酶有关。

本研究对水稻9个IBR基因家族保守结构域进行分析,共预测到6种E3泛素连接酶,说明水稻中的IBR结构域与两侧RING finger结构域组成的复合体是一类E3泛素连接酶。关于水稻中泛素化的研究已取得一些进展,如OsPUB67蛋白可正向调节干旱胁迫[33];OsPUB2和OsPUB3蛋白响应低温胁迫[34];OsATL38蛋白负向调控水稻对冷胁迫的耐受性[35];GW2基因影响水稻粒型[36]等。在水稻(Oryzasativa)中发现的一种微管相关的E3连接酶(Microtubule-associated C4HC3-type E3 Ligase,MEL),能够整合和启动一系列宿主免疫信号,对病毒、真菌和细菌病原体具有广谱抗性[37]。此外,E3泛素连接酶基因OsJMJ715被报道参与了水稻中褐飞虱诱导的防御反应[38]。这些结果表明,IBR基因家族功能广泛,对水稻生长发育及抗性具有重要的作用。

本研究预测的IBR蛋白的亚细胞定位绝大多数(98.6%)位于细胞核中,而在亚细胞定位预测中位于细胞核的蛋白一般为组蛋白、DNA合成酶类、RNA转录及加工酶类、起调控作用的蛋白因子等,由此推测IBR蛋白在细胞代谢中可能作为某种具有调控作用的蛋白因子。调查水稻中IBR家族基因的表达情况,发现在幼苗、愈伤组织、和幼穗中具有高表达量的基因,推测可能与水稻特定生长发育过程所需的细胞代谢有关。

本研究利用生物信息学方法,对水稻IBR基因家族进行了系统的描述。在水稻基因组中找到了124个含有IBR结构域的基因,其中120个被定位在细胞核。这些水稻IBR家族基因聚成A、B两类,包含1个以上保守结构域。拟南芥、玉米、大豆、高粱的IBR蛋白嵌合到水稻的IBR蛋白系统发生树的各分支内。蛋白结构域分析显示水稻IBR家族是一类E3泛素连接酶,根据亚细胞定位结果推测可能与水稻特定生长发育过程所需的细胞代谢有关。这些结果为深入研究该基因家族的功能提供了思路。

猜你喜欢

泛素分支结构域
巧分支与枝
蛋白质结构域划分方法及在线服务综述
一类拟齐次多项式中心的极限环分支
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨
蛋白泛素化和类泛素化修饰在植物开花时间调控中的作用
泛RNA:miRNA是RNA的“泛素”
泛素结合结构域与泛素化信号的识别
SCF E3泛素化连接酶的研究进展
生成分支q-矩阵的零流出性