APP下载

大豆GeBP转录因子家族基因生物信息学分析

2021-04-19张军尹珺王岩田秋丰刘秋瑾何佳琦黄宇翔王丽坤史同瑞翟莹

关键词:基序拟南芥磷酸化

张军,尹珺 伊,王岩,田秋丰,刘秋瑾,何佳琦,黄宇翔,王丽坤,史同瑞,翟莹

(1.黑龙江省农业科学院畜牧兽医分院,黑龙江 齐齐哈尔161005;2.齐齐哈尔大学 生命科学与农林学院,抗性基因工程与寒地生物多样性保护黑龙江省重点实验室,黑龙江 齐齐哈尔161006)

植物表皮毛普遍存在于陆生植物的体表,这种特化的结构可以在植物的生长发育过程中发挥保护作用,例如减少植物热量和水分的散失,保护植物免受昆虫和病原体的侵害等[1-2]。无表皮毛增强子结合蛋白(Glabrous-enhancer binding protein,GeBP)是植物中特有的一类非经典亮氨酸拉链转录因子蛋白,它们在表皮毛的发生过程发挥重要的调控作用,这种作用是通过调控GL1(GLABROUS1)基因(拟南芥中控制表皮毛发生的基因之一)的表达来实现的[3]。目前,已经在拟南芥、水稻、番茄和毛竹中分别鉴定了16[3]、15[4]、10[5]和16[6]个GeBP 基因家族成员。拟南芥AtGeBP 并不参与细胞的增殖过程,而是通过调控拟南芥体内赤霉素和细胞分裂素来控制表皮毛细胞的伸长[5,7]。毛竹中12 个PeGeBP 的表达量在有表皮毛的组织中高于无表皮毛的组织,表明这些基因参与了表皮毛形成的调控。

大豆是重要的油料作物,其表皮毛的发生具有重要的研究价值。大豆基因组测序的完成以及植物转录因子数据库PlantTFDB 的构建[8],为大豆转录因子家族的获取及功能研究提供了便利。但到目前为止,有关大豆GeBP 转录因子家族基因的功能研究尚未开展。本研究利用生物信息学方法对大豆中的9 个GmGeBP基因进行了预测分析,为后续GmGeBP 基因的功能研究提供参考和理论依据。

1 实验部分

1.1 材料

从植物转录因子数据库PlantTFDB(http://planttfdb.gao-lab.org/index.php)中下载大豆GmGeBP 转录因子家族的基因及蛋白质序列。

1.2 生物信息学分析

通过DNAMAN 软件将下载的GmGeBP 蛋白质序列进行比对,剔除重复序列。使用在线网站ExPASy(https://web.expasy.org/compute_pi/)对GmGeBP 蛋白的分子量和等电点进行预测;使用在线网站SMART(http://smart.embl-heidelberg.de/smart/set_mode.cgi?NORMAL=1)对GmGeBP 蛋白序列的保守结构域及位置进行预测;使用在线网站NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)对GmGeBP 蛋白的磷酸化位点进行预测;使用在线网站WoLF PSORT(https://wolfpsort.hgc.jp/)对GmGeBP 蛋白的亚细胞定位进行预测;使用在线网站MEME(http://meme-suite.org/tools/meme)对GmGeBP 蛋白的保守基序进行搜索。

1.3 系统进化树的构建

从PlantTFDB 数据库中获取拟南芥GeBP 蛋白序列。利用MEGA5 软件中的邻接法(NJ)法构建大豆和拟南芥GeBP 蛋白的系统进化树,Boot-strap 重复次数默认1 000,其他均为默认参数。

2 结果与讨论

2.1 GmGeBP 家族基因的获取及序列分析

在植物转录因子数据库PlantTFDB 中获得10 个大豆候选GmGeBP 基因序列。通过蛋白质序列比对,剔除1 个重复基因序列,将剩余的9 个GmGeBP 基因依次命名为GmGeBP1-9。进一步对GmGeBP 基因及蛋白序列进行分析,结果如表1 所示,9 个GmGeBP 基因分别分布在大豆的7 条染色体上(3、5、10、13、15、19 和20 号染色体),其中10 号和20 号染色体上分别含有2 个GmGeBP 基因。它们所编码的肽链长度在353~448 个氨基酸之间,蛋白序列长度差异较大,因此它们的蛋白分子量差异也较大,范围在39.65~49.24 之间。除GmGeBP2 蛋白的等电点为9.08,其他GmGeBP 蛋白的等电点范围处在4.65~5.48 之间,偏酸性类型。

表1 9 个大豆GmGeBP 基因及蛋白序列的鉴定及特性

2.2 GmGeBP 蛋白保守结构域、磷酸化位点及亚细胞定位预测分析

保守结构域预测分析结果如图1 所示,9 个GmGeBP 蛋白序列中均含有1 个功能未知的DUF573 基序。因为DUF573 基序是GeBP 转录因子的中央结合DNA 结构域[5],进一步证明所鉴定的9 个蛋白均为GeBP家族成员。此外,GmGeBP1、3、5、6、7、9 含有多个低重复序列区和1 个螺旋区域,GmGeBP2、4、8 仅含有多个低重复序列区,GmGeBP7 还含有1 个SCOP 结构域。9 个GmGeBP 基因序列中DUF573 基序所处位置存在一定差异,且除了DUF573 基序较为保守外,其他序列部分相似度较低。此外,9 个GmGeBP 基因所编码的肽链长度差异也较大,等电点也各不相同。这些都可能与GmGeBP 基因功能差异相关。

磷酸化位点预测结果显示(表1),除GmGeBP6 蛋白仅含有丝氨酸(Ser)和苏氨酸(Thr)磷酸化位点外,其他8 个GmGeBP 蛋白均含有不同数量的Ser、Thr 和酪氨酸(Tyr)磷酸化位点,且Ser 数量﹥Thr数量﹥Tyr 数量。根据GmGeBP 蛋白中大量磷酸化位点的存在,推测它们可以借助磷酸化及去磷酸化作用调节GmGeBP 蛋白与DNA 顺式作用元件的结合[9]。

亚细胞定位预测结果显示(表1),9 个GmGeBP 蛋白定位于细胞核中的概率均大于89%,且它们均含有1~3 个明显的核定位信号。这与毛竹PeGeBP 蛋白亚细胞定位预测结果相符[6],但不同于水稻OsGeBP蛋白亚细胞定位预测结果[4]。

2.3 GeBP 蛋白系统发育分析

使用MEGA5 软件对 9 个GmGeBP 蛋白和18 个拟南芥AtGeBP 蛋白进行系统进化分析。如图2 所示,27 个GeBP 家族成员可分为5 个进化枝,分别含有11 个(Ⅰ)、4 个(Ⅱ)、1 个(Ⅲ)、4 个(Ⅳ)和7 个(Ⅴ)GeBP 蛋白。进化枝Ⅰ和Ⅳ为拟南芥和大豆共有,进化枝Ⅱ和Ⅴ为拟南芥独有,进化枝Ⅲ为大豆独有,且仅含有一个大豆GmGeBP4 蛋白。大豆GmGeBP 家族中存在3 组旁系同源蛋白(GmGeBP1 和GmGeBP7、GmGeBP3 和GmGeBP9、GmGeBP5 和GmGeBP6)。而大豆和拟南芥AtGeBP 家族之间不存在直系同源蛋白,说明GeBP 家族的分化晚于大豆和拟南芥物种的分化。亲缘关系越近,可能意味着基因的功能越相似。进化枝Ⅰ和进化枝Ⅳ为拟南芥和大豆共有,因此这两个进化枝中的GeBP 基因很可能具有相似的生物学功能。

图1 GmGeBP 保守结构域分析

图2 大豆和拟南芥GeBP 家族系统进化树

2.4 GmGeBP 蛋白保守基序分析

蛋白保守基序预测结果显示,9 个GmGeBP 中共存在15 个保守基序(图3)。系统进化树中亲缘关系越近的GmGeBP 蛋白所含有的保守基序分布也越相似。例如GmGeBP1 和GmGeBP7、GmGeBP3 和GmGeBP9、GmGeBP5 和GmGeBP6,所包含的保守基序在类型、数量和顺序上非常相似。这也反映了GeBP 蛋白系统发育分析结果的准确性。

图3 大豆GmGeBP 蛋白保守基序

3 结论

本研究利用生物信息学方法鉴定了9 个大豆GmGeBP 基因,并对基因及蛋白结构和性质、染色体分布、亚细胞定位、系统进化关系等进行分析,为后续GmGeBP 基因的功能研究提供参考和理论依据。

猜你喜欢

基序拟南芥磷酸化
龙眼全基因组和转录本序列SSR位点的鉴定
带TRS基序突变的新型冠状病毒威胁更大
T69E模拟磷酸化修饰对Bcl-2与Nur77相互作用的影响
GDM孕妇网膜脂肪组织中Chemerin的表达与IRS-1及其酪氨酸磷酸化分析
拟南芥栽培关键技术研究
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
磷酸化肽富集新方法研究进展
MAPK抑制因子对HSC中Smad2/3磷酸化及Smad4核转位的影响
拟南芥
口水暴露了身份