大豆YABBY 基因家族生物信息学分析及组织表达模式研究*
2023-12-28胡春娇梁雪枫姜振峰
胡春娇,梁雪枫,姜振峰
(东北农业大学农学院,哈尔滨 150030)
转录因子(Transcription factor,TF)可特异性识别并与靶基因上游启动因子区域特异DNA 序列模体结合,使其转录激活或抑制,从而调控植物生长发育[1]。YABBY 基因家族属锌指蛋白超家族,是一类存在于植物体内的转录因子,包含2 个高度保守的结构域,其中一个为位于YABBY 蛋白N端的锌指结构域,另一个为位于C 端的“螺旋-环-螺旋”结构域[2]。
双子叶植物中YABBY 基因的研究较为深入。Bowma 等[2]研究发现YABBY 基因与植物生长发育调控植物形态建成和器官发育有相关。YABBY 基因共有5 个亚族,分别为CRC、FLA/YAB3、INO、YAB2、YAB5[3]。其中CRC 基因在心皮和蜜腺中表达,在蜜腺的生长和成熟中发挥重要作用[4];FLA基因与花器官形成及叶发育有关[5-6];INO 基因调控外胚珠珠被发育[7];YAB2、YAB3、YAB5 在植物营养组织中特异表达[8-9]。目前,在拟南芥[10]、水稻[11]、玉米[12]、紫花苜蓿[13]、棉花[14]中分别鉴定出6、8、13、8、23 个该基因家族成员。现有研究发现棉花中所有YABBY 基因家族成员均可在花、蕾和茎端组织中表达[14];YAB7 基因在水稻维管发育中发挥重要作用[15];TaYAB1_5AL 基因在小麦叶原基发育与叶片近-远轴端极性的建立密切相关[16];PgINO 基因在石榴中参与花器官发育且对外种皮发育产生负调控作用[17]。
大豆为我国主要油料作物,在农业生产中占有重要地位[18],其生长发育过程存在复杂的遗传控制机制。在完成大豆全基因组测序[19]和掌握分析大豆全基因组使用方法[20]后,大豆分子生物学实现了新跨越,众多基因功能被阐释。目前,YABBY 基因家族研究多集中在拟南芥、水稻、玉米、紫花苜蓿和棉花[10-14],在大豆生长发育过程中的研究尚未见报道。为探究YABBY 基因家族在大豆生长发育过程中的作用,本研究利用生物信息学手段对大豆YABBY 基因家族理化性质、基因结构、蛋白质二级及三级结构、保守基序分布、系统进化树构建和大豆植株各组织基因表达模式进行分析,旨在为深入研究大豆YABBY 基因家族功能提供理论基础。
1 材料与方法
1.1 试验材料
试验中的蛋白序列、基因序列、基因组注释文件分别来自以下网站:Phytozome(https://phytozome-next.jgi.doe.gov/)、NCBI 数据库(https://www.ncbi.nlm.nih.gov/)、大豆基因组数据库SoyBase(https://www.soybase.org/)。
1.2 试验方法
1.2.1 大豆YABBY 基因家族成员鉴定
由于拟南芥LED 基因与大豆YABBY 基因在序列上存在相似性,因此将拟南芥LED 基因作为查询对象。为获取大豆基因组中包含的全部YABBY基因,通过Phytozom(https://phytozome-next.jgi.doe.gov/)基因组数据库,根据拟南芥YABBY 基因氨基酸序列进行系统BLAST 检索,获得目的基因在大豆中的同源基因,删去重复基因,筛选候选基因;通过Smart(http://smart.embl.de/)在线网站进行结构域预测;利用Pfam(http://pfam.janelia.org/)在线网站下载YABBY 结构域文件,再利用HMMER 3.0软件构建YABBY 基因家族隐马尔可夫模型文件,将2 个文件比对搜索,最后获得大豆YABBY 基因家族成员。
1.2.2 大豆YABBY 基因家族理化性质分析
文中所有基因和蛋白序列来源均为Phytozome(https://phytozome-next.jgi.doe.gov/)基因组数据库。利用Phytozome 基因组数据库和Expasy(https://www.expasy.org/)在线网站对YABBY 基因家族成员进行理化性质分析,得到氨基酸长度、分子质量、等电点等信息。
1.2.3 基因编码蛋白质二级结构与三级结构预测
在Phytozome 数据库下载得到大豆YABBY基因家族成员的蛋白序列,利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl.page=npsa_sopma.html)在线网站预测大豆YABBY 蛋白质二级结构;利用SWISS-MODEL 在线网站构建基因编码蛋白质的三级结构模型。
1.2.4 大豆YABBY 基因家族Motif 分析
利用MEME(https://meme-suite.org/meme/tools/meme)在线网站上传大豆YABBY 基因家族蛋白序列,对Motif 进行预测[21]。
1.2.5 构建大豆YABBY 基因家族系统进化树
在Phytozome 数据库中下载大豆、拟南芥基因蛋白序列,利用MEGA 11 比对分析基因蛋白序列,再使用MEGA 11 构建系统进化树,同时利用chiplot 在线网站将nwk 格式文件作为基础对进化树进行美化。
1.2.6 大豆YABBY 基因家族共线性分析
在大豆基因组数据库SoyBase 和拟南芥数据TAIR(https://www.Arabidopsis.org/)中下载大豆和拟南芥全基因组序列和基因结构注释文件,使用McScan 软件进行共线性分析预测,利用TBtools v1.09857 软件绘图。
1.2.7 大豆YABBY 基因家族表达分析
通过数据库SoyBase(https://www.soybase.org/)下载大豆YABBY 基因家族成员在6 个不同组织中的表达量转录组数据,使用软件TBtools v1.09857的Heat Map 功能绘制热图,以log scale(base=2 和log with=1)为基础,对数据进行归一化处理。
2 结果与分析
2.1 大豆YABBY 基因家族成员鉴定
本研究利用拟南芥LED 基因保守结构域及全长蛋白,通过BLAST 对大豆基因组学数据库进行查询,再利用Smart 网站进一步确认和人工校对,最终获得17 个大豆YABBY 基因家族成员,分别命名为GmYABBY1~GmYABBY17。
2.2 大豆YABBY 基因家族的蛋白质特性分析
由表1 可知,大豆YABBY 基因家族成员的氨基酸数量为173~264 aa,分子质量为18 908.42~29 605.55 Ku。等电点为5.30~9.34,除Glyma.01g029300、Glyma.04g094800、Glyma.06g096500、Glyma.08g285200、Glyma.18g140400 外,其余蛋白等电点均>7.00,表明大豆YABBY 基因家族蛋白大部分呈碱性。大豆YABBY 基因不稳定系数均>40,且蛋白疏水性均<0,表明大豆YABBY基因家族成员蛋白均为稳定的亲水蛋白。
表1 大豆YABBY 基因家族成员蛋白信息及理化性质
2.3 大豆YABBY 基因家族蛋白质的二级结构与三级结构分析
在二级结构预测[22]过程中,YABBY 基因编码的蛋白质α-螺旋均大于0.160 0,其中GmYABBY1、GmYABBY6、 GmYABBY16,GmYABBY3 和GmYABBY10,GmYABBY4 和 GmYABBY7,GmYABBY8 和GmYABBY9 的α-螺旋相近。β-转角中,GmYABBY3 和GmYABBY8,GmYABBY5、GmYABBY6 和 GmYABBY7,GmYABBY12 和GmYABBY15,GmYABBY13 和 GmYABBY14,GmYABBY16 和GmYABBY17 分别相近。β-转角中最大的基因为GmYABBY1,最小的基因为GmYABBY9。无规则卷曲为0.473 5~0.622 3,其中GmYABBY3 和 GmYABBY4,GmYABBY7 和GmYABBY14 无规则卷曲度相近。延伸链为0.1152~0.2216,其 中 GmYABBY2 和 GmYABBY6,GmYABBY4 和 GmYABBY13,GmYABBY5 和GmYABBY10,GmYABBY7 和 GmYABBY15,GmYABBY9、GmYABBY11 和GmYABBY16 的延伸长度分别相近(见表2)。
由图1 可知,GmYABBY2 和GmYABBY4,GmYABBY3 和 GmYABBY5 三级结构相似,GmYABBY6、 GmYABBY8、 GmYABBY10 和GmYABBY17 三级结构表现一致,GmYABBY9 和GmYABBY11 三级结构表现相同。结果表明,部分基因家族成员蛋白质三级结构相同。
图1 大豆GmYABBY 蛋白质三级结构预测
2.4 大豆YABBY 基因家族保守基序分析
通过MEME 在线工具对大豆YABBY 基因家族的17 个成员蛋白序列中的保守序列进行预测,结果表明在大豆YABBY 基因家族中共存在5 个保守基序,分别命名为Motif 1~Motif 5。
由图2 可知,大豆GmYABBY 基因家族成员的保守Motif 数量为2~4 个,其中Motif 1 与Motif 2出现频率最高,为17 次;其次为Motif 3,出现频率为14 次;Motif 5 出现频率最低,仅为4 次。
GmYABBY1、GmYABBY8、GmYABBY10 和GmYABBY17 保守基序相似,GmYABBY3、GmYABBY5、GmYABBY7 和GmYABBY16 保守基序相似,GmYABBY9、GmYABBY11、GmYABBY13、GmYABBY14 和GmYABBY15 保守基序高度相似,GmYABBY2 和GmYABBY12 高度近似。Motif 1 与Motif 2 通常同时成对出现。根据大豆YABBY 基因家族进化关系分析,进化关系相近的同一亚族成员在保守基序组成上具有较高相似性,表明同一亚族成员在基因功能上也具有较高的相似性。
2.5 大豆YABBY 基因家族系统进化分析
由图3 可知,根据系统发育关系和序列相似性将大豆YABBY 基因家族分为4 个亚族(ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ),4 个亚族均包含拟南芥和大豆这2 个物种。其中,ClassⅠ包含5 个大豆基因(GmYABBY1、GmYABBY6、GmYABBY8、GmYABBY10、GmYABBY17)、1 个拟南芥基因(AT1G23420),目标基因GmYABBY6 和GmYABBY8 高度同源;Class Ⅱ包含2 个大豆基因(GmYABBY2、GMYABBY4)、1 个拟南芥基因(AT1G69180),目标基因GmYABBY2 和GmYABBY4 高度同源;Class Ⅲ包含4 个大豆基因(GmYABBY3、GmYABBY5、GmYABBY7、GmYABBY16)、2 个拟南芥基因(AT2G45190、AT4G00180),目标基因 GmYABBY5 和 GmYABBY16,GmYABBY3 和GmYABBY7 均高度同源;ClassⅣ包含6 个大豆基因(GmYABBY9、GmYABBY11、GmYABBY12、 GmYABBY13、 GmYABBY14、GmYABBY15)、2 个拟南芥基因(AT1G08465、AT2G26580),目标基因 GmYABBY11 和GmYABBY14,GmYABBY13 和GmYABBY15 均高度同源。
图3 大豆、拟南芥YABBY 基因家族系统进化树
2.6 大豆YABBY 基因家族共线性分析
植物进化阶段常通过基因复制的方式达到扩大基因组目的。为探究大豆YABBY 基因家族进化关系,对大豆YABBY 基因家族进行物种内共线性分析。由图4 可知,在大豆20 条染色体上共发生14 次复制事件。其中GmYABBY11、GmYABBY12发生3 次复制事件,GmYABBY1、GmYABBY10、GmYABBY14 和GmYABBY17 发生2 次复制事件,其余基因各发生1 次复制事件。结果表明,大豆YABBY 基因在进化过程中出现了基因分化。
图4 大豆GmYABBY 基因共线性关系
2.7 大豆YABBY 基因家族表达模式分析
由图5 可知,GmYABBY4 和GmYABBY6 在6 个组织中均未表达,表明这2 个基因可能为诱导表达基因。GmYABBY11 除在根和根瘤中不表达,在其他组织中均表达,且表达量较高。GmYABBY3和GmYABBY5 在种子发育后期表达量较高,表明这2 个基因可能与种子发育有关。GmYABBY11 在叶和荚的发育期表达量较高,表明该基因可能与叶和荚的发育相关。17 个大豆GmYABBY 家族基因中大部分成员在花、叶中表达量较高,在根与根瘤中表达量较低甚至不表达,表明GmYABBY基因可能参与花和叶的发育过程。
图5 大豆YABBY 家族基因在不同组织中的表达图谱
3 结论与讨论
YABBY 基因家族是一种影响植物侧生器官发育的转录因子[23],在植物花器官发育、激素响应、逆境应答等方面发挥关键作用[24]。本研究利用生物信息学方法在大豆中共鉴定出17 个YABBY 基因家族成员,其氨基酸数量为173~264 aa,分子质量为18 908.42~29 605.55 Ku,等电点最小(GmYABBY8)为5.30,最大(GmYABBY2 和GmYABBY4)为9.34。通过对其理化性质分析可知,大豆YABBY 基因家族成员蛋白大部分呈碱性,表明该家族含有较多的碱性氨基酸,如组氨酸、精氨酸、赖氨酸。大豆YABBY 基因不稳定系数均>40,且蛋白疏水性均<0,表明大豆YABBY 基因家族成员蛋白均为稳定的亲水蛋白。系统进化树分析表明,本研究中鉴定的17 个大豆YABBY 基因家族成员与拟南芥相同,分为4 个亚族,且每个亚族均包含与拟南芥同源的基因,由此推断,大豆与拟南芥的YABBY 基因家族成员可能具有相似基因功能。
蛋白质二级结构主要由α-螺旋、β-折叠、无规则卷曲和延伸链这4 种空间结构构成。GmYABBY 基因家族的17 个基因的蛋白质二级结构主要由无规则卷曲形成。GmYABBY6、GmYABBY8、GmYABBY10 和GmYABBY17 的氨基酸序列高度相似,且这4 个基因的蛋白质三级结构相似。
物种内共线性分析表明,在大豆20 条染色体上共发生14 次复制事件,表明大豆YABBY 基因在进化过程中出现了基因分化。
李圣龙[25]等从石榴基因组中鉴定得到6 个YABBY 基因,发现Pg YABBY 基因家族在石榴的生长发育和生理过程中起重要作用。本研究通过对GmYABBY 家族基因表达模式分析发现GmYABBY6 和GmYABBY10 基因在叶、花、荚3 个发育时期及根、根瘤、种子7 个不同发育时期的6 个组织中均未表达,表明这2 个基因可能为诱导表达基因。GmYABBY 家族基因成员在花、叶中表达量较高,在根与根瘤中表达量较低甚至不表达,表明GmYABBY 基因可能参与花和叶的发育。GmYABBY3 和GmYABBY5 在种子发育后期表达量较高,表明这2 个基因可能与种子的发育相关。
本研究对大豆YABBY 基因家族进行初步鉴定,并进行了生物信息学分析及组织表达模式研究,初步揭示大豆YABBY 基因可能参与花、叶及种子发育,为今后深入研究大豆YABBY 基因家族功能提供理论基础。