APP下载

牡丹基因组中KCS基因的鉴定与演化特征研究*

2022-05-19杜晶晶牟惠冰王晓敏周广灿

菏泽学院学报 2022年2期
关键词:基序分支结构域

李 稳,杜晶晶,牟惠冰,王晓敏,周广灿,2

(1.菏泽学院农业与生物工程学院(牡丹学院),山东 菏泽 274015; 2.菏泽学院牡丹研究院,山东 菏泽 274015)

引言

超长链脂肪酸(Ultra-Long Chain Unsaturated Fatty Acids)是指主链碳原子数≥18个的脂肪酸,在植物的生长发育中起着重要的作用[1].植物中超长链脂肪酸是由锚定在内质网膜上的脂肪酰-CoA延长酶复合体催化合成.脂肪酰-CoA延长酶复合体由四种酶组成,其中β-酮酯酰-CoA合酶(β-Ketoacyl-CoA Synthase, KCS)是催化超长链脂肪酸碳链延长反应的限速酶,并控制着合成超长链脂肪酸的种类[2-5].编码β-酮酯酰-CoA合酶的基因家族被命名为KCS基因家族.KCS基因在植物中起源极早,而且从绿藻类植物中的单拷贝状态通过基因复制扩张成为被子植物中20~30个成员的基因家族[6].随着基因的复制及不同基因拷贝上变异的积累,KCS家族基因成员发生了功能的分化,表现出合成产物的特异性[7-9],并且具有组织与器官的表达特异性[10-11].

牡丹(PaeoniasuffruticosaAndr.)为芍药科(Paeoniaceae)芍药属(Paeonia)多年生落叶灌木.作为中国的国花,牡丹既是一种极具观赏性的花卉,又是一种食材和药材[12].此外,油用牡丹产油率高,富含亚麻酸、亚油酸和油酸等超长链不饱和脂肪酸,是一种优质的木本油料作物[13-14].目前关于牡丹中超长链脂肪酸合成的研究以及牡丹基因组中KCS家族基因的存在情况及其分子演化特征研究的较少.因此,本文运用基础生物信息学的方法,从牡丹基因组中鉴定其编码的KCS家族基因,分析和预测KCS基因在牡丹进化过程中的演化特征,探讨牡丹籽油富含不饱和脂肪酸的分子基础,为后期油用牡丹的分子遗传育种提供理论指导.

1 材料与方法

1.1 材料

在国家基因库生命大数据平台(China National GeneBank DataBase, CNGBdb)下载牡丹(Paeoniasuffruticosa)基因组测序、组装和注释文件(https://db.cngb.org/search/project/CNP0000281/)[15].

1.2 方法

1.2.1 牡丹KCS基因的鉴定

参考Guo等人[6]的方法鉴定牡丹基因组中KCS基因.鉴定采用基于隐马尔科夫模型(Hidden Markov Models)的HMM search和本地BLAST(Basic Local Alignment Search Tool)两种方法鉴定牡丹中的KCS基因.首先以Pfam(http://pfam.sanger.ac.uk/)数据库中KCS基因的3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C结构域 (Pfam: PF08541)和Type Ⅲ polyketide synthase-like结构域 (Pfam: PF08392)的HMM 模型作为问询序列,对牡丹基因组中注释的蛋白序列进行第一轮搜索,参数设定为程序默认.同时,使用KCS基因编码的氨基酸序列对牡丹基因组中注释的蛋白质序列进行BLASTp 搜索,E-value设为1.最后将HMM search和BLAST 方法获得的序列整合并去除重复序列后,提交在线Pfam(http://pfam.sanger.ac.uk/)进一步验证是否每条序列中都存在3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C结构域和Type Ⅲ polyketide synthase-like结构域(E-value 设为0.0001).

1.2.2 牡丹KCS基因编码蛋白质的理化性质分析

对获得的牡丹KCS基因,利用 ProtParam(http://web.expasy.org/protparam/)对其编码氨基酸序列的理化性质进行预测,包括氨基酸长度、分子质量、等电点和不稳定系数等.

1.2.3 KCS基因序列比对和系统演化树的构建

运用ClustalW软件,参数设定为默认值对提取得到的氨基酸序列进行排序,随后使用MEGA6.0软件进行手动校正以提高序列文件质量.最后使用Phyml程序中Maximum likelihood(ML,最大似然法)进行系统发育分析.以拟南芥(Arabidopsis thaliana)的KCS基因为参考序列,构建牡丹KCS基因的演化关系树.内部节点的可靠性使用SH-aLRT(Shimodaira-Hasegawa approximate likelihood ratio test)计算方法进行评估[16].

1.2.4 牡丹KCS基因编码蛋白质的结构域和保守基序分析

利用在线软件https://www.ebi.ac.uk对鉴定的牡丹KCS基因编码蛋白质中的3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C结构域和Type Ⅲ polyketide synthase-like结构域分析并记录它们的大小和位置.通过在线软件MeMe(http://meme.nbcr.net/meme/intro.html)分析牡丹KCS基因的保守氨基酸基序,参数预测数目设为10,其他参数均为默认设置,观察保守基序在 MADS-box 基因上的分布位置.

2 结果与分析

2.1 KCS基因的鉴定及理化性质分析

通过HMM和BLASTp搜索在牡丹基因组中共鉴定出13个KCS基因.它们编码蛋白质的氨基酸数目差异较大(见表1),例如:psu.T.00030776.1中含有274个氨基酸,而psu.T.00028502.1中含有967个氨基酸.在这13个KCS基因编码的蛋白质中,psu.T.00023496.1的等电点最低(5.63),其余编码蛋白质的等电点较高,其中psu.T.00007518.1的最高为9.52.psu.T.00007518.1、psu.T.00020981.1、psu.T.00030776.1、psu.T.00030825.1和psu.T.00031480.1的不稳定系数均大于40,为不稳定蛋白,其余均为稳定蛋白.

表1 牡丹基因组中的KCS基因及其编码蛋白质的性质

2.2 牡丹KCS基因的系统进化分析

以拟南芥基因组中的KCS基因为参照,利用Maximum likelihood(ML,最大似然法)构建牡丹基因组中的KCS基因的系统发育树.由图1可知,演化树由6个演化分支(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ)组成,其中只有演化分支Ⅰ、Ⅱ、Ⅲ和Ⅴ中含有牡丹KCS基因,演化分支Ⅳ和Ⅵ中无牡丹KCS基因.演化分支I中含有psu.T.00024222.1;演化分支Ⅱ中含有psu.T.00002829.1、psu.T.00009670.1、psu.T.00019588.1、psu.T.00020981.1、psu.T.00023496.1和psu.T.00028502.1;演化分支Ⅲ中含有psu.T.00021950.1;演化分支Ⅴ中含有psu.T.00030776.1、psu.T.00030825.1、psu.T.00031480.1、psu.T.00007518.1和psu.T.00007901.1.对演化树进一步分析发现,psu.T.00007901.1的进化分支最长,表明该基因的进化速率较高.

图1 牡丹基因组中KCS基因的系统发育树

注:以拟南芥基因组中的KCS基因为参照,运用ML法构建的演化树,Bootstrap=1 000.括号中的数字表示该演化分支中含有的牡丹KCS基因数目.

2.3 牡丹KCS基因编码蛋白质的结构域和保守基序分析

牡丹基因组中的13个KCS基因均包含3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C结构域和Type Ⅲ polyketide synthase-like结构域,如图2所示.Type Ⅲ polyketide synthase-like结构域的大小为150~290个氨基酸,3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C结构域的大小为80个氨基酸左右.

图2 牡丹KCS基因编码蛋白质的功能结构域及位置

KCS基因编码蛋白质序列的保守基序预测结果表明,如图3所示,牡丹KCS基因编码蛋白序列中的保守基序的种类和数量是不同的.KCS基因编码蛋白质基序较为相似的KCS基因组成同一或演化关系较近的演化分支,如图1和图3所示,不同演化分支或演化关系较近的演化分支中KCS基因的相似性较低.其中,牡丹KCS基因psu.T.00007901.1编码蛋白质的保守氨基酸基序数量最少为3个,与牡丹其他KCS基因成员差别较大,这一结果与系统演化关系分析结果相符.在13个牡丹KCS基因编码蛋白质中均含有motif 1,位于3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C功能结构域中.此外,该结构域中还有motif 3和motif 10、motif 2、motif 4、motif 5、motif 6、motif 7、motif 8和motif 9分布在Type Ⅲ polyketide synthase-like功能结构域中.

图3 牡丹KCS 基因编码蛋白质保守基序图

3 讨论

KCS家族基因在调控超长链脂肪酸合成中起着关键的作用,在多种油料作物中已被发现和克隆.然而,关于牡丹基因组中KCS家族基因的存在情况还鲜有报道.本文通过同源比对鉴定牡丹基因组中的KCS基因,并通过生物信息学相关软件对该基因编码蛋白质的理化性质、功能结构域和演化关系等进行分析,这些初步分析的结果有助于该类基因编码蛋白质的功能研究.

牡丹基因组中共含有13个KCS基因,数目多于最基部植物无油樟(11个)和蔷薇分支基部物种葡萄(8个)[6].虽然牡丹基因组中KCS基因的数目多于无油樟和葡萄,但相对于两者的基因组大小(无油樟:748 Mb;葡萄490 Mb),牡丹基因组(牡丹:13.8 Gb)中KCS基因的丰度较低.此外,植物基因组中的KCS基因数量与物种基因组大小无关.例如:模式植物拟南芥的基因组大小为125 Mb,编码21个KCS基因[17],大豆的基因组大小为1 100 Mb,编码27个KCS基因[6].十字花科植物芜菁基因组中KCS基因的数目是目前已知最多的(31个)[6],但其基因组大小仅为485 Mb.

KCS基因在植物中的起源极早,而且在植物的系统演化过程中逐步扩张,从绿藻类植物中的单拷贝状态通过基因复制扩张成为被子植物中20~30个成员的基因家族[6].目前对KCS基因家族的研究主要集中在十字花科植物中,通过与拟南芥的21个KCS基因构建演化关系树,牡丹基因组中的13个KCS基因可组成4个演化分支(如图1所示),其中演化分支II中含有的KCS基因数目最多(6个).从结构域和氨基酸基序保守性结果来看,同一演化分支中的KCS基因结构较相似,推测其功能应该较为类似.演化分支Ⅳ和Ⅵ中仅分别含有拟南芥的FAE1-LIKE亚类KCS基因和CER6亚类KCS基因,如图1所示.2016年,Guo等人研究表明FAE1-LIKE亚类KCS基因是十字花科植物特有的[6],而CER6亚类KCS基因可能在牡丹的演化历程中发生了基因丢失.

作为新兴的木本油料作物,牡丹种子不但含油量高,而且富含亚麻酸、亚油酸和油酸等超长链不饱和脂肪酸.研究牡丹KCS基因的演化特征可以进一步发掘牡丹KCS基因的功能,加深对其脂肪酸合成机制的了解,为油用牡丹的分子遗传育种提供一定的理论指导.

猜你喜欢

基序分支结构域
细菌四类胞外感觉结构域的概述
带TRS基序突变的新型冠状病毒威胁更大
一类离散时间反馈控制系统Hopf分支研究
一类四次扰动Liénard系统的极限环分支
芥蓝Aux/IAA家族基因生物信息学与表达分析
鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
革兰氏阳性菌蛋白结构域特征分析
巧分支与枝
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析