基于线粒体DNA序列分析金虎尾目在蔷薇亚纲中的地位
2021-01-18覃佳佳姚慧鹏
卿 华,覃佳佳,靳 燕,马 政,姚慧鹏
(四川农业大学生命科学学院,四川 雅安 625014)
金虎尾目(Malpighiales)是蔷薇亚纲中的一个目,包含金虎尾科(Malphigiaceae)、大戟科(Euphorbiaceae)、杨柳科(Salicaceae)等 36 个科,截止至2016年是APG IV系统中科数最多的目之一。目前已发现73属,1315种,原产于热带和亚热带[1]。有关金虎尾目在蔷薇亚纲中的植物学地位已经找到了两个主要的观点。第一个观点是金虎尾目与豆类的亲缘性更近。2000年D.E.Soltis等人通过18s rDNA、vbcL、和atpB序列分析,将金虎尾目归属于豆类中的一个分支[2],2002年APGII系统也认同了这种分类[3];2007年Zhu X.Y.等人选取了线粒体基因matR、叶绿体基因atpB、rbcL以及核基因18S rDNA分析得出COM分支(包括金虎尾目、卫矛目、酢浆草目)与豆类存在88%的亲缘性[4];2007年 P.D.Cantino等人同样认为COM是豆类的一部分[5],2009年APG III系统正式将金虎尾目归属于豆类[6];Wang H.C.等人在2009年从COM的117个物种,59个类群中选取10条叶绿体基因使用最大似然法构建进化树得金虎尾目属于豆类[7];2014年B.R.Ruhfel等人从COM里9个物种筛选78条叶绿体基因构建进化树得金虎尾目属于豆类[8];在2016年APG IV系统同样将核心真双子叶植物中蔷薇类里的COM分支共归属于豆类[9]。第二个观点是金虎尾目与锦葵类的亲缘性更近。2010年Qiu Y.L.等人从COM中选取了4条线粒体基因进行DNA序列分析得出与锦葵类更具亲缘性[10];2012年Zhang N.等人从金虎尾目中选取5条核基因通过RAxML分析得出其与锦葵类亲缘关系近[11];2014年Zeng L.P.等人利用59个基因进行61个分类群的系统发育分析,结果发现金虎尾目与锦葵类亲缘关系更近[12]。因此现在关于COM的植物分类学地位尚未查明。金虎尾目归属于豆类或锦葵类还是一个具有争议的问题,本文从线粒体基因序列方面分析金虎尾目的系统发育关系。
线粒体是植物能量代谢中最重要的细胞器之一,与叶绿体、细胞核一起组成了植物细胞中遗传物质的三大携带者。线粒体基因具有原核起源、无组织特异性、分子小、结构简单等特点,在植物的遗传进化研究中有重要地位。线粒体DNA的进化速率慢于叶绿体,并且DNA的变异率也低于叶绿体和核DNA[13],但是线粒体DNA比两者更稳定,有利于分子系统分析。线粒体基因组碱基对的变化可以用来探究物种间的共同祖先[14],线粒体基因有一个特点是在开花植物中遵循母性遗传,因此能够从分子领域研究植物线粒体同源基因的亲缘性和进化关系[15]。例如,邓长娟等人通过线粒体基因序列变异位点的分析得出香蕉种间的父系系谱之间的关系[16],孙传清等人通过线粒体DNA分析得出普通稻和亚洲栽培稻的多态性[17],或者是通过线粒体某一固定基因进行系统分析,如吴冬霞等人利用线粒体Cyt b部分基因构建系统发育进化树得出线蛱蝶亚科各主要类群的系统发育关系[18]。随着现代分子技术的发展,线粒体DNA序列开始广泛运用于植物分子系统学中[19]。因此,线粒体基因的研究对生物进化过程的分析是具有可靠的依据的,本文根据线粒体基因的特性来进行研究。
1 材料和方法
截止至2018年11月,统计了GenBank上有完整线粒体基因组信息的金虎尾目、豆类、锦葵类物种的数目,其中豆类有10种,锦葵类有12种,金虎尾目有6种。由于豆类的Vigna angularis的3个基因与其他豆类,锦葵类以及金虎尾目差别巨大,因而我们最终去掉了Vigna angularis,筛选出可用的物种豆类9种,锦葵类12种,金虎尾目6种,共27种。从中筛选出其中共有的线粒体同源基因共12条,包括 atp4、atp8、ccmfc、cob、cox1、cox3、matR、nad4、nad6、nad7、nad9、rps12。以 Zhang N.等人发表的文章作为参考,以菊亚纲作为上述物种的外群进行系统发育分析[11]。
从GenBank上下载27种植物各12条线粒体同源基因,用EditSeq检查其基因序列是否存在终止密码子,利用Muscle对线粒体同源序列比对分析,并且手动剪切,多序列比对剪切后的结果用MEGA7.0.26分别进行最大似然法(maximum likelihood method,ML)、最大简约法(maximum parsimony method,MP)、近邻法(neighbor joining method,NJ)系统发生分析,采取的bootstrap重复率是1 000。最后对比3个类型进化树是否得出一致性结论,得出金虎尾目属于豆类还是锦葵类。
2 结果与分析
本实验共在27种植物种选取12条线粒体同源基因,用MEGA7.0.26分别进行最大似然法、最大简约法、近邻法系统发生分析,构建系统发生进化树的结果如下所示。
2.1 最大似然法结果
本实验中最大似然法所选用的概率模型为Tamura-Nei model,该模型考虑到核苷酸替换率的差异和核苷酸频率的不均等,区分了嘌呤之间的过渡替代率和嘧啶之间的过渡替代率。12条同源基因用最大似然法模型构建系统发育进化树结果如表1,包括了分析的各线粒体基因所属的亲缘关系和与之相配应的支持率。从表1中我们可以看出12条线粒体基因中有3条基因分析结果得金虎尾目属于豆类,支持率为17%~52%,nad9支持率是最低的,仅有17%,支持金虎尾目属于豆类的ccmfc和nad4的支持率虽然较高,但也未到达70%。
表1 金虎尾目在ML系统发育树中的汇总Table 1 Summary of the Malpighiales in ML phylogenetic tree
9条基因通过最大似然法分析结果得金虎尾目属于锦葵类,支持率为29%~79%,有较可信支持率(BS>70%)的基因有 atp4、cob、rps12,说明金虎尾目属于锦葵类较为可靠。
2.2 最大简约法结果
12条同源基因用最大简约法模型构建系统发育进化树结果如表2。最大简约法得出有8条基因表示出金虎尾目属于锦葵类,进化树支持率为36%~85%,有较可信支持率:atp4的支持率为75%,cob的支持率为74%,rps12的支持率为85%。支持金虎尾目属于豆类的仅有2条基因,nad9支持率为25%和nad4支持率为66%。此方法中出现了金虎尾目属于豆类和锦葵类分支之外的情况,cox1支持率为77%,matR支持率高达了99%。在此方法中基因分析结果不一致的现象更明显。
表2 金虎尾目在MP系统发育树中的汇总Table 2 Summary of the Malpighiales in MP phylogenetic tree
2.3 近邻法结果
本实验中近邻法使用的模型是Maximum Composite Likelihood model,该模型可以准确地估计成对距离和相关的替代参数。12条同源基因用近邻法构建系统发育进化树结果如表3。nad7中得出2种亲缘关系如图1,从亲缘关系上看来豆类仅有Ammopiptanthus mongolicus与金虎尾目类群接近,但支持率为19%。总体上看来,金虎尾目与锦葵目属于一个分支,与锦葵目的关系更加亲近。近邻法表示8条基因中有14%~82%的支持率表明金虎尾目属于锦葵类,包括nad7基因,支持率较高的是atp4达到82%。只有3条基因表明金虎尾目属于豆类,支持率范围较低36%~66%。此方法中也出现了金虎尾目属于豆类和锦葵类分支之外的情况,图2为基因cox1的近邻法进化树结果,从进化树分支上看来,金虎尾目比锦葵目和豆目都先分化出来,锦葵目和豆目属于一个分支,但支持率可信度不高,仅有44%。
表3 金虎尾目在NJ系统发育树中的汇总Table 3 Summary of the Malpighiales in NJ phylogenetic tree
2.4 分析
通过最大似然法、最大简约法、邻近法构建的系统发生树结果表示不同的同源基因用不同的方法得到的支持率高低不一样。因此根据3种方法共36个系统发生树的支持率(不管进化树支持的归属关系,仅从支持率上看)绘制折线图3,体现3种构建进化树的方法对于不同的同源基因得到的支持率高低。从图3可以看出,在不同构建进化树方法中,3种方法得到的折线图趋势和走向大致相同,可能因为基因的选择对结果的支持率高低有关。3种方法测得的结果中都有较高可信度的基因atp4、cob、rps12,很大原因是其为较保守的基因,在进化过程中比较稳定。这3个基因均支持金虎尾目归属于锦葵类,有较高的支持率。
图1 基因nad7近邻法系统发生树Figure 1 Phylogenetic tree of gene nad7 by nearest neighbor method
图2 基因cox1近邻法系统发生树Figure 2 Phylogenetic tree of gene cox1 nearest neighbor method
图3 ML、MP、NJ共27个系统发生树支持率折线图Figure 3 ML,MP,NJ 27 phylogenetic tree support rate broken line chart
通过3种方法构建的系统发生树发现,不同的同源基因具有不同的结果。根据3种方法共36个系统发生树的支持率(不管所选的线粒体同源基因和3种构建系统发生树的差异,仅从归属关系上看)绘制图4,体现金虎尾目归属关系的支持率高低分布。图4上可看出,3种方法对于12条线粒体同源基因的的系统发生分析中,25个结果表明金虎尾目属于锦葵类,8个结果表明金虎尾目属于豆类,3个结果表明金虎尾目既不属于锦葵类也不属于豆类,即独立分支。其中支持率可信(BS>70%)的7个结果表示金虎尾目属于锦葵类,2个支持率可信的结果表示金虎尾目属于独立分支,对于金虎尾目属于豆类的结果可信度普遍不高。从总体上看,大多数结果支持金虎尾目属于锦葵类。这与前人的研究结果基本一致。如2007年Zhu X.Y.等人利用线粒体基因matR通过最大简约法进行分析发现金虎尾目属于锦葵类(支持率为50%左右)[4];2010年QIU Y.L.等人从COM中选取了4条线粒体基因atp1、matR、nad5和rps3,利用最大似然法对其进行分析得出金虎尾目与锦葵类的亲缘性更近[10];2015年Sun M.等人对来自COM中的79个物种中4条线粒体基因(atp1、matR、nad5 和 rps3),利用最大似然法进行系统发育分析,同样发现金虎尾目与锦葵类物种关系更加密切[20]。相比而言,本研究选取了12条线粒体基因,结合不同系统发生树构建方法,为这一分类观点提供了更为完整和有力的证据支持。
基因matR使用最大简约法99%的支持率表示金虎尾目独立于锦葵类和豆类之外,即比锦葵类和豆类先分化出来。基因cox1使用最大简约法构建系统发生树有77%的支持率表示金虎尾目独立于锦葵类和豆类,也具有可靠支持率。基因matR和cox1进行最大简约法构建系统发生树的结果保持一致,均支持金虎尾目独立于锦葵类和豆类,这一证据为金虎尾目两基因的新来源提供了另外一种可能性。
图4金虎尾目归属的支持率分布Figure 4 Distribution of the support rate of the order chrysocera
3 讨论与结论
3.1 异源多倍体化、杂交和基因渗入事件的发生
许多研究通过分析核基因组和质基因组的一致性证明金虎尾目位置[4,12],但其生物学位置还存在争议。两种原因导致核基因组、线粒体基因组和叶绿体基因组之间系统发生不一致,第一种很有可能是由于在被子植物进化中,发生了独立的多倍体化事件,即异源多倍体化[21]。第二种可能是被子植物在进化过程中经历了多次杂交和基因渗入事件使基因组不一致[22-23]。本实验通过分析线粒体基因系统发生得出选取不同的线粒体同源基因所得到的结果也存在不一致性,支持率也不相同(如图3和图4所示),36个实验结果中,25个结果表示金虎尾目属于锦葵类,具有高支持率的2个结果表示金虎尾目属于独立分支,可能验证了金虎尾目植物在进化过程中发生异源多倍体化、杂交和基因渗入事件。
3.2 不完全谱系分选的存在
由于祖先的基因随机多态性分选和保留,单个基因位点的谱系关系可能对物种或种群之间的关系产生误导或缺乏信息[24-25]。matR基因以最大简约法有99%的支持率支持金虎尾目属于独立分支,其他研究中仅有不到50%的支持率表示金虎尾目属于豆类[4]。本实验支持率与其他实验不同的原因可能是选取的样本不同,不同的样本间谱系关系有差异,存在不同的线粒体基因的保守程度有差异,比如金虎尾目杨柳科中3种杨树(P.tomentasa,P.tomentasa×P.bolleana,P.alba×P.glandulasa)的线粒体基因序列高度保守[26],较保守的线粒体基因植物样本群与不保守的植物样本群混合构建系统发育树会使本来保守的线粒体基因样本支持率降低。
3.3 构建系统发生树方法的差异
近邻法是基于距离的系统发生树构建方法,该算法每迭代运算一次均只搜索最近的一对邻居,对其他的匹配不考虑,可能会遗漏拓扑结构更合理的次优树[27]。最大简约法通过搜索可能的拓扑结构来寻找最优树,适用于分析某些特殊分子数据如插入、缺失等序列,当序列存在较多回复突变和平行突变时,则很可能得到错误的系统发生树。最大似然法基于概率模型,考虑所有可能的突变路径,寻找最高概率发生的系统发生树,但是对概率模型过于依赖。本实验使用的3种系统发生树构建方法中,准确度由高到低排列:最大似然法、最大简约法、近邻法,通常使用两种以上不同的方法构建系统发生树,当结果基本一致时,较为可靠。实验结果表示不同的方法得到的系统发生树和支持率有差异(如图4所示),原因可能是因为3种构树方法的算法存在差异,但得到的系统发生树大多数都支持金虎尾目属于锦葵类,支持率较高。