不同食性雁形目鸟类线粒体基因组的适应性进化分析
2023-10-14张卫平邱冰滢张东升
张卫平 , 邱冰滢 , 张东升
1.上海海洋大学水产与生命学院,水产科学国家级实验教学示范中心,上海 201306;2.上海海洋大学水产与生命学院,环境DNA技术与水生态健康评估工程中心,上海 201306
世界上有10000多种鸟类[1],它们生活于不同的环境中,并演化出相应的解剖学和行为学特征,其中鸟类的食性是备受关注的特征之一。大量研究表明,鸟类通过适应不同的食物资源来推动其形态、生理和行为特征的进化[2-3]。例如,加拉帕戈斯群岛达尔文雀是摄食适应的典型代表,食物的选择影响喙大小和形状的进化[4-5]。鸟类食性多样,几乎包括所有类型的食物,如无脊椎动物、鱼虾、内脏腐肉、水果、花蜜、果实、植物草茎、杂草、苔藓等,许多鸟类吃一种或几种特定类型的食物,而有些鸟类食谱较广[6-7]。食物基质的不同导致这些物质被摄取后所需的酶、机制以及消化吸收的时间存在差异[8]。不少研究表明,鸟类和哺乳动物的基本代谢速率与自身的食性有关[9-12]。此外,鸟种的食物构成对物种的形成和灭绝产生深刻影响[6],鸟类是研究饮食对物种形成和灭绝作用的一个很好的模型系统[13-14]。
动物通过降解食物中的营养物质来获取能量,而线粒体是细胞产生能量的主要细胞器,为真核细胞提供95%的能量[15-17]。同时,线粒体自身的基因组编码13个氧化磷酸化途径中的重要亚基,因此线粒体及其基因组在动物的能量代谢中发挥重要作用[18-19]。线粒体基因组编码基因参与能量代谢,并在动物的长期演化过程中受到适应性进化压力[20-22]。研究发现,基础代谢率较高的哺乳动物比基础代谢率较低的哺乳动物对线粒体DNA的净化选择更强[23]。此外,丧失飞行能力的鸟类比飞行能力强的鸟类在mtDNA中积累了更多的非同义取代,这可能是因为强运动物种维持高效的能量代谢,mtDNA经历了强纯化选择[24]。
雁形目鸟类是备受关注的水鸟种群之一,全世界共有3科178种[1]。雁形目鸟类食谱较广,包括杂食性、草食性和肉食性物种。草食性雁形目主要以植物草茎、杂草、苔藓、真菌、豆类为食,肉食性雁形目主食鱼和无脊椎动物,专食化程度较高[7]。杂食性雁形目则以植物草茎、杂草、苔藓、真菌、豆类以及无脊椎动物为食[7]。本研究以20种雁形目鸟类为研究对象,通过分析不同食性组雁形目鸟类的线粒体编码蛋白基因,以探讨雁形目鸟类食性的差异与这些基因进化表现之间的关系。
1 材料与方法
1.1 数据收集与序列比对
本研究选取了20种雁形目鸟类(Anseriformes birds)作为研究对象。将食性组成中食肉比例达80%及以上的鸟类划分为食肉组;食草比例达80%及以上的鸟类划分为食草组;两者皆食且食草或食肉比例均不超过80%的鸟类视为杂食组。依据食性差异,这些鸟类被划分为食肉组、食草组和杂食组3组。其中,食草组有9种:Anser albifrons(NC_004539.1),Anser anser(NC_011196.1),Anser cygnoides(NC_023832.1),Anser fabalis(HQ890328.1),Anser indicus(NC_025654.1),Branta canadensis(NC_007011.1),Cygnuscolumbianus(NC_007691.1),Cygnus cygnus(NC_027095.1),Cygnus olor(NC_027096.1);食肉组有7种:Bucephala clangula(MW849283.1),Clangula hyemalis(MW849278.1),Histrionicus histrionicus(MW849288.1),Mergus merganser(NC_040986.1),Mergus squamatus(NC_016723.1),Poltastelleri(MW849289.1),Mergus serrator(MZ365040.1);杂食组有4种:Aythya baeri(NC_057048.1),Aythya ferina(NC_024602.1),Aythya fuligula(NC_024595.1),Aythya nyroca(NC_059801.1)。这些物种的序列信息均来源于NCBI数据库,分类信息来源于Eltron-Traits 1.0数据库[7]。
1.2 分子进化分析
本研究以鸡形目雉鸡(Phasianus colchicus)作为外群,雉鸡与雁形目同属鸡雁小纲。将13个线粒体蛋白编码基因删除终止子,再拼接成全长编码序列,即拼接序列(spliced data),使用Mega11[25]程序的Muscle[26]比对方法,对拼接序列进行比对,生成.fas比对文件,并以比对好的拼接序列为基础,通过最大似然法构建系统发育树。同时,按照相同方法生成不含外群的.fas比对文件和.tree树文件,用于Paml和Relax的输入文件。
1.3 放松性选择分析
借助Relax[27]在线服务器(https://www.datamonkey.org/RELAX)对各基因进行放松性选择分析,选择肉食性、杂食性和草食性的鸟类中其中1组作为前景支,以另外2组鸟类作为背景支,来检测这些分支经历的选择压力。当K值大于1,则表示该前景支受到了强化性选择;当K值小于1,则表示该前景支受到了放松性选择。
1.4 选择压力分析
本研究使用了Paml 4.8[28]中的Codeml程序评估3组鸟线粒体13个编码基因受到的选择压力,且以自由比率模型(free-ratio model)对拼接序列以及每一个编码基因进行适应性进化分析。当dN/dS<1时(dN表示非同义替换率;dS表示同义替换率),表示该基因可能受到负选择或纯化选择;当dN/dS=1,表示该基因可能受到中性选择,中性突变是自然界最常见的;当dN/dS>1时,预示着该基因很可能受到了正选择作用,正选择也是物种适应性进化的重要基础。
Codeml程序中的支-位点模型(branch-site model)存在模型A和null假设,根据2种模型之间的似然比检验推测某些位点是否经历了正选择作用,当P<0.05时表示有充足证据可以判断前景支中存在正选择位点。用位点模型(site model)探索每个位点间选择压力的差异,位点模型假定同一分支上不同位点的ω值(ω表示进化速率)都不同,但在进化树不同分支上却无差异。
1.5 氨基酸多态性及有害突变检测
通过Python编程获取氨基酸多态性位点信息,并使用Provean程序[29]评估这些多态性位点的有害性。Score(预测的分值)=-2.5是判断有害位点或中性突变位点的临界值,当预测分值小于-2.5,可视为有害突变位点,反之视为中性突变。考虑到3组鸟类的物种数不一致(食肉组7;食草组9;杂食组4),本研究利用氨基酸多态性比例[多态性位点数/(该基因氨基酸数×该组物种数)]和有害性比例[有害突变位点数/(该基因氨基酸数×该组物种数)]表示3组鸟类间的差异。
1.6 蛋白质三级结构预测
利用Swiss-Model[30]对本研究涉及的所有线粒体蛋白质进行三维结构构建,并且使用PyMOL进行修饰,观察3组食性鸟类中这些位点的分布情况。
2 结果与分析
2.1 分子进化分析
从NCBI数据库中下载已选定的20种雁形目鸟类的线粒体蛋白编码序列,并根据食性分为食肉组、杂食组和食草组。利用Mega11[25]程序的Muscle[26]对编码线粒体蛋白质的13个基因拼接后的序列进行比对,构建的系统发育树(图1)显示实验选取的雁鸭类鸟类中,相同食性的鸟种在进化树中聚类为一个单系群。
图1 基于拼接序列构建的雁形目鸟类系统发育树Fig. 1 Phylogenetic tree based on the spliced data of Anseriformes birds
2.2 放松性选择分析
通过Relax在线分析线粒体蛋白编码基因在不同食性组中受到的放松性选择情况,结果发现(表1),食肉组有COX2、COX3、CYTB、ND1、ND3、ND4共6个基因受到了放松性选择,且没有任何基因受到强化选择;食草组有ND2和ND6共2个基因受到了放松性选择,有ATP6、COX2、COX3、ND3共4个基因受到了强化性选择;而杂食组有COX1、COX2、CYTB、ND2、ND3共5个基因受到了强化性选择,且没有任何基因受到放松性选择。
表1 结果中有显著放松性选择或显著强化性选择的基因Table 1 The significant results of the relaxation and intensification
2.3 选择压力分析
为了估算谱系特异性ω值,通过Codeml程序的自由比率模型(free-ratio model)来评估不同分支的进化速率,得到的编码数据包括每个谱系基因的N、S、dN、dS和ω值。对3组数据(dN,dS,ω)中的3类鸟(拼接序列)做两两之间的t检验,结果显示(图2),食肉组的dS值显著高于食草组和杂食组(P<0.01),虽然食草组的ω值较高,但是跟其他两组比较并没有达到显著水平(P>0.05)。
图2 食肉组、食草组、杂食组的dN、dS和ω比较Fig. 2 Comparisons of dN, dS and ω values among the groups of carnivore birds, herbivorous birds and omnivorous birds
对13个基因分别进行检测并作t检验,食肉组与杂食组进行t检验结果表明,食肉组有10个基因的dS(ATP8、COX1、COX2、COX3、CYTB、ND1、ND2、ND4、ND5、ND6)、7个基因的dN(ATP8、COX2、COX3、CYTB、ND4、ND5、ND6)显著高于杂食组;而食肉组与食草组进行比较表明,食肉组在dS(ATP8、COX1、COX2、COX3、CYTB、ND1、ND2、ND4、ND5、ND6)、dN(ATP8、COX3、CYTB、ND4、ND5)显著高于食草组;但当食草组与杂食组相比较时,dS、dN均未表现出显著性,仅CYTB基因在杂食组中的ω值显著高于食草组。
此外,本研究采用Codeml程序的支-位点(branch-site)模型和site模型探究哪些基因受到了正选择,结果均未发现正选择位点。
2.4 氨基酸多态性分析
基于氨基酸序列的比对结果,通过Python编程得到氨基酸多态性位点信息,并使用Provean程序[29]评估这些多态性位点的有害性[31]。结果发现,在食肉组的这些蛋白质序列中,多态性位点和有害性位点出现的频率均高于另外两组鸟。对13个线粒体蛋白分别检测的结果(图3)表明,在食肉组的13个基因中,其中有11个基因的氨基酸多态性频率高于另外两组(图3B),有7个基因的有害突变频率高于另外两组(图3C)。
图3 食肉组、食草组、杂食组的氨基酸多态性和有害性的频率Fig. 3 Proportion of amino acid polymorphism sites and amino acid harmful sites in carnivore, herbivorous and omnivorous birds
2.5 线粒体蛋白质三级结构分析
本研究使用Swiss-Model在线网址预测了13种蛋白质的三级结构,利用Pymol对中性突变位点和有害位点进行标记:黄色标记中性突变,红色标记有害突变。结果(图4)显示,3组食性鸟类的所有编码基因的蛋白质三维结构位点均呈现多态性,有害位点并未集中分布且主要存在于食肉组中。
图4 食肉组、食草组、杂食组中ND2的3D结构预测和氨基酸多态性、有害性位点的比例Fig. 4 3D structure prediction and proportion of polymorphism sites and harmful sites of ND2 in carnivore, herbivorous and omnivorous birds
3 讨论
由于食物资源的时空分布不一,鸟类演化出了不同的饮食偏好和取食方式及形态特征,因此,普遍认为鸟类的食性选择会影响物种的进化。以往的研究主要集中在食性与生理结构[8,32]、行为特征[2-3]及特定基因[33-34]之间的关系等,而极少在基因组层面研究两者的关系。为了在基因组层面探讨两者的关系,本研究选取20种雁形目鸟类,利用Mega、Paml、Relax、Python、Swiss-Model、Pymol等生物信息学软件或方法对线粒体基因组进行进化速率分析、选择性分析、氨基酸多态性和有害性分析、蛋白质3D结构分析等。已有对鸟类等动物的研究中通常认为线粒体编码的基因在能量代谢相关的特征进化过程中受到强烈的选择压力[18-19,35],纯化选择的放松可能与进化速度的加快有关[36-38]。本研究对鸟类食性与线粒体基因组的这些编码基因做了进化分析,结果也证实了这种现象。与杂食组和食草组鸟类相比,食肉组的雁形目鸟类大部分编码蛋白的线粒体基因处于放松性选择,而杂食组鸟类的强化性选择信号显著。利用Paml-Codeml对3种食性鸟类进行两两间的进化分析比较,虽然ω值没有表现出显著性,但是食肉组鸟类的dS和dN值显著高于另外两组鸟类,杂食组鸟类的dS和dN值显著偏低。此外,不同食性组鸟类线粒体基因组在氨基酸多态性及氨基酸有害性方面也表现出明显的差异,食肉组中有11个基因表现出较高的氨基酸多态性频率,有7个基因表现出较高的氨基酸有害性频率。研究结果表明,摄取肉食比例较高的雁形目鸟类,其线粒体基因组受到放松性选择作用。
专门的蜜食动物和果食动物多在“四季常青”的地方生存,食虫动物则在全年都有昆虫的热带环境中生存[39],因此资源的可获得性相对稳定。杂食动物在不稳定的资源和环境中更有优势[40]。但是,在生态竞争的竞技场中,杂食动物作为可食多种食物资源的“多面手”,在利用特定食物资源方面表现不佳[41],因此在物种宏观进化方面,表现出低物种形成率或高灭绝率。Burin等[7]通过分析比较现存的近万中鸟类的进化关系和食性,发现杂食性鸟类是鸟类食性的“进化陷阱”,同其他食性的鸟类相比,杂食性鸟类的灭绝率较高,多样化率较低。但是,该研究并未涉及这些现象的分子机制。本研究从基因组层面揭示杂食性的雁形目鸟类线粒体基因组受到强化性的选择压力,氨基酸多态性下降,有害突变位点被淘汰,为杂食性鸟类物种的低多样化率提供了一定的分子依据。