APP下载

虫草属线粒体基因组特征及系统发育

2022-09-30韩利红柯欣茹秦相月任怡园

西南农业学报 2022年7期
关键词:核苷酸虫草线粒体

韩利红,柯欣茹,秦相月,普 琪,任怡园,刘 潮

(曲靖师范学院生物资源与食品工程学院/云南省高校特色果酒技术创新与应用工程研究中心,云南 曲靖 655011)

【研究意义】虫草属[Cordyceps(Fr.) Link]和棒束孢属(IsariaFries)真菌隶属于虫草科(Cordycipitaceae),其中很多物种具有重要经济价值。虫草属物种多富含虫草素、腺苷、喷司他丁和多糖等有效成分,可作为冬虫夏草的替代品;棒束孢属物种中的有效活性成分一般包括虫草酸、多糖、麦角甾醇和腺苷等,它们被广泛应用于抗菌、抗病毒、抗肿瘤、提高免疫力等方面,具有较高医疗保健价值[1-3]。虫草属真菌多为昆虫病原真菌,通过寄生于落叶层、苔藓或表层土壤的昆虫体内,从变成僵虫的虫体前端生出有柄头状或棍棒状的子座[4-5]。2018年5月公布的《中国生物多样性红色名录—大型真菌卷》(生态环境部)包含了59种虫草属和2种棒束孢属物种。线粒体作为真核生物的能量工厂,是具有独立基因组的半自主细胞器,在真核生物生长发育、能量代谢和应激响应过程中发挥重要作用[6]。线粒体基因组已成为研究真核生物起源、进化和系统发育的重要工具[7-10]。线粒体基因组的大小、结构、基因排列、重复序列内容和内含子信息成为反映真核生物起源和进化的重要参考[7,11]。【前人研究进展】近20年来,随着分子生物学证据的加入,这2个属的分类地位发生了较大变化。Sung等[5]基于7个基因分子片段(nrLSU+nrSSu+tef1α+rpb1+rpb2+β-tubulin+atp6),对广义虫草开展了分子系统发育研究,发现广义虫草属[Cordyceps(Fr.) Link s.l.]和广义麦角菌科(Clavicipitaceaes.l.)均为多系类群,依据系统发育树不同演化枝的聚类关系,可将广义麦角菌科分为3个科,分别为狭义麦角菌科(Clavicipitaceae s.s.)、虫草科(Cordycipitaceae)和线虫草科(Ophiocordycipitaceae),但棒束孢属位于狭义虫草属(Cordycepss.s.)分支中。Kepler等[12]基于5个分子片段(nrLSU+nrSSU+teff1α+rpb1+rpb2),针对虫草科物种分类展开了系统发育研究,将狭义虫草属细分为11个属,其中包括虫草属和白僵菌属(Beauveria)等;而棒束孢属为多系起源,该属部分物种甚至超出了虫草科的范畴,因此将粉质棒束孢(Isariafarinose)和细脚棒束孢(I.tenuipes)等与蝉棒束孢(C.cicade)亲缘关系较近的物种置于虫草属下,修订为粉质虫草(C.farinose)和细脚虫草(C.tenuipes)。一些棒束孢属物种被证实为虫草无性型,如细脚虫草为高雄山虫草无性型[13]。李增智等[14-15]基于6个分子片段(ITS+nrLSU+nrSSu+teff1α+rpb1+rpb2),描述了新种蝉花虫草(C.chanhuaZ.Z. Li,F.G. Luan,HywelJones,C.R. Li & S.L. Zhang),并证明C.cicadae代表了一个物种复合群。蝙蝠蛾拟青霉(Paecilomyceshepiali)是我国重要药用虫草真菌,Wang等[16]将其转移至Samsoniella属,该属兼具类似虫草属有性形态和棒束孢属无性形态,一些棒束孢属物种被重新归在该属[17]。蛹虫草和蝉花虫草等部分物种被广泛用于生产栽培,针对菌株选育[18-19]、有效成分[20-22]和培养条件[23]等开展了大量研究。目前多个虫草属物种核基因组[24-25]和线粒体基因组[26-29]已被公布,蛹虫草基因组、转录组、蛋白质组等研究[30-31]对虫草属资源保护、菌种选育和资源开发具有重要的推动作用。【本研究切入点】虫草属物种具有重要的药食两用经济价值及巨大开发应用前景,近年来已成为人们的研究热点之一。但是,关于虫草科代表性物种线粒体基因组特征及其进化的研究还较少,相关遗传分析对于揭示该科物种的起源进化、资源保护和开发利用均具有重要的理论和实践指导意义。【拟解决的关键问题】本研究基于线粒体基因组数据,利用生物信息学方法,对虫草属物种的亲缘关系和遗传多样性进行研究,为虫草资源的开发和利用提供理论依据。

1 材料与方法

1.1 序列获取

从NCBI GenBank数据库(https://www.ncbi.nlm.nih.gov/)下载球孢虫草(C.bassiana)、布氏虫草(C.brongniartii)、蝉花虫草(C.chanhua)、粗糙虫草(C.confragosa)、蛹虫草(C.militaris)、粉被虫草(C.pruinosa)、细脚虫草(C.tenuipes)、蝉棒束孢(C.cicadae)、粉质虫草(C.farinosa)9个虫草属物种线粒体基因组数据。

1.2 基因组组成分析

使用MEGA X[32]统计各物种线粒体基因组4种碱基构成。为了解线粒体基因组的碱基使用偏性,分别计算AT偏移(AT-skew)和GC偏移(GC-skew)[33]。计算公式分别为AT-skew=(A-T)/(A+T)和GC-skew=(G-C)/(G+C)。

1.3 重复序列分析

利用REPuter软件(https://bibiserv.cebitec.uni-bielefeld.de/reputer)分析线粒体基因组序列重复,包括正向(forward)、反向(reverse,R)、回文(palindromic)和互补(complementary,C)重复,筛选参数为最小重复长度30 bp,Hamming距离3。利用MISA在线工具(https://webblast.ipk-gatersleben.de/misa/)检测SSR数量及位置分布,最小重复数设置为单核苷酸为8,二核苷酸和三核苷酸为4,四核苷酸、五核苷酸和六核苷酸均为3。

1.4 序列多样性分析

利用mVISTA在线软件(https://genome.lbl.gov/vista/index.shtml),以球孢虫草(C.bassiana)线粒体基因组(EU100742)序列为参照,对虫草属物种线粒体基因组序列变异进行可视化比对。利用MAFFT v7.490 软件(https://mafft.cbrc.jp/alignment/server/)对各物种线粒体蛋白编码基因串联序列进行比对,使用DnaSP v 6.10[34]分析线粒体蛋白编码序列(Coding sequence,CDS)核苷酸多样性(Pi),以分析虫草属物种的基因变异程度。

1.5 基因进化分析

利用MAFFT v7.490 软件对各物种线粒体CDS进行比对,利用PAMLX[35]的CODEML算法采用位点模型法对正选择位点进行检测,并评价虫草属物种线粒体基因的进化情况。

1.6 系统发育分析

为分析虫草属物种间的系统发育关系,从GenBank数据库下载5个白僵菌属(Beauveria)、3个蜡蚧菌属(Lecanicillium)和2个拟青霉属(Paecilomyces)物种线粒体基因组序列,使用MAFFT进行多序列比对,通过IQ-TREE v. 2.1.1软件基于最大似然法(maximum likelihood,ML)构建系统发育树,建树模型为GTR+F+R4,步长值为1000。

2 结果与分析

2.1 线粒体基因组组成

根据已公布的线粒体数据分析显示,虫草属物种线粒体基因组大小差异较大,其中细脚虫草基因组最大(66.7 kb),其次是蝉棒束孢(56.6 kb),而粉质虫草最小(24.2 kb),平均大小为39.3 kb,均含有15个蛋白编码基因(Protein coding gene,PCG)和2个rRNA,不同物种编码的tRNA数目略有差异(表1)。所有物种线粒体基因组AT碱基比例均高于72%,含有较高的A和T碱基。核苷酸偏移(skew)分析显示,虫草属物种线粒体基因组多数AT-skew(除粗糙虫草和粉质虫草外)和GC-skew均为正值,相比于T,多数物种更偏好A,但偏差程度很小,而相对于C,所有物种更偏好G。与基因组相比,蛋白 编码基因更偏好使用碱基T,且不同密码子位置的碱基偏移有明显差异,其中第1位偏好T和G,第2位偏好T和C,第3位偏好A和C(表2)。结果表明,虫草属物种线粒体基因组偏好嘌呤碱基,而蛋白编码基因密码子不同位置有不同的偏好,这可能与密码子的简并性和基因表达有关。

表1 虫草属物种线粒体基因组特征

表2 虫草属物种线粒体基因组碱基组成及偏移

2.2 线粒体基因组重复序列

重复序列分析发现,虫草属物种重复序列数目差异较大,细脚虫草含有的重复序列数最多,达81个,其次为布氏虫草含有57个,而粉被虫草仅含有1个反向重复,粉质虫草仅含有1个回文重复(图1-A)。各物种重复序列以正向重复和回文重复为主,仅含少量的反向序列,未发现互补序列。30~39 bp长度的重复序列数目最多,其次为40~49 bp长度序列(图1-B)。

图1 虫草属物种线粒体基因组重复序列类型及分布Fig.1 Type and distribution of repeats in the mitogenome of Cordyceps species

虫草属线粒体基因组中含有13~27个SSR位点(图2-A),主要以二核苷酸、三核苷酸和四核苷酸重复为主,其中各物种三核苷酸数目接近,均介于5~9个,其他类型SSR数目种间差异较大,所有物种均未检测到六核苷酸重复(图2-A)。单核苷酸全部为A/T重复,二核苷酸重复仅有AT/AT 1种类型,三核苷酸重复仅有AAT/ATT重复,均未检测到CG/GC重复,四核苷酸重复有AAGC/CTTG、AAGT、AATT/AATT和AAAT/ATTT 4种类型,五核苷酸重复有AATAA和ATTAT 2种类型,未检测到六核苷酸重复,所有SSR中均含有较高比例的A或T碱基(图2-B)。

图2 虫草属物种线粒体基因组SSR位点类型及分布Fig.2 Type and distribution of SSRs in the mitogenome of Cordyceps species

2.3 线粒体基因组结构变异

以球孢虫草线粒体基因组(EU100742)为参照,利用mVISTA软件分析了虫草属线粒体基因组结构变异(图3)。结果显示,9个物种线粒体基因组结构相似度较高,未发生基因重排现象,非编码区的变异水平高于编码区,tRNA区的变异水平低于PCG区和rRNA区。分析发现,9个物种线粒体基因组大小和内含子长度之间的Pearson相关系数为0.960(P<0.001),二者呈线性相关(图4),表明线粒体基因组大小与内含子密切相关,内含子区增加或减少显著影响线粒体基因组大小。

图3 虫草属物种线粒体基因组结构比较Fig.3 Comparison of mitogenome structure of Cordyceps species

图4 虫草属线物种粒体基因组大小与内含子长度相关性分析Fig.4 Correlation analysis between mitogenome sizes and intron lengths of Cordyceps species

使用DnaSP软件对虫草属物种线粒体14个编码基因核苷酸多态性(Nucleotide diversity,Pi)进行分析(图5)。9个物种线粒体编码基因平均Pi值为0.045,基因rps3核苷酸变异程度最高(Pi值0.097),其次为nad6(Pi值0.061),此外,nad1、cox3、nad4、nad2和nad3的Pi值均大于0.05。

图5 虫草属物种线粒体蛋白编码基因序列核苷酸多态性Fig.5 The nucleotide diversity (Pi) of mitogenome sequence of Cordyceps species

2.4 基因进化分析

为了解基因在进化过程中是否受到选择作用,利用PAML软件对虫草属线粒体蛋白编码基因dN/dS比率和正选择位点进行分析(图6,表3)。dN/dS比率用于在密码子替换模型中估计选择压力,dN/dS<1、dN/dS=1和dN/dS>1分别表示纯化、中性和正选择[36]。所有基因的dN/dS比率均小于1,表明虫草属线粒体蛋白编码基因主要受纯化选择作用。根据经验贝叶斯分析,共有7个蛋白质编码基因正选择位点达显著水平(P>95%),分别为nad4、rps3、cob、nad2、nad1、nad6和cox1,正选择位点数分别为6、5、4、3、2、2和1(表3)。结果表明,尽管虫草属线粒体基因主要受纯化选择作用,但部分位点仍受到正选择作用。

图6 虫草属物种线粒体蛋白编码基因dN/dS分析Fig.6 The dN/dS ratio analyses of the protein coding genes of mitogenome of Cordyceps species

表3 基于位点模型的虫草属物种线粒体蛋白编码基因正选择分析

2.5 系统发育分析

基于线粒体基因组数据,构建了虫草属物种系统发育树(图7)。粗糙虫草和粉质虫草聚类关系较近,与蝇蚧疥霉(Lecanicilliummuscarium)和蝙蝠蛾拟青霉聚在一起,靠近系统发育树基部,随后是粉被虫草,节点支持率均为100%。细脚虫草、蝉棒束孢和蝉花虫草以100%的支持率聚在一支。

图7 基于IQ-TREE软件构建的虫草属物种线粒体基因组系统发育树Fig.7 Phylogenetic tree of mitogenome sequences of Cordyceps species based on IQ-TREE

3 讨 论

线粒体基因组的结构变异或基因突变可影响真核细胞的稳态、应激反应和代谢过程。不同科属真菌的线粒体基因组在基因含量、基因排列、重复序列和内含子数量上存在较大差异,甚至亲缘关系很近的物种之间也有不同[11,37-38]。本研究对9个虫草属线粒体基因组特征及进化进行了分析,发现虫草属物种线粒体基因组大小存在较大差异,平均为39.3 kb,但编码的基因数目基本一致。线粒体基因在AT和GC倾斜上略有不同,但总体趋势一致,基因组偏好A和G,编码蛋白基因不同密码子位置偏好明显,这可能与密码子的简并性和基因表达有关。

线粒体基因组序列变异率往往大于核基因组,甚至一些近缘种间的线粒体也存在较大的差异。与银耳(Tremellafuciformis)等近缘种相比,稻瘟菌(Hannaellaoryzae)线粒体核心PCG在长度和碱基组成上有很高的变异率[11]。物种进化过程中,大部分线粒体基因转移到核基因组,但大多数真菌仍保留14个用于能量代谢的保守蛋白质编码基因和1个rps3基因,这些被称为真菌线粒体基因组的核心PCGs[39]。多种因素导致线粒体基因组大小差异,包括内含子、未知功能基因和基因间序列的动态变化,这些因素共同导致牛肝菌属不同物种间较大的线粒体基因组差异[7]。虫草属线粒体均含有15个保守的蛋白编码基因,基因组大小与内含子长度正相关,二者呈线性关系,表明内含子长度和数量直接影响了物种线粒体基因组大小。虫草属物种的线粒体结构高度相似,未发现基因重排现象,基因顺序高度保守,反映了这些物种具有密切的系统发育关系。与牛肝菌属(Boletus)[7]、栓菌属(Trametes)[40]和一些担子菌门(Basidiomycota)[39]真菌研究一致,虫草属线粒体基因组大小与内含子含量密切相关,线粒体基因组大小受到内含子区插入或缺失的影响。研究发现,rps3、nad6和nad1等表现出较高的核苷酸多态性,这些变异度较高的基因可为种群遗传学提供潜在的分子标记。所有基因均受纯化选择作用,但从nad4、rps3、cob、nad2和cox1等5个基因中检测到多个正选择位点,表明这些基因在与宿主和环境互作过程中受到了轻微的选择作用,可能与物种的生态适应性有关。

虫草属种类丰富、生活史复杂,历史分类地位多次变更[13,16]。随着分子系统发育研究的发展,核基因组和线粒体基因组被广泛用于真菌物种的分类和鉴定。因线粒体基因组较小,测序成本低,具有较高的保守性和区分度,已成为分析真菌系统发育关系的重要研究方向。本研究基于线粒体基因组序列构建系统发育树,发现粗糙虫草、粉质虫草和蝙蝠蛾拟青霉聚在一支,细脚虫草、蝉棒束孢和蝉花虫草亲缘关系较近,该结果与基于核基因序列构建的系统发育关系类似[5,13],证明线粒体基因组序列是有效的虫草类真菌分类研究的分子标记。随着高通量测序成本的降低,越来越多的真菌线粒体基因组被测序,有望在大型真菌的进化、起源和系统发育研究中发挥更大的作用。

4 结 论

本研究发现,虫草属物种线粒体基因组大小存在较大差异,主要受内含子长度影响,但基因组结构高度保守,未检测到基因重排。线粒体重复序列和SSR数目差异较大,正向重复和回文重复比例较高,含有较多的二核苷酸、三核苷酸和四核苷酸重复SSR。编码基因主要受纯化选择影响,部分基因存在正选择位点。粗糙虫草和粉质虫草亲缘关系较近,而细脚虫草则与蝉花虫草亲缘关系较近。虫草属线粒体基因组研究可为虫草类真菌资源保护和开发利用提供参考。

猜你喜欢

核苷酸虫草线粒体
线粒体质量控制系统与脓毒性心肌病发病机制相关性的研究进展
线粒体自噬在纤维化疾病中作用的研究进展
慢性乙型肝炎抗病毒治疗进展
MFN2调控线粒体动态变化的研究进展
虫草花,是冬虫夏草的花吗
吃味精会对身体有害吗
中科院专家表示:冬虫夏草不含抗癌成分虫草素
“药膳新宠”虫草花
虫草花是虫草的花吗?
为什么我们还保留着线粒体DNA?