系统发育及其在药用植物中应用的研究进展
2023-10-09谭宁华陈凌云
廖 洋,张 娜,谭宁华,陈凌云
(中国药科大学 中药学院,江苏 南京 211198)
系统发育也被称为系统发生、种系发生、系统进化、系统发展,是指单个生物或生物类群的演化过程[1],已经被广泛应用到生物和医学的多个领域[2],如:生物分类、蛋白质或基因家族分类、物种与基因的关系、物种形成过程、物种迁徙模式、人口结构变化[3]、昆虫保护[4];疾病诊断、疾病与病毒的进化过程及二者的相似性[5]、疾病感染途径重建[6]等。测序技术的不断发展和测序成本的持续下降,使得越来越多的生物学数据喷涌而出,为系统发育研究提供了充足的数据基础。
我国药用植物资源丰富[7-8],使用药用植物防病治病、保健养生已有几千年的历史[9-11]。随着社会的发展,对药用植物资源的需求也在增加,但人类活动的破坏和无节制的滥用,以及相关技术的限制,使得许多药用植物还未得到很好的开发与利用,就已经灭绝或即将面临灭绝[12]。因此,加快药用植物资源的保护迫在眉睫。
本文对系统发育在药用植物研究中的应用进行综述,以期让更多的药用植物研究者关注了解系统发育,从而更好的实现药用植物资源的保护、开发和可持续利用。
1 系统发育的历史
系统发育这一学术名词最先由德国生物学家Ernst Haeckel 基于形态学概念而提出[13],迄今,已发展为一门独立学科——系统发育学或分子系统学。系统发育分析结果通常以系统发育树展示[14]。
系统发育研究的历史起源于1859 年达尔文在《物种起源》中发表的进化论。进化论的发表促使植物学家开始考虑植物物种之间的亲缘关系,从而开启了系统发育系统的研究[15]。20 世纪中叶之前,植物系统发育围绕植物的外部形态特征和内部结构而展开。20 世纪中叶之后,随着生物学的发展进入分子时代,研究者开始从分子水平去研究植物进化、分类等科学问题,系统发育进入了一个全新的时代。
20 世纪80 年代,数学思维、计算机技术以及居群思想的引入,对系统发育产生了极大的影响,人们对物种的认识有了新的理解,对种间关系、变异、分化、物种的环境适应有了更深的认识。再到20 世纪90 年代,分子生物学在方法上有了很大的突破,极大地推动了植物系统发育的发展,系统发育研究分为种上和种下两个水平,诞生了分子系统学,为种上水平;分子生态学以及谱系地理学,隶属种下水平。
进入21 世纪,二代、三代测序技术的发展,使得DNA 数据爆发式增长,推动了植物系统发育和分类研究进入“黄金时代”,研究者们对植物系统发育的研究不再局限于DNA 分子标记,而是开始使用不同类型的基因组数据,如叶绿体基因组、线粒体基因组、核基因组[15-17]。
系统发育作为强有力的分析工具,已经应用到多个学科,如:化学[18]、生物地理学[19-20]、生态学[21-22]、发育学[23]、流行病学[24-25]等。
2 系统发育主要研究方法及分析流程
依据不同的计算方式,系统发育重建方法可分为两大类[26]:一类是字符运算法 (如:数字、碱基、氨基酸等字符)又可细分为三种主要方法,即最大似然法 (ML)、最大简约法 (MP)、贝叶斯推断法 (BI);一类是距离矩阵法,该方法依赖于计算数据集中每对序列之间的遗传距离,并通过聚类算法从生成的距离矩阵构建系统发育树[27]。距离矩阵法也可细分为两种主要方法[28-29],即不加权对群分析法 (UPGMA) 和邻接法 (NJ)。不同建树方法[3]的优缺点比较见表1。这些方法都有各自的使用范围和使用条件,如:最大简约法适用于序列碱基差异小、碱基总数大、所有碱基变异速率相近、较少的碱基转换、信息位点较多的序列矩阵。所以通常需要研究者综合考虑这几种方法建立可靠的系统发育树,以提高分析结果的可性度。
表1 系统发育重建不同方法比较Tab.1 Comparison of different methods of phylogenetic reconstruction
早期的系统发育重建多为根据形态和生理特征来推断进化关系,分子生物学和测序技术的发展使得系统发育重建多采用序列数据。基于序列的系统发育重建可分为4 个主要步骤:一、待分析序列数据的获取;二、序列比对;三、系统发育树构建;四、系统发育树可视化[30-31]。简略流程图见图1。
图1 系统发育分析主要步骤及分析工具Fig.1 Main steps of phylogenetic analysis and analytical tools
3 系统发育分析常用的组学数据类型
基因组时代的系统发育分析多采用组学数据,总体而言,系统发育分析常用的组学数据类型可以归为三大类,分别是叶绿体基因组数据,线粒体基因组数据以及核基因组数据。
叶绿体是植物特有的半自主细胞器,是植物进行光合作用的场所,对植物的生长发育起着非常重要的作用。叶绿体基因组序列结构较为保守,不易发生重组,为单亲母系遗传,保留了很多植物进化过程中的遗传信息,易于进行序列比对,是研究植物系统发育很好的分子数据资源[32-33]。进行系统发育研究常用的叶绿体基因组数据主要有rbcL、matK、psbA-trnH序列。
线粒体是存在于大多数真核细胞中的半自主性细胞器,参与细胞的众多生物过程,如能量转化、三羧酸循环、氧化磷酸化、细胞分化、细胞信息传递、细胞凋亡等,具有许多非常重要的生理生化功能[34]。不同于叶绿体基因组,线粒体基因组结构在植物中的变化率很高,极易发生结构重排[35-37]。植物线粒体基因组具有保守的核苷酸替代速率,进化缓慢,因此很少用于植物系统发育研究,但却十分适合动物系统发育研究[38-39]。
核基因组与叶绿体基因组和线粒体基因组相比,具有更丰富的遗传信息,为双亲遗传,能揭示更为复杂的系统发育关系,在系统发育研究中的潜力更大,是未来系统发育研究的主流方向[17]。进行系统发育研究常用的核基因组数据主要有ITS 序列,ITS序列又包括ITS1 和ITS2 序列。
4 系统发育在药用植物中的应用
4.1 系统发育在药材鉴定中的应用
基因组序列蕴含着植物起源、进化、发育、生理、遗传性状等重要信息,是分子水平上破译基因组多样性、化学多样性、形态多样性的前提和基础[40]。DNA 条形码是从用于识别物种的基因组序列中提取的具有物种水平遗传变异或差异,且包含保守侧翼位点的一个或多个短基因序列[41],是一种基于DNA序列的物种快速鉴定工具。目前在植物应用中首选的标准条形码有rbcL、matK、trnH-psbA、ITS、ITS2。DNA 条形码鉴定物种是通过将未知样品的条形码序列与已建立的物种DNA 条形码库进行匹配,通过匹配率进行物种的识别,其局限性在于,如两个或多个未知物种的条形码序列(其中,既有已知物种,也有已知物种的混伪种)与已知物种的DNA条形码序列匹配率很高时,依旧无法鉴定未知物种是否为真实的已知物种[41-42]。此时,将未知物种的条形码序列与已知物种的DNA 条形码序列进行系统发育树的构建,通过系统发育结果,观察未知物种是否与已知物种聚到同一枝,从进化关系上去鉴别未知物种与已知物种的亲缘关系,则可以很好地解决这一问题。
基于药材DNA 条形码等序列数据的系统发育分析,能从进化树上清晰的看出枝与枝之间的亲缘关系远近(枝与枝离的越近,亲缘关系越近,反之,则亲缘关系越远),从而在分子水平上对药材极其掺杂物进行鉴定。很多植物药材在形态特征上与掺杂物具有高度的相似性,通过肉眼很难辨别药材真假,这就使得在药材市场流通时存在一定的安全风险,一些不法分子以假充真,严重破坏了药材市场秩序,使用系统发育分析对药材进行鉴定则能很好的解决这一问题。系统发育由于具有快速、高效、可靠等优点,在药材鉴定领域越来越受欢迎,使用系统发育分析方法进行药材鉴定也越来越普遍。
系统发育可以对中药材基源物种进行区分和鉴定,见表2。系统发育可以应用于药材及其掺杂物的鉴定,见表3。
表2 系统发育在中药材基源物种鉴定中的实例Tab.2 Examples of phylogeny in the identification of basal species of herbal medicines
表3 系统发育在中药材及其掺杂物鉴定中的应用Tab.3 Applications of phylogeny in the identification of Chinese herbal medicines and its adulterants
4.2 系统发育在药用植物亲缘关系及药材道地性鉴定中的应用
一些药用植物亲缘关系较为复杂,药材基源植物使用混乱、药材道地性存在争议,影响临床用药安全,使用药用植物及其近缘物种完整或部分基因组序列数据进行比对建树,可以通过系统发育结果揭示药用植物及其近缘物种的亲缘关系,很好的解决基原和用药问题。通过系统发育分析进行药用植物亲缘关系鉴定的实例,见表4。
表4 系统发育在药用植物亲缘关系鉴定中的应用Tab.4 Applications of phylogeny in the identification of relatives of medicinal plants
4.3 系统发育在药用植物及活性成分预测中的应用
将具有某种药理活性的药用植物基因序列进行系统发育分析,可以从系统发育结果观察具有某种药理活性的基因序列聚在哪一枝,从而找到具有该药理活性的潜在药用植物或药理活性成分。植物通常含有多种次生代谢产物,而这些次生代谢产物往往具有丰富的生物活性,是人类对抗疾病的重要来源[60]。一些药用植物的有效成分已经被阐明,但某些有效成分在植物中的含量却很低,系统发育研究有助于确定具有潜在药用价值的药用植物预测,从而找到高含量有效成分的替代资源,是药物发现的有力工具。此外,通过系统发育分析还能缩小拟调查群体的数量,提高对目标群体的探测效率和准确率。系统发育对药用植物及活性成分预测的应用实例,见表5。
表5 系统发育在药用植物及活性成分预测中的应用Tab.5 Applications of phylogeny in the prediction of medicinal plants and active ingredients
4.4 系统发育在药用植物生物合成中的应用
一些化合物的生物合成通路还未阐明,同一化合物的生物合成通路在不同物种中的合成模式也不尽相同,且同一化合物在不同物种中存在与否,以及含量变化同样具有差异。基于组学数据进行系统发育分析,将功能已知的基因序列同目标基因序列进行比对建树,通过系统发育结果解析参与化合物生物合成基因或基因家族的演化历史,判断是否发生基因转移、基因复制、基因丢失等事件,可以很好地回答化合物在不同物种中存在与否、含量出现差异的原因、以及合成通路模式不同等系列问题,为化合物生物合成通路的解析提供更多的理论依据。系统发育在生物合成中的应用实例,见表6。
5 结语
综上所述,利用系统发育分析,可以进行药材鉴定,区分药材真伪,促进中药材市场的稳定健康发展;可以进行物种亲缘关系鉴定,揭示物种的进化地位和物种间的进化关系;可以进行药用活性成分预测,找到候选药用化合物,为新药筛选提供理论依据,提高研究效率;可以进行潜在药用植物预测,扩大药用植物资源,实现药用植物资源的保护和可持续利用。除此之外,系统发育还可应用于寻找国外进口药物的国内替代药用资源,完善、解释中草药用药经验等。随着系统发育基因组学的不断发展,未来利用系统发育进行生物合成通路的解析可能会成为研究热点之一,基因的起源与进化,病原体的来源与进化等问题也可能成为系统发育研究的主流。