APP下载

从保护遗传学到保护基因组学

2018-12-30谭鑫鑫

关键词:基因组学遗传学基因组

谭鑫鑫,李 明

(1. 中国科学院动物研究所 动物生态与保护生物学重点实验室,北京 100101;2. 中国科学院大学,北京 100049)

生物多样性(biological diversity)是人类生存的物质基础,而全球生物多样性正以惊人的速度不断丧失[1].保护生物学(conservation biology)是研究如何保护生物及其生存环境,从而保护生物多样性的科学[2].保护生物学发展迅速并形成许多分支学科,涉及生物学研究的不同领域,例如保护生态学、保护行为学、保护生理学、保护遗传学等[3].近年来,由于高通量测序技术的发展,使得保护生物学面临着新的挑战和机遇:即如何将大规模基因组数据技术有效地整合到保护生物学的应用之中,实现从保护遗传学到保护基因组学的转变?

1 保护遗传学

1.1 保护遗传学的发展

保护遗传学(conservation genetics)是指利用遗传数据和研究来指导生物多样性保护和物种及种群管理的学科[4],其研究包括遗传多样性量化、物种鉴定、亲缘关系鉴定、历史动态追溯、有效种群大小的监测管理、种群结构和生境适应的探究等内容[5-18].随着遗传标记的不断发展,保护遗传学研究逐渐成为保护濒危物种的重要手段,相关报道也逐年稳定增加[6].在过去的几十年里,保护遗传学已经从基于理论的种群生物学发展为一个成熟的、有积累的学科[19].

作为保护遗传学研究中的重要工具,遗传标记经历了多次的变革,推动了保护遗传学的发展.同工酶(allozyme)是最早的遗传标记[20],它的出现可以使研究者基于多个位点对任意物种进行遗传变异的检测和比较[21].随着分子标记种类的增多,保护遗传学研究早期使用的同工酶标记被逐步取代[19].在动物类群中,应用较为广泛的分子标记有微卫星(microsatellite)、线粒体DNA(mitochondrial DNA,简称mtDNA)、扩增片段长度多态性(amplified fragment length polymorphisms, 简称AFLPs)和单核苷酸多态位点(Single nucleotide polymorphisms, 简称SNPs)等.单一的遗传标记不能适用于所有的分析,每一种标记的效用需要根据其技术原理、成本、时间、实验样本的数量和类型以及研究的具体问题来确定.例如:微卫星标记(又被称为短串联重复,short tandem repeats, 简称STRs,一般由2~6 bp重复出现的DNA组成)广泛地应用于遗传漂变、基因流、有效种群大小等分析中;而线粒体DNA序列作为一种母系遗传的分子标记,常被用于重建物种的系统发育关系[22-24].

经过近几十年的发展,保护遗传学取得了长足进展.保护遗传学基于一些中性的遗传标记,利用有效的研究方法来进行种群动态、基因流、有效种群大小、种群遗传结构的评估,取得了诸多进展[7-10].通过分析分子标记所带来的数据,掌握种群当前和过去状态的多种信息,是指导和实施管理策略来缓解濒危风险的依据.另外,保护遗传学不仅为保护生物学中的相关问题提供了新的见解,对进化生物学的其他领域同样具有重要作用.通过近几十年来分子标记的大规模的应用,已经积累并产生了一个巨大且不断增加的数据库,为生物学研究提供了相关资源和基础.

1.2 保护遗传学的局限

尽管保护遗传学目前已经取得了很多成就,但仍有许多局限性,尚不能有效地解决保护生物学中的所有问题.首先,保护遗传学中使用分子标记的数量相对较少,例如一般的研究中常用十几个微卫星标记或者是几百个AFLPs位点,这些标记只有几千个核苷酸位点,分散在基因组的不同部位,覆盖基因组的极小一部分,限制了其在基因组范围估算参数的能力.因此,这样的分子标记数量尚不足以代表基因组水平的研究结果[25].其次,基于一种标记无法对濒危物种的所有问题进行全面研究,不同分子标记类型的应用正变得更加专业化,更适合处理特定类型的问题.另外,保护遗传学不一定适用于对环境适应性的研究[26].由于保护遗传学中用到的分子标记大多数是利用基因组中的中性位点,这些中性标记可能无法准确地反映出自然种群的基因组遗传多样性[27],也无法将环境适应性和具体的基因功能相联系.将基因组技术应用到保护生物学是目前研究适应性的有效方法和当务之急[26,28].

2 从保护遗传学到保护基因组学

2.1 保护基因组学

基因组测序技术可以在短时间内,对成千上万的位点进行大规模测序,得到非常高的标记密度.随着基因组测序技术在保护生物学中的广泛应用,为保护生物学带来了更大的发展潜力,在此背景下保护基因组学(conservation genomics)应运而生[4].与保护遗传学相比,保护基因组学具有诸多优势,在很大程度上克服了保护遗传学的局限性,有助于解决保护生物学中一些悬而未解的问题.

首先,全基因组测序可以实现基因组范围的标记筛选,得到数以万计的高密度分子标记,因此在此基础上对种群的各种参数的评估更具代表性,例如对个体杂合度、遗传距离、基因流、种群增长、种群遗传结构等的统计[19].基因组测序还可以得到物种之间、种群之间以及种群内部特有的分子标记,使得研究种群内部、种群之间的基因组水平的遗传变异成为可能.

其次,基因组测序技术的不断发展使得分子标记的种类也越来越丰富,除了单核苷酸多态性位点外,全基因组测序还可以检测到小片段的插入和缺失(insert and deletion)、大片段的结构变异(structure variation)以及基因拷贝数变异(copy number variation)等,为新方法的探索提供了必要的基础.

第三,基因组测序技术为研究环境适应性的机制提供了可能性[25],基因组测序能够提供高密度的各类分子标记,极大地提高选择性以及适应性等方面的检测能力.借助于基因注释,基因组测序技术还可以实现对分子标记的分类、区分出编码区的功能标记和基因间区的中性标记,将适应性变异和具体的基因相结合,以探索分子标记与濒危物种的特殊表型、生活习性之间的关系,增强我们对环境和基因如何相互作用来影响表现型和适应性的了解.

2.2 保护基因组学方法策略

研究人员根据目标物种是否有参考基因组可选择基因组从头测序(Denovosequencing)或基因组重测序(resequencing).Denovo测序是指对生物进行第一次的基因组拼装,其组装效果依赖于基因组的大小和复杂程度.而基因组重测序则是在已经有参考基因组的前提下,对物种进行个体或者群体的测序分析,重测序法受到有无参考基因组的限制.

目前,除了全基因组测序外,简化基因组测序也常被应用于保护生物学的相关研究中.例如,RAD测序(restriction site associate DNA sequencing, 简称RAD-seq)就是一种常见的简化基因组测序技术[29],它只是针对限制性酶切位点附近的序列进行测序,用于SNP分子标记的检测.RAD不受参考基因组的限制,性价比较高,适合进行群体分析,鉴定不同种群的遗传结构.除此之外,RNA测序和外显子测序也可视为简化基因组测序的范畴[30-31].

3 基因组学在物种保护中的应用

基因组学技术和方法已经在生态学、进化生物学等方面得到了非常广泛的应用,近年来大量濒危物种的基因组相继被报道.尽管有些报道并未探讨具体的物种保护问题,但其基因组数据资源的积累,为日后的保护生物学研究奠定了基础,利用基因组学的方法和技术解决物种保护问题的研究也逐渐增多.

3.1 更准确的系统发育关系和种群遗传结构

物种是最基础的分类单元,保护计划的成功实施在很大程度上依赖于对保护目标的分类地位的正确识别,还要避免将不同种、不同来源的种群聚在一起.全基因组数据包含了一个物种的几乎全部遗传信息,通过全基因组信息来重建系统发育树更具说服力,而利用基因组数据来确定种群遗传结构在很多濒危物种中也得到了应用.基因组技术可以更有效地解决保护生物学中传统标记解决不了的争议.

例如,金丝猴(仰鼻猴属,Rhinopithecus)是分布在亚洲的一类濒危灵长类.仰鼻猴属内的系统发育关系曾经存在较多争议.Zhou 等[32]通过Denovo测序并组装了一只雄性的川金丝猴(R.roxellana)的基因组,将其与另外3种金丝猴(R.bieti,R.brelichi和R.strykeri)进行全基因组比较分析,解析了4种金丝猴的遗传多样性,并重建了仰鼻猴属内的进化历史.继首次完成川金丝猴基因组的Denovo测序后,Zhou 等[33]对来自金丝猴属内的4个物种共38个个体进行了全基因组重测序和群体基因组学分析,通过系统发育重建和遗传结构分析显示在川金丝猴中主要有两个遗传簇,各自对应于两个独立的遗传管理单元.

长江江豚(Neophocaenaasiaeorientalis)仅分布于长江中下游,是全世界唯一的江豚淡水种群,也是生物多样性和水生生态系统保护的新旗舰物种.由于长江江豚的生境被破坏,其种群数量在逐年降低[34],进一步加强对该物种的保护将具有极为特殊的必要性.传统的研究中,江豚(N.phocaenoides)被定义为了单一的种,而基于线粒体DNA和形态学标记对江豚亚种的分类存在较多争议,有研究将其分为3个亚种(N.p.phocaenoides,N.p.asiaeorientalis和N.p.sunameri)[35-36],而有研究又支持2个种的假说(N.phocaenoides和N.asiaeorientalis)[37].通过对江豚的Denovo测序和不同地理分布区个体的全基因组群体重测序分析,确定将江豚分为3个种:N.phocaenoides,N.asiaeorientalis和N.sunameri.通过种群基因组学分析发现,3种江豚现在已有显著遗传分化,并且在几千年的时间里都没有发生基因交流[38].

中国大鲵(Andriasdavidianus)俗称“娃娃鱼”,是中国特有的珍稀野生动物,也是世界上现存的两栖类中体型最大者.中国大鲵的基因组约有50 G,组装难度极大,成本较高,不适合进行Denovo测序.研究人员选择了简化基因组的方法,对中国大鲵的野生种群开展了种群遗传学分析[39].基因组分析与线粒体基因分析的结合意外发现,中国大鲵并非单一物种,其名下至少隐藏有5个不同种.这5个物种的分布地与水系分布相关,大致对应黄河、长江、珠江、钱塘江等水系流域.

上述研究表明,保护基因组学可以清晰重建系统发育关系,确定种群遗传结构,使传统方法中存在争议的诸多问题得到有效解决,对保护生物学具有重要意义.

3.2 重塑种群历史动态

种群历史动态的研究内容包括瓶颈、迁徙模式、扩散和历史有效种群大小的评估等,在保护生物学中具有重要的意义.将现生种群的基因组与进化历史结合起来,有助于了解过去的历史事件及其对现生种群的基因组背景的影响,以应对保护管理中的各种挑战.

例如,树袋熊(Phascolarctoscinereus)是唯一现存的有袋类动物,由于栖息地的丧失和其易感染疾病的特点,树袋熊被列为濒危物种.2018年,研究人员利用基因组测序技术组装得到完整的树袋熊基因组[40],再利用顺序配对马尔可夫溯祖模型(PSMC)对树袋熊进行历史动态的模拟,发现位于两个地理分布区的树袋熊PSMC模拟结果不一致.这预示着在树袋熊群体中存在着地区的差异,群体之间基因交流可能存在阻碍.这种区域的差异在之前基于线粒体进行的保护遗传学分析中也有相关报道[41-42].历史动态分析的结果表明,树袋熊种群数量的大量降低与澳大利亚巨型动物的数量下降一致,而且现生的种群中存在生物地理界限.由此可见,基因组技术在保护生物学中的应用,可以为保护管理策略提供科学的依据.研究人员可以将这些研究成果应用于树袋熊的保护管理,以帮助树袋熊在野外生存.

Zhao等[43]在2013年对34只大熊猫(Ailuropodamelanoleuca)进行种群基因组学分析.利用PSMC重塑了大熊猫从1万年前到80万年前的种群大小波动过程.此外,基于多个种群之间的联合频谱(allele frequency spectrum,简称AFS),通过扩散逼近的方法(diffusion approximation)模拟了大熊猫的3个种群近期的种群历史.在此分析过程中,共鉴定到了2次种群扩张、2次瓶颈效应以及2次分化过程,并推断出了大熊猫种群数量在过去的3 000年里下降的原因可能是人类活动造成的.

以上的研究说明了全基因组数据如何促进对历史有效种群波动的推断和历史动态事件的追踪.基于全基因组数据的模拟可以提高对种群历史动态和有效种群大小的模拟精确度,而这些事件可以帮助研究人员更好地理解现生种群的遗传多样性和种群遗传结构,制定更有效的保护策略.

3.3 鉴定环境适应性分子机制

对支持物种适应特定生境条件的基因组区域的识别是进化生物学的研究热点之一,也是保护生物学中功能性保护的重要基础.这些信息可以告诉管理者,将相对受威胁的种群转移到其他地方是否为一种可行的保护策略.全基因组扫描是确定与生境适应性相关的位点和基因组区域的有效方法,借助于基因注释结果,可以确定与这些区域关联的适应性基因的功能,在一系列的环境条件下将表型与基因相关联.

猕猴(Macacamulatta)是我国的II级保护动物.作为分布最广泛的非人灵长类动物,猕猴的栖息地具有较大的多样性,它们成了研究灵长类动物对不同气候局部适应的重要研究对象[44].此外,猕猴在生理、心理、认知等研究中也具有重要的应用价值.因此,保护猕猴的生物多样性对多方面的研究都意义非凡.Liu等[45]利用种群基因组学的方法,在重建中国猕猴的种群遗传结构和种群历史动态的基础上,通过全基因组范围的扫描检测了不同亚种对极端环境的适应机制.分布于最北的寒冷气候下的猕猴华北亚种(M.m.tcheliensis)和分布于最南部热带岛屿上的海南亚种(M.m.brevicaudus)的体型变化完全符合贝格曼规则,即华北亚种比海南亚种的体型更大[46].检测发现华北亚种和海南亚种中与骨骼的生长和发育相关的基因受到选择,这些基因可能和其体型大小相关,代表了灵长类动物适应不同气候环境的一种新机制.此外,华北亚种的栖息地在冬季和早春时节,气候寒冷、食物匮乏,检测过程中发现在华北亚种中,FBP1、FBP2基因受到正选择.这2个基因所编码的蛋白质在糖异生过程中有重要作用,它们可能是华北亚种在食物短缺的情况下维持血糖稳定的重要因素.

江豚(Neophocaena)同时分布在海水和淡水中,为了确定江豚对于咸淡水生境的适应机制,研究人员对生活在海水和淡水的两个种进行了全基因组扫描,鉴定得到一系列与渗透调节相关的基因.例如,与肾脏水稳态、加压素调节的水重吸收、尿素的转运等有关的基因ADCY1、DYNC2H1和SLC14A2,以及与肾素-血管紧张素系统功能相关基因ACE2等[38].这预示着长江江豚已经对不同于海洋的淡水环境产生了适应性进化,在长江江豚与海洋江豚之间可能已经出现了生殖隔离和物种的分化[38].

以上列举的研究说明了基于全基因组数据可以将生物表型、环境和具体基因相结合,以检测目标物种的适应性进化,为制定合理有效的保护策略提供科学依据.

4 讨论及展望

近十多年来基因组测序技术的发展,被认为是解决保护生物学难题的契机.高通量测序技术给保护学者带来很多便利,但也有其自身的局限性.首先,相比传统的保护遗传学,保护基因组学的测序技术难度较高,成本较大.其次,高通量测序技术对样品的质量要求较高,而濒危物种的样品采集难度大,很难保证用于保护基因组学分析的样品数量.第三,基于全基因组测序得到的分子标记数量较多,而现有的一些算法多是基于传统的少数分子标记开发的,应用到基因组范围将需要超长的运算时间.第四,基因注释的准确性仍然是一个挑战,尤其是对于缺乏详细的转录组数据的非模式生物,准确度不高的基因组注释结果将直接影响到环境适应性相关的功能基因的分析结果.

像任何新兴领域一样,保护基因组学也不得不面对上述挑战和限制.目前,虽然没有某种全基因组测序的检测方法能够满足保护生物学的全部需要,而且分析方法都有各自的局限性.但是,随着高通量测序技术的发展以及各种算法的优化,以上的各种局限将会被逐一克服.可以设想,在不久的未来,全基因组分析必将为保护生物学研究提供最重要和最有效的基础.

* * * * * *

致谢:中国科学院动物研究所灵长类生态学研究组刘志瑾博士和周旭明博士对该论文提出宝贵的修改意见,在此一并感谢!

猜你喜欢

基因组学遗传学基因组
小麦-中间偃麦草2A/6St代换系014-459的分子细胞遗传学鉴定
基于宏基因组学方法分析化肥减施对热带地区菜地土壤微生物群落的影响
“植物界大熊猫”完整基因组图谱首次发布
牛参考基因组中发现被忽视基因
山西在谷子功能基因组学研究领域取得重大突破
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
例析对高中表观遗传学的认识
实验设计巧断遗传学(下)
本草基因组学