DNA宏条形码技术在动植物法医鉴定中的应用进展
2021-04-17陈云霞
李 磊,蒋 敬,陈云霞*
(1.南京林业大学,江苏 南京 210037;2.南京森林警察学院,江苏 南京 210023)
防止野生动植物相关犯罪是维护生态安全、保护人民健康的重要举措,是森林公安、食药环等执法部门的首要任务。然而,有效打击野生动植物相关犯罪活动的重要环节之一就是涉案物证的种属来源确认。涉案动植物及其制品是否属于国家重点保护物种或《濒危野生动植物种国际贸易公约》(CITES)附录监管物种是相关犯罪定性以及量刑的主要依据。通常涉案的动植物法医样本有两类,一类为成分单一的动植物个体、组织、器官或制品等,此类样本可通过形态学方法或DNA条形码(DNA barcoding)方法进行种属来源的鉴别;另一类则为非单一物种来源的样本,如一些肉制品、保健品、传统中成药物等,此类检材具多重物种来源,成分复杂。通常DNA条形码技术,一次只能检测出一种物种,当分析由不同物种组成的混合样本时,由于这些样品通常由一种以上的成分组成,只有在多种DNA条形码模板可以并行测序的情况下,才能有效地进行分析,这是第2代测序技术可以有效完成的[1]。因此,对于混合生物样本,DNA宏条形码技术(DNA metabarcoding)可实现多物种的同步快速识别,具有良好的应用前景。
笔者对DNA宏条形码技术进行了简要介绍,并从司法实践应用的角度出发,概述了DNA宏条形码技术在食品药品监管、刑事案件侦查等动植物法医鉴定领域的研究与应用现状,对其在实践应用中所面临的问题与挑战进行了剖析,并对其应用前景等进行了探讨与展望,可以为推进DNA宏条形码技术在动植物法医鉴定领域的常规化应用提供一定的理论依据及实践支撑。
1 DNA宏条形码技术概述
1.1 基于1代测序(Sanger测序)的DNA条形码技术
DNA条形码技术是利用生物基因组中普遍存在的一段较短的、标准的DNA 序列作为分子标记,通过参考数据库同源比对以及进化树分析来确定物种间的亲缘关系,从而实现动物、植物、真菌等物种的快速准确鉴定。相较于传统的物种形态鉴定方法,DNA条形码技术不受个体形态、性别以及发育阶段的影响,通用性强、准确性高,而且便于标准化操作[2-3]。
DNA条形码的概念在2003年一经提出,很快成为物种分子鉴别的主要方法,在生物分类学领域发挥了重要作用[2]。2004年,由45个国家组成了生命条形码联盟(CBOL,the Consortium for the Barcode of Life),该联盟成立后,相继开发了一套标准的生物DNA条形码以及操作流程,并建立了较为全面的DNA条形码数据库——生命条形码数据系统(BOLD,the barcode of life database system)[4]。截至2019 年12月,BOLD 已经收录了30.6万个物种,776.3万条DNA条形码序列。研究者可以登录系统通过物种名称来搜索相关物种的DNA条形码数据,或者提交序列来鉴定该物种的分类信息。随着相关技术的不断成熟和相关研究的不断深入,DNA条形码数据库将会陆续得到补充和扩展,同时结合计算机智能化,可实现物种的标准化和自动化鉴别,这将会推动生物分类学的进一步发展。
大量研究已表明,线粒体细胞色素氧化酶I基因(mitochondrialcytochromeCoxidaseI,COI)、细胞色素b基因(mitochondrialcytochromeb,Cytb)具有较高的突变率以及引物通用性,被认为是标准的动物DNA 条形码序列[2,5]。植物中,由于线粒体基因组进化太慢,COI基因和其他线粒体基因并不是物种鉴定的理想选择[6-7]。在植物DNA条形码研究中,叶绿体成熟酶K蛋白编码基因(matK)以及核酮糖1,5-二磷酸羧化酶/加氧酶大亚基基因(ribulose-1,5-bisphosphatecarhoxylase,rbcL)被认为是植物的“核心”DNA条形码[8-10]。
虽然DNA 条形码技术已日趋成熟,也逐步发展成为分子鉴定及物种分类的常规手段,但随着新的应用需求以及相关研究工作的深入,其局限性也非常明显,比如一代测序技术无法完成对多物种混合样品中的物种信息进行快速同步分析与鉴定。所以DNA条形码技术与一些新兴技术的结合,如高通量测序技术,向着多技术融合以及多样化的方向发展,将会具有更广阔的应用前景。
1.2 基于2代测序的DNA宏条形码技术
第2代测序技术(next generation sequencing,NGS)是相对于1代测序技术而言,单次测序能获得大量的序列数据,这是2代测序的突出特点,所以又被称为高通量测序技术[11-13]。第2代测序的主流测序技术主要有3种,分别为Roche/454 焦磷酸测序技术、Illumina/Solexa 聚合酶合成测序技术和ABI/SOLiD 连接酶测序技术。Illumina公司目前拥有MiSeq、NextSeq、HiSeq系列等多样的高通量测序平台,优势在于其产生的测序数据错误率极低[14],但其最大读长较短,一般不超过300 bp;Roche公司的454测序平台的测序读长可达400 bp,在读长方面具有突出优势,但会出现插入和缺失的错误类型,而且整体错误率高达约1.5%[14-15];ABI/SOLiD 测序平台读长最短,仅有50 bp,但其优势在于应用了双碱基编码,降低了测序的错误率,而且具有与重测序相似的原理,所以SOLiD测序平台特别适合具有高质量参考基因组的物种重测序[10,14]。
DNA测序技术在生命科学的发展中起着重要的作用。高通量测序技术的出现,使得DNA 测序技术发生了重要转变,同时给生命科学研究带来了更多新的方法和途径。现阶段,高通量测序技术已广泛应用于转录组、基因组、微生物组测序等方面[12,16-17]。DNA宏条形码技术就是随着高通量测序技术的发展而新兴的一种物种分类鉴别以及生物多样性分析的技术。该技术结合了高通量测序技术和DNA条形码的优势,通过单次测序可以同时获得样本中所有物种的目的基因扩增子序列,然后通过生物信息学手段对这些序列进行除错、去冗、聚类等分析,从而确定混合样本中的物种组成。现阶段,DNA宏条形码技术以高效率与低价格的优势极大地拓展了DNA条形码的应用范畴。
2 DNA宏条形码技术在动植物法医鉴定中的应用
DNA宏条形码技术的早期应用多集中于生物多样性研究,主要是微生物群落的多样性。现在该技术已广泛应用于动物食性分析、食品源性成分分析、药品基源组成分析、生态评估等多个研究领域。DNA宏条形码技术在动植物法医鉴定领域的应用目前也开展了初步研究,比如食品掺假、药品掺伪、濒危动物非法添加的监管、死者原生地推断等方面的应用。
2.1 食品监管
近年来国内外食品掺假以及食品安全事件频有发生。以“国家林业局森林公安司法鉴定中心”(以下简称“中心”)受理的案件为例, 2013年,“中心”对江阴市检疫局送检的标称羊肉冻制品进行源性成分鉴别,其中除了检出绵羊 (Ovisaries)成分,还检出了北极狐(Vulpeslagopus)、赤狐(V.vulpes)、貉(Nyctereutesprocyonoides)的成分;2014年,对南昌市工商行政管理局送检的100余份在售牛肉干进行源性成分鉴定,其中40%的牛肉干存在掺假行为,检出了猪(Susscrofadomesticus)、鸡(Gallusgallusdomesticus)以及鸭(Anasplatyrhynchos)的成分。这些食品的掺假、标签误标、“瞒标”等是关系人类健康和社会发展的重要问题。在此类问题中,源性成分组成的准确鉴定是解决该问题的关键,也是对食品真伪及其质量监控的有效手段。
DNA宏条形码技术作为一种基于高通量测序的新型物种鉴别技术,相比传统的食品真伪鉴别方法具有准确、高效等优势,目前在食品源性成分鉴定中的应用已有一些学者开展了相关研究。如Prosser等[18]、邢冉冉等[19]应用Ion Torrent PGM测序平台,以COI(120 bp)、rbcLa(162 bp)和[nuclear ribosomal DNA internal transcrsbed spacer 2, (ITS2)](~350 bp)为条形码标记,对不同产地和加工方式的7种蜂蜜进行了真伪鉴别。其中,蜂蜜中花粉的物种来源用ITS2作为分子标记;蜂蜜中微量或者降解的植物DNA种属来源的鉴定用rbcLa作为分子标记;其蜜蜂的来源鉴定用COI基因作为分子标记。该研究利用DNA宏条形码技术基本实现了蜂蜜中蜜源植物与采蜜蜂源的准确鉴定,为蜂蜜的真伪鉴别以及产地溯源提供了一个新的途径,也为其他食品的真伪鉴别提供了新思路。Stefanie等[20]选择欧洲食品中常见的15种哺乳动物和6种家禽动物为研究对象,分别构建了不同物种组合的DNA提取液,并制备了4种模式香肠,利用MiSeq(Illumina)测序平台,线粒体16S ribosomal RNA(16S rRNA)基因的一个区域作为条形码片段,对其物种组成进行了分析。结果表明,21种目标物种均可被识别,而且灵敏度高,可检测含量低至0.1%的物种。该研究还通过对个体DNA提取液、混合DNA提取液和模型香肠提取液的分析,探讨了该方法的适用性,因此该方法在常规分析中具有很高的应用潜力。蔡一村等[21]选择24个哺乳动物、禽类和鱼类为研究样本(包括东北虎(Pantheratigrisaltaica)、梅花鹿(Cervusnippon)等珍稀濒危物种),以354 bp的16S rRNA基因区域片段作为分子标记,利用基于高通量测序的(Illumina公司MiSeq测序平台)DNA宏条形码技术分别对混合DNA 样品、模拟动物源性样品(煮熟的肉丸)、已知浓度占比动物源性样品以及商业化样本中的动物源性成分进行鉴定,结果表明,混合样品中所有动物源性成分均能正确鉴定,而且最低检测下限达0.5 ng/μL。特别是在针对市售的10个商业化动物源性制品样本进行检测后发现了2例标签不符的问题。该检测方法有效实现了混合动物源性制品中物种来源的同步识别,检测结果准确,适用范围广,有望为食品监管、打击走私等相关执法提供技术支持。
2.2 药品监管
传统中成药(traditional Chinese medicine, TCM)已经有几千年的历史,是我国大部分人口的主要药物治疗手段,近几十年来,中药与传统的西医结合作为替代疗法,在亚洲以外地区的使用越来越多。中成药的一个基本特点就是使用植物、动物、矿物等自然资源入药。比如我国药用动物有1581种,其中一部分动物就属于珍惜濒危野生动物。据《中华人民共和国药典》(2000年版)所载的62种药用动物中,被列入国家重点保护动物名录的有9种,被列入《濒危野生动植物种国际贸易公约》附录监管的有15种,共占39%[22]。
随着中药产品的日益普及,对中药的种类及数量的需求也随之增长,而这种需求已经成为一系列濒危物种生存的主要威胁之一,如高鼻羚羊(Saigatatarica)、印度犀牛(Rhinocerosunicornis)、东北虎、黑熊(Ursusthibetanus)等。CITES公约于1973年6月21日在华盛顿签署,于1975年7月1日正式生效,所又称华盛顿公约。该公约禁止或限制了3.5万多种濒危野生动植物及其制品的贸易。我国于1981年4月8日正式加入该公约,成为履约国之一,根据CITES公约及附录的有关规定,凡含有附录Ⅰ、附录Ⅱ或附录Ⅲ所列物种成分的中药材或中成药进行国际贸易,必须要遵循CITES公约的要求和我国相关机构的有关规定,否则,均属于非法走私[23]。所以,中成药中动植物成分的分析鉴定,可以有效监管药物掺伪、濒危动植物非法添加等违法行为,保障药品的安全性与合法性。
近年来,不少学者将DNA宏条形码技术应用到中成药物成分鉴定的研究中。如Coghlan等[24]利用高通量测序技术,以tRNAnucleoticlyltransferasel(trnL)和16S rRNA为分子标记,对15种海关进口的以粉末、晶体、胶囊、片剂和草药茶等形式呈现的中药制剂成分进行了鉴定,共鉴定出68种动植物物种,其中一些重要样本中甚至检测出了黑熊、高鼻羚羊等濒危物种,一些样品中检出麻黄属(Ephedra)、细辛属(Asarum)等未列出的可能有毒或致敏的植物成分。Cheng等[25]基于高通量测序技术,对3个厂家生产的不同批号共9份六味地黄丸的六味配方进行宏条形码分析,结果显示,不同商家的产品在质量和安全性方面存在显著差异,因为在一些六味地黄丸中发现了未上市的刺五加(Acanthopanaxsenticosus),可能会给消费者带来安全风险。Raclariu等[26]利用DNA宏条形码技术结合高效液相色谱联用质谱法(High Performemce Liquid Chromatoqraphy-Mass Spectrometry, HPLC-MS)对16份市售含有药用婆婆纳(Veronicaofficinalis)的中药产品进行成分分析。结果显示,只有15%的产品可检测到药用婆婆纳,62%的产品检测到混伪品石蚕叶婆婆纳(V.chamaedrys)。石林春[27]等使用Illumina HiSeq测序平台,以ITS2为条形码,对3份不同批次的如意金黄散进行物种基原识别。结果表明,基于DNA宏条形码技术可检测到除厚朴(Magnoliaofficinalis)外的全部处方成分,而且检测到药材苍术(Atractylodeslancea)的混伪品朝鲜苍术(Atractylodescoreana)以及天南星(Arisaemaheterophyllum)的混伪品虎掌(Pinelliapedatisecta), 说明如意金黄散临床使用的有效性和安全性存在一定的潜在风险。这些研究表明,DNA宏条形码技术不仅为中药质量控制提供了新技术,也为药品监管、非法贸易的查处、野生动植物保护提供了技术支持。
2.3 刑事案件侦查
在一些刑事案件侦查中,往往嫌疑人或死者身上携带的植物信息能帮助警方缩小侦查范围,为案件侦破提供线索。如刘萌妍等[28]采用Ion S5TM(Thermo Fisher Scientific)高通量测序平台,以rbcL(402 bp)与matK(349 bp)基因片段为条形码,对一具无身份信息男性尸体10份肺部组织中的孢粉组成进行分析,共取得27科31属32种植物,虽然其中超过15个属都难以鉴定到种,但是并不影响死者原居住地的推断。研究结果显示,在31个属中有9个属的物种有一定程度的地域指示作用,比如龙眼属(Dimocarpus)、黄连属(Coptis)、波罗蜜属(Artocarpus)、买麻藤属(Gnetum)、铁力木属(Mesua)、银叶树属(Heritiera)、同钟花属(Homocodon)、刺葵属(Phoenix)和青梅属(Vatica),这些植物种属与广西、广东、云南、海南等地具有较高的地域相关度。实地调查结果也印证了该研究的分析结果,死者生前确实在广西南部某县长期生活过。该研究表明利用DNA宏条形码技术可以分析死者肺组织内所携带的植物孢粉信息,结合植物地理分布辅助推断死者生前的居住地,为无名尸案件的尸源查找提供新的思路与方法。
3 存在的问题
虽然DNA宏条形码技术作为成熟的物种鉴定方法,被广泛应用于生物多样性、动物食性、环境监测、食品药品监管等生命科学与生态学领域,但是在法庭科学领域的应用还有一些问题需要克服与解决。
3.1 DNA的提取
混合成分生物样本的物种鉴定,样品的初始制备以及DNA的提取是最关键的一步。由于涉案样品的复杂性和多样性,每个提取步骤都很难标准化和优化,而且每个样品存在的问题都不相同。例如,难以确保从由许多异质成分组成的混合样品中获得所有物种的基因组DNA,所以在这种情况下,充分的均质化在DNA提取之前特别关键。还有一些法医样品,比如中成药物,可能含有非常少量的DNA,或者在生产过程中经过高温、高压、pH调节、研磨或干燥等各种处理的成分,可能会导致DNA高度降解[29-31]。此外,无法从待检样本中消除潜在的抑制成分和干扰物质,例如多酚、多糖、脂质等,这些可能会严重影响PCR扩增。所以,任何可能导致下游偏差的因素都需要最小化。在许多情况下,法医样本中DNA提取和PCR扩增的不成功直接阻碍了物种的有效鉴定。因此,需要系统的研究来优化DNA的分离方法和效率,获得一个稳定快速的可广泛应用于野生动植物法医样本的DNA分离方法,达到DNA纯度和产量的最大化。
3.2 DNA条形码的选择
在条形码的选择方面,宏条形码技术与传统的DNA条形码技术并不完全相同。首先条形码的选择既要保证不同物种间的通用性,又要具有足够的分类变异。
首先,对于动物源性成分的检测,条形码的通用性相对比较强,但是对于植物,并没有通用性较好的条形码,虽然已经针对不同的应用领域(如陆地植物的分类学鉴定、药用植物的鉴定等)提出了不同组的DNA条形码,并且它们都不符合通用条形码的真实要求,理想情况下,充分的植物物种鉴别需要结合使用多种DNA条码标记。通常由于PCR引物序列的通用性不足,可能会导致复杂样本中PCR扩增发生偏倚而使得某些物种漏检。
其次,由于动植物混合法医样本通常可能是高度加工的,如中药、保健品、肉制品等,其DNA发生严重降解,在此类样品中,DNA的降解通常会阻碍PCR的片段扩增,一般不超过300 bp[32-34],因此DNA宏条形码在动植物法医鉴定中的应用需要能够基于短DNA序列进行物种鉴定的条形码[5]。使用较短的条形码,即所谓的迷你条形码,由于片段较小,因此在降解样品中通常比标准的全长条形码扩增效率更高[32-33]。但另一方面,通常迷你条形码的长度与分类学辨别率呈正相关。所以,尽管可以设计微型PCR引物以适应DNA降解样品中较短DNA条形码区域的扩增,但是这种微型条形码包含的信息较少,其引物限制性较大,分辨率低。
3.3 参考序列数据库
DNA宏条形码技术要实现物种分类学地位的确认,必须通过与某个参考数据库的序列进行比对与匹配。然而参考序列数据库的质量和完整性,对执法问题尤为重要,因为在司法鉴定中高质量和可靠性至关重要。但是目前一些珍稀濒危物种及其近缘物种的DNA条形码参考数据不足严重阻碍了其物种的鉴定。
4 展 望
伴随着DNA高通量测序技术的发展以及DNA条形码应用需求的扩增,共同孕育了DNA宏条形码技术的诞生,两种技术的结合可以准确、快速鉴定混合样品中的物种组成。该技术虽然已应用于生命科学的不同领域,目前仍处于起步阶段,尚存在一些技术上的问题和挑战,比如条形码的通用性、条形码的分辨率、PCR偏向性以及数据库的覆盖度等,但这些问题随着研究的不断深入以及技术的进步,都是有可能解决的。如Coissac等[35]对DNA宏条形码技术在动植物生物多样性分析中存在一些问题提出了相应的解决策略,如引物设计问题、PCR扩增偏向性问题、数据处理等问题开展了探讨,为进一步推进DNA宏条形码技术的广泛应用提供了一定参考。
虽然很难设计分辨率高、通用性强的迷你条形码,但是在某些情况下,在属或更高分类级别上具有相对适度区分能力的迷你条形码也是可用的。例如,我国重点保护动植物名录里的濒危物种以及CITES公约列出的监管物种有时是整个目、科或属,而不是单个植物物种。因此,对于我国重点保护名录里的一些科属,如隼科(Falconidae)、鹦鹉科(Psittacidae)、绿鸠属(Treron)、苏铁属(Cycas)、红豆杉属(Taxus)所有种;CITES公约列出的许多动植物科属,如鲸目(Cetacea)、猫科(Felidae)、熊科(Ursidae)、麝属(Moschus)、穿山甲属(Manis)、兰科(Orchidaceae)、仙人掌科(Cactaceae)、黄檀属(Dalbergia)、沉香属(Aquilaria)所有种等,只需鉴定科或属这一级的分类单元即可。但是,这并不适用于所有非法交易的植物种属,在这种情况下,另一种方法就是设计特定于该物种的迷你条形码。
另外,随着测序技术的发展,测序准确度的提高以及测序长度的增加,DNA条形码局限性的问题将会得到解决。比如第3代测序技术(又称为单分子测序),其优势就在于整个测序不再依赖PCR扩增,可以避免扩增过程中出现的错误,比如2代测序中PCR扩增偏向性的问题[12-13,17];新一代测序技术即第4代测序技术,如纳米孔测序,它采用物理方法直接读取碱基序列,而不需要对DNA样品进行任何生物或化学方面的处理。未来基于纳米孔的DNA测序技术可以同时实现高通量和长读长。因此,预计新一代的测序技术将同时具有2代测序的高通量以及一代测序的长读长的优势,而且成本低于2代与3代测序[36]。
DNA宏条形码技术在法庭科学中应用不同于其他领域,在常规应用之前,必须对其进行验证。只有当DNA宏条形码被证明是稳定的、可跨实验室转移的,该方法才能真正实现在法医检测中的常规化应用。如Arulandhu等[37]开展了多位点DNA宏条形码方法在复杂样本中鉴别濒危物种的研究与验证,该方法是基于MiSeq测序平台,利用12种DNA条形码标记,结合明确定义的实验混合物样本进行开发的,同时开发了一种具有友好界面的网络生物信息学分析软件,并在16个实验室的国际验证试验中,对该方法的性能进行了评估,结果发现该方法具有很高的重复性和灵敏度,足以鉴定混合物中干重含量为1%的物种。该研究为DNA宏条形码技术在动植物法医鉴定中的常规化应用奠定了很好的前期基础。
虽然DNA宏条形码在动植物法医鉴定中的应用才刚刚开始,仍属于起步阶段,但相信随着各国学者的努力,测序技术与生物技术的发展,DNA宏条形码技术一定会在动植物法医鉴定领域实现常规化应用,为野生动植物相关犯罪活动的打击、食品药品安全性与合法性的监管提供强有力的技术支持。