APP下载

基于微流控芯片的InDel快速族群推断体系研究*

2022-08-20张博源王颖希斌赵丽健杨瑞琴韩俊萍

生物化学与生物物理进展 2022年8期
关键词:等位基因分型族群

张博源 王颖希 赵 蕾 江 丽 万 群 庄 斌赵丽健 杨瑞琴** 韩俊萍

(1)中国人民公安大学侦查学院,北京 100038;2)北京市公安局刑事侦查总队,北京 100007;3)公安部物证鉴定中心法医遗传学公安部重点实验室,北京市现场物证检验工程技术研究中心,现场物证溯源技术国家工程实验室,北京 100038;4)山东第一医科大学基础医学院,济南 250000;5)北京博奥晶典生物技术有限公司,北京 101111;6)北京市公安局朝阳分局刑事侦查支队,北京 100025)

法医DNA检验中常用的短串联重复序列(short tandem repeat,STR)遗传标记可实现精准个体识别,但对于STR分型入库无比中,无目标嫌疑人,也没有其他线索的某些案件,STR分型无法发挥作用。祖先信息标记(ancestry informative markers,AIMs)是指在不同族群间具有等位基因频率分布差异的标记位点[1]。插入/缺失多态性(insertion/deletion polymorphism,InDel)作为一种常见的祖先信息标记,能对现场生物物证的族群、地域来源等特征进行预测,在个体识别无法发挥作用时,获取更多有关种族、地域信息,进一步缩小侦查范围[2]。传统DNA检验技术包括DNA提取、DNA定量、PCR扩增、毛细管电泳检测,整个过程耗时费力,且对人员技能和设备要求较高。基于微流控芯片技术的法医DNA现场快速检验系统将上述步骤集成于一体,可实现“样本进-结果出”,能够满足公安实战对DNA现场化和快速化检验的迫切需求。近年来,已有RapidHIT®200、RapidHIT®ID、ANDETM6C 3款仪器相继推向市场,国内外学者针对这3款仪器开展了大量验证研究[3-5]。

QuickTargSeq全集成法医DNA现场快速检测系统是国内首台自主研发的DNA快速检验仪,2 h可完成法医DNA检验全部流程,可用于STR个体识别,并且首次实现了InDel族群推断。本研究基于前期建立的InDel族群推断微流控芯片检测体系,根据SWGDAM指南[6]对建立的InDel族群推断微流控芯片检测体系进行验证评估,以期为实践应用提供参考。

1 材料与方法

1.1 实验样本

本研究的检测样本包括口腔拭子、血卡、唾液卡及烟蒂样本。其中口腔拭子样本来源于实验室人员,共107份;血卡样本来源于国家科技资源共享服务平台计划项目(YCZYPT[2017]01-3),共31份,已通过公安部物证鉴定中心伦理委员会的伦理审查(编号:2017-001);唾液卡样本取实验室人员,共5份;烟蒂样本取自实验室人员,共1份;人类基因组DNA标准品9947A购自苏州新海生物科技股份有限公司。另有36份口腔拭子样本为实验室人员饮食后采集,用于干扰物耐受性研究。

1.2 样本采集

107份口腔拭子样本采集时,实验室人员漱口后使用取样拭子在口腔内壁左右两侧刮擦,阴干备用;5份唾液卡样本取实验室人员左右两颊黏膜擦拭物,转移至唾液卡上,阴干备用。36份用于干扰物耐受性研究的口腔拭子,实验室人员在饮食后使用取样拭子在口腔内壁左右两侧刮擦,阴凉处晾干备用。

1.3 DNA提取与定量

采用QIAamp®DNA Mini M48试剂盒(QIAGEN公司,德国)提取烟蒂检材DNA,用NanoDrop 2000C分光光度计(Thermo Scientific公司,美国)进行DNA定量。将人类基因组DNA标准品9947A(初始浓度10 mg/L)进行梯度稀释,使用QuantifilerTM人类DAN定量试剂盒(Life Technologies公司,美国)进行定量,用于灵敏度验证。

1.4 全集成检测

取全集成芯片卡盒备用,卡盒中已预先存储冻干扩增试剂、电泳试剂及缓冲液(图1a)。在1.5 ml离心管中加入200µl直扩处理液Ⅰ和Ⅱ混合液(含80µl处理液Ⅰ和120µl处理液Ⅱ,苏州新海生物科技股份有限公司),放入1根口腔拭子,或血卡/唾液卡6片(Φ=2 mm),震荡5~10次,然后取60µl上述混合液加样至扩增芯片样本处理池复溶扩增冻干试剂。提取的烟蒂DNA样本(初始浓度为10 mg/L)直接吸取2µl与去离子无菌水混合至60µl,加样至扩增芯片样本处理池复溶扩增冻干试剂。

将全集成芯片卡盒插入Quick TargSeq DNA现场快速检验仪(图1b)进样仓,输入样本信息,选择预先设定的程序,点击运行键后,仪器自动完成样本裂解、PCR扩增、电泳分离全部流程。收集数据,使用配套软件BioStrGenotyping v2.0对结果进行分析。

Fig.1 The fully automated and integrated chip cartridge(a)and the Quick TargSeq Rapid DNA Integrated System(b)

1.5 灵敏度研究

采用人类基因组DNA标准品9947A、口腔拭子、血卡3种样本进行灵敏度测试。将DNA标准品9947A梯度稀释:50、25、15、10、5、2.5 ng;采集3名实验室人员口腔拭子,每名测试人员使用取样拭子在口腔内壁左右两侧各刮擦1、2、3、4、5、6、7、8、9、10次;取3份血卡,使用直径2 mm打孔器在待测血卡上取样2、3、4、5、6、7、8片;使用全集成芯片卡盒检测,以上每种浓度或取样方式平行重复检测3次。

1.6 干扰物耐受性研究

针对口腔拭子样本种可能存在干扰PCR扩增的物质,如附着在口腔内壁的食物残渣、饮料、烟草,采集3名实验室人员在饮食、饮咖啡、饮茶、吸烟后的口腔拭子作为检测样本,每种取样方式各采集3份(n=36),同时采集漱口后的口腔拭子作为阳性对照。所有样本使用全集成芯片卡盒检测。

1.7 成功率和分型准确率研究

对107份口腔拭子和31份血卡进行全集成检测,统计成功率和分型准确率。成功率是指等位基因检出率≥80%的样本占全部测试样本的比率;分型准确率是指分型成功的结果,软件准确分型的等位基因占全部等位基因的比率[7-9]。

同时以常规PCR-CE平台的检测结果作为参考样本分型,扩增体系、热循环参数、电泳参数、数据分析方法均参考文献设置[10]。

1.8 精确性和准确性研究

将38-plex InDels复合扩增体系的等位基因分型标准物(allelic ladder)在微流控芯片检测平台重复电泳检测10次,计算等位基因分型标准物中各等位基因片段大小的平均值和标准差,验证该体系的精确度。随机选取1.7中20份分型成功的全集成检测结果,计算等位基因片段大小与相应的等位基因标准物的差异,验证该体系的准确性。

1.9 峰平衡性研究

选取1.7中分型成功的全集成检测结果,统计每个基因座的等位基因峰高值,计算每个基因座的杂合子峰高比值(peak height ratio,PHR),计算方法参照文献[4];评估不同荧光通道之间平衡性,评估方法参照文献[11]。

1.10 检材适应性研究

对4类不同检材进行全集成检测,包括口腔拭子、血卡、唾液卡、烟蒂(其中口腔拭子、血卡和唾液卡采取直扩方式,烟蒂采取先提取DNA后检测的方式),以测试该体系的检材适应性。

1.11 测试样本族群推断分析

选取1.7中40份分型成功的全集成检测结果,经BioStrGenotyping v2.0软件导出分型数据,使用族群推断软件DAA v1.0软件计算样本的人群匹配概率(assignment match probability,AMP)和似然比(likelihood ratio,LR),运行参数为K=3,n=15。自动获得待测样本的人群匹配概率、似然比、祖先成分,结合祖先成分比例,当LR>100时,AMP值排序第一位的族群为测试个体的来源族群,当LR≤100时,AMP排序前两位的族群均不排除[12]。

2 结 果

2.1 灵敏度

分别使用50、25、15、10、5、2.5 ng DNA标准品9947A作为模板进行全集成检测,统计不同DNA模板量检测结果的等位基因峰高(相对荧光强度,RFU)和等位基因检出率(图2)。其中峰高值随着DNA模板量的增加而依次增加,DNA模板量为5~50 ng均可获得完整分型,当DNA模板量低于2.5 ng出现等位基因丢失。因此,该体系的最低DNA检测限为5 ng。

Fig.2 Sensitivity study for different input DNA template

Fig.3 Sensitivity study for different wipes of buccal swabs

在口腔内壁左右两侧各刮擦1、2、3、4、5、6、7、8、9、10次,使用全集成芯片卡盒检测。统计不同刮擦次数口腔拭子检测结果的等位基因峰高和等位基因检出率(图3)。当刮擦次数为1~4次时,峰高值较低,等位基因检出率从78.33%增加到92.06%;随着刮擦次数的增加,峰高值和等位基因检出率均依次增加,刮擦次数为8次时,等位基因检出率达到100%,即所有样本均能获得完整分型;刮取次数增加至9次、10次时,等位基因检出率分别为97.50%、96.67%,各有1份样本在rs16416位点荧光信号过强,产生渗透现象,造成相邻通道其他位点等位基因错判,影响分型结果。综上,口腔拭子最佳刮擦次数为8次。

取Φ=2 mm血卡2、3、4、5、6、7、8片进行全集成检测,统计不同血卡片数检测结果的等位基因峰高值和等位基因检出率(图4)。血卡片数从2片增加到6片,等位基因峰高值依次增加,等位基因检出率从94.15%增加至100%,6片时所有样本均得到完整分型,7片和8片时,出现了不同程度的等位基因丢失现象。因此,本体系对血卡的最佳检测方式为6片(Φ=2 mm)。

2.2 干扰物耐受性

36份不同取样方式口腔拭子均可获得有效分型,其中9份饮食后和9份饮咖啡后样本的分型准确率为100%;9份饮茶后的样本中,有1份样本rs2308067位点分型错误,分型准确率为95.83%;9份吸烟后的样本中,有1份样本rs5789229位点分型错误,分型准确率为95.65%。

应用配对t检验检测含有干扰物和不含干扰物的口腔拭子样本分型准确率之间是否存在差异性。结果显示,二者之间没有呈现出显著性差异(P>0.05)(表1)。

Fig.4 Sensitivity study for different pieces of dried blood spot samples

Table 1 The effect of inhibitors on concordance rate

2.3 成功率和分型准确率

由于部分全集成芯片卡盒出现断胶现象,6份样本未获得成功分型,132份样本(102份口腔拭子和30份血卡)分型成功。本体系的全集成检测成功率和分型成功率统计结果如表2所示。

Table 2 The result of success rate and concordance rate

2.4 精确性和准确性

使用等位基因分型标准物在微流控芯片检测平台重复电泳检测10次,计算allelic ladder中各等位基因片段大小的平均值和标准差,统计结果(图5)显示,10次电泳检测所得各等位基因片段大小标准差均在0.3 bp以内。随机选取2.3中20份样本的全集成检测结果,所有等位基因与位基因分型标准物中相对应的等位基因片段差异均不超过0.5 bp(图6)。以上结果说明,该微流控芯片检测体系具有较高得精确性和准确性,分型时未出现等位基因偏差。

2.5 峰平衡性

选取2.3中分型成功的132份全集成检测结果,统计每个基因座的杂合子峰高比值,计算平均值和标准差,其中rs1160852、rs35633537两位点在所检样本中未出现杂合子分型,故只统计37个位点。由图7可知,最大PHR值为rs3054057位点(0.965 2±0.013 6),最小PHR值为rs145415095位点(0.742 4±0.185 1),所有基因座的平均杂合子峰高比值为0.86。

Fig.5 Standard deviation of sizing precision for each locus in the allelic ladder calculated for 10 runs on Quick TargSeq systems

Fig.6 Size differences between allele and corresponding allele in allelic ladder for 20 testing samples on Quick TargSeq systems

Fig.7 Heterozygote peak height ratios(PHR)calculated from 132 testing samples in the concordance study

同时对该132份全集成检测结果的不同荧光通道之间平衡性进行比较(表3)。蓝色荧光通道(FAM标记)平衡性最好,峰高比值均值达89.65%,其余三色荧光通道分别为75.73%、72.98%和77.58%,不同荧光通道之间的峰高比值为61.96%。上述结果说明该微流控芯片检测体系具有良好的峰高平衡性。

Table 3 Balance within one dye and among different dyes for 132 testing samples

2.6 检材适应性

对口腔拭子、血卡、唾液卡、烟蒂等4类不同模拟检材进行全集成检测,所有样本均成功获得分型,并与常规PCR-CE平台检测结果一致,整个检测时间为2 h,部分样本的检测结果如图8所示。

Fig.8 The InDel profiles of mock case samples

2.7 测试样本族群推断分析

使用25个参考族群,对40份测试样本结果进行个体族群来源推断,计算得到样本的AMP及LR值,AMP排序第一位均为东亚人群,与AMP排序第二位的人群相比LR值远大于100,群体水平的祖先成分中的东亚成分为96.98%。主成分分析如图9所示,其中PC1与PC2分别表示主成分1与主成分2,二者共解释了总方差的37.34%。所有样本与东亚人群聚为一类,与已知样本来源信息一致。

Fig.9 The principal component analysis of 40 testing samples

3 讨 论

基于微流控芯片技术的法医DNA现场快速检验系统提升了法医DNA检验现场化和快速化的能力,满足了公安实战的迫切需求。目前,国外推出的RapidHIT®200、RapidHIT®ID、ANDETM6C 3款商业化DNA快速检验仪,均是配套使用STR试剂盒进行个体识别[3-5],尚未见将快检系统应用于族群推断领域。Quick TargSeq全集成法医DNA现场快速检测系统,作为中国国内首台自主研发的DNA快速检验仪,可配套使用38-plex InDels复合扩增体系,首次实现了DNA快速检验仪器在族群推断领域的应用。本研究使用InDel族群推断微流控芯片检测体系,参考SWGDAM指南,对该体系进行了系统研究。

灵敏度研究结果显示该芯片检测体系在DNA模板量≥5 ng时,可获得完整InDel分型,可以满足大多数犯罪现场生物物证检材的最低检测限[4]。对于口腔拭子样本,刮擦次数较少时由于DNA模板量不足会出现等位基因缺失,当刮擦次数较多时也出现等位基因缺失,原因可能是刮擦次数较多时口腔中黏蛋白或蛋白酶也会相应增多,而这些物质可能会抑制PCR扩增[13],并且刮擦次数较多时出现渗透峰而影响分型,因此最佳采集次数为口腔内壁左右各刮擦8次。对于血卡样本(Φ=2 mm血片),使用片数较少时同样会由于DNA模板量不足会出现等位基因丢失,而使用片数较多时(7~8片)也会出现等位基因丢失,其原因可能是随着血卡用量的增多,样本所含血红素也随之增多,而血红素是潜在的PCR扩增抑制剂[14]。口腔内壁附着的食物残渣、饮料、烟草等物质可能成为PCR扩增的潜在干扰物,干扰物耐受性研究结果显示,含有干扰物和不含干扰物的口腔拭子样本分型准确率之间并未呈现出显著性差异,这说明食物、咖啡、茶叶、烟草在检测过程中的干扰效应并不明显。

InDel族群推断微流控芯片检测体系对138份样本的全集成检测成功率为95.65%(132/138),分型准确率为 98.85% (6 954/7 035),与RapidHIT®200、RapidHIT®ID和ANDETM6C检 测STR的成功率(分别为85.45%、84.5%和99.98%)相当,而分型准确率与RapidHIT®200(100%)和ANDETM6C(99.98%)相当[7-9],可以实现对口腔拭子和血卡的准确有效分型。该体系的精确度和准确度较高,分型时不会出现等位基因偏差。对于分型成功的全集成检测结果,所有基因座的平均PHR值为0.86,高于配套使用FlexPlexTM27试剂盒的ANDETM6C快检仪的PHR值(0.81)[15]。

4 结 论

与常规PCR-CE平台相比,微流控芯片检测体系具有集成、快速、操作简便等优点,集成化一体检测实现了“样本进-结果出”,降低常规方法由于需要多种仪器且步骤繁琐导致的样本污染等风险。本研究将InDel族群推断体系与中国国内首台自主研发的DNA快速检验仪结合,2 h左右即获得样本的准确分型,能够准确推断样本族群来源,能满足现场检测的要求,可供实际办案选用。但也存在检测通量较低、目前只能对口腔拭子、血卡等常规样本检验等不足,未来研发人员需对系统进行优化升级,提高样本检测通量,同时优化提取模块以适应更多样本类型的检测。

猜你喜欢

等位基因分型族群
从彭阳姚河塬卜骨刻辞看西周早期西北边域族群关系
肺炎克雷伯菌RAPD基因分型及其与氨基糖苷类药敏分型对比研究
论《白牙》中流散族群内部的文化冲突
归来吧!精灵(大结局)
浅析不同层次的认同是巩固和发展中华民族多元一体格局的基础
CT三维及X线在股骨转子间骨折分型的可靠性
用数学思维分析遗传的基本规律
Goldeneye 20A试剂盒检测发现TPOX基因座三等位基因一例
复杂分型面的分型技巧
爱笑不爱笑,基因早知道