APP下载

高变异Y染色体短串联重复片段检验体系的建立及对北方汉族群体调查

2021-08-04李运丽宋诚诚郝世诚张金佩

中山大学学报(医学科学版) 2021年4期
关键词:拷贝等位基因分型

李运丽,宋诚诚,郝世诚,张金佩,刘 岩,徐 妍,袁 丽,3

(1.中国政法大学证据科学教育部重点实验室,北京 100088;2.司法文明协同创新中心,北京 100088;3.上海市法医学重点实验室∕∕司法部司法鉴定重点实验室(司法鉴定科学研究院),上海 200063)

Y 染色体上的短串联重复片段(short tandem repeat,STR)是父系遗传关系鉴定和强奸案混合斑中男性个体识别的有效手段,是常染色体遗传标记的重要补充[1-2]。随着男性家系检测的增多和YSTR数据库的建立,发现现有的Y-STR试剂由于低突变率常常不能有效区分不同男性家系[3]。快速变异的Y-STR(rapidly mutating Y-STR,突变率≥1.00×10-2)[4-5]有助于缩小侦查范围、锁定犯罪嫌疑人,是法医DNA 领域新的研究、检测方向。然而,在欧美白人中被定义为快速变异的Y-STR 基因座有的在中国人群中突变率并不高,并且个别基因座融入复合扩增难度大[6]。为了提升Y-STR 鉴别男性家系的能力,本研究筛查了既往研究报告中在我国群体突变率高的21个Y-STR基因座,建立五色荧光复合扩增体系,并对北方汉族群体进行调查,为高突变的Y-STR在父子间突变情况提供基础性资料。

1 材料和方法

1.1 样本

北方汉族健康男性无关个体志愿者500 人,每人及其儿子组成父子对500 对,经知情同意采集外周血,保存在FTA 卡上,父子关系均经“母-子-父”或“父-子”亲子鉴定,亲权指数均超过10 000。

1.2 方法

1.2.1 基因座的筛选 根据本实验室以往研究结果[6],从国外13个RMY-STR中选取在中国群体中突变率高的DYF399S1、DYF404S1、DYS449、DYS518、DYS526b、DYS547、DYS570、DYS576、DYS612、DYS626 和DYS627 11 个基因座,另外,根据文献筛选在中国民族群体突变率≥4.0×10-3具有高变异的9个Y-STR基因座[7-10],包 括DYS390、DYS439、DYS456、DYS458、DYS460、DYS481、DYS549、DYS552 和DYS630 基因座。另外,本体系也纳入了常用的DYS391 基因座,其在中国南方汉族人群[7]突变率为3.3×10-3。除了DYS481和DYS612系三核苷酸重复序列外,其他均为四核苷酸重复序列(表1)。

表1 筛选的Y-STR基因座及其基本信息Table 1 Selected Y-STR loci and their basic information

1.2.2 引物的设计与合成 在GeneBank 中查询所选取的高变异Y-STR 基因座的基因序列信息,利用Primer 3 软件(http:∕∕bioinfo.ut.ee∕primer3∕)设计引物,并利用UCSC(http:∕∕genome.ucsc.edu∕)中的BLAT软件检验引物的特异性。根据各基因座核心序列情况设计其在体系中的位置,每对引物的前导链5'端分别标记6-FAM、HEX、TAMRA、ROX 荧光染料,内标选用橙色的ILS550,委托上海生工生物技术有限公司合成引物。

1.2.3 复合扩增体系的建立与引物优化 PCR 体系中使用2×MasterMix(北京金马晟和科技有限公司)缓冲液,内含Taq酶。在离心管中配置10 μL直扩体系,包含:2×MasterMix 4 μL,引物1~5 μL,用去离子水补足至10 μL。用0.5 mm 的打孔器对打孔1 片加入各个离心管中。PCR 热循环参数设置为:95 ℃11 min、94 ℃10 s、59 ℃1 min、72 ℃30 s,27 个循环,60 ℃60 min,4 ℃保持,在9700 扩增仪(AB公司)上进行PCR反应。在PCR扩增体系中分别设置各个基因座的引物浓度,进行引物浓度优化,使基因座之间的等位基因峰值达到平衡。

1.2.4 扩增片段的分离与检测 PCR 扩增产物采用ABI 3130 型基因分析仪进行毛细管电泳分离。PCR 扩增产物1 μL、ILS 500 内标0.15 μL、Hi-DiTM‐Formamide 10 μL 混匀,加入自动进样盘,编制进样表,采用GM 模式电泳。电压15 000 V、进样 时间10 s,电泳30 min。电泳数据应用GeneMapper®IDX 1.4软件分析,读取等位基因的片段大小。

1.2.5 北方汉族群体及家系突变情况调查 采用本研究建立的21个Y-STR 基因座的五色荧光复合扩增体系,对500 对中国北方汉族父子样本进行检测。直接计数法统计突变个数,用突变个数除以父子对数获得突变率,并利用二项概率分布计算95%的置信区间[11]。在500 名无关男性样本群体中,用算式(Gene Diversity,GD)=n(1-ΣPi2)/(n-1);Pi表示等位基因频率,n代表样本数。计算各基因座的基因多态性,观察每个样本是否存在相同的Y-STR单倍型。

2 结果

2.1 复合扩增体系的建立

本文成功设计了21对引物,建立了1个五色荧光复合扩增体系。在10 μL 直接扩增PCR 反应体系中,各基因座引物浓度优化结果为:2.5 μmol∕L各基因座引物在0.18~0.50 μL 之间。根据优化结果,21个Y-STR 基因座均得到有效扩增(图1),扩增片段长度在90~370 bp之间,电泳图谱显示扩增效果好,各基因座之间及多拷贝等位基因之间的峰高基本平衡。除DYS612 为三核苷酸重复、stutter 峰略高外,其他基因座stutter 峰低于主峰的10%。根据DYS526a∕b 序列特点,设计一对引物仅扩增DYS526b基因座(图2)。

图1 21个Y-STR基因座复合扩增优化图谱Fig.1 A genotyping of a sample with 21 Y-STR Optimized amplification system

2.2 基因多态性结果

在500 个北方汉族无关个体中,本次建立的21个Y-STR 检测体系,未发现有相同的单倍型。基因多态性结果请见表2。在一些多拷贝Y-STR 基因座上发现异常分型,见图3-5。

2.3 父子突变率调查结果

500 个父子对中观察到16 对出现2 个基因座的突变,1对出现3个基因座的突变,未发现有超过3 个基因座同时出现突变的情况。其他具体突变的情况见表2。

表2 21个Y-STR基因座在中国北方汉族群体的基因多样性和突变率Table 2 Gene diversity and mutation rates of 21 Y-STRs in Han population of Northern China

3 讨论

Ballantyne 等[12]通过系列研究表明13 个RM Y-STR 组合(DYS570、DYS576、DYS518、DYS526a∕b、DYS626、DYS627、DYS449、DYS547、DYS612、DYF387S1、DYF399S1、DYF403S1 a∕b 和DYF404S1)无论在多态性还是个体识别能力方面均明显强于当前常用的17 个Y-STR 的Yfiler 系统(美国AB 公司)。我们前期的研究中发现:①DYF387S1、DYF403S1b、DYS526a 在中国汉族群体突变率没有到达快速变异基因座的标准;②DYF403S1a∕b 基因座单一引物扩增效率高、没有杂峰,但只要与其它基因座复合扩增,产生很多非特异性产物,难以纳入20 多个基因座的复合检测体系中;③Ballantyne 等[12]公布的DYS526a∕b引物,其中一条引物能与DNA 模板的两段序列结合(DYS526a引物与模板有两个碱基的错配),产生两个最少相差180 bp的等位基因,由于错配和大片段扩增缺乏优势的原因,DYS526a和DYS526b扩增效率都不高。鉴于DYS526b 基因座序列包含了DYS526a基因座,在本次体系构建中我们设计引物仅能检测DYS526b 基因座(图2),可提高其在复合扩增体系中扩增效率。本次纳入复合扩增体系的基因座既要优选在中国群体突变率高的,又要考虑复合扩增效率和减少非特异性峰的影响,最终建立的21 个Y-STR 五色荧光复合扩增体系,每个基因座均获得了准确分型,复合体系扩增DNA 分型结果稳定、均衡,具有种属特异性。

图2 DYS526a/b 基因座序列Fig.2 DYS526a/b Locus sequence

法医学应用的Y-STR 基因座一般为单拷贝,但有少部分Y-STR 基因座为多拷贝。其原因是因为在Y 染色体重复回文区域有重复拷贝存在[13]或一对引物能与不同序列结合[14]产生多个等位基因。本体系中DYF404S1 为二拷贝基因座,DYF399S1为三拷贝基因座,相对于单拷贝Y-STR 基因座,多拷贝Y-STR 基因座具有较高的遗传多态性,存在多个等位基因,有助于法医学个人识别和亲缘关系鉴定。然而,DYF404S1 和DYF399S1 会出现异常分型,在500 个无关男性样本的DNA 分型图谱中,DYF404S1 基因座上出现三等位基因14 例(图3),DYF399S1基因座出现四等位基因10例(图4)和五等位基因2 例(图5),且有5 个样本在这两个基因座上同时出现稀有拷贝数等位基因分型。出现异常多等位基因DNA 分型提示在混合斑鉴定的案件中,对于嫌疑人数目的确定会存在困难,需结合其他检验结果综合分析。

图3 DYF404S1上出现三等位基因分型Fig.3 Distinctive tri-allelic pattern in DYF404S1

图4 DYSF399S1上出现四等位基因分型Fig.4 Distinctive tetra-allelic pattern in DYSF399S1

图5 DYSF399S1上出现五等位基因分型Fig.5 Distinctive five-allelic pattern in DYSF399S1

快速变异的Y-STR 基因座核心序列结构复杂、重复次数多,需要更多的空间来容纳这些基因座,故而本文建立了五色荧光复合扩增体系,使用了6-FAM、HEX、TAMRA、ROX 和ILS550 荧光染料组合。根据在北方汉族人群中的调查结果,显示21 个Y-STR 基因座的基因多态性除DYS391 为0.402 3外,其余20个Y-STR 在0.611 8以上,在500个无关男性个体中,未观察到有相同单倍型的情况出现。在500 个父子对中大部分基因座的突变率远高于常染色体STR 及目前法医学常用的Y-STR基因座,突变率最高达到7.4×10-2,发生在DYF399S1 基因座上。观察500 对北方汉族父子的21 个Y-STR 基因座DNA 分型图谱,共出现134 次等位基因突变,其中一步突变出现127 次,两步突变出现7 次,符合逐步突变机制。增加突变与减少突变数目相同,均为67 次。本次研究突变率≥1.00×10-2的12个Y-STR基因座中有10个基因座属于复合或复杂核心序列,核心序列重复次数较多,体现了基因座的突变率受重复序列结构和等位基因重复次数的影响,重复序列结构复杂度越高、平均重复次数越多的基因座,突变率相对更高[15-16]。Ballantyne 等[4]提出重复区毗邻的不可变序列长度对基因座的突变率有一定影响,不可变序列越长则会增加DNA 合成时复制滑脱的机会,本次研究中重复区毗邻的不可变序列长度大于30 bp的基因座有9 个(DYF404S1、DYS439、DYS449、DYS518、DYS526b、DYS547、DYS552、DYS626 和DYS627),其中突变率≥6.00×10-3有8 个,验证了上述理论。DYS630 和DYS390 基因座虽不在Ballantyne 等列出的RM Y-STR 之中,但在北方汉族群体中突变率达到快速变异标准。本研究在DYS391、DYS456基因座上未发生突变,而在南方汉族群体[7]中的突变率为3.3×10-3和4.4×10-3。另外,DYS549、DYS481、DYS552、DYS460 突变率接近Y-STR 的平均突变率,为2.0×10-3,分析可能是由于本次调查父子对样本量的限制,同时也体现了Y-STR 突变率受不同地域、人群的差异的影响[17]。

应用这些高变异Y-STR 基因座进行法医学亲子鉴定及个人识别,更易于区分具有父系亲缘关系的男性个体,有助于解决目前法医学应用Y-STR基因座只能排除不能认定的瓶颈。但需要注意的是,由于高变异Y-STR 突变率较高,在亲子鉴定中对有父系亲缘关系的男性个体容易错误排除,故并不能完全取代现有Y-STR 试剂盒,但可以作为CO‐DIS 常染色体和常规低突变Y-STR 系统基因座的补充,具有良好的法医应用价值。

猜你喜欢

拷贝等位基因分型
肺炎克雷伯菌RAPD基因分型及其与氨基糖苷类药敏分型对比研究
亲子鉴定中男性个体Amelogenin基因座异常1例
CT在早期预测新型冠状病毒肺炎不同临床分型的应用
用数学思维分析遗传的基本规律
文化拷贝应该如何“拷”
文化拷贝应该如何“拷”
复杂分型面的分型技巧
影子与我
爱笑不爱笑,基因早知道
孟德尔定律的扩展及其应用