APP下载

复杂亲缘关系鉴定的研究进展

2020-12-06

法医学杂志 2020年5期
关键词:基因座亲缘同胞

(中国刑事警察学院,辽宁 沈阳 110854)

亲缘关系鉴定是指通过检测各种遗传标记的分型,根据遗传定律证明被鉴定人之间是否存在某种特定亲缘关系的鉴定[1]。亲缘关系鉴定普遍应用于诉讼、仲裁、公证、寻亲、继承、移民以及各类事故处理等领域,在保障司法公平公正和维护社会长治久安中具有重要价值[2]。近年来,随着法医物证学的不断发展,亲缘关系鉴定的检测范围从常规的父子(女)或母子(女)关系鉴定扩大到祖孙、叔侄、同胞及半同胞等复杂亲缘关系鉴定。复杂亲缘关系鉴定是指由于父或(和)母亡故,或因为其他原因不能参与检验(父母均不参与鉴定),为了民事或刑事案件中的个体识别等而进行的特殊亲缘关系鉴定[3]。这种亲缘关系鉴定案件由于重要被鉴定人的缺失,需要隔代、同胞或旁系亲属参加检验。复杂亲缘关系鉴定应用普遍,鉴定诉求逐年增加,然而,现有的复杂亲缘关系鉴定技术和方法并不能很好地满足实际工作需要,很多方面有待提高。

1 复杂亲缘关系的主要类型

1.1 祖孙关系

祖孙关系又称隔代关系,是指(外)祖父母与(外)孙子、(外)孙女之间的关系。

1.2 叔侄关系

广义的叔侄关系包括叔(姑)-侄子(女)、舅(姨)-外甥(女)等之间的关系[4]。

1.3 全同胞及半同胞关系

全同胞关系是指同父母所生的子女之间的关系;半同胞关系是指由同父异母或异父同母所生的子女之间的关系。

1.4 第一代堂(表)兄弟姐妹、第二代堂(表)兄弟姐妹关系

第一代堂(表)兄弟姐妹关系是指全同胞的子女之间的关系,第二代堂(表)兄弟姐妹是指全同胞的孙子、孙女、外孙子和外孙女之间的关系。

2 复杂亲缘关系鉴定检测的主要遗传标记及其优缺点

目前,复杂亲缘关系鉴定检测的遗传标记主要是常染色体短串联重复(short tandem repeat,STR),X染色体STR(X-STR)、Y染色体STR(Y-STR)、单核苷酸多态性(single nucleotide polymorphism,SNP)、人类白细胞抗原(human leucocyte antigen,HLA)基因分型等。

2.1 常染色体STR

常染色体STR在人类基因组中约占5%,其中50%左右具有遗传多态性,主要分布在非编码区[5]。STR分型具有灵敏度高、鉴别能力强、种属特异性高、结果准确度高、检测容易等优点。20世纪90年代初,STR首次应用于人类亲缘关系鉴定并沿用至今,是亲缘关系鉴定中使用最普遍的遗传标记,在亲缘关系鉴定中具有重要价值[6]。与性染色体相比,常染色体中应用的STR位点数量庞大,聚合酶链反应(polymerase chain reaction,PCR)联合STR技术能够提供大量等位基因信息[7],常染色体STR适用于大部分复杂亲缘关系鉴定案件。虽然常染色体STR在法医学DNA分析中得到了普遍的应用,但仍存在一些局限性,主要原因是在一些复杂亲缘关系鉴定中还是不能得出排除或者认定的结论,此时需要联合使用其他类型的遗传标记,得出相对准确的结论[6-7]。而且STR的突变率相对较高,STR也不适用于降解严重的DNA检材[6-7]。

2.2 X-STR

X-STR是位于X染色体上的STR,表现为特有的性连锁特征,有时X-STR能够提供比常染色体STR更多重要的信息。在某些特殊的亲缘关系鉴定中,如祖母-孙女亲缘关系鉴定,X-STR的使用特别重要,因为其排除或认定能力高于具有相同基因多样性的常染色体STR[8]。在某些复杂亲缘关系鉴定中,如果来自常染色体STR的信息不足以得出结论,可以增加分析X-STR位点提高准确率。由于X染色体会受到被鉴定人的性别限制,和常染色体STR相比使用较少,X-STR主要作为辅助指标。

2.3 Y-STR

Y-STR是位于Y染色体上的STR,呈父系遗传特征,适用于男性参与的复杂亲缘关系鉴定[9]。Y染色体为男性所特有,同一父系的男性Y染色体具有相同的父系祖先,如果排除突变,同一父系的Y-STR分型应该完全相同,因此可以帮助高效地排除全是男性参加的复杂亲缘关系鉴定。

2.4 SNP

SNP是一种DNA序列多态性,由基因组某一特定部位的单个核苷酸发生突变而引起。SNP存在普遍,且大多为二等位基因,易于分型和计算基因频率。与STR相比,SNP遗传标记突变率低,平均突变率约10-9~10-7,具有高稳定性,因此SNP非常适合亲缘关系鉴定[10];SNP基因座片段更短,分析降解DNA能力更强。但由于SNP的二等位基因性质,多态性程度大大降低,需要更多的SNP遗传标记,方能获得与多等位基因STR标记相应的识别率。如果在某些复杂亲缘关系鉴定中,常染色体STR的信息不足以得出结论,可以增加分析更多的SNP位点,帮助计算复杂亲缘关系。有研究[11]结果表明,作为亲缘关系鉴定STR分型的补充,SNP的分析至少会增加4倍的父权指数(paternity index,PI),将来可能取代STR在法医物证学中的应用。

2.5 HLA基因分型

HLA显性遗传多态性系统,在人类基因组所有碱基序列中所占的比例相对较小,仅占0.12%,具有共显性、单倍型、高度多态性和连锁不平衡的遗传特点,由于其高度多态性,在20世纪80年代至90年代的亲缘关系鉴定中作为重要的遗传标记得到了普遍应用[12]。但是,HLA基因分型困难,随着其他新兴技术的出现,各国学者将注意力转移到其他遗传标记上,HLA基因分型在法医学应用中发展缓慢。近年来,大规模并行测序(massive parallel sequencing,MPS)的引入彻底改变了HLA分型方法[13]。基于MPS的HLA基因分型在法医学领域的应用可能有助于HLA遗传标记在法医学应用中的发展。TruSight HLA实验证明,该方法具有高准确率、低模糊率、低成本等优点[14]。虽然目前HLA基因分型并没有应用于复杂亲缘关系鉴定中,但在将来基于MPS的HLA基因分型会成为使用STR遗传标记解决复杂亲缘关系鉴定的有力补充[15]。

3 复杂亲缘关系鉴定的计算方法

目前,常规亲子关系鉴定主要采用的方法是计算PI,PI是假设父亲(alleged father,AF)是孩子生物学父亲的概率(X)和随机男子是孩子生物学父亲的概率(Y)的比值,n个PI相乘则为累积父权指数(combined paternity index,CPI)[5]。当 CPI<0.000 1 时,支持AF不是孩子生物学父亲的假设[5];当CPI>10 000时,支持AF是孩子生物学父亲的假设。但对于复杂亲缘关系的计算需要应用下面介绍的方法。

3.1 常染色体血缘一致性法

血缘一致性(identity by descent,IBD)法是依据孟德尔遗传定律,同一家系中各成员的遗传物质起源于相同祖先,各成员间会有一定的亲缘关系,若某两个相同的等位基因是来自同一祖先,就称这两个等位基因的关系为血缘同一[16]。LI等[17]最早利用IBD法结合数学矩阵得到二联体亲缘关系的计算方法,BRENNER[18]对该方法进行了简化。计算方法如下:设血缘机会大小为R1,随机两个体血缘关系大小为R0,则

式中,CI、CT、CO是指两个体间有2个、1个或者没有同源基因的概率(CI+CT+CO=1)。I、T、O分别表示在CI、CT、CO条件下,被鉴定人之间有相同基因型的概率。根据孟德尔遗传定律,祖孙的常染色体间不可能有两个同源基因,祖孙CI=0,祖孙CO=CT=1/2,则

根据此公式可以计算出祖孙各种基因型下的R1值,最后通过计算似然率(likelihood rate,LR)(R1/R0)得出祖孙二联体亲缘关系。同理,叔侄的常染色体间不可能有两个同源基因,叔侄CI=0,叔侄CO=CT=1/2,则

全同胞CO=1/4,CT=1/2,CI=1/4,则

半同胞CI=0,CO=CT=1/2,则

第一代堂(表)兄弟姐妹CO=3/4,CT=1/4,CI=0,则

第二代堂(表)兄弟姐妹CO=15/16,CT=1/16,CI=0,则

TZENG等[19]研究126个真实同胞对中的15个常染色体STR基因座,计算同胞指数(sibling index,SI)、累积同胞指数(cumulative sibling index,CSI)中位数为5 579.98的情况下同胞认定率达96%。PU等[20]根据IBD法用AmpFℓSTR® Identifiler® PCR扩增试剂盒(美国Thermo Fisher Scientific公司)研究3个群体357 630个全同胞对和178 815个非同胞对的15个STR基因座,计算CSI,得出中国人群体的灵敏度和特异性分别是98.500%和98.125%,高加索人群的灵敏度和特异性分别是98.392%和98.410%,非裔美国人群体的灵敏度和特异性分别是98.660%和98.585%,阳性预测率和阴性预测率均超过98%。PU等[21]研究了3个群体355 620个半同胞对和178 815个非同胞对的15个STR基因座,计算累积半同胞指数(halfsib index,HSI),中国人群的灵敏度和特异性分别是87.98%和86.76%,高加索人群的灵敏度和特异性分别是87.14%和87.78%,非裔美国人群的灵敏度和特异性分别是88.27%和88.67%。陆惠玲等[22]使用Power-Plex®16系统(美国Promega公司)扩增500对全同胞、50对半同胞及500对无关个体的15个STR基因座,采用IBD法分别计算全同胞指数(full sibling index,FSI)、半同胞指数(half sibling index,HSI),以FSI≥19、FSI<1,HSI≥19、HSI<1,FSI∶HSI≥1、FSI∶HSI<1作为判别标准,准确率分别为96.4%、85.3%、87.5%。

在亲缘关系鉴定中,IBD法使用广泛,适用于绝大多数的复杂亲缘关系鉴定,IBD法考虑等位基因频率,相较其他方法结果比较准确[23]。但计算公式及过程复杂,需要查询种群等位基因频率,若等位基因频率未知,不能使用IBD法[24]。

3.2 X染色体IBD法

X染色体具有特殊的性连锁特征,依据伴性遗传定律,同一家系中各成员间会有一定的亲缘关系,计算方法同常染色体IBD法(3.1节)。AQUINO等[25]研究发现,在没有AF的情况下,与15个常染色体STR相比,可以通过使用一组6~10个X-STR标记来更有效地研究假定的父子关系,这说明X染色体在复杂亲缘关系鉴定中有很大的价值。X染色体IBD法是对常染色体IBD法的重要补充,但由于X染色体的伴性遗传方式,不适用于所有类型的复杂亲缘关系,如计算祖母-孙子的亲缘关系不适用X染色体IBD法。X染色体除了补充常染色体信息,还可以判断常染色体无法确定的亲缘关系[26]。

3.3 亲本基因型重建法

亲本基因型重建(parental genotype reconstruction,PGR)法,是通过家系构建推断亲缘关系中缺失的关键个体基因型,再根据推断后的基因型进行计算。家系构建是决定群落结构和遗传参数估计的重要组成部分,对亲缘关系的确定具有重要作用[27-28]。主要适用于以下2种情况。

3.3.1 祖孙亲缘关系

适用于祖父、祖母都参加鉴定的状况,通过推断生父的可能基因,再计算祖父、祖母传递生父基因的概率(计算生父基因在祖父、祖母4个等位基因中所占比例),最后计算PI。徐春燕等[29]应用亲本基因型重建法计算1例祖孙亲缘关系,外祖父-外祖母-外孙子三联体39个STR基因座累积LR值为592 957.971 9,外祖父-外孙子二联体累积LR值为3.381 3,外祖母-孙子二联体LR值为349.952 3。可以看出,PGR法得到的祖孙三联体累积LR值要远远大于祖孙二联体累积LR值。

3.3.2 全同胞、半同胞亲缘关系

全同胞或者同父异母半同胞亲缘关系鉴定中,可以根据确定的兄弟姐妹基因型推测出父亲的基因型,然后计算出PI。LEE等[30]对两个“参照”兄弟姐妹和一个所谓的“测试”兄弟姐妹进行亲缘关系的研究。HUANG等[31]在此基础上总结了各种同胞数据对应的9种PGR模式,并在确定相应的IBD值后,导出了同胞的LR公式。PGR法提供了一种更简单、更普遍的方法来满足在涉及不同数目的兄弟姐妹的情况下识别同胞身份的需要。杨雪等[32]分别应用PGR法和IBD法鉴定1例半同胞,PGR法分析后再根据IBD法计算可获得较为可靠的鉴定意见,单独使用IBD法计算半同胞指数则难以提供可靠的鉴定意见。根据PGR法计算同胞关系,在目前实验室常规可获得的检测体系条件下提高了鉴定效能,尤其是半同胞关系的鉴定效能,具有很好的应用性[33]。

3.4 共有等位基因总数法

共有等位基因总数(total number of shared alleles,TNSA)法是计算两个个体间的共有等位基因总数,从概率统计的角度看,同一家系各成员间拥有共有等位基因总数的倾向必然大于无关个体,可以计算两个体间的共有等位基因总数判断是否具有亲缘关系。

3.4.1 叔侄亲缘关系

章雅清等[34]使用PowerPlex®16系统扩增19对叔侄、119对无关个体的15个STR基因座,计算每对个体的共有等位基因总数(A),根据共有等位基因总数建立判别函数:

判别是否存在叔侄关系的平均准确率为80.7%。

3.4.2 同胞亲缘关系

INOUE等[35]使用GlobalFilerTMPCR扩增试剂盒(美国Thermo Fisher Scientific公司)扩增10 000对全同胞和10000对无关个体的21个STR基因座,计算每个STR基因座的共有等位基因数目总数,发现TNSA≥24仅存在于全同胞中,而不存在于无关个体对中。王静等[36]使用 AmpFℓSTRTMProfilerTMPlus(美国 Thermo Fisher Scientific公司)及AmpFℓSTRTMCofilerTM试剂盒(美国Thermo Fisher Scientific公司)扩增556例同胞对和251例无关个体对的13个常染色体基因座,计算每个STR基因座共有等位基因总数,用SAS统计学软件对两组数据进行Bayes判别分析,得出:

平均错判率为2.65%。赵书民等[37]使用AmpFℓSTRTMIdentifilerTMPlus PCR扩增试剂盒(美国Thermo Fisher Scientific公司)扩增280对全同胞及2003对无关个体的15个STR基因座,对15个STR基因座的共有等位基因总数(S15)进行统计,结果表明,共有等位基因总数≥15且全相同基因座数≥3时可以作为判定全同胞的参考值,应用SAS 8.2软件包得出Fisher判别函数:

平均错判率为2.98%。袁丽等[38]使用Goldeneye®DNA身份鉴定系统20A[基点认知技术(北京)有限公司]扩增344对全同胞和两两随机组合的3 693对无关个体的19、21和39个常染色体STR基因座,统计共有等位基因总数,应用SPSS 19.0软件包得出Fisher判别函数:

平均错判率分别为2.060%、1.705%和0.570%。

TNSA法很容易通过每个位点中个体对的共有等位基因总数(0、1或2)进行计算[39]。TNSA法有3个优点:(1)不需要复杂计算;(2)结果容易计数;(3)结果直观易懂。然而根据IBD法计算出的LR,确定复杂亲缘关系是最可靠的[35]。

3.5 全不同等位基因数目法

在实际案件中,样本成百上千,即便逐一统计共有等位基因总数也比较繁琐,并且基因座越多越困难。黄书琴等[40]根据53对确证叔侄关系的样本,在23~27个Y-STR等位基因一致的条件下,若检测AmpFℓSTRTMIdentifilerTMPlus PCR扩增试剂盒15个常染色体STR基因座其全不同等位基因数目≤4或检测PowerPlex®21系统20个常染色体基因座时全不同等位基因≤5,则说明两者可能存在叔侄关系,灵敏度分别为84.9%和77.4%。全不同基因座的数目法判断亲缘关系简单、操作容易、速度快,适合基层法医分析实际案件[40]。

3.6 状态一致性法

状态一致性(identity-by-state,IBS)法,最早是CHAKRABORTY等[41]提出用于推断高加索人的STR基因座成对关系。EHM等[42]在此基础上设S1和S2各代表有n个标记的基因型个体,当S1和S2在位点i处有2个相同等位基因,设Xi=1;当S1和S2在位点i处有1个相同等位基因,设Xi=1/2;当S1和S2在位点i处有0个相同等位基因,设Xi=0,最后计算Xi的总和。

IBS法适用于全同胞亲缘关系鉴定。GE等[43]根据高加索人群13个组合DNA索引系统(combined DNA index system,CODIS)的STR基因座得出,当全同胞对的IBS≥17时,可以判断绝大多数的全同胞。TAMURA等[44]使用AmpFℓSTRTMIdentifilerTMPlus PCR扩增试剂盒扩增10 000对全同胞和无关个体的15个STR,发现全同胞对和无关个体对1次等位基因共享的发生率没有显著差异,CSI值的大小主要由0个和2个等位基因共享的数量决定,IBS法判断全同胞准确率为96.8%,正确拒绝无关个体概率为98.8%。IBS法在国内应用普遍,中华人民共和国司法部司法鉴定管理局在2014年出台的《生物学全同胞关系鉴定实施规范》(SF/Z JD0105002—2014)[45]所采用的方法就是IBS法。李佳珏等[46]使用PowerPlex®21系统扩增234对全同胞和200对无关个体中的19个常染色体STR基因座,计算IBS值,全同胞认定率为82.91%,有17.09%的样本无法给出倾向性意见。王晓丹等[47]随机选择了1000万对全同胞和无关个体样本,使用IBS法鉴定全同胞关系,在19、29、39个常染色体STR检测系统上,假阳性率和假阴性率分别为0.016%和0.014%、0.024%和0.00023%、0.029%和0。

IBS法应用到实际复杂亲缘关系鉴定案件中具有快速、简便、易于判断的优点,可以直接、快速地给出鉴定意见,但应用面窄,检出率低于IBD法[48]。

3.7 第5等位基因排除法

第5等位基因排除法适用于全同胞亲缘关系的鉴定。BOEHNKE等[49]提出,根据孟德尔遗传定律,3个及以上全同胞在同一个位点不可能出现5个及以上的等位基因,可以排除不明确的全同胞亲缘关系。张更谦等[50]使用Goldeneye®DNA身份鉴定系统20A扩增13组2个全同胞个体-1个待检个体和5组3个全同胞个体-1个待检个体中19个STR基因座,并与100个无关个体进行比对,用19个STR基因座检测13组二联体全同胞与100个无关个体的排除率为47.77%,5组三联体全同胞与100个无关个体的排除率为88.00%。该方法简单明了,主要根据等位基因分型进行推算,而不使用等位基因频率信息。

3.8 叔侄指数定律

叔侄指数(avuncular index,AI)定律,是一种专用于计算叔侄亲缘关系的计算方法。AI指当被鉴定人是假设父亲(alleged father,AF)兄弟姐妹时,被鉴定人与孩子之间存在叔侄关系的可能性与被鉴定人与孩子无任何亲缘关系可能性的比值。根据遗传定律,

AI定律计算叔侄亲缘关系与IBD法计算叔侄亲缘关系的结果完全一致[52]。

4 不足与展望

随着DNA检验技术在法医遗传学中的应用,复杂亲缘关系鉴定技术得到了很好的发展,普遍应用于各类案件。然而,现在的复杂亲缘关系鉴定仍然存在许多不足之处:(1)检测的遗传标记较多。对于复杂亲缘关系鉴定,有时候检测常规亲缘关系所用的遗传标记并不能得出排除或者认定的意见,就需要添加更多的遗传标记,费时费力费钱。(2)计算方法相对复杂。以上国内外学者提供的各种计算方法大多步骤较多,计算过程容易出错。(3)准确率不够高。相比于常规亲缘关系鉴定,复杂亲缘关系鉴定的准确率要低得多,得出错误意见的可能性较大。(4)研究范围较窄。目前国内复杂亲缘关系鉴定研究的样本都是以汉族人为主,没有考虑其他民族的适用性,不具有普遍性。针对以上不足,在未来的工作中,法医物证学科研工作者应该:(1)探索更多新的认定或排除能力强的遗传标记,以期减少需要检测的遗传标记的数量并提高结果的准确率;(2)简化复杂亲缘关系鉴定计算方法,改进计算过程;(3)区分随机2人是否具有复杂亲缘关系,可以推断现场嫌疑人遗留DNA与数据库内的DNA样本是否可能存在复杂亲缘关系,从而推断嫌疑人的家族,为抓捕嫌疑人提供重要信息,该方法可用于大规模排查,减少刑侦人员工作量;(4)研究其他民族的复杂亲缘关系家系样本,检验各种复杂亲缘关系的计算方法应用于其他民族的适用性,探索适用于其他民族复杂亲缘关系鉴定的计算方法。

猜你喜欢

基因座亲缘同胞
谷子近缘野生种的亲缘关系及其利用研究
以中华文化促进两岸同胞心灵契合的路径思考
广东肇庆汉族人群20个STR基因座遗传多态性
两岸同胞福建漳浦欢度“三月三”
厂窖惨案遇难同胞纪念馆
菊科药用植物遗传多样性及亲缘关系的ISSR分析
多拷贝Y-STR基因座在法庭科学领域的研究
小白菜种质遗传多样性与亲缘关系的SRAP 和SSR分析
海外同胞与中国健儿心心相连
PowerPlex21系统在亲子鉴定中的应用评估