GoldeneyeTM DNA身份鉴定系统22NC在福建汉族人群的遗传多态性和法医学应用价值
2022-10-11陈金烟韩俊永王坤金静君薛士杰
陈金烟, 韩俊永, 王坤, 金静君, 薛士杰
福建省位于中国东南沿海,总面积1.24万km2,常住人口为4.187×107人[1],是一个多民族聚居的地方。其中,汉族为主体民族,人口为3.661×107人,占97.84%;少数民族中畲族占比最多,共37万人,占福建省少数民族人口的45.87%;回族人口11.6万人,满族次之[2]。短串联重复序列(short tandem repeat, STR)基因座指由2~6个碱基重复序列组成的一段DNA,具有遗传平衡、高度遗传多态性、稳定性的特点,且分析快速、廉价、易于自动化,被广泛用于亲子鉴定、法医案件调查和大规模灾难受害者的身份识别等,近年来更是成为细胞鉴定的“金标准”。GoldeneyeTMDNA身份鉴定系统22NC是由基点认知技术(北京) 有限公司研发的包含20个非CODIS (combined DNA index system) STR基因座、1个CODIS STR基因座(D3S1358) 和性别基因座Amelogenin的五色荧光STR复合扩增试剂,目前已用于检测国内多个地区不同民族人群STR基因座基因频率分布[3]。本研究应用该试剂盒对福建汉族人群的21个常染色体STR基因座进行检测并分析其遗传多态性,为福建地区汉族人口的法医学个体识别和亲权鉴定提供基础数据,也为福建地区汉族与其他地区汉族及其他民族之间的基因频率分布差别鉴定提供理论依据。
1 对象与方法
1.1 对象 样本量的估计参考群体遗传学调查的要求[4],常染色体STR基因座的检测至少需要500人份以上,本次研究拟纳入福建省医学科学研究院明正司法鉴定所受理的亲子鉴定案例中福建地区汉族人口,即拥有福建籍贯且在福建连续居住时间不少于5 a的562例汉族健康的无关个体,其中男性347例,女性215例。本研究符合《世界医学协会赫尔辛基宣言》。根据委托协议,患者均签署知情同意书。
1.2 样本采集
1.2.1 DNA提取 采集研究对象末梢血5~50 μL。采用常规Chelex-100法进行新鲜外周血DNA提取[5]。吸取5~50 μL血样加入1 mL的Tris-EDTA (TE) 缓冲液,颠倒混匀后室温静置 30 min,转速12 000 r/min 离心3 min,弃上清液留取沉淀,加入260 μL含5%的Chelex-100,置56 ℃水浴 30 min消化,再于100 ℃煮沸8 min,转速12 000 r/min 离心 3 min,4 ℃保存备用。
1.2.2 STR检测 采用GoldeneyeTMDNA身份鉴定系统22NC 试剂盒10 μL体系对21个常染色体STR基因座(D6S477、D22-GATA198B05、D15S659、D8S1132、D3S3045、D17S1290、D14S608、D18S535、D13S325、D10S1435、D11S2368、D7S3048、D19S253、D1S1656、D2S441、D10S1248、D3S1744、D7S1517、D5S2500、D4S2366和D3S1358)和性别基因座Amelogenin进行复合五色荧光PCR扩增。扩增体系组成:2.5× PCR反应缓冲液4 μL ,5×引物混合液2 μL,Taq DNA聚合酶0.2 μL,DNA模板0.5~2 ng;阳性对照为标准品DNA 9948 (美国Promega公司);扩增条件:95 ℃预变性11 min;94 ℃变性30 s→60 ℃退火60 s→70 ℃延伸60 s,循环30次,60 ℃延伸30 min,15 ℃保温;PCR扩增反应在9700型扩增仪(美国Applied Biosystems公司)上进行。PCR产物在3130型遗传分析仪(美国AB公司)上进行毛细管电泳,STR基因座采用GeneMapper ID v3.2.1软件进行分型。
1.3 统计学处理 采用Modified-Powerstates v1.2软件计算21个常染色体STR基因座的基因分布频率、Hardy-Weinberg平衡检验和群体遗传多样性参数。运用Arlequin v3.5软件的分子方差分析(analysis of molecular variance, AMVOA)计算福建地区汉族与其他地区汉族及其他民族的相应位点基因频率分布差别,经Bonferroni多重校正检验后P<0.002 4 (P<0.05/21) 为差别有统计学意义。
2 结 果
2.1 福建汉族人群21个常染色体STR基因座等位基因频率分布 本研究应用GoldeneyeTMDNA身份鉴定系统 22NC 试剂盒检测 562 例无关个体的 21 个STR基因座等位基因片段的大小,共观察到 229 个等位基因、860 种基因型;经Modified-Powerstates v1.2 软件计算等位基因频率分布范围为0.000 9~0.375 4,最高值为基因座D10S1248的基因型13;21 个等位基因呈现高度基因多态性,基因型分布范围为5(D14S608)~28(D7S1517)(表1)。
2.2 Hardy-Weinberg平衡检验及遗传多态性分析 经Hardy-Weinberg平衡检验,除D6S477、D22-GATA198B05和D5S2500基因座外,其余18个等位基因的基因型观察值与预期值比较,进行χ2检验,差别无统计学意义(P>0.05),符合遗传平衡定律;而D6S477(P=0.031 8)、D22-GATA198B05(P=0.031 5)和D5S2500(P=0.049 5)经Bonferroni 多重校正检验后也符合Hardy-Weinberg平衡定律。21个常染色体STR基因座的个体识别率(discrimination, DP)均>0.85,在群体中的累积个体识别率(combined power of discrimination, CDP)为1-3.7718×10-26(表2)。基于各基因座之间互相独立,运用乘法法则计算后得到该系统21个基因座的累积非父排除率 (combined power of exclusion, CPE) 为1-2.9531×10-9。
2.3 福建汉族人群与其他地区人群的基因频率比较 将福建汉族人群的21个基因座的基因频率分别与中国南方汉族、北方汉族、东部汉族、西部汉族、海南汉族以及海南黎族、西藏藏族、维吾尔族人群的基因频率分布进行比较,发现福建汉族人群等位基因亚型分布频率与其他地区人群存在一定差别。GoldeneyeTMDNA身份鉴定系统22NC检测系统未获得南方汉族、北方汉族、西部汉族和维吾尔族群体遗传信息数据,本研究参考其他检测系统的相同STR基因座群体遗传学数据;22NC检测系统已获得针对东部汉族、海南汉族、海南黎族和藏族等群体的21个STR基因座群体遗传数据。福建汉族人群与东部汉族有10个基因座的等位基因频率分布差别无统计学意义,与南方汉族有6个、北方汉族有3个、西部汉族有5个基因座、海南汉族有6个基因座的等位基因频率分布差别无统计学意义,与海南黎族仅有2个、维吾尔族有1个基因座的等位基因频率分布差别也无统计学意义,与藏族有7个基因座的等位基因频率分布差别无统计学意义。福建汉族人群在D8S1132、D10S1435、D11S2368、D1S1656和D7S3048基因座的基因频率分布与其他几个地区汉族差别有统计学意义(P<0.002 4,表3)。
2.4 实际案例应用 根据2021年发布的《生物学全同胞关系鉴定技术规范》(SF/T 0117—2021),状态一致性评分(identity by state score, IBS)为对于每一个STR基因座而言,两名有争议个体之间的状态一致性等位基因的个数。累计状态IBS(cumulative identity by state score, CIBS)为两名个体在同一基因座上可出现相同的等位基因,这种可能来源于遗传,也可能来源于随机匹配的一致性被称为状态一致性,该等位基因也被称为状态一致性等位基因。当采用包含多个相互独立的常染色体遗传标记分型系统对两名有争议个体进行检测时,各个遗传标记上IBS之和为CIBS。本实验室联合利用PowerPlex®21 System系统(美国Promega公司)和GoldeneyeTMDNA身份鉴定系统22NC 试剂盒,对父母皆无的2名个体进行生物学全同胞关系的鉴定,依据规范检测二者在39个常染色体STR基因座的分型,并计算了IBS为52,高于规范认定为全同胞的CIBS阈值(>40),故倾向认为二者为生物学全同胞(表4)。
3 讨 论
GoldeneyeTMDNA身份鉴定系统22NC共包含20个非CODIS STR基因座、1个CODIS STR基因座(D3S1358) 和性别基因座Amelogenin,其中D3S1358基因座在多种常用常染色体检测系统中均有包含,可为使用不同试剂盒之间的相互验证,同时,联合该系统与PowerPlex®21 System系统(美国Promega公司)和AGCU 21+1 STR荧光检测系统(中德美联公司)使用,可使检测基因座数目达到55个,具有极高的非父排除率(power of exclusion, PE)和DP,同时也能满足中华人民共和国司法部司法鉴定管理局于2021年发布的《生物学全同胞关系鉴定技术规范》(SF/T 0117—2021)建议的补充基因座的要求。
表1 福建汉族人群21个常染色体STR基因座的等位基因频率
我国是一个以汉族为主的多民族聚居国家,幅员辽阔、人口众多,但生产力分布不均,决定了人口分布不平衡,因此,调查各基因座在不同地区汉族人群的基因频率,对我国汉族人群遗传学研究、法医学DNA数据库的建立及亲权鉴定的应用均有重要意义。本研究中,笔者运用GoldeneyeTMDNA身份鉴定系统22NC对福建汉族人群的21个常染色体STR基因座的遗传多态性进行调查,并获得相应的群体遗传学数据。每一套检测系统的遗传分析、个体识别与亲权鉴定均在Hardy-Weinberg平衡定律的基础上统计分析。本研究21个基因座在福建汉族人群的基因型、基因频率分布及遗传多态性等,均符合Hardy-Weinberg平衡定律。除D3S1358基因座外,其余20个STR基因座均为高鉴别力(DP>0.9)、高多态信息含量(PIC>0.7)的高度多态性基因;CPE和CDP均符合司法部《亲权鉴定技术规范》(GB/T 37223—2018)的相关要求。本研究结果表明,这21个STR基因座在福建汉族人群中具有良好的遗传多态性,联合应用具有高度法医学个人识别和亲权鉴定应用价值。
表2 福建汉族人群21个常染色体STR基因座群体遗传和法医遗传学参数
表3 福建汉族人群21个STR基因座与中国不同地区人群等位基因频率比较
表4 生物学全同胞姐弟39个STR基因座的基因分型检测结果及IBS评分
最新版《生物学全同胞关系鉴定技术规范》(SF/T 0117—2021)中提到:在双亲皆无情况下,检测规定的19个必检STR基因座基础上增加20个不存在连锁不平衡的其他常染色体STR基因座,以提高系统效能。本研究的实际案例应用中,PowerPlex®21 System系统包含了19个必检STR基因座,但其系统效能仅为0.565 5,而GoldeneyeTMDNA身份鉴定系统22NC 试剂盒则提供了规范中推荐的补充检测20个STR基因座,使检测系统效能高达0.978 2,大大提高了本鉴定的系统效能,并降低了错判风险。
本研究应用Arlequin Version 3.5软件分析比较福建汉族和其他地区汉族及其他民族的相应基因座基因频率分布差别。根据文献[13]报道,我国汉族可分为南方汉族和北方汉族。然而,在漫长的历史进程中,我国汉族经历了多次的迁移、融合和分化,不同地区汉族人群已形成不同亚群独特的分子遗传结构特征[14]。福建汉族与东部汉族等位基因频率分布中,21个基因座有10个差别无统计学意义,具有一定的共性,这可能与福建地区地处东南沿海、位置相近及历史人口迁徙等原因有关;福建汉族与北方汉族的等位基因频率分布差别性较大,共18个基因座,有15个差别有统计学意义,约占83%,仅D22-GATA198B05、D15S659和D18S535 3个基因座差别无统计学意义;同时,与西部汉族(共15个基因座,有10个差别有统计学意义)、南方汉族(共16个基因座,有10个差别有统计学意义)和海南汉族(共21个基因座,有15个差别有统计学意义)等位基因频率分布差别也比较大,这与张蒙等[14]的研究结论一致,即福建、浙江和上海等汉族亚群与其他南方汉族亚群的遗传距离较远。由此可见,不同地域的汉族人群同一基因座的基因频率分布也不尽相同,这可能与不同地区汉族群体的起源不同、历史上的人口迁徙及长江地理隔离等有关。福建汉族与部分少数民族的基因频率分布比较,差别更为显著,说明彼此之间的基因交流和融合很少。综上所述,本研究对不同地区人群基因频率分布进行比较分析,对研究人群的源流、人口迁移及人类遗传学具有重要意义,同时也提示在法医学等实际应用中应注意不同地区人群或民族基因频率的选择。