19个短串联重复序列基因座在河南汉族人群中的遗传多态性分析
2021-09-07王美莹于皓
王美莹,于皓
(1.河南省生殖健康科学技术研究院,河南 郑州 450002;2.河南事缘法医物证司法鉴定所,河南 郑州 450002)
在过去的一个世纪里,亲权鉴定遗传标记的技术已经从血清学检测(红细胞抗原和白细胞抗原)转变为DNA多态性遗传标记。目前,短串联重复序列(short tandem repeat,STR)作为第二代遗传标记,因种类繁多、分布广泛、多态性高、 扩增成功率高、检测灵敏、重复性好、高杂合度、容易检测并遵循孟德尔共显性遗传规律等特点在分析人类血统和亲属关系方面有广阔的应用前景。目前临床常将STR应用于遗传咨询、双胞胎研究、医院婴儿混合后的产妇确定以及常见的胎儿染色体非整倍体的快速产前诊断等方面[1]。除了医疗保健之外,STR也常被用于公安犯罪侦查破案中。我国目前已经建成世界最大的可疑犯罪人群常染色体STR数据库,库容量约4 300万[2]。STR在查明肇事者和失踪人员、确定亲属关系、儿童抚养费执行、遗产和社会保障以及移民确认等方面也有应用价值。越来越多的基于STR的人口统计数据扩充了不同国家的法医数据库,并促进了数据共享。不同的基因频率和突变率可直接影响个体识别和亲权鉴定的准确性,因此获得本地区人群的STR多态性数据十分重要。本文应用GoldeneyeTM20A荧光标记复合扩增系统,对河南汉族1 000名无关个体的19个STR基因座进行多态性调查及法医遗传学参数评估,为司法鉴定的个体识别、亲子鉴定及群体遗传学研究提供可靠的参考数据。
1 材料和方法
1.1 样本采集随机选取河南事缘法医物证司法鉴定所2019—2020年日常接收案件中1 000个河南汉族健康个体的样本,样本类型为滤纸血卡。纳入研究的人员无任何关系。本研究经河南省生殖健康科学技术研究院伦理委员会审批通过。纳入样本时,符合知情同意原则,并对人员信息进行保密。
1.2 检测方法本研究严格按照国际法医遗传学协会(International Society for Forensic Genetics,ISFG)提出的建议在法医遗传学实验室中进行。选择GoldeneyeTM20A DNA身份验证系统试剂盒[基点认知技术(北京)有限公司],包括D2S1338、D21S11、D3S1358、D18S51、D12S391、D13S317、D8S1179、D7S820、D6S1043、CSF1PO、TPOX、D16S539、D5S818、TH01、D19S433、Penta D、VWA、Penta E、FGA共19个STR位点。用血斑打孔器(直径1.0 mm)对血卡滤纸进行手工打孔后,根据试剂盒说明书加入相应试剂。为减少误差,每组实验均添加阴性对照组(ddH2O)和阳性对照组(9947A),通过ABI 9700型基因扩增仪进行复合聚合酶链反应(polymerase chain reaction,PCR),扩增体系为10 μL。PCR扩增产物在ABI 3500 DX型遗传分析仪上进行毛细管电泳,所得分型数据用GeneMapper-IDX 1.4分析。
1.3 统计学方法应用Modified Powerstates软件[3]对所得数据进行统计分析。计算各基因座的群体遗传学参数,包括基因频率、杂合度(heterozygosity,H)、个体识别能力(discrimination power,DP)、匹配概率(probability of matching,PM)、非父排除概率(probability of exclusion,PE)、多态信息含量(polymorphism information content,PIC)、亲权指数(paternity index,PI),进行Hardy-Weinberg平衡检验。应用GENEPOP软件分别对基因座进行连锁不平衡分析。
2 结果
2.1 基因座等位基因分布在1 000例河南汉族人群个体的19个常染色体STR基因座中检出245个等位基因和980种基因型。经过Modified Powerstates软件分析,各基因座的等位基因分布频率均符合Hardy-Weinberg平衡(P>0.05)。应用GENEPOP 软件分析后均未见连锁不平衡。各基因座等位基因频率分布见表1。
表1 河南汉族人群19个STR基因座等位基因频率分布
2.2 基因座等位基因遗传学参数19个常染色体STR基因座的PM值为0.014~0.202,PE值为0.321~0.847,PIC值为0.56~0.91,H值为0.592~0.902,DP值为0.781~0.984。按照DP≥0.9、H≥0.7、PIC≥0.7的衡量标准[4],除TPOX、TH01、D3S1358、CSF1PO基因座外,其余15个均为高鉴别能力的基因座。经计算19个基因座的累积个体DP为(1~1.814 99)×10-23,累积非父PE为0.999 999 988。见表2。
表2 河南汉族人群19个STR基因座的遗传学参数
3 讨论
目前,国内的商品化STR试剂盒大多包括美国联邦调查局选取的13个CODIS核心基因座,即TPOX、D3S1358、D5S818、FGA、CSF1PO、D7S820、D8S1179、TH01、VWA、D13S317、D16S539、D18S51、D21S11。本研究采用的试剂盒也包含这13个位点。但是,TPOX、TH01、D3S1358、CSF1PO在美国和欧洲等西方人群中具有较高的DP和PE[5],但是在亚洲人群中的PIC较低,检测效率不如其他STR基因座[6-7]。本次检测的19个常染色体STR基因座中,基因分型最少的基因座为D3S1358、TPOX,均只有6种等位基因,其中TPOX的等位基因8在所有基因座等位基因中的分布频率最高,为53.0%。TPOX的PIC较低,故TPOX在河南汉族人群19个STR基因座中是DP和PE最低的基因座。等位基因分型最多的基因座为Penta E,有25个分型,其中分布频率最高的等位基因为11,分布频率为12.5%。故河南汉族人群中Penta E基因座的DP、PE、PIC和PI最高,PM最低。这与既往针对福建汉族人群的相关研究结果[8]一致。
在针对河南汉族人群19个STR基因座的多态性研究中,扩增出了多个试剂盒等位基因标准分型物ladder之外的稀有等位基因,在STR分型图谱上常显示为“OL”(off-ladder)。这些样本经过DNA提取及不同试剂盒验证后,等位基因数据不变,按照STR命名规则分别命名。稀有等位基因分布为FGA(10、25.1、26.2),Penta E(13.2、18.4、19.4、27), D19S433(11.2、18、18.2),D16S539(7),D7S820(8.3、9.1、9.2、10.1、11.1、11.3、15),D6S1043(12.3、18.2、19.3、20.3、22、22.3、23),D12S391(18.3),D21S11(30.3、34.1)。在8个STR基因座中共检出28个稀有等位基因。其中D7S820的9.1检出率为0.4%,D21S11的30.3检出率为0.3%,这可能与河南区域的人群特异性有关。除上述2个等位基因外,余下26个等位基因在河南汉族人群中分布较少,且与北京、重庆、贵州的汉族人群有一定差异[9-11],与新疆维吾尔族人群有明显差异[12]。这些稀有等位基因潜力巨大,在人群中出现的概率相对较低,对DP和PE的贡献较高,在法医物证亲权鉴定使用中要格外注意[13]。
《亲权鉴定技术规范》[14]中要求:用于三联体亲权鉴定和二联体亲权鉴定的检测系统的累计PE不应小于0.999 9。STR基因座的数量决定了试剂盒的检测效率。本研究采用的19个STR位点在河南汉族人群中累积非父PE为0.999 999 988,可达到鉴定行业标准。
综上所述,GoldeneyeTM20A DNA身份验证系统试剂盒包含的19个STR基因座在河南汉族人群中具有较高的个体DP和亲权鉴定能力,可应用在司法鉴定日常工作和检测中。