贵州汉族人群23个STR基因座的OL等位基因研究
2020-02-05胡锡阶刘祖林万卫红陈鹏宇余丽梅
张 昊,胡锡阶,刘祖林,罗 丽,万卫红,陈鹏宇,余丽梅
(1.遵义医科大学附属医院 贵州省细胞工程重点实验室,贵州 遵义 563099;2.遵义医科大学 法医学院,贵州 遵义 563099;3.遵义医科大学附属医院 司法鉴定中心,贵州 遵义 563099)
短串联重复序列(Short tandem repeat,STR)是一类长度多态性遗传标记,在人类基因组中分布广泛,核心重复单位数目的变化形成了STR基因座的遗传多态性[1]。STR基因座在不同人群中存在显著的群体遗传结构差异,主要表现在等位基因的数目、分布频率、突变和序列结构特征等方面[2-3]。在法医学实践中,对特定群体的STR基因座进行遗传多态性调查,是应用于该群体个体识别、亲权鉴定以及群体遗传学研究的基本前提。
OL(Off-Ladder)等位基因是采用国际标准化检测仪器对STR进行等位基因分型时,因所检测的等位基因未被包含在商品化试剂盒等位基因分型标准物(Allelic ladder)中,不能被仪器自动识别和程序化数字命名的等位基因[4]。其来源于群体中发生微变异的等位基因或稀有等位基因,多数情况下是具有群体特征性而之前未报道的新等位基因。目前,国内外多个实验室相继在不同群体或单个STR基因座上检测出OL等位基因[5-7],贵州汉族群体的OL等位基因数据尚缺乏。本研究应用在中国群体中遗传多态性高的Huaxia PlatinumTM试剂盒,对贵州汉族人群23个常染色体STR基因座的OL等位基因进行统计和分析,以期补充和完善贵州汉族群体的遗传多态性数据。并与采用相同检测体系的群体进行OL等位基因及频率比较,进一步探讨OL等位基因在不同群体中的差异性。
1 材料与方法
1.1 材料 样本来源于遵义医科大学附属医院法医鉴定中心法医物证室(即贵州省细胞工程重点实验室分子生物学技术室的法医物证室)亲子鉴定的日常检案,随机选取2016~2018年1 291例贵州汉族无关个体血样,其中男性882例,女性409例。
1.2 主要试剂与仪器 Huaxia PlatinumTM试剂盒、等位基因分型标准物、内标(LIZ600)、POP 4凝胶和缓冲液(ABC、CBC)均为美国ABI公司产品,Veriti 96 well PCR扩增仪和3500-DX遗传分析仪也购于美国ABI公司。
1.3 方法
1.3.1 制备FTA血卡 取80 μL血液均匀涂至FTA卡中央区域,室温自然干燥,手动打孔器取下直径约1 mm血斑放入PCR管。
1.3.2 PCR扩增与毛细管电泳 严格按照Huaxia PlatinumTM试剂盒说明,配置扩增体系和设置循环参数。PCR扩增体系共10 μL,其中Master Mix 4.0 μL、Primer Set 4.0 μL、Pure water 2.0 μL。反应循环参数为:95 ℃ 1 min;94 ℃ 3 s,59 ℃ 16 s,65 ℃ 29 s,26个循环;60 ℃ 5 min;4 ℃ 保存。取1 μL PCR扩增产物,与9.6 μL甲酰胺和0.4 μL内标混合,使用3500-DX遗传分析仪进行毛细管电泳。每批样本均同时检测等位基因分型标准物(ladder)、阳性对照(control 007)和阴性对照(water)。
1.3.3 基因分型与OL等位基因命名 应用Gene Mapper ID-X 1.4 software(美国ABI公司)分析电泳结果,以试剂盒ladder为参照标准,获得等位基因分型。对于在分型图谱中未被数字化命名的OL等位基因,根据《司法鉴定技术规范》(SF/Z JD0105011-2018),参照内标计算每个带有实际分子量标的信号峰的位置来进行命名。
1.3.4 参考群体选择与群体比较 参考群体纳入标准:(1)采用与本研究相同的检测体系;(2)报道数据通过质控;(3)具有语系、地域、民族代表性。
检索PubMed、CNKI和万方数据库,选取四川汉族(n=309)[8]、海南汉族(n=193)[9]、四川藏族(n=198)[9]、华东汉族(n=500)[10]、内蒙古蒙古族(n=100)[10]、宁夏回族(n=183)[11]和新疆哈萨克族(n=550)[12]作为参考群体,获得各群体的等位基因频率后,筛选出OL等位基因及分布频率作为比较数据。
2 结果
2.1 等位基因分型标准物 Huaxia PlatinumTM试剂盒包含23个常染色体STR基因座(D3S1358、vWA、D16S539、CSF1PO、TPOX、D8S1179、D21S11、D18S51、Penta E、D2S441、D19S433、TH01、FGA、 D22S1045、D5S818、D13S317、D7S820、D6S1043、D10S1248、D1S1656、D12S391、D2S1338、Penta D)及2个性别鉴定基因座Amelogenin和Y-indel (rs2032678),各基因座可见数目不等的标准物等位基因分型图谱(见图1)。
2.2 贵州汉族群体OL等位基因分型及其频率 1 291例无关个体共检出36个OL等位基因,分布于vWA、D16S539、D21S11、D18S51、Penta E、D2S441、D19S433、FGA、D22S1045、D7S820、D6S1043、D1S1656、D12S391和D2S1338 共14个STR基因座,各基因座可见1~8个OL等位基因,基因频率为0.0004~0.0232(见表1)。36个OL等位基因分为两种类型:5个超出ladder范围而位于两个邻近基因座ladder之间(见图2A),分别为vWA(10)、D6S1043(6,8)、D12S391(28)和D2S1338(29);其余31个出现在基因座ladder最大和最小等位基因范围内(见图2B)。
1 291例样本中,235例共检出OL等位基因256次。其中214例为单个基因座上出现1个OL等位基因;3例为单个基因座上的2个等位基因均为相同的OL等位基因,即由OL等位基因组成的纯合子(见图2C);18例为两个不同的基因座上各出现1个OL等位基因(见图2D)。
图1 Huaxia PlatinumTM试剂盒ladder分型图谱
表1 贵州汉族群体OL等位基因及其频率
续表
A: D6S1043 OL 6; B: D2S441 OL 9.1; C: D2S441 OL 9.1; D: D7S820 OL 12.1; D2S441 OL 12.3。图2 OL等位基因分型分型图谱
2.3 贵州汉族与参考群体OL等位基因及频率比较 与四川汉族、海南汉族、华东汉族、四川藏族、宁夏回族、内蒙古蒙古族和新疆哈萨克族7个群体相比,贵州汉族人群发现OL等位基因数目最多,分布基因座最广。D2S441(10.1)、D16S539(6)、D18S51(8)、vWA(10)、D7S820(12.1)、D19S433(9.2,18)、FGA(27.2)、D22S1045(12.1)和 D6S1043(6,19.2,19.3)共12个等位基因仅在贵州汉族中检出,其中10个为稀有等位基因;D1S1656(18)和FGA(23.2)在所有群体中均有检出,且等位基因频率在各群体均高于1‰。
图3 贵州汉族与参考群体OL等位基因频率比较
3 讨论
OL等位基因产生的主要原因是等位基因突变引起的核酸缺失、插入或核苷酸改变,这种改变也被称为微变异[4],同时之前未报道过的新等位基因也会被检测为OL。OL等位基因主要分为两种类型:一类是超出ladder范围而位于两个邻近基因座ladder之间,通常是由STR基因座滑动突变形成的稀有等位基因,表现为核心序列的完整重复;另一类是出现在基因座ladder最大和最小等位基因范围内,通常由于微变异引起,表现为核心序列的不完整重复。本研究中,前一类5个OL等位基因vWA(10)、D6S1043(6,8)、D12S391(28)和D2S1338(29)均为核心序列完整重复的稀有等位基因(频率低于1‰);后一类31个OL等位基因中仅6个为核心序列的完整重复,其余25个为核心序列的不完整重复。综合OL等位基因类型和分布频率,在贵州汉族人群中检出的OL等位基因多出现在基因座ladder最大和最小等位基因范围内(31/36),多表现为核心序列的不完整重复(25/36),以稀有等位基因居多(19/36)。
Huaxia PlatinumTM试剂盒作为在中国人群遗传多态性数据基础上研发的复合扩增体系,在多个群体遗传学调查中展现出高度的多态性和鉴别能力[13-14]。23个常染色体STR基因座包括了美国联合DNA检索系统、欧洲标准基因座和中国国家数据库推荐使用的所有核心基因座,在保证高系统效能的同时,能有效实现与已知数据库的数据共享和比对。应用该体系检测贵州汉族群体,OL等位基因在14个STR基因座上被检出,而9个STR基因座上未检出。D6S1043和FGA基因座所含OL等位基因较多,分别为8个和7个,其余基因座均不超过3个。结合各基因座的法医学参数,发现检出OL等位基因的14个基因座均为贵州汉族群体的高鉴别能力基因座(DP>0.9,Ho>0.7),而在低鉴别能力或中等鉴别能力的基因座上未检出,如TH01和TPOX基因座。这表明OL等位基因使得所在基因座的鉴别能力增强,包含的多态性信息更为丰富。
本研究在贵州汉族群体中检出OL等位基因比例较高,占总样本18.20%(235/1 291例);且个别OL等位基因的频率较高,如D2S441基因座的9.1等位基因频率达到0.0232,D1S1656基因座的18等位基因频率也达到0.0128。与前述3个汉族群体和4个少数民族群体比较,从OL等位基因数目来看,8个群体的OL等位基因多分布于D2S441、FGA和 D6S1043三个基因座,不同群体OL等位基因分布的基因座及数目具有一定差异。8个群体总体呈现出样本量越大检出OL等位基因数目越多,而各群体的OL等位基因总频率保持在较为恒定的范围(0.11±0.0345),即显示为各群体的遗传基因趋于稳定。对于相近样本量的群体,汉族群体检出OL等位基因数目多于少数民族群体,这可能是因为汉族在人口迁移或社会变动中更多地与不同民族、地域的人群发生基因交流和融合,形成汉族的遗传多态性信息更为复杂所致,而少数民族由于地理环境相对封闭,外族通婚相对较少,遗传多态性更为保守。按语系分类,汉族和回族属于汉藏语系的汉语语族,藏族属于汉藏语系的藏缅语族,蒙古族和哈萨克族分别属于阿尔泰语系的蒙古语族和突厥语族。在6个汉藏语系和2个阿尔泰语系群体中,观察到部分OL等位基因仅检出于汉藏语系的群体,在阿尔泰语系的群体未检出,说明OL等位基因在汉藏语系和阿尔泰语系群体中存在一定差异。因目前Huaxia PlatinumTM检测体系的群体遗传多态性数据较为缺乏,有待增加南岛语系、南亚语系和印欧语系的群体以进一步探讨OL等位基因在不同语系群体中的差异性。从OL等位基因频率来看,在多个群体中观察到等位基因频率较高的OL等位基因,如D1S1656基因座的18等位基因,在8个群体中均被检出,且等位基因频率不低于0.005。这提示试剂盒生产公司应特别注意收集各群体的OL等位基因数据,有必要将多数群体中频率高的OL等位基因纳入ladder,不断优化和完善试剂盒。同时,也观察到一些OL等位基因仅存在特定群体或少数群体(如D2S441基因座的10.1等位基因仅存在于贵州汉族人群),等位基因频率较低,是与其他群体在遗传结构上具有差异性的反映。这类具有明显群体特征的OL等位基因有利于个体排查、甄别,甚至确认,在灾难遗骸识别或混合物鉴定等案件调查中具有强大的应用价值。
实际检案检测到OL等位基因时,其频率按照该基因座上等位基因频率的最小值取值。对于超过稀有等位基因评定标准的OL等位基因,计算时若仍取最小等位基因频率,必然会增大该基因座的父权指数,从而影响累计父权指数的计算结果。OL等位基因对DNA检测结果判定有着重要影响,一方面,OL等位基因有助于提升基因座的鉴别能力,亲子间相同的OL等位基因能够增加亲缘关系的确定;另一方面,OL等位基因的误读可能会影响案件分析的可靠性,增大鉴定风险,使法医DNA检测不能真正起到认定罪犯、保护无辜的作用。因此在鉴定工作中应警惕被标识为OL的等位基因。常染色体STR分型是目前法医物证案件鉴定的金标准,基于STR长度多态性检测结果,相同或相似长度的等位基因包含了更加丰富的多态性信息[15]。这意味着通过比照和推导相邻等位基因长度命名的OL等位基因也极有可能包含了不同的序列结构组成。国际法医学组织建立了专门的STR Base数据库,接收并持续更新来自全球各实验室的OL等位基因数据,随着DNA数据库的完善和新一代测序技术的发展,更加丰富的OL等位基因信息必将得到精准的解读。
综上可见,对贵州汉族人群23个STR基因座的OL等位基因进行比较分析,丰富了法医学个体识别、亲权鉴定、人类学和群体遗传学研究中该群体的遗传多态性数据。由于不同群体的OL等位基因存在基因座分布、等位基因数目及频率的一定差异,OL等位基因的分析将在提高案件准确性中发挥重要作用。