SifaInDel 45plex 体系在我国汉族和蒙古族人群中的应用
2022-03-15杨光远袁春艳陶瑞旸夏若成王亚丽董新宇柴思雨吴黎明蒋志伟蒋婷婷陈开琴李成涛陈丽琴
杨光远,袁春艳,陶瑞旸,夏若成,王亚丽,董新宇,3,柴思雨,4,吴黎明,3,蒋志伟,5,蒋婷婷,6,陈开琴,4,李成涛,陈丽琴
1.内蒙古医科大学法医学教研室,内蒙古自治区 呼和浩特 010030;2.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063;3.山西医科大学法医学院,山西 太原 030001;4.遵义医科大学基础医学院,贵州 遵义 563000;5.温州医科大学基础医学院法医学系,浙江 温州 325035;6.南方医科大学法医学院,广东 广州 510515
STR 具有灵敏度高、操作简便、分型快速等优势,是目前法医物证鉴定中最常使用的遗传标记,被广泛用于个体识别和亲权鉴定[1]。然而,STR 也存在一定的局限性,其存在影子峰(stutter peak)、突变率较高、扩增片段长等缺点[2]。插入/缺失(insertion/deletion,InDel)和SNP 大多为二等位遗传标记,突变率低于STR[3],且扩增片段相对较短[4-5],一定数量InDel 和SNP 的复合检测可作为辅助工具弥补STR 检测的不足。其中,SNP 的检测方法复杂多样,在实验室间难以统一,不易于推广应用。相比之下,InDel适用于复合荧光多重PCR 联合毛细管电泳(capillary electrophoresis,CE)分型平台,易于在法医DNA 实验室推广应用。目前,已有研究针对不同群体设计了多重InDel 扩增体系并评估其法医学应用价值[6-14],其中,Investigator DIPplex试剂盒(德国Qiagen 公司)是应用较为广泛的商品化试剂盒,包含30 个常染色体InDel(autosomal-InDel,A-InDel)位点。然而,有研究[15-17]表明该体系中部分InDel 位点在我国人群中的多态性较低,如rs16438 和rs1305047 在我国汉族人群中的PIC 值分别为0.11 和0.14[15],低多态性位点的存在导致Investigator DIPplex试剂盒的应用受到限制。因此,为了建立一套适用于中国人群的高多态性InDel 扩增体系,本课题组前期研究[18]针对我国人群筛选出遗传多态性较高且数量更多的InDel 位点,构建了SifaInDel 45plex 体系,其中包括27 个A-InDel、16 个X 染色体InDel(X-InDel)和2 个Y 染色体InDel(Y-InDel)位点。
汉族是我国的主体民族,在我国呈现东密西疏的分布特点。汉族的语言通称汉语,属汉藏语系,是世界上历史最悠久、最丰富的语言之一。蒙古族则是我国传统的游牧民族,主要分布于内蒙古、新疆、甘肃等省份,其民族语言为蒙古语,属阿尔泰语系。根据2020 年第七次全国人口普查数据[19],汉族人口超过12亿,占全国总人口的91.11%,而蒙古族人口接近630万人,相较于2010,其人口增加200 万余,是我国人口较多的少数民族之一。本研究拟应用SifaInDel 45plex体系对我国江苏汉族和内蒙古蒙古族人群进行遗传多态性调查,并评估该体系的法医学应用效能,为其在法医DNA领域的应用积累人群数据。同时基于gnomAD 数据库[20]筛选获得东亚人、非洲及美国非洲裔人、美洲拉丁裔人、阿米什人、芬兰人、非芬兰欧洲人、犹太人与中东人8个洲际人群数据,探讨不同人群间的遗传关系。
1 材料与方法
1.1 样本
实验样本:本研究共采集398 例健康无关个体的外周血样本,其中,江苏汉族200 例、内蒙古蒙古族198 例。所有研究对象在采样前均签署知情同意书,该研究已获得司法鉴定科学研究院伦理委员会批准。
参考人群样本:东亚人、非洲及美国非洲裔人、美洲拉丁裔人、阿米什人、芬兰人、非芬兰欧洲人、犹太人与中东人8 个不同洲际人群数据选自gnomAD 数据库。
1.2 DNA 提取与定量
使用QIAamp DNA Blood Mini 试剂盒(德国Qiagen公司)进行DNA提取,具体操作参照试剂盒说明书。使用NanoDrop 2000 分光光度计(美国Thermo Fisher Scientific 公司)检测样本DNA 的浓度及纯度。
1.3 PCR 扩增
基于9700 型PCR 仪(美国Applied Biosystems 公司),使用SifaInDel 45plex 体系对DNA 样本进行扩增。PCR 扩增体系为10 μL,包括:2 μL 反应预混液,2 μL 引物混合物,2 μL DNA 模板(1 ng/μL),4 μL 去离子水。扩增条件:95 ℃ 5 min;94 ℃ 30 s,58 ℃ 1 min,70 ℃ 1 min,30 个循环;60 ℃ 60 min;4 ℃保存。
1.4 电泳与分型
PCR产物在3130xl基因分析仪(美国Applied Biosystems 公司)上进行毛细管电泳,使用GeneMapperTMIDv3.2.1 软件(美国Thermo Fisher Scientific 公司)对电泳原始数据进行分析。
1.5 统计学分析
使用Arlequin v3.5.2 软件[21]检验Hardy-Weinberg平衡并进行连锁不平衡分析。运用Microsoft Office Excel 软件分别统 计27 个A-InDel 和16 个X-InDel 位点的等位基因频率、Ho、He、DP、CDP、PIC、PE、CPE、MEC、CMEC等群体遗传学参数。27个A-InDel位点在2 个研究人群中的群体遗传学参数根据《亲权鉴定技术规范》(GB/T 37223—2018)计算。16 个X-InDel 位点在2 个研究人群男性群体和女性群体中的群体遗传学参数依据文献[22-23]公式进行计算。使用Arlequin v3.5.2 软件计算2 个研究人群和8 个参考人群间的Fst遗传距离,根据遗传距离矩阵分别应用MEGA 11软件[24]和SPSS 25.0 软件(美国IBM 公司)构建系统发育树与多维尺度(multidimensional scaling,MDS)分析图。
2 结果
2.1 Hardy-Weinberg 平衡和连锁不平衡分析
Hardy-Weinberg平衡检验结果显示,经Bonferroni校正后27 个A-InDel 位点在2 个研究人群中均符合Hardy-Weinberg 平衡(P>0.001 9),且16 个X-InDel 位点在2 个研究人群中均符合Hardy-Weinberg 平衡(P>0.003 1)。连锁不平衡检验结果显示,所有位点间均不存在连锁不平衡现象,即27 个A-InDel 和16 个XInDel位点在2 个研究人群中可视为彼此独立遗传。
2.2 等位基因频率分布
27 个A-InDel 位点在2 个研究人群中的缺失等位基因频率:在江苏汉族为0.240 0(rs2307783)~0.697 5(rs66850318),在内蒙古蒙古族 为0.219 7(rs2308232)~0.669 2(rs2307805)。
16 个X-InDel 位点在2 个研究人群中的缺失等位基因频率:在江苏汉族为0.116 7(rs36208458)~0.896 7(rs200177947),在内蒙古蒙古族为0.132 1(rs36208458)~0.906 1(rs200177947)。
2.3 群体遗传学参数
27 个A-InDel 位点在江苏汉族和内蒙古蒙古族人群中的群体遗传学参数见表1。其中,PIC 分别为0.298 3(rs2307783)~0.374 9(rs35248926)和0.284 1(rs2308232)~0.375 0(rs35248926、rs3837647),CDP分别为0.999 999 999 982 175和0.999 999 999 986 552,CPEtrio分别为0.991 449 541 和0.997 986 006,CPEduo为0.953 418 308 和0.955 381 659。
表1 27 个A-InDel位点在2 个研究人群中的群体遗传学参数Tab.1 Population genetic parameters of 27 A-InDels in two studied populations
16 个X-InDel 位点在江苏汉族和内蒙古蒙古族人群中的群体遗传学参数见表2。其中,PIC 分别 为0.168 1(rs200177947)~0.374 9(rs66554185)和0.155 7(rs200177947)~0.374 6(rs72513349),CMECtrio分别 为0.998 018 512 和0.998 243 638,CMECduo分 别为0.974 854 830 和0.976 907 303。在2 个研究人群的女性群体中,CDPfemale分别为0.999 997 962 和0.999 998 389;男性群体中,CDPmale为0.999 818 940和0.999 856 063。
表2 16 个X-InDel位点在2 个研究人群中的群体遗传学参数Tab.2 Population genetic parameters of 16 X-InDels in two studied populations
此外,2 个Y-InDel 位点在所有男性群体中均被检出,在所有女性群体中均未被检出。
2.4 10个人群间的遗传距离与系统发育树的构建
根据10 个人群27 个A-InDel 位点的等位基因频率,使用Arlequin v3.5.2软件计算得到Fst遗传距离,结果显示,江苏汉族、内蒙古蒙古族和东亚人群间Fst遗传距离较近(0.000 06~0.000 27),以上3 个人群与其他7个洲际人群间Fst遗传距离较远(0.001 82~0.004 62)。
为了更加直观地反映不同人群间的遗传关系,基于人群间的遗传距离矩阵构建了系统发育树(图1)与MDS 分析图(图2)。系统发育树显示:10 个人群共分为两大主支;本研究中的汉族、蒙古族和东亚人群为一支,且汉族与蒙古族人群进一步聚为同一分支;7 个洲际人群聚为一支,其中3 个欧洲人群、2 个西亚人群、1 个美洲人群以及1 个非洲人群分别位于独立分支。MDS 分析图中,汉族、蒙古族和东亚人群聚集在右上方;除非洲外的6 个洲际人群分布在右下方,非洲人群则位于左下方。
图1 10 个人群间的系统发育树Fig.1 Phylogenetic tree of 10 populations
图2 10 个人群间的MDS 分析图Fig.2 MDS analysis diagram of 10 populations
3 讨论
InDel是一种二等位基因遗传标记,广泛存在于人类基因组中,兼具STR 与SNP 的优点,可用于群体遗传学领域,其中包括探寻祖先遗传信息、分析群体的遗传学结构等[25]。本研究使用自主研发的SifaInDel 45plex 体系对我国江苏汉族和内蒙古蒙古族共398 名无关个体进行遗传多态性调查,并基于其27 个AInDel 位点分析上述2 个研究人群与其他8 个参考人群间的遗传关系。
在江苏汉族和内蒙古蒙古族人群中,27个A-InDel和16 个X-InDel 位点的分布均符合Hardy-Weinberg平衡,位点间均不存在连锁不平衡现象。CPE、MEC和CDP 是法医学应用领域常用的评估指标,在本研究中,27 个A-InDel 位点的CDP 均高于0.999 999 999 9,说明该试剂盒可用于江苏汉族与内蒙古蒙古族人群的法医学个体识别。但CPEtrio在2 个研究人群中均小于0.999 9,不建议单独应用于亲权鉴定,可作为常规STR 分型试剂盒的有效补充。相比于以往的检测体系[10,26-28],SifaInDel 45plex体系同时包含了27个AInDel、16 个X-InDel 和2 个Y-InDel 位点,可获得更多的遗传信息,并能够有效地提高性染色体的识别度,为复杂亲缘关系鉴定提供有效的遗传信息。该体系的不足之处在于CPE 值较低,无法独立应用于亲权鉴定,在后续优化过程中,可将该体系中部分InDel 位点进行替换以提高该体系的系统效能。
不同民族人群的遗传标记分布存在差异,这对全面了解各人群的遗传多态性和相互遗传关系具有重大意义。研究InDel 位点在不同人群间的遗传学数据,可促进其在法医学实践中的应用。本研究选取了10 个具有代表性的人群,包括1 个中国江苏汉族人群、1 个中国内蒙古蒙古族人群以及8 个洲际人群。其中,江苏汉族人群主要分布在我国华东地区,内蒙古蒙古族人群主要分布在我国西北地区,其他8 个参考人群则分布在不同洲际。江苏汉族、内蒙古蒙古族与东亚人群的地理位置分布较近,与其他7 个洲际人群地理距离较远,将遗传关系与地理分布信息相结合,有助于加深对不同地区、不同民族间遗传关系和遗传背景的理解。基于27 个A-InDel 位点的等位基因频率计算得到10 个人群间的遗传距离矩阵,其结果显示,我国江苏汉族、内蒙古蒙古族以及东亚人群间遗传距离较近,与其他7 个洲际人群间遗传距离较远。为了进一步明确人群间的遗传关系,本研究根据遗传距离矩阵构建了系统发育树和MDS 分析图。系统发育树显示,10 个人群分为2 个主支,第一主支由我国江苏汉族、内蒙古蒙古族以及东亚人群构成。本研究中东亚参考人群包含除我国外的其他东亚地区人群,如韩国人群、日本人群等,包含样本数量多且分布范围较广。也就是说,第一主支中遗传关系较近的3 个人群均分布在东亚地区。因此,本研究进一步从分子遗传学角度证实,地理位置相近的民族可能会有更多的基因交流,从而具有较近的遗传关系。第二主支由其他7 个洲际参考人群构成,其中3 个欧洲人群、2 个西亚人群、1 个美洲人群以及1 个非洲人群进一步形成各自分支。MDS 分析图显示,本研究中江苏汉族、内蒙古蒙古族与东亚人群聚在一起,遗传关系较近,且与其他洲际人群的遗传关系较远。上述遗传距离矩阵、系统发育树和MDS 分析图所反映的遗传关系远近与历史文化背景及地域分布等较为吻合,江苏汉族、内蒙古蒙古族与地理位置分布近的东亚参考人群具有较近的遗传关系,与地理位置相隔远的其他洲际人群的遗传关系较远,这也间接表明地域隔离对人群间遗传背景的影响,从而形成了独特的地域遗传差异。本研究结果与既往研究[29-30]结果基本一致。
综上所述,本研究应用SifaInDel 45plex 体系对我国江苏汉族和内蒙古蒙古族共398 名无关个体进行了遗传多态性调查,获得了人群的等位基因频率以及PIC、CDP、CPE 等群体遗传学数据,并与不同洲际人群进行了遗传关系分析。结果表明,SifaInDel 45plex体系包含的InDel 位点在2 个研究人群中有较好的多态性和鉴别能力,并能够区分不同洲际人群。本研究获得了2 个研究人群45 个InDel 位点的基因分型数据及等位基因频率等信息,丰富了中国人群InDel 数据库,也为法医学应用及群体遗传研究提供了数据支持。