东亚族群中Y染色体D-M174单倍群的遗传多态性
2019-07-12钱恩芳邓盼黄美莎马泉赵慧李彩霞黄江江丽
钱恩芳 ,邓盼 ,黄美莎 ,马泉 ,赵慧 ,李彩霞 ,黄江 ,江丽
(1.贵州医科大学法医学院,贵州 贵阳 550004;2.公安部物证鉴定中心 法医遗传学公安部重点实验室北京市现场物证检验工程技术研究中心 现场物证溯源技术国家工程实验室,北京 100038;3.株洲市公安局,湖南 株洲 412007;4.山西医科大学法医学院,山西 太原 030001)
Y染色体为男性特有的性染色体,约95%区域为非重组区,呈父系遗传[1]。单核苷酸多态性(single nucleotide polymorphism,SNP)为二等位基因遗传标记,突变率较短串联重复(short tandem repeat,STR)序列低,回复突变和二次突变少,具有较高的遗传稳定性。Y染色体SNP(Y-SNP)在族群地理中的分布具有特异性,在不同族群和不同地区范围内具有特有的谱系分布,是研究人类父系迁移及进化的理想遗传标记[2-4]。Y染色体D-M174单倍群是从非洲的YAP+位点分化出来的,主要分布在安达曼岛、中国西藏和日本[5-8]。目前法医学领域常用的祖先信息遗传标记大多位于常染色体上,可区分的族群为3~10个,在东亚族群及混合族群中分辨力不足[9-14]。Y染色体单倍群的族群地理特异性可为男性生物样本的族群地理来源推测提供更多生物信息[15-16]。本研究观察了Y染色体D-M174单倍群及下游分支D1-CTS11577、D1a-F6251、D1a1-M15、D1a2-P99、D1b-M64.1 和 D2-L1378共7个Y染色体单倍群在东亚22个族群中的遗传分布特点,同时对共享单倍群内个体的Y染色体STR(Y-STR)进行检测和分析。本研究将进一步揭示Y染色体D单倍群及其下游分支在东亚人群中的分布特征,为法医学应用及群体遗传学等提供基础数据。
1 材料与方法
1.1 样本信息
本研究的群体样本包括22个东亚族群、1个欧洲族群、1个非洲族群,共1426例无关男性个体(表1)。所有样本对象均签署知情同意书。本研究已通过公安部物证鉴定中心伦理委员会的审查批准。
1~20号群体样本为静脉血,DNA提取采用QIAamp®DNA Blood Mini试剂盒(德国Qiagen公司)。21~24号群体样本为细胞系,提取后DNA使用NanoDrop 2000c分光光度计(美国Thermo Scientific公司)进行定量。
表1 24个群体样本信息
1.2 分型方法
1.2.1 Y-SNP遗传标记
选取的位点为2017版Y染色体谱系树(YCC:https://isogg.org/)上主要D单倍群及主要的下游分支,包括M174、CTS11577、F6251、M15、M64.1、P99、L1378。7个Y-SNP单倍群构成的谱系树见图1。PCR扩增引物和延伸引物用Primer Premier5.0软件设计,由生工生物工程(上海)股份有限公司合成。
图1 D-M174单倍群谱系树
采用Applied BiosystemsTMSNaPshotTMMultiplex试剂盒(美国AB公司)对样本在7个Y-SNP位点上的分型进行检测,检测方法见文献[17]。使用Mastercycler®Pro梯度PCR扩增仪(德国Eppendorf公司)进行PCR扩增,使用3130xl基因分析仪(美国AB公司)进行毛细管电泳检测。利用GeneMapperIDv3.2软件(美国Thermo Fisher Scientific公司)分析分型结果。
1.2.2 Y-STR遗传标记
采用DNATyperTMY26 PCR试剂盒[18](公安部物证鉴定中心)检测样本在22个Y-STR基因座(DYS19、DYS389Ⅰ、DYS389Ⅱ、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS439、DYS444、DYS447、DYS448、DYS456、DYS458、DYS460、DYS508、DYS522、DYS533、DYS617、DYS635和GATA-H4)上的分型。使用Mastercycler®Pro梯度PCR扩增仪进行PCR扩增,使用3130xl基因分析仪进行毛细管电泳检测。利用GeneMapperIDv3.2软件(美国Thermo Fisher Scientific公司)分析分型结果。
1.3 数据处理
基于图1谱系树,根据各样本在7个Y-SNP位点上的分型判断其所属单倍群类别,用直接计数法统计各单倍群频率。根据单倍群频率分布,使用R v3.2.3软件绘制热图,进行聚类分析。根据22个Y-STR基因座的等位基因频率,使用PHYLIP v3.65构建系统进化树。对共享Y-SNP单倍群的个体,使用Network v5.022软件(英国Fluxus Technology公司)绘制网络图。
2 结 果
2.1 D单倍群在族群间的分布
根据国际Y染色体协会的命名法则,7个Y-SNP位点共组成7种单倍群(图1)。在24个族群中共检测出5种单倍群,未见D1*和D2单倍群的分布(图2)。在非洲黑人和欧洲白人中未发现D*及其下游单倍群的分布。在东亚族群中,单倍群D-M174在西藏藏族人中的频率达到40.96%,在日本人中的频率为35.71%,在四川西昌彝族人中有17.86%的分布,青海土族人中有11.86%的分布,而在余下的群体中分布频率更低(均低于8%)。D单倍群的下游分支在东亚不同族群中的分布频率有明显差异。单倍群D1a1-M15散布于以藏族(10.26%)为主的东亚族群中。单倍群D1a2-P99在藏族中检测频率最高(26.92%),而在其他群体中零星分布。除了在藏族中检测到1例,单倍群D1b-M64.1只分布在日本(28.57%)。
图2 24个群体Y-SNP单倍群分布热图
从图2左侧的系谱树可以看出:西藏藏族人和日本人在D单倍群上高频分布而聚为一支,但是西藏藏族人在D1a2单倍群上高频分布,日本人在D1b单倍群上高频分布,因而各自聚为一小类支;青海裕固族人、广西京族人、青海土族人、四川西昌彝族人在D单倍群上有较高频率分布而聚为一类支;广西侗族人、河南汉族人、新疆回族人、新疆维吾尔人、青海撒拉族人、新疆哈萨克族人、非洲黑人、韩国人、青海回族人、欧洲白人、广西壮族人、广西瑶族人、云南佤族人、新疆塔吉克族人、广西苗族人、五峰汉族人、广西汉族人、青海汉族人在D单倍群上低频分布或无分布而聚为一大类支。
2.2 族群系统进化关系
基于24个族群在22个Y-STR基因座上的等位基因频率构建系统进化树(图3),以非洲黑人为进化树的根节点,24个族群主要分为两类:一类为新疆塔吉克族人、欧洲白人、新疆维吾尔族人、青海撒拉族人、新疆回族人;另一类为余下18个族群聚为一大类,其中西藏藏族人和四川西昌彝族人聚为一小类,日本人和韩国人聚为一小类。
图3 24个族群系统进化树
2.3 D单倍群分支遗传关系网络图分析
应用邻接法对Y染色体单倍群D1-CTS11577、D1a-F6251、D1a1-M15、D1a2-P99、D1b-M64.1分别绘制网络图(图4),进一步分析D单倍群在东亚族群的遗传关系。结果显示,在D1-CTS11577单倍群下,西藏藏族人相对紧密聚类位于网络图的中心,日本人紧密聚为一大类。其他有D单倍群的族群散在分布于藏族族群周边位置。在下游分支单倍群中,D1a2-P99单倍群西藏藏族人分布最多,D1b-M64.1单倍群基本上是日本人分布,仅有1例是西藏藏族人。D1a1单倍群则是各个不同族群所共享的单倍群,西藏藏族人和四川彝族人频率较高,分别为10.26%和12.5%,其他民族频率较低(<7%)。
图4 Y染色体单倍群D1-CTS11577、D1a-F6251、D1a1-M15、D1a2-P99、D1b-M64.1的Y-STR网络图
3 讨 论
单倍群D是从非洲YAP插入单倍群衍生出来的[19],在全球的分布具有明显的地域特异性。D-M174单倍群高频分布于东亚,主要分布于西藏藏族人和日本人(30%~40%),在东亚其他族群、东亚周边(中亚、北亚、中东)族群等罕见,分布频率通常低于5%[20]。
本研究中D单倍群在藏族和日本高频分布,分别为40.96%和35.71%。在东亚其他族群中有低频分布或没有分布,研究结果与以往文献[6]报道一致。D单倍群的下游分支在不同族群中的分布频率不同。D1-M15(现已更名为D1a1-M15)在青海藏族人、西藏藏族人、四川凉山彝族人、云南彝族人中广泛分布,在东亚其他群体中也有低频分布[21]。D1a1-M15广泛分布于西藏藏族人、四川西昌彝族人、广西京族人、青海裕固族人,低频分布于河南汉族、青海土族、广西侗族、新疆回族和日本族群中。本研究结果发现,D1a2高频分布于西藏藏族人,同时在其他东亚族群中低频分布,印证了既往研究结果[22-23],即D1a2-P99下游分支P47位点突变仅在藏缅族群中出现。日本人主要是M55、M57、M64等突变位点界定的单倍群[22],是上古绳文人的主要成分[6]。本研究中,D1b-M64.1单倍群除了在西藏藏族人群中检测到1例外,都分布在日本人中,频率达到28.57%。但是,文献报道[24]与M64.1平行的M57、M55、P37.1位点仅在日本人中检测到,在日本人以外的地区非常罕见,这可能是样本量少或近期基因流动所致。单倍群D1a2-P99和D1b-M64.1的分布具有较强的族群特异性。
Y-SNP突变率较低,遗传稳定性高,包含更多关于群体的历史信息,可反映人类父系的遗传特征,并追溯久远的历史进化事件,而Y-STR突变率较高,可反映起源相同群体近期基因交流。例如,西藏藏族人与日本人的D单倍群频率的族群聚类结果(图2)与Y-STR频率数据的系统发育树聚类结果(图3)基本一致,系统发育树将亚族群进一步细分和聚类。西藏藏族人和四川西昌彝族人的D单倍型聚类结果与YSTR系统发育树聚类结果不一致,D单倍群聚类中西藏藏族人和四川西昌彝族人分别聚类,表明历史上两族群由于交通闭塞、不通婚等因素各自进化;而在进化树中聚在一起,可能在人类社会发展中,族群间迁徙、通婚等动态变化过程可能会影响族群间遗传成分。遗传关系网络图聚类结果也表明,各个单倍群下游的样本间呈现以同一族群小范围内聚集的现象,表明在一定范围内,同一族群内的样本间遗传关系更为密切。遗传关系较近的族群间,样本分布呈现相互交叉的情况,表明可能在历史上存在一定的基因交流。遗传关系较远的族群间交叉的情况较少。
基于Y-SNP单倍群及其下游分支在世界人群中的地域分布特点,通过检测Y染色体单倍群可推测样本的父系族群来源。BRIÓN等[16]用Y-SNP分型方法预测男性地理来源,能区分世界范围内主要地区的人群,认为推断未知样本的种族地域来源在刑事案件调查阶段具有巨大的价值。Y-SNP单倍群的下游细小分支在小范围内具有明显的地域差异性,可为法庭提供科学证据[25-26]。D单倍群在东亚族群中具有明显的族群地域分布特征,高频分布于西藏藏族人(40.96%)和日本人(35.71%),在平原汉族中分布低(<3%),其中26.92%藏族人主要为D1a2-P99亚单倍群,28.57%日本人主要为D1b-M64.1亚单倍群。目前,洲际人群推断技术已非常成熟[12,14,27-28],D 单倍群的族群特异性分布特征为进一步细分东亚亚人群提供了新的视角,可进一步完善法医SNP族群地域推断体系,为刑事案件侦查提供科学依据。值得注意的是,O单倍群在东亚族群中均占相当一部分比例[22,29],未来可采集更多不同地域典型族群样本,并对该单倍群及其下游分支进行更细分的研究。此外,Y-SNP只是从父系的遗传上进行族群地域的推断,缺乏母系的遗传信息。有学者[30]提出,将Y染色体、常染色体和线粒体进行综合分析,能够获得更加准确的祖先地域推断。下一步,我们将结合常染色体及线粒体DNA遗传信息进行相关研究,得到更为完善的推断证据,该技术方法在东亚人群及混合人群的族群地域推断中具有潜在应用价值。