APP下载

东北三省汉族人群的遗传特征及族源推断研究

2020-05-15宋珊珊张志宏贾振军

关键词:东北三省基因座汉族

宋珊珊, 张志宏, 贾振军

(1.北京大学法学院, 北京 100871;2.厦门市公安局刑科所, 福建厦门 361000;3.中国人民公安大学侦查与刑事科学技术学院, 北京 100038)

0 引言

在当代中国,东北三省指辽宁省、吉林省和黑龙江省。三省由南向北排列,位于中国东北部,周围与朝鲜、俄罗斯、内蒙古自治区相邻,南接河北省,与山东省隔海相望。在古代,东北三省始终为少数民族的聚居地,在数百年的时间内,经历了明朝的军户、俘虏、自发迁徙,清朝柳条边解禁[1],以及建国后“北大荒”建设3次大规模的迁徙,东北三省最终成为了以汉族为主体,满族、蒙古族、朝鲜族、回族、达斡尔族、锡伯族、赫哲族、鄂伦春族、鄂温克族、柯尔克孜族等多个少数民族聚居的多民族聚居区。

本研究旨在分析东北三省汉族人群的遗传多态性,并探究中国东北部地区、华中部地区和西南部汉族以及少数民族人群的亲缘关系。因为参与比较的人群越多,被研究人群间的关系越接近实际[2],所以本研究也选择了韩国[3]和日本[4]两个人群来作为参照,以提高实验结果准确性。本研究选择了东北三省汉族,湖北[5]、湖南[6]、四川[7]、重庆[8]汉族,贵州苗族[9]、布依族[10]和侗族[11],云南彝族[12]、白族[13]、哈尼族[14]、纳西族[15],广西壮族[16],以及日本和韩国共15个人群,选取D8S1179、D21S11、D18S51、vWA、D3S1358、 FGA、TH01、D5S818、D13S317、 D7S820、CSF1PO、D16S539、TPOX、D2S1338、D19S433共15个STR基因座,对15个STR的等位基因频率进行主成分分析、遗传距离计算和多维尺度分析,以此来进行以上15个人群的族源研究。

1 材料和方法

1.1 样本制备

在获得书面知情同意的基础上,根据人群的固定性、变迁规律以及流动程度大小,本研究抽取了东北三省汉族人群无直接亲缘关系的326份常住人口血样卡。其中,辽宁省63份,吉林省107份,黑龙江省156份。

1.2 DNA提取及扩增

使用磁珠法配合Kingfish-Flex核酸提取仪提取血样卡上血迹的DNA。根据产品说明书,将PowerPlex@21 System荧光扩增试剂盒中的物质制成溶液,使用Biomek-4k工作站进行分液、移液等操作,使用扩增仪对原液进行扩增。

1.3 扩增产物的检测

使用ABI3130xL型遗传分析仪(美国 Applied Biosystems 公司 美国)对扩增产物进行毛细管电泳后,产生电泳文件。使用GeneMapper ID v3.2对电泳文件进行分析,以获取STR的基因分型。

1.4 统计学分析

利用Modified-Powerstates软件[17]计算得到17个STR基因座的个体识别参数:杂合度(Ho)、匹配概率(PM)、个体识别率(PD);亲权鉴定参数:多态信息含量(PIC)、非父排除率(PE)、父权指数(TPI);并通过x2检验其哈迪温伯格平衡(HWE)[18]。

1.5 15个人群的族源关系分析

基于15个STR基因座的等位基因频率,利用phylip-3.695软件计算各群体间遗传距离(Fst);利用IBM SPSS20.0 软件进行主成分分析(PCA)和多维尺度分析(MDS);利用Minitab16软件根据主成分和多维尺度分析结果绘制分析图。

2 结果

2.1 统计学结果分析

东北三省汉族人群的等位基因频率及法医学参数分别见表1和表2。

表1 东北三省汉族人群中17个STR基因座的等位基因频率(n=326)

续表1

续表1

东北三省汉族人群的17个基因座(D8S1179、D21S11、D18S51、vWA、D3S1358、FGA、TH01、D5S818、D13S317、D7S820、CSF1PO、D16S539、TPOX、D2S1338、D19S433、PENTA_D、PENTA_E)中共发现186个等位基因,等位基因个数最多的基因座是FGA和Penta-E,分别发现了20和18个等位基因。17个基因座的H值在0.582 6~0.905 0之间,PD值在0.805 8~0.980 5之间,PE值在0.270 5~0.805 6之间,PIC值在0.51~0.91之间。3个参数均是在TPOX处取得最低值,在Penta-E处取得最高值。累积个体识别率(CPD)为0.999 999 999 999 999 999 975 249 4,累积非父排除率(CPE)为0.999 999 82。HWE检测的P值为0.603~0.977 8,说明17个基因座均符合HWE平衡。

表2 东北三省汉族人群中17个STR基因座的法医学参数(n=326 )

Ho:观察杂合度,PM:匹配概率,PD:个人识别率,PIC:多态信息含量,PE:非父排除率,TPI:典型父权指数,p-HWE:Hardy-Weinberg的p值。

图1 主成分坐标图

2.2 东北三省汉族及其他14个人群的族源比对结果及分析

主成分分析结果如图1所示,第一成分占解释的总方差16.950%,第二成分占14.640%,第三成分占9.244%。第一成分和第二成分的坐标图如图1(A)所示,日本、云南哈尼族、贵州苗族与剩余12个人群相距较远,分布在散点图的外围。剩余12个人群中,贵州侗族、贵州布依族与广西壮族聚集在一起;所有的汉族和云南省除哈尼族以外的少数民族聚集在一起,东北三省汉族相对地位于聚集区的外围;韩国与汉族的人群没有明显区分开,且与之距离最近的为东北三省汉族。第一成分和第三成分的坐标图如图1(B)所示,与第一和第二成分的坐标图基本相似,不同之处在于贵州侗族、贵州布依族、广西壮族分布略微分散;湖北汉族不再位于汉族聚集区,而是距离其他人群均较远。

东北三省汉族人群与其他人群的遗传距离如表3所示,与东北三省汉族亲缘关系最近的为湖北汉族和云南白族,遗传距离分别为0.003 586和0.004 747,均小于0.005。湖北省距离东北三省距离较近且均为汉族,但云南位于中国的西南部,在研究对象中是距离东北三省最远的地区,且属于不同民族,云南白族却是除湖北汉族之外与东北三省汉族遗传距离最近的人群;湖南、四川、重庆的汉族,云南的纳西族和彝族以及韩国与东北三省汉族的遗传距离处于0.005~0.01之间,贵州侗族、布依族和云南的哈尼族与东北三省汉族的遗传距离处于0.01~0.02之间;贵州苗族、广西壮族和日本与东北三省汉族的遗传距离大于0.02。

表3 15个STR基因座在15个人群中的遗传距离

多维尺度的分析结果如图2所示,与主成分分析结果基本一致,不同之处在于,多维尺度分析结果中,贵州侗族与贵州布依族和广西壮族明显分离开,云南纳西族与云南白族、云南彝族和其他汉族明显分离开,这表明贵州侗族与贵州布依族和广西壮族有明显的遗传差异。同理,云南纳西族与本研究中云南省的其他少数民族和各汉族人群也有明显的遗传差异,遗传关系较为疏远。

图2 多维尺度分析图

3 结论

对东北三省汉族326名无关个体17个STR基因座的等位基因频率和法医学参数进行分析,发现17个基因座在法医学应用上均具有较高的效能,但也有明显差异。在17个基因座中等13个基因座的个体识别能力及遗传多态性较高,其中D18S51、FGA和PENTA_E 3个基因座尤为突出;剩余4个基因座中,D3S1358和CSF1PO中等,TH01和TPOX较低。

通过比较东北三省汉族与14个比较人群以及被研究人群以外的4个人群[19-22]的各基因座的等位基因,发现仅在目标人群的FGA上检出了等位基因19.3,在D3S1358上检出了等位基因21。由此可推测,这两个等位基因可能为东北三省汉族人群特有的等位基因。但由于样本总量少,两个等位基因19.3和21均只出现一次,不排除仪器误差和读数错误的可能,准确的结果需要更大的样本量来进行考证。

本研究对包含东北三省汉族在内的15个人群,对15个STR基因座的等位基因频率进行了主成分分析、遗传距离计算和多维尺度分析,将3者的结果进行综合分析,以期得出更加准确的结论。直观来看,同一民族的亲缘关系较近,如四川、湖北、湖南、重庆和东北三省的汉族,且一般地理位置越近,亲缘关系越近;同一地区的不同民族则有较大差异,如同样位于贵州省的少数民族,侗族和布依族群体遗传关系比较接近,而苗族与前述两个民族的遗传关系则较远,云南亦是如此,纳西族、白族、彝族3个民族的亲缘关系较近,哈尼族则与前述3个民族的关系较远;相距较远的不同民族之间也可能有较近的亲缘关系,如云南白族在遗传距离上是除湖北汉族之外距离东北三省汉族最近的人群,且云南白族、彝族、纳西族与各地区汉族的亲缘关系均较近。人群之间的遗传差异如何精确计算以及差异如何形成,地理位置距离较远的不同人群之间的遗传相似性又是何种原因,需要更多更深层次的研究来探索。

猜你喜欢

东北三省基因座汉族
国清荣
2003 年—2022 年东北三省地区生产总值及一般公共预算收支情况表
初中地理《东北三省》教学案例与反思
Study on Local Financial Supervision Right and Regulation Countermeasures
改成汉族的满族人
东北三省滑雪产业的空间拓展路径
DXS101基因座稀有等位基因的确认1例
临夏回族自治州撒拉族人群15个STR基因座遗传多态性
DYF387S1基因座分型异常现象
国家视野中的河湟汉族