APP下载

基于全基因组SNP标记分析中国地方鸡品种的遗传多样性和种群结构

2023-02-27高超群曹然然杜文苹胡晓玉雷艳茹李文婷康相涛

畜牧兽医学报 2023年2期
关键词:三黄鸡斗鸡茶花

高超群,曹然然,杜文苹,胡晓玉,雷艳茹,李文婷,康相涛

(1.河南农业大学动物科技学院,郑州 450046; 2.河南省鸡种质资源创新与利用重点实验室, 郑州 450046)

家鸡是人类驯化较早的家禽,不仅是人类优质蛋白质的主要来源,而且与人类文化生活也有着密切的联系,从古至今被用于祭祀、娱乐或观赏等[1-2]。中国作为可能的家鸡起源地之一,地理和文化多样性丰富且幅员辽阔[3-5],是世界上鸡遗传资源最丰富的国家之一[6]。2021年公布的《国家畜禽遗传资源品种名录》中地方鸡品种达到115个。中国地方鸡在经历几千年的自然和人工选择下已形成了纷繁、各具特色品种众多的群体,积累了相当丰富的遗传变异和表型多样性[7]。清楚地研究和理解种群之间和种群内部的多样性及种群结构对于有效管理遗传资源至关重要[8]。

此前,中国地方鸡遗传多样性与种群结构的研究主要使用微卫星标记[9-11],其在非洲[12]、孟加拉国[13]、印度尼西亚[14]等国的地方鸡及商业品种[15-16]的遗传多样性研究中被广泛使用,研究结果对地方品种的保护以及揭示品种起源、育种历史提供了参考。但微卫星标记对于新物种开发微卫星位点时随机性大,利用其检测多态性耗时耗力,因此具有一定的局限性[17]。近年来,NGS测序及基因分型芯片的快速发展极大的推进了更加精细、快速、且低成本的全基因组SNP标记分析。Zhang等[18]利用全基因组SNP标记分析了中国地方鸡的种群多样性及斗鸡的选择特征;Cendron等[19]利用SNP标记对意大利地方鸡品种多样性以及种群结构进行了详细的分析,在其他物种如羊[20]、牛[21]、猪[22]、马[23]等的研究中基于全基因SNP标记对其遗传多样性、种群结构以及育种起源历史进行了比较系统的研究。因此,本研究使用全基因组SNP标记,分析中国地方鸡品种的遗传多样性、群体结构、亲缘关系、ROH,为设计和实施遗传资源保护策略提供参考。

1 材料与方法

1.1 样本来源

本研究选取Synergistic Plant and Animal(SYNBREED, www.synbreed.tum.de)项目部分数据。SYNBREED 项目从全球范围鸡群体中广泛收集了脱氧核糖核酸 (DNA) 样本,本研究从中选取了18只白耳黄鸡(Baier)、19只茶花鸡(Chahua)、20只河南斗鸡(Fighting)、20只固始鸡(Gushi)、20只狼山鸡(Langshan)、20只皖南三黄鸡(WanTy)、20只泰和乌骨鸡(Wugu)以及20只萧山鸡(Xiaoshan)等8个中国地方鸡品种,共157只地方鸡个体及80只白壳蛋鸡系(WL)、73只褐色蛋鸡系(BL)和80只肉鸡系(BR)共233只商品鸡个体构建新的数据集。

1.2 基因分型

使用 Affymetrix®AxiomTM600 K全基因组鸡基因分型芯片对 DNA 样本进行基因分型,基因分型在慕尼黑工业大学 (Prof. R. Fries) 进行,Affymetrix®AxiomTM600 K全基因组鸡基因分型芯片 包含超过580K个SNPs[24]。使用参考基因组Gallus_gallus-5.0[25]注释了 579 621 个 SNPs。

1.3 数据过滤

首先删除了重复、注释不明确及性染色体的27 427个SNPs,之后使用PLINK 1.9[26]进行过滤:1) ≥95% 的个体检出率;2) ≥99%的SNP 检出率,共保留443 352个SNPs的数据进行后续分析。最后使用PLINK基于连锁不平衡进行过滤,窗口大小、步长及r2的参数分别为“50、5、0.2”,通过过滤的157 968个SNPs用于种群结构的分析。

1.4 数据分析

1.4.1 遗传多样性指数 使用PLINK 估计观测杂合度(observed heterozygosity,Ho)和期望杂合度(expected heterozygosity,He)、次等位基因频率(minor allele frequency, MAF)以及基于观测和期望纯合基因型数量之间的差异估计的基因组近交系数(FHOM)。每个品种中个体的He和Ho估计值是所有 SNPs 的平均值。使用VCFtools[27]进行种群核苷酸多样性计算,以上多种指数可以反映种群的遗传多样性。

1.4.2 群体结构、亲缘关系及ROH 使用PLINK基于Bayesian model用于主成分分析(principal component analysis, PCA)、地方鸡和商品鸡组合数据集多维尺度缩放(MDS)分析及构建遗传距离矩阵和全基因组的状态同源(identity by State, IBS)距离矩阵,使用MEGAX (https://www.megasoftware.net/) 邻接法构建系统发育树(phylogenetic tree),参数设置为引导复制1 000次,通过iTol(https://itol.embl.de/)注释可视化。使用 ADMIXTURE 1.3[28]分析种群的相关性,设置了K=2~10的数据集。R语言Hierfstat包用于计算所有品种成对群体分化指数(Fst),估计种群间遗传分化,根据Fst值将遗传分化分为4个水平:低(<0.05)、中(0.05~0.15)、高(0.15~0.25)和极高(>0.25)[29]。使用PLINK检测长纯合片段(runs of Homogeneity,ROH),基因组近交系数(FROH)等于基因组中ROH片段的总长度占常基因组总长度(944 270 kb)的比例,每个ROH根据其物理长度分类如下:1~2、2~4、4~8、8~16和≥16 Mb[30-32]。

2 结 果

2.1 种群内遗传多样性

遗传多样性指标如表1所示,皖南三黄鸡的期望杂合度(He, 0.314)、观测杂合度(Ho, 0.321)及次等位基因频率(MAF, 0.236)最高,斗鸡的最低(He, 0.239;Ho, 0.260;MAF, 0.175),所有品种的Ho均高于He,表明各品种遗传多样性均较为丰富;斗鸡的平均FHOM最高(0.205),其次是固始鸡(0.184)与乌骨鸡(0.180),狼山鸡(0.018)与皖南三黄鸡(0.017)的FHOM最低。核苷酸多样性结果见图1,其变化趋势与MAF值基本一致,皖南三黄鸡具有最高的核苷酸多样性,斗鸡最低。

表1 家鸡品种遗传多样性指数

图1 不同鸡种的核苷酸多样性

2.2 群体结构与亲缘关系

2.2.1 群体结构 本研究利用邻接法构建了种群之间的系统发育树,并对样本和品种进行注释(图2A),不同品种分布在不同的分支上,充分展示了品种间的集群和关系。皖南三黄鸡的分支最短,而茶花鸡的分支最长,其中有一只离群的乌骨鸡出现在了萧山鸡的分支旁。

主成分分析(PCA)显示前两个主成分的贡献率: PC1(18.59%)和PC2(15.27%)。来自8个品种的个体清楚地分为5个亚群(图2B),其中茶花鸡、固始鸡、斗鸡以及狼山鸡为独立的种群。在PC1上斗鸡、固始及狼山鸡距离较近,与进化树分析结果基本一致。进一步利用组合数据集进行MDS分析(图2C),虽然地方鸡种整体相对与商业肉鸡品种(BR)更加接近,但也呈现出不同的分层,在地方品种中,茶花鸡和萧山鸡更接近商业肉鸡品种。

图2 家鸡群体系统发育树(A)、PCA(B)及MDS(C)分析图

通过Admixture分析(图3)计算了从2到10个潜在集群(K)的范围,由图3A可知,总样本中存在的最佳拟合种群数量是K=7。K=2(图3B)时,茶花鸡首先分离出来;K=3时,斗鸡与固始鸡分离出来;K=4时,狼山鸡分离,K=5时白耳黄鸡与乌骨鸡分离出来;K=6时萧山鸡分离出来。有趣的是在最小误差K=7时皖南三黄鸡血统也是其他几种品种之间的混合,直到K=8时,皖南三黄鸡才分离出来。事实上,当K=8时也更符合现实的分群,其误差也仅次于K=7(图3A),表明皖南三黄鸡的血统比较杂合,这与其上述遗传多样性研究结果相一致。

图3 K值最佳路线图(A) 和群体结构图(B)

2.2.2 亲缘关系 所有品种对之间的遗传分化程度见图4A,这些结果与 PCA分析结果一致。Fst值范围从0.09(皖南三黄鸡和狼山鸡)到 0.22(茶花鸡和狼山鸡),皖南三黄鸡与其他品种的Fst值最低在0.09~0.14之间,茶花鸡的最高在0.14~0.22之间。

品种之间和品种内部个体的IBS遗传距离见图4B,群体的IBS遗传距离在0.092 9~0.319 9之间,平均为0.277 4。品种间的IBS遗传距离较远,但也存在一定程度的亲缘关系(图4B中颜色较浅的方格);其中茶花鸡与其他品种之间遗传距离较远,这与PCA结果一致。部分斗鸡个体间的IBS遗传距离较近(图4B中颜色较浅的方格),皖南三黄鸡个体之间遗传距离都较远。

图4 所有品种成对基因频率分化指数Fst (A),IBS距离矩阵可视化热图(B)

2.3 ROH分析

ROH分析共得到524 2个ROH片段,长度分布在1~41.51 Mb之间。ROH的长度和数量被认为与物种的近交程度呈正相关,其中长的ROH片段被认为是近世代近交繁殖的结果,而较短的ROH可能表明更远的祖先效应[33-34]。如图5A表示,狼山鸡1~2 Mb长度的ROH占比70.95%,未检测到大于16 Mb长度的ROH;其次在皖南三黄鸡1~2 Mb长度的ROH占群体的64.84%,同样未检测到大于16 Mb的ROH;茶花鸡8~16 Mb与大于16 Mb的ROH分别占比5.14%、0.96%。基于每个个体内ROH总数量与长度的分布(图5B)可以清楚地看到,皖南三黄鸡和狼山鸡中ROH的数量和长度均低于其他品种。目前,基于ROH 的近交系数估(FROH) 被认为是检测近亲繁殖的最有效方法之一[35],茶花鸡品种的近交平均值最高(图5C最上方数字),其次是固始鸡和斗鸡。皖南三黄鸡的近交平均值最低,其次为狼山鸡,个体中FROH最高极值出现在斗鸡群体中(FROH=0.277)。

图5 各个品种中不同长度ROH统计(A), 各个品种个体ROH数量与总长度(B)及各个品种FROH (C)

3 讨 论

在现代化的动物遗传育种进程中,优良畜禽品种经历了短期高强度的人工选择,其在改善畜禽生产性能的同时不可避免造成群体的近交[36]。近交会造成近交衰退及群体遗传多样性降低等危害,因此评估畜牧群体遗传多样性[23],了解品种间的关系和种群结构对于保证农牧业生产可持续发展具有重要意义[19]。本研究基于高密度全基因组 SNP 芯片使用多种方法估计了遗传多样性指数和基因组近交系数,以此评估品种内的遗传多样性水平。所研究的地方品种群体平均观测杂合度均高于平均期望杂合度,表明地方鸡遗传多样性较高,这与先前报道一致[18]。FHOM分析结果表明,家鸡品种中皖南三黄鸡和狼山鸡近交程度较低,斗鸡与茶花鸡近交程度较高。同时观察到皖南三黄鸡和狼山鸡品种的遗传多样性最为丰富,皖南三黄鸡目前并未处于国家级保护计划之中,这应与其原产地有关[37]。处于保护计划之中的狼山鸡遗传多样性高于其他3个保护品种,这也与Zhang 等[38]的研究结果一致。

基于 PCA、进化树及Admixture对种群结构分析结果表明,每个品种的个体聚集在一起并表现出一致的遗传背景,在地方鸡与商品鸡进行MDS分析的结果中,商业品种与中国地方品种明显区分开来,但整体上地方鸡与商业肉鸡品种相对更加接近,这也符合肉鸡系的育种历史[39],表明了地方品种的肉用育种潜力。使用群体分化指数Fst和IBS遗传距离评估种群间与种群内的亲缘关系,结果表明,不同方法评估 8个品种之间的相对关系也相一致,其中斗鸡部分个体间的IBS遗传距离较近,说明其存在较高的亲缘关系以及较大的近交风险,可能需要改进选配措施,而皖南三黄鸡个体之间遗传距离都较远,这与多样性研究结果一致。

ROH 分析有利于实施品种保护计划[23],全基因组SNP特别适合检测杂合性降低的基因组区域[40],由此计算而来的FROH被认为是检测近亲繁殖的最有效方法之一,其准确性已在牛[41]、猪[42]和山羊[43]中得到证实。ROH的长度和数量与群体历史信息的多个方面有关[18,44-45]。近交水平越高,基因组中ROH的数量和长度越大,因此根据结果,茶花鸡、固始鸡以及斗鸡可能经历过较高强度近交繁殖。

4 结 论

本研究表明,地方鸡遗传资源多样性整体较为丰富。斗鸡和茶花鸡品种的遗传多样性低于其他品种,狼山鸡与皖南三黄鸡的遗传多样性更加丰富,基因组近交系数和ROH分析表明茶花鸡、固始鸡以及斗鸡近交程度相对过高,不同品种间出现了中高等群体分化且整体与商业肉鸡品种更为接近。了解品种间分化程度与亲缘关系是支持保护计划工作的重要因素,帮助制定有针对性的交配计划,以保护最濒危的品种以及支持育种、遗传资源开发与利用工作。

猜你喜欢

三黄鸡斗鸡茶花
三黄鸡疫病防疫技术要点
我眼中的茶花
原来“再接再厉”说的是斗鸡
茶花
美丽的茶花
三黄鸡果园、山地相结合的放养技术探讨
鸡年娱乐话斗鸡
◆专利名称:一种三黄鸡用微量元素添加剂
NO.9 斗鸡
茶花泉探景