基于SNP芯片撒坝猪保种群体的遗传结构分析
2022-09-08刘艺端许文坤孙利民
邓 俊, 刘艺端, 许文坤, 孙利民, 戚 敏
(云南省畜牧总站,云南昆明 650225)
我国是世界上猪遗传资源最为丰富的国家之一,地方猪种资源的数量已达到108个,在世界种质资源中的占比达到1/3左右 (魏菁等,2021),而随着国外良种猪品种的大量引入以及与地方猪种进行杂交,导致地方优良猪种种质资源在逐渐下降,因此保护地方猪种种质资源也成为一项重要工作(陈清森等,2012)。撒坝猪产于云南海拔2000 m左右昆明和楚雄一带,中心地处禄劝县撒坝,得名撒坝猪,具有耐粗饲、产仔性能好、肉质优良、杂交利用经济性能好等优点 (张伟力等,2013;赵中保等,2005),是云南省9个经国家畜禽遗传资源委员会鉴定的地方猪品种(遗传资源)之一,是我国重要的地方种质遗传资源(袁跃云等,2015)。
一个物种(或群体)不同个体(或染色体)之间的DNA水平上的差异称为遗传多样性,一般指种内个体之间或者一个物种(或群体)内的不同个体(或染色体)之间的DNA差异的总和,因此也称种内的遗传多样性(Ellegren等,2016)。遗传多样性有助于一个物种 (或群体)对环境的变化作出适应,物种遗传多样性与环境的适应性呈正相关关系(Ellegren等,2016);群体内的遗传多样性水平会影响该重点群体的生产力、数量增长和稳定性,对一个物种(或群体)进行遗传多样性分析,对该物种(或群体)的保护、恢复和在农业方面的应用具 有 重 要 意 义 (Dewoody等 ,2021;Hughes等 ,2010)。单核苷酸多态性(SNP)是基因组中单个核苷酸因碱基的转换、颠换、插入、缺失所引起的,SNP标记技术是基于高通量测序和DNA芯片技术的分子标记技术,通过芯片在分子水平上对遗传物质的变异发生反应标记,能对遗传物质的变异具有更精准的辨别,具有廉价、快速、准确等特点(陈星等,2019)。现阶段,SNP技术已用于人类疾病诊断(Weedon等,2021)、构建家犬遗传图谱(Dreger等,2016)、家畜遗传结构分析(蔡春波等,2021;兰蓉等,2019)等方面,运用SNP技术对家畜保种工作提供了更加便捷的技术手段。本研究利用“京芯一号”SNP芯片从分子水平分析撒坝猪保种群体的遗传结构变化以及遗传多样性,拓宽遗传背景,指导和促进撒坝猪的保种工作。
1 材料与方法
1.1 试验材料
1.1.1 试验动物 试验用撒坝猪样本来源于楚雄州种猪种场,共100头,其中37头公猪,合计63头母猪。
1.1.2 SNP芯片 “京芯一号”SNP芯片来源于北京康普森生物技术有限公司。
1.2 试验方法
1.2.1 撒坝猪保种群体基因组DNA的提取 对100头猪进行耳静脉采血,血液样品均匀涂在血液采集卡的点样圈内,自然阴凉至完全干燥,至实验室使用Magbead Blood Spots DNA Kit磁珠法血卡DNA提取试剂盒提取DNA。
1.2.2 撒坝猪保种群体基因组DNA分型与质控使用“中芯一号”芯片对DNA样本进行SNP基因分型,100头撒坝猪保种群体中共检测到51315个SNPs位点,分析之前使用Plink(V1.90)软件对SNPs位点数据进行质控,只保留分型质量最好的位点进行后续分析,通过质量控制的SNPs数目为42986个。根据不同分析的需要进行再次质控,具体分析项目的质控标准及剩余SNPs数目见表1。
表1 具体分析项目的质控标准与剩余SNPs数目
2 结果与分析
2.1 撒坝猪保种群体遗传多样性分析 撒坝猪保种群体遗传多样性分析主要包括有效群体含量(Ne)分析、群体的多态性标记比例(PN)分析、群体的期望杂合度(He)和观察杂合度(Ho)分析。撒坝 猪 保 种 群 体 的Ne为21,PN为0.533,He为0.263,Ho为0.275。
2.2 撒坝猪保种群体基因组亲缘关系分析 利用SNP位点构建的基因组关系G矩阵可以进一步分析撒坝猪保种群体的亲缘关系,撒坝猪保种群体公畜与母畜之间基因组亲缘关系系数介于-0.2251~0.7798,平均基因组亲缘关系系数为(0.009±0.1351)。可视化结果如图1所示,该撒坝猪保种群体按照亲缘关系出现多个家系,部分个体之间亲缘关系值较大,说明部分个体之间存在近交问题。
图1 撒坝猪亲缘关系分析可视化结果图
2.3 撒坝猪群体家系构建 本次研究使用邻接法(NJ),基于IBS遗传距离分析结果对样本进行聚类。鉴于公猪对于整个保种群体的重要性,将公猪样本提取出来单独做了聚类分析,聚类结果如图2所示,将现100头撒坝猪保种群体中37头公猪划分为A~G 7个家系,根据与不同家系公猪亲缘关系的远近程度,将63头母猪划分进上面已构建的7个公猪家系中,结果见表2。该撒坝猪保种群体构建家系中家系C与家系F个体数量最少,公畜有且仅有1头,应当着重对这两个家系进行保护,保证家系多样性,防止保种群体家系进一步减少。
表2 撒坝猪群体家系构建结果
图2 撒坝猪公猪样本聚类分析结果图
2.4 撒坝猪基于ROH的近交系数分析 在100头撒坝猪保种群体中,共检测到3552个ROH,长度在8.20~621.32 Mb,每头撒坝猪含有ROH在2~53个,如图3所示,其中含有35~40个ROH个体数量最多,且含有25~45个ROH个体数量占种群数量的87%。如图4所示,该撒坝猪保种群体在ROH总长度为250~300 Mb的个体数量占比最大,且平均个体ROH长度为(319.38±111.39)Mb。该撒坝猪保种群体基于ROH的近交系数(FROH)平均为0.130,如图5所示,该撒坝猪保种群体FROH的中位数大于0.125,FROH的上四分位数和下四分位数介于0.100~0.175,且该撒坝猪保种群体中在FROH为0.100~0.150的数量最多。
图3 撒坝猪个体ROH数量的分布图
图4 撒坝猪ROH长度分布图
图5 撒坝猪基于ROH的近交系数FROH的分布
3 讨论
动物保种的主要目的是最大限度地减少近交衰退,避免其他品种血缘的杂化,同时保证种群的遗传多样性。有效群体含量(Ne),是指在一个理想群体中,在随机遗传漂变影响下,能够产生相同的等位基因分布或者等量的同系繁殖的个体数量,而理想群体是指规模恒定、公母各半、没有选择、迁移、突变,也没有世代交替的随机交配群体(任宪云,2011;Wright,1931)。Ne值可以根据群体的连锁不平衡 (LD)值进行估算 (Barbato等,2015),且Ne值与LD值呈反比关系 (Soule等,1980),Ne值过小,说明这个群体LD值过大,从而该群体在进化过程中可能很少发生迁移、突变、选择等遗传变异(罗元宇,2016),一般情况下,当群体Ne值大于等于50时,能够避免近交衰退,确保群体短期内的生存能力 (Lander等,1994)。本研究中撒坝猪保种群体的Ne为21,说明该保种群体比较封闭,遗传变异较小,存在着较高程度的近交现象,为此,需要积极引入本品种新血缘,防止种群因近交衰退。群体中多态的位点与总位点的比值称为多态性标记比例(PN),该撒坝猪保种群体PN值为0.533,说明该保种群体多态性位点的比例较高。观察杂合度(Ho)由观察到的某一位点杂合子个体数与总个体数之间的比值得出,是指随机抽取的两个样本的等位基因不相同的概率,期望杂合度是根据年提出的公式计算得出的理想期望值 (Nei,1978)。该撒坝猪保种群体He为0.263、Ho为0.275,观察杂合度(Ho)高于期望杂合度(He)的值,说明该保种群体曾经可能引进了非撒坝猪的外来血缘,需要进一步保证纯化度。
G矩阵是基于VanRaden(2008)提出的使用全基因组标记构建基因组关系矩阵的方法。鉴于保种群体的系谱信息通常是缺失比较严重,因此在标记密度合适的情况下,G矩阵能更真实的反映个体间的关系,它相对于单纯根据系谱信息进行的亲缘关系分析结果,更加准确和接近实际情况判断保种群体的亲缘关系,基因组亲缘关系系数(Grelation)介于-1~1,越接近1,说明两个个体亲缘关系越近。该撒坝猪保种群体平均基因组亲缘关系系数为(0.009±0.1351),说明大部分个体亲缘关系呈中等程度,存在较大的潜在近交风险,要进一步强化选配措施,理论上公畜应优先与亲缘关系远的个体进行交配,即与基因组亲缘关系系数低的母畜进行交配。
基因组长纯合片段(ROH)是亲代在传代过程中产生的纯合基因型连续片段,在所有群体中均广泛存在。ROH的长度和频率可以反映群体亲缘关系历史,长ROH片段数量和家系内近交的可能性呈正比,数量越多,近交的可能性越大(Zhang等,2018)。该撒坝猪保种群体ROH片段长,平均个体ROH长度为(319.38±111.39)Mb,高于青峪猪(刘彬等,2020)平均(131.39±121.33)Mb的ROH长度,也高于蓝塘猪(王晨等,2018)平均(240.90±170.93)Mb的ROH长度,且该撒坝猪保种群体基于ROH的近交系数(FROH)平均为0.130,中位数大于0.125,该撒坝猪保种群体平均近交系数近似在遗传学中(FROH)为1/8(0.125)叔侄交,从以上数据表明,该撒坝猪保种种群存在近交现象,需要进一步加强保种,防止近交衰退。
4 结论
通过对撒坝猪分子水平上群体遗传的研究,发现该保种撒坝猪群体内家系数量适中,个别家系公畜数量较少,各家系个体数差异明显,群体中可能存在非撒坝猪的外来血缘,个体亲缘关系呈中等程度,近交程度较高,需要进行合理选配或者从原种场引入新的血统等方式来确保撒坝猪遗传资源的多样性。