基于70 K SNP芯片分析济宁青山羊保种群体的遗传结构
2023-07-31张任豹周东辉周李生高霄霄贺建宁
张任豹,周东辉,周李生,高霄霄,柳 楠,贺建宁
(青岛农业大学动物科技学院,青岛 266109)
济宁青山羊(Jining gray goat)属于地方羔皮用山羊品种,其嘴唇、角、被毛和蹄均为青色,前膝为黑色,具有“四青一黑”的特征。济宁青山羊是我国乃至世界上优异的种质资源,以其全年发情、多胎多羔、羔皮品质好、遗传性稳定、耐粗抗病等品种特性而著称,但其生长速度慢,加上近几十年来,猾子皮市场的下滑和肉羊市场的兴起,各地盲目引入其他品种进行改良,致使纯种数量急剧下降。目前,该品种优质种公羊主要由保种场、养殖企业和散养农户提供,然而,经过长期封闭繁殖,可能会造成近交程度的上升,对该品种的生存与保护带来严重威胁[1-2]。
动物的家系结构、亲缘关系模糊、错误的系谱记录以及随意的选育选配会降低该品种的遗传多样性,造成一定程度的近交,有效群体数量的减少,进而影响对该品种的提纯复壮、繁殖更新[3]。单核苷酸多态性(SNP)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP标记与其他DNA分子标记相比具有不可比拟的优势,SNP 具有数量多、分布广、突变率低、遗传稳定性高、多态性丰富、准确性较高、成本低等优点[4]。当前全基因组SNP芯片在研究动物的遗传多样性、亲缘关系、家系结构等方面得到了广泛的应用[5]。济宁青山羊是我国珍贵的山羊遗传资源,在养羊生产和种质创新中做出了重要贡献,已实现了多点小群体活体保种,但仍需要对保种效果进行检测和评价[6-10]。为了了解济宁青山羊保种群体的保种效果,本研究利用Illumina 70 K Goat SNP芯片对40只济宁青山羊全基因组范围内的SNP进行检测,分析群体遗传多样性、近交程度,厘清家系结构、亲缘关系等,为济宁青山羊的有效保护与合理开发利用提供指导。
1 材料与方法
1.1 试验动物
本研究所用40只济宁青山羊的耳组织样均采自山东省济宁青山羊原种场。所有试验羊均为成年羊,其中公羊23只(对原种场内公羊全部进行了采样,基本包含了整个保种群体的血缘),母羊17只。将采集的耳组织放置含有无水乙醇的冻存管中,记录样品的个体编号,24 h 内带回实验室,-20 ℃冻存。
1.2 试验方法
1.2.1 济宁青山羊全基因组DNA的提取 利用基因组DNA提取试剂盒(Vazyme)对每只山羊耳组织进行基因组DNA提取。利用超微量紫外分光光度仪Nano Drop ND-2000和琼脂糖凝胶电泳试验来检测基因组DNA 的浓度和纯度,判断其质量是否合格。具体检测方法如下:1)使用量程为2.5 μL的移液枪,从提取的DNA样品中吸取1 μL加入至Nano Drop ND-2000超微量紫外分光光度计的加样孔中,再将其调至到DNA测量选项进行检测。2)配置1%的琼脂胶,在琼脂胶板滴孔中滴入4 μL PCR扩增体系,在电压为120 V的电泳槽中电泳25 min,在UV凝胶电泳成像系统下拍照检测电泳结果。
1.2.2 SNP分型及芯片数据质量控制 将提取合格的DNA样品送至纽勤生物科技(上海)有限公司,进行基因型分型,本研究所有样本都使用 Illumina 70 K Goat SNP芯片进行基因型分型。该芯片由内蒙古农业大学开发,是一款中密度SNP分型芯片,利用Illumina平台定制,同时兼容了 Illumina 山羊52 K SNP芯片位点,最终保留了67 088个高质量SNPs,集成一款全新的山羊70 K SNP芯片。利用 Plink(V1.90)软件对基因型数据进行质控,只保留分型质量最好的位点进行后续分析。质控标准为:只使用常染色体上的位点,SNP检出率大于等于90%,个体检出率大于等于90%,哈迪温伯格P值大于等于0.000 001,最小等位基因频率(minor allele frequency, MAF)大于等于0.01。
1.2.3 济宁青山羊保种群体遗传多样性分析 通过 Plink(V1.90)软件计算各位点的遗传多样性参数,包括有效等位基因数、最小等位基因频率(MAF)、期望杂合度(He)、观测杂合度(Ho)、多态信息含量(PIC)和多态性比例标记(PN),以此来了解济宁青山羊群体的遗传多样性。
PN指的是在目标群体中表现为多态的位点占总位点的比例。首先使用Plink软件计算出每个位点的最小等位基因频率(MAF),然后使用R脚本计算PN,利用如下公式计算PN。
公式中,M为表现多态的位点数,N为总的位点数。
He指的是群体中任一个体的任一位点是杂合的概率;Ho指的是群体中某一位点是杂合子的个体数占总个体数的比例,用如下公式计算。
其中,n为群体的总个体数,N为总的位点数,Hk为位点k的杂合个体数,Pki为位点k等位基因i的频率。
PIC是衡量基因变异程度高低、反映遗传信息多少的指标,PIC利用如下公式计算。
公式中Pi和Pj分别为第i个和第j个等位基因频率,n为等位基因数。
有效等位基因数是指在理想群体中,一个基因座上产生与实际群体中相同的纯合度所需的等位基因数,它等于实际群体的纯合度的倒数。MAF是指在给定群体中的不常见的等位基因发生频率。
1.2.4 济宁青山羊保种群体亲缘关系分析 利用GCTA工具构建G矩阵,采用 Plink(V1.90)软件构建状态同源(IBS)距离矩阵,分析保种群体个体间的亲缘关系,并使用R软件绘制IBS距离矩阵和G矩阵结果的热图。
1.2.5 济宁青山羊保种群体的家系结构分析 利用Plink(V1.90)软件对质控后的数据进行主成分分析,采用R语言脚本绘制主成分的二维图,分析被测济宁青山羊的群体结构,实现群体分层可视化。
1.2.6 基于ROH的近交程度分析 使用Plink(V1.90)计算得到每个样本的ROH长度,基于ROH的近交系数是通过计算个体中ROH片段的总长度占常染色体基因组总长的比例。因此,个体中ROH的总长度越长或数量越多,该个体的近交系数就越高。
其中,k是个体中ROH的数量,L是基因型数据覆盖的常染色体基因组的长度(山羊的常染色体基因组长约为2 468 749.279 kb)。
2 结 果
2.1 济宁青山羊全基因组DNA提取质量检测结果
利用超微量紫外分光光度仪Nano Drop ND-2000和凝胶电泳试验来检测基因组DNA的浓度和纯度,判断其质量是否合格,表1为部分济宁青山羊DNA样本纯度检测结果,A260 nm/A280 nm的比值在1.8~2.0间。图1显示,DNA条带单一,表明DNA纯度高,质量合格,可用于后续分析。
图1 基因组DNA琼脂糖凝胶电泳结果Fig.1 Genomic DNA detected by agarose gel electrophoresis
表1 济宁青山羊 DNA 样本纯度检测结果Table 1 The test results of DNA purity of Jining gray goats
2.2 济宁青山羊保种群体遗传多样性分析
SNP芯片共检测到了67 088个SNPs,个体基因型检出率为98%,通过 Plink(V1.90)软件对数据质控,剩余的有效SNPs有57 991个,多态性比例标记(PN)为85.5%,表明此芯片适用于济宁青山羊遗传多样性分析。经过Plink(V1.90)软件对各位点进行统计,在 40个个体中共检测到了68.87个有效等位基因,平均有效等位基因数(effective number of allele)为 1.697,最小等位基因频率(MAF)为0.293,各位点PIC在 0~0.375 之间,平均PIC为 0.283;该群体平均观察杂合度(Ho)为 0.409,平均期望杂合度(He)为 0.418,He略高于Ho。
2.3 济宁青山羊保种群体亲缘关系分析
通过构建G矩阵,分析被测济宁青山羊群体的亲缘关系。整个群体的G矩阵的可视化结果如图2所示,结果表明,大部分济宁青山羊个体间的亲缘关系较远,但也有部分个体之间存在较近的亲缘关系。
G矩阵结果中,每个小方块代表样本两两之间的亲缘关系值,该值越大越接近红色,即两个体亲缘关系越近In the G matrix results, each small square represents the value of the relationship between two pairs from the first sample to the last one, the larger the value, the closer it is to red, that is, the closer relationship between two individuals图2 G矩阵可视化结果Fig.2 G matrix visualization results
通过构建IBS距离矩阵,研究比较了40只济宁青山羊之间的遗传距离,结果显示被测济宁青山羊保种群体的IBS值在 0.174~0.396之间,其平均遗传距离为0.333 4,表明济宁青山羊个体间差异较大,并存在较远的遗传距离。23只济宁青山羊公羊的IBS值在 0.174 0~0.387 9 之间,其平均遗传距离为0.330 3。整个群体的IBS距离矩阵的可视化结果如图3所示,大部分被测济宁青山羊个体间的亲缘关系较远,部分个体间存在较近的亲缘关系。
IBS距离矩阵中,每个小方块代表样本两两之间的遗传距离值,该值越大越接近红色,即两个个体的遗传距离越大,反之亦然Each small square in IBS distance matrix represents the genetic distance value between two pairs from the first sample to the last one,the larger the value, the closer it is to red, that is, the larger the genetic distance between two individuals, vice versa图3 IBS距离矩阵可视化结果Fig.3 The visualization results of IBS distance matrix
2.4 济宁青山羊保种群体的家系结构分析
从主成分分析图4可以看出,整个济宁青山羊群体中个体间的亲缘关系不太紧密,以第一主成分为横轴,以第二主成分为纵轴,左上侧的JNQ17、JNQ18、JNQ09聚在一块,右上侧的JNQ04、JNQ12聚在一块,JNQ16、JNQ21聚在一块,JNQ22、JNQ02、JNQ08、JNQ03、JNQ05聚在一块,其他公羊聚在一块,表明该济宁青山羊保种群体可能由多个家系构成。左下侧的两个个体聚在一块,说明它们之间遗传距离较远,同时可以看出部分公羊与母羊聚集一起,表明这部分的济宁青山羊遗传距离较近。
图中带红色标记编号的个体为公羊,黑色圆点表示母羊The individuals with red marks in the figure are rams, and the black dots indicate ewes图4 主成分分析图Fig.4 The results of principal component analysis
鉴于公羊对于整个保种群体的重要性,将公羊样本提取出来单独做聚类分析,以此来判断它们之间的亲缘关系远近。以公羊间分子亲缘系数0.1为标准进行聚类,将23只公羊划分为14个家系。图中相同颜色标注的样本被评估为同一个家系,在进化树分析中被聚类在较小的分类单元中。结果如图5所示,现有的公羊样本可以分为14个家系,分别命名为家系 1、家系 2、家系3……家系14,分别有 1、1、1、1、1、1、1、1、1、3、1、1、2、7只公羊。
2.5 基于ROH的近交程度分析
在40个样本中共鉴定出347个ROHs,其中1~5 Mb数量最多,约占42.65%(图6),ROH片段平均覆盖基因组约11%,ROH在29条常染色体上的分布见图7,可以看出,18号和12号染色体上的 ROH 数量最多,为20个,27号和22号染色体ROH数量最少,约为6个;个体ROH长度的样本数分布如图8所示,每个济宁青山羊个体的ROH总长度在0~900 Mb,平均ROH长度为115.37 Mb,个体 ROH 长度在 0~100 Mb 内的个体数比例最大,约占33%。同时发现个体ROH长度在 200~300 Mb 和400~700 Mb之内的个体数很少,平均每个个体含有8.68个ROH,在没有家系记录的情况下,FROH可以作为近交估计的替代方法,该种群的平均近交系数为0.047 9,近交程度较低,群体遗传多样性丰富(图9)。
图6 济宁青山羊群体的ROH长度分布Fig.6 Distribution of ROH length in Jining gray goats
图7 每条染色体上的ROH数量分布Fig.7 The quality distribution of ROH on each chromosome
图8 济宁青山羊个体ROH长度的样本数分布Fig.8 Distribution of ROH length samples in Jining gray goats
小提琴图主要用于展示数据的分布,中心的白色的点代表群体FROH的中位数。小提琴图的宽窄表示群体FROH的概率密度分布The violin diagram mainly show the distribution of data, and the white point in the center represents the median of population FROH. The width of the graph indicates the probability density distribution of the population FROH图9 基于ROH的近交系数FROH的分布图Fig.9 Distribution plot of FROH based on ROH
3 讨 论
动物的遗传多样性研究多采用微卫星多态性(SSR)和单核苷酸多态性(SNP)的方法,但用SNP芯片分型的方法报道山羊的遗传多样性则很少[11-16]。SNP标记被证明比SSR标记有更高的准确性,已被广泛应用于动物进化研究和遗传关系鉴定等[17-22]。Stella等[23]利用山羊50 K Goat SNP芯片对来自35个国家148个群体共4 653只山羊个体,进行了种群遗传多样性研究,研究了全球山羊的种群遗传结构、群体历史选择特征、迁移路线和环境适应性等,结果表明不同品种山羊的基因组和地理环境之间存在密切联系,这为在全球范围内研究山羊适应性等奠定了基础。本研究中使用的山羊70 K SNP分型芯片由内蒙古农业大学开发,是一款中密度SNP分型芯片,利用Illumina平台定制,同时兼容了 Illumina 山羊52 K SNP芯片位点,最终保留 67 088 个高质量SNPs位点,集成一款全新的山羊70 K SNP芯片。该芯片是国内首款具有自主知识产权的山羊中密度芯片,其应用领域包括全基因组关联分析、基因组选择、群体遗传及选择进化研究、亲子鉴定、亲缘关系及种质资源鉴定等[24-26]。该款芯片在济宁青山羊群体中进行测试,结果表明基因分型成功,SNP检出率大于98%。从SNP密度分布图来看,质控前后SNP的分布较为均匀,缺失片段很少,质量合格,可用于本次试验分析。
本研究利用全基因组SNP信息从遗传多样性、亲缘关系、家系结构、近交程度等方面评估济宁青山羊保种群体的保种效果。通过杂合度、有效等位基因数、多态信息含量等参数度量群体遗传多样性。王可等[6]利用12个微卫星标记分析了济宁青山羊遗传多样性,结果发现所有微卫星标记PIC均大于0.5,平均PIC为0.73,均为高度多态标记,遗传多样性丰富;各标记的平均Ho约为0.73,平均He约为0.76;平均有效等位基因数约为4.727。在本研究中,平均Ho为0.409,平均He为0.418,各位点PIC在 0~0.375 之间,平均PIC为 0.283,平均有效等位基因数约为1.697。可以看出,利用全基因组SNP信息检测的结果比利用SSR检测的结果明显降低,可能与SNP标记呈二态性有关,即SNP标记通常只能检测到两个等位基因,而SSR标记可以检测到较多的等位基因[27-31]。He略高于Ho,表明济宁青山羊保种群可能存在杂合子缺失,同时也可能有小部分引进了外来血缘,需要继续加以纯化,这一结果与王可等[6]利用微卫星方法得出的结果一致。
血统对动物遗传学和育种研究至关重要。在养殖生产中,通常根据系谱鉴定畜禽的身份信息,在养殖规模较小时,利用系谱来鉴定畜禽亲子关系准确性较好,但是随着养殖业的发展工厂化、规模化、智能化、数字化,这种传统记录方式在现代畜牧生产中存在许多弊端,无法确定亲子关系[32-34]。研究表明,可以通过遗传关系和个体间的遗传距离来构建家系[35-36],袁娇等[37]利用“中芯一号”50 K SNP芯片对通城猪的全基因组SNP进行扫描,通过IBS距离矩阵和G矩阵分析了该种群的亲缘关系、遗传结距离;通过主成分析构建了公猪的家系结构,结果表明通城猪保种群无明显的群体分层,保种效果良好。本研究采集的样本均来自同一原种场,该原种场在一段时间内一直处于封闭繁殖状态,一些个体不可避免地有近亲或远亲。IBS距离矩阵和G矩阵均表明部分个体之间存在密切的亲缘关系,因此在繁殖保护过程中,应注意公羊与母羊的交配工作,防止近亲繁殖带来的风险。主成分分析表明,整个济宁青山羊群体中个体间的亲缘关系不太紧密,表明该济宁青山羊保种群体可能由多个家系构成。考虑到公羊在整个保种群体的重要性,单独对公羊进行了聚类分析、家系构建,以公羊间分子亲缘系数0.1为标准进行聚类,将23只公羊划分为了14个家系,高于国家级保种场最低6个不同家系的要求。同时发现部分家系数量较少,因此在后续的保种利用工作中要及时关注各家系济宁青山羊的数量,对家系数量少的应进行适当扩群,控制一定的近交水平,确保家系结构维持平衡。
为了保持种群不受外来品种的影响,我国的畜禽保种群体大多采取闭锁繁殖的方式,但这可能会造成一定程度的近交,造成该品种遗传多样性降低,有效群体数量减少。长纯合片段是个体内纯合基因型的连续片段,由亲代将同源单倍型完整地传递给子代所产生的。长的ROH指示发生在较近时期的亲缘关系,越多说明家系内存在近交的可能性越高;短的 ROH指示发生在较远时期的亲缘关系,现有系谱通常已不能解释这些亲缘关系[38-39]。Islam等[40]利用山羊50 K芯片分别对济宁青山羊、中卫山羊、阿尔巴斯绒山羊种公羊全基因组SNP信息进行扫描、通过亲缘关系分析和近交系数计算,结果表明中卫山羊场的保种群家系数达17个,高于国家级保种场最低6个不同家系的要求。评价进一步发现,中卫山羊品种ROH短片段较多、群体近交系数低(0.017)、有效群体数量较高,该发现表明保种群体的遗传多样性较高,为中卫山羊保种群的管理措施制定及种公羊育种计划提供新的思路。本研究中,济宁青山羊共检测到347个ROH片段,ROH数量较少,表明在历史上对济宁青山羊的选择驯化强度低。同时发现济宁青山羊群体ROH长度与频率可能成反比(图7),济宁青山羊群体的ROH长度分布与频率的关系在0~20 Mb满足这个规律,当ROH长度大于20 Mb,可能在此区域受到了密集选择。整个群体平均近交系数为0.047 9,近交系数较小。但也发现有部分个体的近交系数较高,超过了0.3,为降低群体近交增量,同一家系的公、母羊不建议进行配种。
4 结 论
本研究基于70 K Goat SNP 分析了济宁青山羊保种群体的遗传多样性,发现济宁青山羊保种群体近交程度较低,遗传多样性较丰富,群体内家系多,但各家系个体数较少,需要制定合理的配种计划,确保家系结构保持平衡,同时应将该品种资源的保护与开发利用相结合,不断推进该品种资源的选育,加快从资源优势向经济优势转化。