APP下载

基于SNP 芯片挖掘伍隍猪新遗传材料

2022-08-13杨祎挺甘麦邻沈林園

中国畜牧杂志 2022年8期
关键词:基因组遗传群体

杨祎挺,甘麦邻,刘 杨,辜 浩,沈林園,朱 砺

(四川农业大学动物科技学院,四川成都 611130)

伍隍猪主要分布于四川资阳市雁江区,是内江猪的“豪杆嘴”类群,自上个世纪初以其独特的外型特征、优良繁殖性能、超强适应能力和优秀的育肥效果被当地人称为“伍隍老槽猪”,是我国优质的地方种质资源。

伍隍猪养殖历史悠久。据《资阳县志》记载,“解放前后资阳以饲养‘伍隍老槽猪’为主,1942 年以前,伍隍猪的主产区农民以饲养“豪杆嘴”猪盛行,1942—1943 年及六十年代先后几次引入内江“狮子头”猪来伍隍区以改善“豪杆嘴”的大型晚熟性能。”据《雁江区志》(1986—2005)记载,1988 年内江市畜牧部门组织26 名猪品种鉴定专家针对伍隍猪进行普查鉴定,将“伍隍老槽猪”命名为“内江猪伍隍类群”。20 世纪90 年代有调查研究表明,伍隍类群猪在引入内江猪血液成分后,经过长期选育,目前无论在体形外貌、生长发育还是生产性能等方面都与内江猪极为相似。

由于资阳在1998 年以前一直归属于内江市管辖,内江猪的保种工作在省农业厅和内江市畜牧局的重视和支持下持续推进。但是1998—2000 年期间,资阳地区撤地建市,在之后的20 年时间里,脱离了内江市管辖的伍隍猪类群既没有被作为内江猪“豪杆嘴”类群继续保护,也没有被作为独立的品种资源而加以保护。

本研究利用50K SNP 基因芯片,分别对伍隍猪和内江猪保种群进行基因分型,通过多种分析软件对2 个保种群群体遗传多样性、遗传距离、遗传结构变化、遗传进化关系进行分析,进而对伍隍猪种质资源进行鉴定,为第3 次全国畜禽遗传资源普查工作中伍隍猪遗传种质资源的保护与利用提供理论基础。

1 材料与方法

1.1 实验材料 实验材料分别来自四川资阳市、内江市、绵阳市多个公司保种场,其中伍隍猪猪场采集全保种群共计131 头个体(包括7 头公猪,79 头母猪,45 头后备母猪),内江猪共采集全保种群共计156 头个体(包括20 头公猪,136 头母猪)耳组织样品。

1.2 DNA 提取与基因分型 采用氯仿抽提的方法提取DNA,经琼脂糖凝胶电泳后,通过紫外分光光度仪(NanoDrop2000)和凝胶成像设备(NewbioGi-1)对提取后的DNA 进行质量检测,经过琼脂糖凝胶电泳鉴定质量符合分型标准后,送北京康普森生物技术有限公司进行猪“中芯一号”50K SNP 芯片分型。

1.3 数据过滤与合并 使用Plink(V1.90)软件对芯片数据进行数据质控,去除缺失率大于0.1、最小等位基因频率(MAF)小于0.01、哈迪-温伯格(Hardy-Weinberg)平衡检验<10的SNP,选择常染色体的共有SNP 并使用R 语言提取2 个品种共有位点进行合并,用于后续分析。

1.4 群体多样性、主成分、亲缘关系、进化树分析 本研究使用Plink(V1.90)分析2 个品种多态性标记比例(The Proportion of Polymorphic Markers,PN,仅选择常染色体中的SNP)、群体的期望杂合度(Expected Heterozygosity,He)、观测杂合度(Observed Hetero zygosity,Ho);使用PopLDdecay软件计算所有SNP 之间连锁不平衡(LD)系数的均值(窗口值为200 kb),构建LD 衰减图谱;使用SNeP(v1.1)软件计算2 个品种群体有效含量(Effective Population Sizes,Ne);使用Plink(V1.90)对伍隍猪与内江猪混合群体质控合并后的39 914 个SNP 位点进行主成分分析(Principal Component Analysis,PCA),参数为:--pca 5 header;将得到的eigenval 文件使用R(4.1.2)进行可视化。基于IBS(Identical by State)的遗传距离分析和基于G 矩阵的基因组亲缘关系分析能在不清楚群体系谱或祖代样本的情况下对群体进行亲缘关系分析。使用TASSEL 软件计算亲缘关系矩阵(G 矩阵),构建IBS 距离矩阵,使用R(4.1.2)进行可视化,并使用Mega(v11.0.9)对IBS 距离矩阵以邻接法(Neighbor-Joining,NJ)构建进化树。

1.5 ROH 检测及近交系数计算 基因组上的长纯合片段(Runs of Homozygosity,ROH)是个体内纯合基因型的连续片段,它是由于亲代将同源单倍型完整地传递给子代而产生。本研究使用DetectRUNS软件包对伍隍猪与内江猪进行全基因组ROH 检测,检测参数为windowSize=50,threshold=0.05,minSNP=30,ROHet=FALSE,maxOppWindow=1,maxMissWindow=1,maxGap=250000,minLengthBps=1000000,minDensity=1/100,maxOppRun=NULL,maxMissRun=NULL。通过如下公式计算个体ROH 的近交系数(F),最终使用DetectRUNS软件包中的summaryRuns()函数进行结果整理。

其中,k 是个体中ROH 的数量,L 是该物种常染色体基因组的长度(猪V10.2 版本基因组,常染色体长度约为2 450 713 kb)

统计每个SNP 在各自猪群体内参与组成ROH 的次数占样本数的比例,并将高于45%的SNP 区域作为高频ROH 区域,利用RCircos 包绘制2 个猪群体ROH 频率在染色体上分布的Circos 图。基于高频ROH 区段的物理位置,利用Ensembl 基因组数据库对捕获的ROH热点区域进行基因注释,挖掘己报道的与猪重要经济性状相关的功能基因。

利用DAVID 数据库对高频ROH 区域注释到的基因进行基因本体(Gene Ontology,GO)功能富集和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,当<0.05 时,则表示显著富集。将显著富集到生物学过程和信号通路的基因与猪数量性状基因座(Quantitative Trait Locus,QTL)数据进行比对,获得候选功能基因。

1.6 选择信号分析 本研究选用基于群体分化与基因组杂合度的2 种选择信号检测方法。使用Vcftools软件分别对伍隍猪与内江猪进行固定指数(Fixation Index,Fst)分析与核苷酸多态性比值分析(πA/πB,π-ratio),窗口为1 000 kb,步长100 kb。对2 种方法筛选排名5%的候选选择区域进行选择信号的筛选。使用ANNOVAR进行基因注释,利用David 在线软件对提取到的受选择区域候选基因进行GO 功能和KEGG通路富集分析。

2 结果

2.1 芯片数据质控 本研究使用的50K 芯片包括57 466个位点,其在染色体上分布如图1 所示。经过SNP 缺失率、最小等位基因频率、哈迪-温伯格检验过滤后伍隍猪得到32 345 个有效SNP 位点信息,内江猪得到39 914 个有效SNP 位点,合并提取28 754 个共有有效位点用于后续分析。

图1 SNP 在染色体上的密度分布条形图

2.2 伍隍猪与内江猪群体多样性、主成分分析与连锁不平衡分析 如表1 所示,伍隍猪与内江猪2 个品种间伍隍猪多态性标记比例高于内江猪,伍隍猪He 与Ho 均低于内江猪,表明伍隍猪群体内遗传变异大于内江猪群体,保持了较高的群体遗传多样性。2 个品种群体有效含量Ne 如表2 和图2A 所示,伍隍猪与内江猪群体有效含量从前219 世代相对缩减了94.36%、96.68%。26世代往前伍隍猪有效个体数量大于内江猪,26 世代以后伍隍猪有效个体数量小于内江猪。

表1 伍隍猪和内江猪各世代的遗传多样性结果

表2 伍隍猪和内江猪群体有效含量

PCA 分析结果如图2B 所示,内江猪与伍隍猪呈现明显分离,2 个群体间具有单独聚类,其亲缘关系相差较远,说明本研究所选择的2 个保种群体是2 个独立的群体,用于后续的群体遗传结构对比分析。

在本研究中,2 个种群物理距离小于10 Mb 的SNP 被成对计算了LD 值(),每个群体不同SNP 间距的均值统计如表3 所示,同时,利用300 kb 距离内的结果绘制了2 个群体的连锁不平衡衰减图,如图2C 所示。从LD 总体趋势上能够看出,随着SNP 在基因组上物理距离的增加,逐渐减小,同时,衰减的速度随着SNP 间距的增加而下降。在本研究中,使用下降到0.30 对应的标记间距作为LD 衰减距离,来衡量群体的LD 衰减速度,结果表明,伍隍猪LD 衰减最快,其次为内江猪。

表3 不同SNP 间距下2 个品种的连锁不平衡程度

图2 伍隍猪和内江猪群体有效含量、主成分分析与连锁不平衡分析可视化

2.3 伍隍猪与内江猪亲缘关系分析与NJ 进化树构建伍隍猪与内江猪群体的IBS 距离值为0.119 4~0.370 9、0.130 0~0.342 6 之间,平均遗传距离为0.264 3±0.011 3、0.274 9±0.007 2,表明2 个群体个体之间的平均遗传距离较远,且差异较大。其中7 头伍隍种公猪平均遗传距离为0.255 2±0.013 3,19 头内江种公猪平均遗传距离为0.278 7±0.006 3,表明种公猪之间的遗传距离均较远。对于2 个品种整个群体的IBS 距离矩阵和G 矩阵亲缘关系的可视化结果如图3 和图4 所示。2 个保种群体内大部分个体间的亲缘关系呈中等程度,而部分种猪之间的亲缘关系较近,说明2 个保种群体均存在较大的潜在近交风险。

图3 伍隍猪与内江猪IBS 矩阵可视化

图4 伍隍猪(左)与内江猪(右)G 矩阵可视化

本研究利用个体间的IBS 值构建了四川省8 个地方品种和1 个外国品种(NJ:内江猪;WH:伍隍猪;QY:青峪猪;CH:成华猪;TP:四川藏猪;YN:雅南猪;LS:凉山猪;YC:丫杈猪;YY:大白猪)NJ 矩形系统发育树(图5A),结果显示伍隍猪、内江猪与其他6 个地方品种划分为2 个支系,表明伍隍猪与内江猪具有相对较高的遗传相似度。单独构建伍隍猪和内江猪2 个群体的NJ 系统发育树如图5B 所示,可见伍隍猪与内江猪被划分为2 个支系,且距离较远,说明二者虽然存在联系,但是为2 个独立的群体。由图5B、5C可知,伍隍猪和内江猪均聚集10 个分支,代表2 个猪品种均含10 个家系。结合系谱信息分别对内江猪与伍隍猪家系进行核对,结果与树文件基本相符。

图5 基于IBS 亲缘关系构建的NJ 进化树

2.4 伍隍猪与内江猪基于ROH 的近交系数分析 伍隍猪和内江猪群体中分别检测到4 282 个、4 652 个ROH。由图6A 可知,其长度主要集中在0~4 Mb 以内。伍隍猪ROH 的平均长度为5.65±4.18 Mb,个体的平均ROH 数量为32.69±17.52 个;内江猪ROH 的平均长度为4.83±2.60 Mb,个体ROH 的平均数量为29.82±7.86 个。

由表4 可以看出,伍隍猪基因组的最大F值为0.233 4,最小值为0.006 4,平均值为0.075 5±0.050 8;内江猪基因组F的最大值为0.142 2,最小值为0.019,平均值为0.058 8±0.017 8,其中伍隍猪平均F值要高于内江猪群体平均F值。对比表5 中2 个种猪群体的4 种近交系数发现,伍隍猪群体中F组与F组在0.001 水平显著相关,F组与F组在0.001 水平显著相关;内江猪群体中F组与F组在0.001 水平显著相关。

表4 基于ROH 的伍隍猪和内江猪近交系数(FROH)

表5 基于ROH 近交系数的FROH 相关性分析

2.5 高频ROH 区域及候选基因的鉴定 本研究选取45%作为高频ROH 区域的阈值(图6B),分别在伍隍猪、内江猪群体中发现6 个、19 个高频ROH 区域(表6),通过对高频ROH 区域进行基因注释,伍隍猪群体与内江猪群体分别注释得到的10、63 个基因,将注释得到的基因与猪QTL 数据库进行比对;伍隍猪比对得到候选功能基因CA3(表7),内江猪比对得到候选功能基因和(表7)。

表6 伍隍猪及内江猪高频ROH 区域

表7 高频ROH 注释基因及候选基因

图6 伍隍猪和内江猪ROH 分析

2.6 伍隍猪与内江猪选择信号分析 本研究使用Fst 与π-ratio(πA/πB)2 种方法进行选择信号检测。计算伍隍猪与内江猪Fst 和π-ratio 值以筛选2 个地方猪种正选择区域,即Fst 和π-ratio 都在前5%的区域为共享差异选择信号。伍隍猪与内江猪Fst 和π-ratio 阈值为0.224 3、1.458 6,二者在猪基因组常染色体分布图如图7A、7B所示。其次结合Fst 与π-ratio 2 种方法的前5%的区域(图7C),本研究发现140 个受到正向选择的区域,其中5号染色体受选择区域最多(22 个),10 号染色体最少(1个)。这些区域共发现368 个显著SNP 位点。

针对伍隍猪与内江猪基因组受选择区域的显著SNP 位点进行基因注释,受选择SNP 成功落在125 个候选功能基因区域。通过针对候选功能基因区域的基因进行GO、KEGG 功能富集分析发现:GO 富集分析富集到分子功能、细胞组分和生物过程3 大类(图7D),共51 条GO 条目,其中有28 条通路达到显著水平(<0.05)。成骨细胞分化负调控(GO:0045668);获能过程中精子活力正调控(GO:0060474);C-AMP信号通路(GO:0019933)等与生长发育与能量代谢有关的通路被显著富集;其中富集到了血管内皮生长因子受体3 结合(GO:0043185)、淋巴管生成的正向调控(GO:1901492)、肥大细胞趋化的正向调控(GO:0060754)中,是重要的功能基因。KEGG 富集分析发现(图7E),共有14 个通路被显著富集(<0.05),TNF 信号通路(ssc04668)和白细胞迁移(ssc04670)与免疫调节相关。多个与繁殖性状相关的基因例如:基因富集在卵母细胞成熟(ssc04914)中。

图7 选择信号分析可视化

3 讨 论

伍隍猪早期以“豪杆嘴”的形式存在,先前的研究报道描述豪杆嘴为嘴特长,额狭窄,额上皱纹少,但不深。由于地理相邻,自1942 年以来资阳、资中先后多次引进近200 头内江狮子头猪去改造当地豪杆嘴猪(即当时的伍隍猪)。早年产区习惯按头型的特征划分为狮子头、二方头、豪杆嘴3 个类型,往往忽视生产性能的选择。实际上按头式分类已出现很大变化,群体内多采用狮子头× 二方头,而典型的豪杆嘴已十分少见。1978 年关于内江猪外形的描述中已没有关于豪杆嘴型的报道。先前的研究认为伍隍猪是内江猪的一个类群,张成忠等研究发现伍隍猪与内江猪极其相似,但由于资阳、内江2 地选育目标和方式上的差异,导致伍隍猪类群产生自己的特点。冯保华等认为经过长期的独立选育,原来的豪杆嘴猪已消失,伍隍猪中的绝大多数个体是含内江猪血液成分较多的“大二方头”猪,他认为当前关于内江猪的描述中仅包含二方头及狮子头2 种头型的群体。本研究图5 中所呈现的结果展现出伍隍猪与内江猪虽然地理起源相近,即相邻分布的品种之间的系统发育关系密切,但2 个群体在长期的遗传选留中形成了地理同源的不同群体。

从基因组的层面中,本研究中伍隍猪与内江猪的PN 低于一些其他地方品种如巴马香、金华猪和可乐猪等。伍隍猪以及内江猪整个群体的Ho 都高于He,说明2 个品种经过了闭锁繁育后,其遗传多样性有所降低,且群体中可能混入了其他品种的血缘,需要继续加以纯化。另外群体的杂合性表现出较低的水平,这可能是由于近亲繁殖或者基础群个体来源有限所造成的,这也是在小群体的地方品种保种群中较为常见的特征。Ne能够反映基因组遗传多样性与纯合模式。通过基因组不同物理距离的位点间连锁不平衡程度能够推断种群不同历史时期的Ne,但由于Ne 的估计对于系统误差较为敏感,当前世代的估计结果不准确,因此本研究仅计算不同群体在前219 世代到3 世代的Ne 值。结果表明,随着时间的推移,所有群体的Ne 都在逐渐缩小,这也表明物种进化过程中,尤其是在选择作用下,遗传变异在不断减少,遗传多样性同样也在下降。外种猪则由于强烈的人工选择,导致地方群有效群体大小不断衰减,这与之前的研究报道相一致。中国地方猪不同品种间的LD 衰减与Ne 差异都非常大,说明不同地方猪品种间遗传结构与多样性差异很大,这也与我国地理面积大、气候环境多元化有关。欧洲猪的LD 值()普遍大于中国地方猪群,由于其遗传背景不同,LD 衰减速度也存在很大差异。驯化选择会导致群体遗传多样性下降,位点间的相关性(连锁程度)加强。所以,通常驯化程度越高、选择强度越大的群体,LD 衰减速度越慢。类似的,自然选择、遗传漂变导致的群体遗传多样性下降,也会减慢LD 衰减的速度。

为了分析整个群体的遗传背景差异程度,本研究使用邻接法,并且基于IBS 距离矩阵对四川8 个地方猪种与1 个外国猪种进行聚类。结果显示,伍隍猪与内江猪相对于其他猪种在一个支系,这与先前的报道其血缘存在一定交流一致。但是伍隍猪与内江猪2 群体内部的NJ 进化树显示,伍隍猪与内江猪属于2 个独立的品种,虽然存在血缘交流,但是遗传距离较远。针对2 个群体的家系分析表明,不同家系的公母猪数量和近交程度均不相同,且2 个群体在种猪数量中也不平衡。所以在后续的保种过程中,需要时刻关注平衡各家系种猪的数量,以免造成血统流失,维持一个平衡的家系结构。

ROH 是一种普遍的遗传现象,在不同种群基因组上广泛存在,而ROH 作为一种反映群体基因组结构特征的遗传参数,又具有群体特异性。ROH 可以指示亲缘的远近和近交的历史,ROH 片段越长,家系内存在近世代近交的可能性越高。本研究结果表明伍隍猪ROH的平均长度相较于内江猪更长。在过去几十年里,欧洲现代品种猪占据着中国养猪业的统治地位,导致中国地方猪的养殖数量显著减少,伍隍猪、内江猪的种群规模也因此受到影响。在本研究中,伍隍猪、内江猪样品采集于保种场,种群数量有限,从而导致近世代较高程度的近交。近交使得群体的遗传变异减少,多样性降低,是影响基因组纯合性的一个重要因素。在缺乏基因组数据的传统育种中,往往只能通过个体的系谱记录计算通径系数来估计近交。后续研究发现,基于ROH 计算的近交系数(F)与基于系谱信息的近交系数间的相关系数随着ROH 长度的增加而提高,在群体系谱信息不全的情况下,F可以替代系谱信息来评估近交程度。伍隍猪、内江猪猪保种场早期的猪主要从主产区及周边长期从事地方猪饲养的农户收集而来,系谱信息不全,因此需要通过基于ROH 的近交系数(F)来评估其近交程度。本研究基于ROH 计算了每个猪群的近交系数,2 个猪群中内江猪的近交程度较低,伍隍猪的近交程度较高,这也可能与伍隍猪公猪数量较少有关,由于在伍隍猪群体组建时缺乏足够公猪血缘导致的伍隍猪近交系数较高。

本研究对2 个群体ROH 高频区域进行了注释分析,通过将注释分析得到的基因与猪 QTL 数据库进行比对,鉴定到1 个伍隍猪候选功能基因和5 个内江猪候选功能基因,基因与猪肉24 h 电导率、解冻损耗、肌内脂肪含量、后腿质量有关,基因影响虹膜色素沉着,基因影响猪的体长,INTU 基因与仔猪出生窝重有关,基因影响3~4 肋间背膘厚度及瘦肉率,基因与猪日增重有关,而注释到的基因主要围绕肉品质性状、生长性状相关。

先前的研究发现,地方猪在长时间的自然选择和人工选择中存在大量的受选择信号,例如刘刁在深县猪种进行全基因组选择信号检测,发现了多个与深县猪肉质、繁殖及免疫相关的候选基因。路玉洁等在6 个地方品种中发现了多个与产仔相关的功能基因。本研究利用Fst 与π-ratio 对伍隍猪群体与内江猪群体进行了群体间全基因组信号检测与生物信息学分析发现,基因在精子生成中与精子获能相关,这与在长期自然选择中中国地方品种优异的繁殖性能有关。显著富集在黄体酮调节卵母细胞成熟(ssc04914)过程中,间接说明在上世纪40 年代引入内江猪改良伍隍猪群体性成熟性能,经历长期选择后在基因组中表现出了强选择信号。基因在先前的研究证明与肌肉有氧运动有关,在肌肉的生长发育过程中,基因在鸡的胸肌卫星细胞中高表达证明了其与肌肉的生长相关,这二者共同富集在了血管内皮生长因子受体信号通路中表明,伍隍猪的肉质表型在长期的人工选择中收到了正向的选择。富集在生长激素的合成、分泌和作用(ssc04935),这说明了伍隍猪重点选留其生长性能表型,与早期研究中阐明伍隍猪育肥性能弱于内江猪相符。淋巴管生成的正向调控(GO:1901492)和白细胞跨内皮迁移(ssc04670)均与免疫相关,这也为中国地方品种耐受力高提供了佐证。

4 结 论

本研究对伍隍猪与内江猪进行全基因组SNP 芯片分型后发现,伍隍猪作为一个优良地方品种,其与内江猪虽然存在基因层面的交流,但是从群体遗传学与进化的角度分析显示伍隍猪是独立于内江猪外的一个独立群体。综上所述,为了预防我国优质种源丢失,需尽快针对伍隍猪地方种群进行保种措施,以确保品种遗传资源的长期保存。

猜你喜欢

基因组遗传群体
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
宏基因组测序辅助诊断原发性肺隐球菌
“85后”非遗传承人的旗袍梦
哪些群体容易“返贫”——受灾户、遇困户、边缘户
认清亏欠问题——对参与近期香港暴乱的青年群体之我见
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
“群体失语”需要警惕——“为官不言”也是腐败