母系猪繁殖性状的基因组选择策略
2019-08-12董林松吴珍芳蔡更元
董林松,谈 成,吴珍芳,吴 丹,蔡更元*
(1.华南农业大学动物科学学院,国家生猪种业工程技术研究中心,广东广州 510642;2.温氏食品集团股份有限公司,广东新兴 527400)
中国是养猪大国,生猪生产和猪肉消费都位居世界第一。然而相较于一些发达国家,中国的生猪生产成绩并不理想。中国的母猪年断奶仔猪数(PSY)仅为16~18 头,比欧美国家低10 头左右[1],其原因与种猪质量、营养饲料、疾病防控和饲养管理等方面有关,其中种猪质量是最关键的一个因素,约占养猪增产贡献率的40%。因此,对种猪性能进行遗传改良是提高中国养猪业成绩的重要手段,而对母系猪繁殖性状的改良是提高PSY 的首要考虑因素。因此,有必要探讨母系猪繁殖性状的育种策略,对节约生产成本、提高母猪繁殖效率和经济效益都具有重要意义。
1 母猪的繁殖性状特点
母系猪指的是繁殖力较高、生产商品猪时其后代用作终端母本作为或其杂交后代作为终端母本的母猪品种(系),通常是指大白和长白猪。母系猪主要有产仔多、母性好、生长和肉品质较为优秀(如长速较快、瘦肉率较高)等特点,通常是将繁殖性状当作首选性状,再结合生长速度、饲料转化效率和背膘厚度等性状来进行综合选择。父系猪主要考虑生长和肉品质性状,通常不考虑繁殖性状,因此母系猪与父系猪选育的最大区别就在于如何对繁殖性状进行选育。相对于生长性状,繁殖性状的选育存在两大困难:一是遗传力较低,通常认为不超过0.1(表1),使用传统方法很难获得较高的育种值(Estimated Breeding Value,EBV)估计准确性;二是繁殖性状为限性性状,公猪无产仔能力但却携带产仔基因,为提高公猪的选择准确性需要进行后裔测定。尽管后裔测定可以获得很高的EBV 预测准确性[2],但该方式会导致世代间隔过长。虽然母猪可以通过自身产仔数据来预测EBV,但仅凭单胎的产仔数据很难获得准确的EBV 预测结果,而采用多胎产仔记录来提高选择准确性同样会导致世代间隔过长而无法加快遗传进展。因此,传统的育种方法虽然对生长性状有较好的选育效果,但对繁殖性状的选择效果较差,需要考虑采用更先进的育种技术。
表1 母猪各个繁殖性状的遗传力估计值
2 基因组选择
目前常规的EBV 预测方法以最佳线性无偏预测(Best Linear Unbiased Prediction,BLUP) 为 主, 由Henderson 等[6]于20 世纪70 年代提出并随计算机技术的发展而迅速被推广应用。BLUP 方法考虑了多个固定效应,并充分利用系谱信息做到对EBV 的无偏预测。然而,亲属间的关系是根据系谱通过概率进行推断,同样存在2 个潜在的问题:一是系谱记录的准确与否,如果系谱记录不够准确,通过系谱推断个体间关系对预测EBV 可能起到相反的效果;二是即使系谱记录准确无误,等位基因在世代传递中的差异也无法捕获到,因此无法很好地预测个体育种值中包含的孟德尔抽样误差项[7]。解决上述问题的根本方法是获取个体的基因型信息,通过基因型来推断个体之间的亲缘关系。由于繁殖性状是数量性状,由众多的微效基因共同影响,因此为了能够准确地预测EBV,需要使用高密度的标记来捕获足够的遗传方差。这种通过全基因组的标记信息来预测基因组育种值(Genomic Estimated Breeding Values,GEBV)的方法被称为基因组选择(Genomic Selection,GS)或基因组预测(Genomic Prediction,GP),最早由Meuwissen 等[8]于2001 年提出。由于GS 可以为奶牛业带来巨大利润[9],同时随着高通量测序技术的发展,该方法逐渐被重视并加以利用。
2.1 GS 的优势 GS 的优势主要体现在以下几方面:①提高选种的准确性。由于GS 可以更准确地捕获EBV中所包含的孟德尔抽样误差项,所以相对于传统育种,GS 可以获得更高的GEBV 预测准确性。例如,全同胞在没有测定记录时,通过常规BLUP 方法预测的EBV 是相同的,而通过GS 方法就可以预测出不同的GEBV。已有研究证明,通过GS 预测母猪产仔数GEBV 比常规BLUP 方法准确性更高[2,5]。②降低群体近交增量[7]。利用系谱是通过概率推算个体间亲缘关系,难免会产生一些误差,而GS 直接利用标记基因型进行推断,可靠性更高,可以有效降低群体近交发生的概率。③可以进行早期选择[9]。有些性状(如公猪精液品质和母猪产仔数)的记录需要种猪长到一定阶段才可以。若对产仔性状的选择要等到母猪有了产仔记录或公猪有了后裔测定记录之后进行都不太现实,而GS 可以在公(母)猪出生后不久进行,极大地缩短世代间隔,加快遗传进展。此外,淘汰的小公猪由于提前去势,避免了未去势公猪肉质口感上的劣势导致的价格降低,因此还可以带来额外的收益。④有助于对难以活体度量的性状进行选择[10]。如抗病力和肌肉品质等性状不适合在候选个体上进行活体度量,而GS 方法只需进行少量身体组织采样即可预测GEBV,大大降低了对候选个体的伤害,更适用于这些性状的选育。
如上所述,由于繁殖性状的遗传力较低且为限性性状,即使母猪有性能表现也通常要长到12 月龄之后,因此GS 非常适用于对繁殖性状进行选育。尽管GS 也可以提高生长性状的GEBV 预测准确性,但其额外的收益要远低于繁殖性状。
2.2 影响GEBV 准确性的因素 GEBV 预测准确与否直接关系到选种的准确性,进而影响到遗传进展。Daetwyler 等[11]对影响GEBV 预测准确性的因素进行了分析:
其中,r(g^,g)为预测准确性,N 为参考群大小,h2为性状的狭义遗传力,M 为影响性状的有效染色体片段,这里可认为是数量性状基因座(Quantitative Trait Loci,QTL)数量。参考群越大和性状遗传力越高,GEBV 预测准确性越高;而QTL 数量越多,GEBV 准确性反而越低。此外,GEBV 预测 的准确性还受到预测方法、标记数量、参考群体代表性和实验操作误差等因素的影响。GS 预测方法主要包括各种基因组BLUP(Genomic BLUP,GBLUP)[8,12]和贝叶斯[8,13-15]等方法,不同方法在计算时间、先验假设和预测准确性上各有优缺点,但目前较为常用的是能够将系谱和基因组数据结合分析的一步GBLUP 法(single-step GBLUP,ssGBLUP)[16-17],该方法扩大了可利用的信息范围,从而获得较高的GEBV 预测准确性。单核苷酸多态性(Single Nucleotide Polymorphism,SNP)标记数量通常达到50 000 以上就可以满足GS 需求,在种猪上这种级别的SNP 数据不论是芯片[18]还是简化基因组测序[19]技术都可以达到。参考群体代表性是指参考群体与候选群体的亲缘关系,关系越近代表性越强,预测的准确性也越高。
然而,GS 育种也有缺点,如基因型分型成本昂贵。除了改进基因型分型方法之外,也可以通过控制参考群的个体数量来降低成本。从公式(1)可发现,参考群大小可以依据遗传力的高低进行调节。例如,假设其他条件均不变的情况下,当性状遗传力为0.1 时使用10 000个体构建的参考群,与遗传力为0.4 时使用2 500 个体构建的参考群所获得的GEBV 预测准确性是完全相同的,但后者在参考群体的基因型分型费用只达前者的25%。因此,若能够提高或变相提高性状的遗传力,则可以减少参考群的个体数量,从而降低GS 育种成本。
3 繁殖性状GS 育种策略
本文以母猪产仔数性状为例进行说明,也可以用于其他繁殖性状,如母猪泌乳力和断奶至配种间隔天数等。如何构建一个优秀的参考群体是GS 育种成功的关键。母猪产仔数的遗传力较低,为提高GEBV 预测的准确性,根据公式(1)可以选择加大群体测定数量,但同时会增加成本,因此不考虑采用此策略。由于母猪可以进行多胎产仔,此时可以通过记录多胎数据来变相提高性状的“遗传力”。
3.1 提高母猪的“遗传力” 综合以往研究报道[3-5],这里假设母猪产仔数的狭义遗传力为0.1,重复力为0.15,通过母猪单胎次产仔记录来预测产仔数EBV 的准确性为性状遗传力的平方根[20],即31.6%;对于连续有多胎记录的母猪,EBV 预测准确性(r)可通过如下公式获得[20]:
其中,k 为有记录的产仔次数,re为产仔数重复力,h 为遗传力的平方根。根据公式,母猪有连续1 胎,2胎,......,直到8 胎产仔记录的EBV 预测准确性分别为31.6%、41.7%、48.0%、52.5%、55.9%、58.6%、60.7%和62.5%。由此可知,当母猪有连续5 胎的产仔记录时,其EBV 预测准确性达到55.9%,相当于遗传力为0.31 的性状通过单次表型记录预测EBV 的效果,基本等价于猪生长速度的表型选择效果。
3.2 提高公猪的“遗传力” 虽然公猪不产仔,却携带有产仔基因,因此优秀的公猪可以将优秀基因传递给子代。由于公猪往往与多个母猪交配而产下较多的后代,因此每头公猪的女儿被留种的数量通常比较多。如果通过女儿的产仔记录来反映该公猪的产仔潜力(即后裔测定),将会获得一个很高的EBV 预测准确性。借助于奶牛GS 的经验[9],可以考虑将有女儿生产记录的公猪作为参考群体来进行GS 育种。通过后裔测定对公猪的EBV 预测准确性可通过如下公式计算[20]:
可以看出,公猪EBV 的预测准确性受到性状的遗传力(h2)、重复力(re)、女儿的测定数量(n)、有记录的产仔次数(k)和后代间亲缘关系(rAO)等因素的影响。根据上述公式推算,不同的女儿测定数量和产仔记录次数下的公猪EBV 预测准确性见表2,可以看出,公猪产仔数EBV 预测准确性随着女儿测定数量和记录的产仔次数增加而上升。但当有连续5 胎以上记录时,随胎次记录的增加,EBV 准确性上升幅度较慢,并且育种场为加快遗传进展通常会及时淘汰超过6 胎的母猪。假设公猪有20 个女儿,且每个女儿有5 胎的产仔数记录,女儿之间的亲缘相关系数为0.25(即半同胞),该公猪的EBV 预测准确性很高(79.3%),相当于遗传力为0.63 的性状通过单次表型记录预测EBV 的效果;即使女儿亲缘系数为0.5(即全同胞),EBV 准确性也可达到62.7%,相当于遗传力为0.39 的性状单次表型记录获得的EBV 预测效果,况且场内通常不会出现同一头公猪所有女儿都是全同胞的现象。因此,利用女儿产仔记录来预测公猪的产仔数EBV,相当于变相提高了公猪产仔数性状的“遗传力”。
表2 不同女儿测定数量和产仔次数记录下的公猪产仔数EBV 预测准确性
3.3 参考群体构建方案 根据上述结果,通过预测生产公猪和有多胎记录的母猪产仔数EBV 可以变相提高性状的“遗传力”,在同等条件下就可以减少参考群个体的数量。因此,为节省基因型分型成本,可考虑使用核心育种场的公猪构建参考群体。对年龄较大的生产公猪进行DNA 样本采集,对年轻公猪也可以进行DNA 采样,但由于后裔测定数量不够可暂时不加入参考群。通过后裔测定记录预测出每头公猪的EBV,而将来这个EBV则可作为观测值加入到基因组预测模型中。
在大部分育种场中,由于大龄公猪往往已经被淘汰且没有留下DNA 样品,而场内公猪数量过少通常达不到建群规模,因此用来建群的更有可能是有多胎记录的母猪,例如可以利用有5 胎以上产仔记录的母猪来构建参考群。图1 为作者设计的以母猪作为参考群进行繁殖性状GS 育种的示意图。在实际应用中,由于有多次测量记录,可以考虑使用重复力模型进行候选个体的GEBV 预测。但需要注意的是,如果母猪已经用于预测父亲的EBV 并且该父亲已经在预测模型中,该母猪不应再次出现在模型中,否则会出现同一个体重复参与估计的问题而降低GEBV 预测准确性。
图1 母系猪繁殖性状GS 策略示意图
在上述GS 参考群体构建方案中,详细完整的性能记录是十分必要的,同时若使用公猪建群需要有准确的系谱记录,完整的系谱也是ssGBLUP 能够准确预测GEBV 的前提。此外,GS 还需要对参考群个体进行DNA 采样。原则上,使用公猪建群的效果要好于母猪,但由于国内绝大多数猪场都没有提前对淘汰公猪的DNA 样品进行保留,导致可利用的公猪数量过少,因此不得已只能使用母猪构建参考群体,这是我国育种工作需要改进的一个方面。以芬兰[21]为例,尽管养猪规模并不大,但从20 世纪90 年代开始就已经保存了所有生产公猪的毛发用于DNA 提取,可以顺利开展GS 研究。因此,原始样本和数据的积累工作,不论是对常规育种还是基因组育种都是必不可少的环节。
4 小 结
随着高通量测序技术的飞速发展,种猪选育工作必然会进入基因组育种时代。GS 育种的关键核心就是一个有代表性的参考群体,针对不同物种和性状的特点应有特定的育种策略。上述母系猪繁殖性状的GS 策略有助于将有限的参考群体发挥出更大的功效,有益于提高GEBV 预测准确性、加快遗传进展和节省育种成本。