全基因组选择技术在猪育种中的应用进展
2023-02-04江慧青李千军崔茂盛张丰霞李文军
江慧青 ,李千军 ,崔茂盛 ,马 墉 ,张丰霞 ,李文军
(1.天津市农业科学院畜牧兽医研究所,天津 300381;2.天津农学院动物科学与动物医学学院,天津 300384;3.天津市农垦康嘉生态养殖公司,天津 300380)
家畜育种是人类应用遗传学理论,主要是在遗传水平上改良动物群体重要经济性状,从而提高效益的方法和技术。家畜在经过长期的优胜劣汰自然选择后,人工选择也加快了育种进程。时代和科学技术的发展,动物育种经历了4个阶段,从主要依靠古朴经验学的人工驯化1.0阶段,到依赖于试验设计和数据统计的杂交育种2.0阶段,再到分子育种时代,而分子育种时代又分为转基因育种3.0阶段和智能设计育种4.0阶段。随着分子育种时代的到来,育种家们将分子标记和全基因预测应用到了选育工作中,全基因组选择等智能设计育种技术在时代发展的需求下应运而生。
育种的关键是选择,选择的关键是提高选种的准确性,即若想选择具有优良遗传性状的个体,其主要核心在于选择的准确性。市场需求是家畜育种发展的动力,全基因组选择是对传统遗传评估技术的一次重大革新,该技术是利用覆盖全基因组的高密度遗传标记计算个体的基因组估计育种值(Genomic estimated breeding value,GEBV)。全基因组选择技术在动物育种中最早应用于奶牛,且已在奶牛行业取得显著成效,但在猪育种方面研究得还不够深入。猪的生长性状和繁殖性状的提高是养猪经济效益的基础,与生长性状相比,猪的繁殖性状,如产仔数、产活仔数具有遗传力低和限性表现的特点,传统育种方式难以获得较高的育种值估计准确性。目前全基因组选择技术(Genomic-wide selection,GS)在猪育种方面的研究与国外相比仍存在较大差距,在“十三五”、“十四五”农业动物育种领域规划中GS已被我国列为重点发展和研究的育种技术之一。GS可以有效提高育种的准确性和遗传进展,缩短世代间隔和降低人工育种成本,且对于传统育种中的低遗传力性状和难以测量的等性状,比如繁殖性状,GS也更具优势。所以基因选择等分子育种技术在动物育种方面是非常值得深入研究的技术方法。
本文主要从全基因组选择技术在猪育种中的方法步骤、影响因素、优势和应用现状等方面进行综述,以期为我国在猪育种行业中应用全基因组选择技术提供参考。
1 猪全基因组选择步骤与方法
GS的计算方法主要可以分为直接法、 间接法和其它方法,是对基因组估计育种值即GEBV的算法,常见应用模型见表1。GS选择流程主要包括参考群和候选群的建立。第一步:建立参考群,参考群体要求至少有3代以上的系谱数据,且都有已知的表型数据和基因型数据,选择合适的统计模型分析计算得到每个个体的单核苷酸多态性(Single nucleotide polymorphism,SNP)效应值。第二步:候选群的选择,对候选群里的个体进行基因检测,获得基因型数据即基因分型,再依据参考群中估计得到的SNP效应值来获得候选群中每个个体的GEBV;如果只有单性状,则根据GEBV排名由高到低对个体进行选留,如果有双性状或者多性状,则根据需要计算获得综合选择指数,最后按选择指数从高到低选留个体。待选留个体完成表型性能测定后,若想使优良性状得到稳定遗传,就需要将这些个体放入参考群中用于重新估计效应值,用来保持参考群和候选群的更新。
表1 全基因组选择技术方法
2 猪全基因组选择优势
全基因组选择是指利用覆盖整个基因组的高密度SNP计算个体的GEBV并加以选择的育种方法。育种值能够稳定遗传给后代,根据育种值进行选种可以获得稳定的遗传进展。根据数量遗传学理论,可知遗传进展的公式为:
与传统选育相比,由上述公式可知GS主要在选择准确性和缩短世代间隔方面有显著优势,可有效提高遗传进展。(1)早期选择准确率高:在猪的GS应用中主要是靠提高GEBV的准确性来加快遗传进展的。(2)缩短世代间隔:运用GS,在候选群中,仔猪出生后哪怕没有表型数据,也可利用基因型数据分析获得的效应值进行前期个体选择,将不合格的仔猪早期就淘汰掉,不用等长大再去选择,即实现早期选择,相当于提高了选择强度,降低了育种成本。(3)GS对一些低遗传力性状、限性性状和难以测定的性状以及不能早期度量的性状,如抗病性状率、产奶性状、繁殖性状、使用寿命等性状提供了可行性操作的途径,能大幅度的提高育种值估计准确性,加快遗传进展。
3 影响全基因组选择准确性的因素
性状的GEBV值准确性可以用来体现选择的准确性,而GS的准确性受多个因素的影响,其中有表型数据的准确性、参考群规模、芯片密度等。
3.1 表型数据记录的准确性
参考群体的系谱数据和表型数据的完善记录和准确收集对于开展全基因组选择至关重要,不然哪怕拥有基因分型数据,也没有任何价值,因为只有在确保系谱和表型信息的准确的前提下,才能保证GS结果的准确性。
3.2 参考群规模
Hayes等和vanRaden等的研究都表明,参考群规模的大小对GEBV准确性影响很大。Haberland等研究认为,GS应用于猪时,参考群至少大于1 000头才能达到较好的准确性,目前主流观点是参考群大于2 000头或3 000头效果最好,且遗传力越低,规模越大效果越好。总之,参考群规模越大,GS技术评估准确性越高。
3.3 育种芯片标记密度
GS是基于育种芯片的基础上进行的研究分析,理论上在猪育种中SNP芯片的标记密度是越高越好,虽然标记密度越高意味着检测费用越贵,但SNP标记密度越高代表标记间的连锁不平衡就越高,可使预估到的基因估计育种值即GEBV准确性越高。
3.4 遗传力大小
中、高遗传力性状,GS取得的应用效果较明显,但对于低遗传力或难以度量的性状,需要的参考群规模就越大,评估准确性才会越高,否则实际意义不大。
3.5 参考群与目标群体个体间的相关性
候选群的GEBV估算依赖于参考群的SNP效应值即遗传参数进行计算选择,所以参考群与候选群之间的世代间隔也将影响选择的准确性。研究表明,参考群和候选群世代间隔数越小,尤其二者世代间隔在1-2代时其GS预测准确性越高。
3.6 育种值估计方法
不管是直接法、间接法还是其他方法,目的都是通过模型计算获得估计育种值,目前应用最多的还是第一种和第二种方法。在全基因组选择技术研究中育种估计方法一直都是研究创新的重点。总之,任何方法和模型都有优缺点,目前没有哪一种模型可以保证计算准确性效果是具有绝对优势的。对于不同的遗传标记、不同的性状等情况,计算EBV需选择最适宜的全基因组选择方法和模型。
4 GS在猪育种中的应用现状
4.1 SNP芯片在猪育种中的使用现状
2001年由Meuwissen等提出全基因组选择概念,之后GS首先应用于奶牛且取得了显著的效果。2005年公布了家猪的基因组序列,Ramos等在2009年研发出了首款猪的全基因组SNP芯片,该款Illumina PorcineSNP60芯片的出现为猪实施GS育种提供了可能。目前猪品种中应用范围较广的SNP芯片国内外都有好几款,这些芯片的出现为猪进行GS育种提供了极大的便利。常见猪SNP芯片的信息简介见表2。
4.1.1 国外猪育种芯片
目前国外市场上猪品种应用范围较广的SNP芯片主要有3款,分别是PorcineSNP60 V2 60K芯片、PorcineSNP80 芯片和Axiom PorcineHD芯片。PorcineSNP60 V2 60K芯片属于固相芯片,来源于Illumina公司,该款芯片有64 232个SNP位点,该芯片是PorcineSNP60 V1 60K芯片的升级版,参考群主要涵盖长白猪、大白猪、杜洛克猪和皮特兰猪等国外的瘦肉型猪品种,性价比高,能提供足够的SNP密度,有效提高育种效率和准确性,但并不适用于我国地方品种猪。PorcineSNP80是来源于纽勤公司研发的固相芯片,该款芯片有68 528个SNP位点,SNP密度较高,参考群数据主要来源于杜洛克猪、长白猪、皮特兰猪和大白猪,可应用于全基因组选择和比较基因等研究,但芯片上的SNP位点都是从常见的国外品种中筛选出来的,跟PorcineSNP60 V1 60K芯片一样并不适用于我国地方品种猪的研究。Axiom PorcineHD芯片是Affymetrix公司研发的固相芯片,该款芯片有658 692个SNP位点,密度高,SNP标记的参考群品种主要源于杜长大和皮特兰猪,该芯片能够对样本进行基因分型而不会出现标记丢失或数据丢失问题,具有很高的遗传评估准确性,但价格昂贵,成本较高,不易大量检测。
4.1.2 国内猪育种芯片
在国家的大力支持和育种企业、育种专家的努力下,我国终于打破了国外猪育种芯片的垄断,拥有了具有我国自由知识产权的猪育种芯片。目前我国市场上猪品种应用范围较广的SNP芯片主要有3款,分别是中芯一号芯片、液相50K芯片和PorcineWEN 55K芯片。中芯一号V1芯片是江西农业大学最新研发的固相芯片,该款芯片有51 368个SNP位点,属于高密度芯片,是我国自主设计的固相芯片,打破了国外猪基因芯片的垄断,参考群已涵盖杜长大等主要商品品种及二花脸、巴马香、疝气等六大类型的中国地方猪品种,对我国特有猪品种选育更具针对性,该芯片涵盖猪从出生到屠宰整个生育期的繁殖、免疫等七大类422个性状,同时芯片可升级,但检测成本较高,大规模测定较难实施。中芯一号PLUS猪育种芯片在原中芯一号的基础上提升了有效位点数,以提升企业育种相关性状的选育效率、提高与其他分子检测产品数据填充方面的兼容性。CAUporcine5K是中国农业大学最新研发的液相芯片,该款芯片拥有543 832个SNP位点,液相50K芯片是基于靶向捕获测序技术的液相芯片,拥有自主知识产权,该芯片定制灵活、可任意增删 SNP 位点,芯片目前可拆分为1 K、10 K、40 K,检测成本较低,检测速度较快,可使基因组育种效率提升且更容易实施,但深度不够,遗传评估准确性低于高密度的固相芯片。PorcineWEN 55K芯片是广东温氏食品集团股份有限公司针对自有12个瘦肉型品系种猪遗传特点,自主研发的种猪育种专用高密度SNP固相芯片,是国内首款规模化应用于企业现场育种的自主设计芯片,拥有56 380个SNP位点,在种质资源多样性分析、GS、GWAS分析等方面优势明显,但该芯片属于定制类芯片,目前专用于温氏集团,针对性较强。
4.2 GS在猪繁殖性状中的研究现状
种猪的繁殖能力从侧面反映了养殖场的生产能力和经济效益,其中繁殖性状中的产仔数和产活仔数作为猪重要的经济性状之一,对猪场效益有直接影响,产活仔数越多,养殖户获得的收益越多。影响猪繁殖性能的因素有很多,其中遗传因素占主因,传统选育进展缓慢,而GS在这些方面尤其是对繁殖性状等低遗传力性状具有很好的改良优势。自从在牛育种上取得显著成效后,随着2012年国际猪基因组测序联盟、华大基因与中国农业科学院相继公布了猪的全基因组序列之后,GS在猪的育种上也逐渐成为了育种新时代的研究热点。在母系猪中GS能够通过实现早期选择和提高繁殖性状的选择准确性来达到加快遗传进展的目的。通过模拟繁殖性能数据,研究结果显示,运用GBLUP比BLUP分析得到的基因组预测准确性提高23%-91%。李勇等采用BLUP和GBLUP(GBLUP_WGS、GBLUP_snp60)两种方法对1 097头大白猪的总产仔数、产活仔数、健仔数和出生窝重进行育种准确性分析,研究表明除总产仔数外,产活仔数、健仔数和出生窝重的预测准确性GBLUP>BLUP。Forni等研究发现传统的BLUP预估效应为0.22,而运用一步法对平均窝产仔数进行预估分析其获得的效应在0.28-0.49之间。Simianer等对猪的产仔性状进行全基因组选择分析,研究发现GS可提高该性状37%的年遗传进展。张金鑫等对1 789头大白公猪的总产仔数进行GS分析,其EBV准确性为0.41,GEBV准确性为0.60,提高了19个百分点,研究指出运用GS对低遗传力性状提高幅度最大。
4.3 GS在猪其它表型性状中的研究现状
除了繁殖性状,GS在猪的其它表型性状上也取得了诸多进展,目前已有大量文章报道了猪全基因组选择的相关研究。邱奥等分别运用猪50 K固相芯片和猪50 K液相芯片,采用GBLUP方法对1 267头大白猪的达100 kg体重日龄(AGE)和100 kg活体背膘厚(BF)进行GS分析,研究表明两款芯片具有很好的兼容性,同时在对2个生长性状的GEBV准确性分析上,液相芯片比固相芯片平均高出1.7%。周隽等运用BLUP、GBLUP和ssGBLUP对杜洛克猪群体的达100 kg体重日龄、背膘厚和眼肌面积3个生长性状进行GS分析,结论表明一步法预测的准确性高于BLUP和GBLUP,其准确性提升为14.7%-51.1%和13.4%-45.7%。Ostersen等对杜洛克猪的日增重和饲料转化率进行了GS准确性分析,研究指出GEBV的可靠性分别可达0.34和0.20。Lee等使用BayesB方法预测2 432头大白猪的体长、体高和总乳头数的GEBV,其准确性分别为0.60、0.52和0.51,而且BayesB方法对猪的这3个外部特征的基因组准确性略高于BayesC方法。张金鑫等对1 789头大白公猪进行基因型检测,结合100 kg体重日龄、100 kg活体背膘厚的表型数据进行GS分析,研究指出传统育种值准确性分别为 0.70和0.72,GEBV准确性进一步提高至0.78和0.84,GEBV比EBV准确性提高了8和12个百分点,可见GS的准确性高于传统的系谱指数和育种值选种。这些相关研究都表明了全基因组选择技术在猪育种中是成效显著和具有光明前景的。
5 展望
目前,全基因组选择技术已经开启了猪育种新时代,虽然尚不及在牛育种上应用得普遍和成熟,但与传统育种相比GS是具有显著优势和改善效果的,且随着国家的重视、高通量检测技术的不断优化和芯片检测成本的下降,GS在国内种猪育种工作中还是相当有应用前景的。但不可忽视的是,GS在猪育种中仍然面临诸多挑战,比如养殖人员对表型数据的准确性和持续性记录重视度不够高;高通量的基因型测定成本对于大部分企业来说成本依旧高昂;随着数据的积累,对于模型和算法的要求会日益增高,所以仍需努力找到最佳的优化方法以及因为行业对专业度要求较高,育种专业技术人才目前是相对缺乏的。这一系列问题,都是急需大家去解决或重视的问题。总之,随着高通量技术的高速发展,种猪育种工作进入全基因组选择时代是大势所趋,不管是在猪还是其它动物育种上,检测成本、分析方法、品系和性状等诸多因素都影响着GS的应用与普及,因此具体如何高效应用GS,还值得进一步研究。