种猪生长性能选育的统计学基础和场内测定要求
2021-12-03王庆林
王庆林
(北京市顺义区张镇人民政府农业科 101300)
1 种猪数量性状选育方法的演进
1.1 原始选育方法
依据测量值的经验型选育方法。在统计法学出现并应用于育种之前的几千年里,人们直接依据测量值选择,选择性状多为质量性状、简单的数量性状和驯化,如外貌、产仔、肉质风味数等。这个阶段的选育,测量值一般直观可见,并不需要测量,且可比较群体和遗传物质交换十分局限,选育的进展相当缓慢。选育结果是形成了很多适应农耕文明和当地饮食口味的地方品种。
1.2 近代选育方法
基于方差分析对效应剖分的选育方法,需要比较严格的抽样、分组和置信度等试验设计,具有一定的选育效率,20 世纪70~80 年代前广泛应用,因局限性现已被基本淘汰。
1.2.1 效应表达
效应表达:P=G+E。
表型值P 由基型值和环境值相加构成。在不考虑测量误差的情况下,测量值即为表型值。
基型值G 包括加性遗传效应、显性效应和上位效应。数量性状由多基因决定,显性效应和上位效应微乎其微,且不能确定的遗传不予考虑,即基型值G 等于加性遗传效应A。为性状表现的内因。
环境值E 性状表现的外因归结为环境值。
1.2.2 遗传效应剖分
遗传效应剖分:δ2P=δ2A-δ2E。
型基效应δ2A测量值并不能直接反应基因的遗传作用,数量遗传学采用效应剖分,利用亲缘个体间基因存在的确定性和基因效应的确定性,剖分出环境效应,继而得到基型效应δ2A=δ2P-δ2E。
环境效应δ2E从作用一致性角度分为系统环境和非系统环境。系统环境指环境因素可控,同质同量的作用于每一头受测种猪,环境效应一致。不做环境因素分组设计的方差分析不能剖分出系统环境效应,其包含在δ2A里。非系统环境指环境因素R 不可控,随机的作用于受测种猪个体,具有正负性,其均值为零,即R=0,P=A。
1.2.3 遗传力h2
1.2.4 估计育种值
估计育种值(EBV)是利用加性遗传效应和表型值P 的简单线性关系,对育种值的估计,即A′=h2P)+P。数据标准化后P=0,A′=h2P′。
1.2.5 综合选择指数
综合选择指数(I)是多个形状育种值的经济加权I=∑rh2P。
1.2.6 置信度α 要求
置信度即数据的可信程度,置信度取决于抽样的代表性和抽样数量。简单的理解就是抽样对总体要代表性,且受测种猪数量不能过少,否则h2的置信度低,选择的准确性降低。
1.2.7 方差分析的局限性
由于系统环境效应包含在基因效应里,其差异造成基因效应对表型值占比的差异,即不同系统环境下的遗传力h2不尽相同。要保证选育工作效果,就要努力创造持续一致的系统环境,这就带来了环境控制的要求;而且分期测定,各期需要计算本期的h2,这又带来了测定分组设计的要求,进而带来了测定规模的受限,即抽样数量受限。正是因为这种方法效率低下,所以被80 年代开始应用的BLUP 方法所取代。
1.3 现代选育方法
应用计算机技术,采用数学模型描述变量间的关系和特征,以BLUP(最佳线性无偏估计)方法估计出总体中每个个体的某个性状的估计育种值或多个性状的综合选育指数。
1.3.1 最佳线性无偏估计
BLUP 实质是利用观察值的线性函数L′y 对固定效应和随机效应的任意线性可估函数(K′b+M′u),通过矩阵运算,对总体的每个点位进行估计和预测,要求同时满足无偏性和预测误差最小。
1.3.2 BLUP 法的优点
(1)不需要严格的试验设计。(2)广泛利用有亲缘关系个体的信息。(3)不同系统环境条件下的数据可以比较。可利用的数据量剧增,且每次运算均针对样本整体估计出变量关系,得到的EBV 更加准确有效,使得选育工作能高效的持续推进。
1.3.3 联合选育
基于数据库和场间遗传联系,进一步增加抽样数量和覆盖程度,提高估计的准确性和场间可比性。
1.3.4 建模的要求
(1)模型中因素不应过多,由于抽样的限制,因素过多会降低估计的准确性。(2)应减少低价值或低遗传力性状,它们会牵制其他性状的遗传进展。(3)在具备测定条件时,饲料转化效率和眼肌面积可纳入模型。(4)肉质性状可以利用同胞的屠宰信息。
2 本场(场内)测定的基本要求
2.1 抽样
即确定受测猪。
2.1.1 随机性
BLUP 法不需要计算h2,所以不需要做亲缘关系的分组设计,几公几母几阉割的设计完全没有必要。BLUP 法更注重抽样的随机性,使得样本更加具有备选群体的代表性,保证每个个体的估计育种值EBV 和综合选择指数I 更加可靠。
2.1.2 抽样数量
足够的抽样数量,即信息来源的数量,也是为了保证每个个体的估计育种值EBV 和综合选择指数I 的可靠性。
2.2 测量要求与结果
种猪性能本场测定的测量器具、计量标准和测定人员资质要求,参照《种猪生产性能测定规程》 NY/T 822-2019。
2.2.1 测量值
测量值包含表型值和测量误差,即:X=P+e,X 为测量值,P 为表型值,e 为测量误差。
2.2.2 测量精度
测量值由确定部分和估计部分组成。确定部分的最小量级既是测量精度,即测量值的个位,由数值和单位组成。如1g、1kg。测量精度对于数量性状的区分比较具有决定意义,例如日增重指标的精度为1g,如果降低到1kg 则失去了选育意义。估计部分是对精度下一量级质的主观量化,具有一定的区分比较意义,是测量误差的来源。
2.2.3 测量误差
广义的测量误差分为系统偏差和随机误差。系统偏差主要来自测量器具分度错误,具有方向性,对于测量个体的作用一致,对本场(场内) 测量值的比较影响不大,可视为系统环境效应。上升到场间测量值的比较,系统偏差则成为测量错误。随机误差即狭义的误差,测量过程不可避免,应尽量减小。选育过程中,世代遗传进展往往很微小,测量误差过高,测量值的置信度降低,将销蚀遗传进展,使得选育工作事倍功半。
2.2.4 测量错误
造成测量值失去真实性,使得选育工作劳而无功。
2.3 环境控制
2.3.1 环境要素
包括温度、湿度、光照、空气质量、营养水平、饮水、饲喂管理方式、微生物环境、社群地位等。从施加者角度分为自然环境和人工环境。从作用的均匀一致性分为系统环境和随机环境。
2.3.2 环境控制
环境条件适合本场生产水平,满足或略高于猪群正常生长需要即可。重点在于控制其作用的一致性,而不是人为地提供多么优越的环境。
3 本场(场内)测定的常见问题
3.1 是否设立测定舍
设立测定舍,增加环境控制设施,配置专人饲养管理等,即用人工环境取代自然环境,可以有效干预自然环境周期性变化的影响,有利于基因效应充分展现和测定工作连续开展。且有利于控制环境作用的一致性,增加估计的准确性。不利点在于增加了育种成本,限制了抽样数量。因此,有条件设立测定舍最好,没有条件,在一般的育肥舍抽样测定亦可。但要相对固定测定期安排,即年度间自然环境相对一致。
3.2 测定期的安排
对于设立测定舍,且人工环境比较稳定,不受自然环境影响的场,测定工作可以全年开展。对于育肥群抽测的场,需要确定测定期,亦即结测期。北方地区自然环境大致分为春秋季、夏季和冬季3 个特征段。春秋季适宜猪只生长,但也是种猪销售旺季,大部分种猪在抽测前已经被销售,这使得抽样产生偏差;夏季和冬季相对严酷,对猪只生长不利。综合考虑,北方地区选择晚秋初冬结测较为合适,即仔猪阶段落在夏季,因为仔猪相对不怕热,且一般产房、仔猪舍环境控制最好,炎热的影响小;生长期落在秋季,自然环境适宜猪只生长,且种猪销售为夏季生长的大猪;结测落在晚秋初冬,即使天气越来越冷,对生长后期的大猪影响也小。
3.3 受测种猪抽样
设立测定舍的场,结合保育阶段选留和血缘覆盖,抽取达30kg 体重的仔猪入测定舍测定。没有测定舍的场,在达到结测体重阶段,抽取生长发育最优的前20%~25%的种猪进行测定。其余种猪可能受到特殊环境因素的影响,生长过程出现过受阻,不宜列入测定。由于GBS 系统数模未列入阉割猪,故阉割猪不测定。
3.4 结测体重范围
考虑规程的普适性,《种猪生产性能测定规程》 NY/T 822-2019 规定的结测体重范围比较宽泛。具体到某个场,结测体重范围要收紧和固定,范围过宽,模型的线性降低,造成估计的准确性降低;范围过窄,结测的称重操作次数会增加,造成受测猪的应激,影响后期生长。结测体重定在本场选育目标体重±5kg 范围比较合理。
3.5 要不要空腹称重
要不要空腹取决于饲喂方式,按顿饲喂需要空腹,自由采食就不需要空腹。只要饲喂方式持续,确定下来的空腹或不空腹对估计的准确性影响很小。
3.6 极值的处理
测定数据出现极优值和极差值的原因可能是测量错误,要慎重对待。建议做预处理,即同期数据落在95%置信区间外的予以剔除。做预处理要注意两点:(1)猪群为同质群体。(2)多个同胞个体出现同向合理极值的应予采信。
3.7 无测定成绩的种猪可以被选留
BLUP 法是对总体每个点位进行估计。无自身测定成绩的种猪,通过亲属的测定信息,一样可以估计出育种值,作为选育依据。这也是BLUP 法与方差分析法的优点之一。