APP下载

气象因素对江苏地区荷斯坦奶牛产奶量的影响及产奶量预测研究

2020-02-22张顾任义方肖良文史潇罗晓春敖意

江苏农业科学 2020年23期
关键词:预测模型BP神经网络主成分分析

张顾 任义方 肖良文 史潇 罗晓春 敖意

摘要:在奶牛品种、生理因素以及管理条件相对稳定可控的情况下,气象因素是影响产奶量的重要因素。利用主成分分析法研究气象因素对产奶量的影响,并与相关分析法结果进行比较,确定影响江苏地区荷斯坦奶牛产奶量的主要气象因素和关键时期;在此基础上,构建考虑气象因素下基于BP(back propagation)神经网络的产奶量预测模型。结果表明,产奶量与温度、湿度呈明显负相关,与风速、降水量呈负相关,与日照时长、能见度呈明显正相关;主成分分析法得到的3个主成分因子(温度因子、天气因子、雨量因子)累积贡献率达0.794 3;较相关分析法,主成分分析法充分考虑气象因素的协同关系,分析结果更符合实际情况。考虑气象因素条件下基于BP神经网络的产奶量预测模型检验样本的决定系数达0.65,相对误差达9.48%,精确性、稳定性均较好。研究结果对江苏地区奶牛管理和牛奶生产提供环境控制依据具有重要意义。

关键词:荷斯坦奶牛;产奶量;气象因素;主成分分析;BP神经网络;预测模型

中图分类号:S823.9+1;S811.1   文献标志码: A  文章编号:1002-1302(2020)23-0150-05

奶业是江苏现代农业和食品工业发展的重点产业,2018年末全省存栏13.4万头奶牛,生鲜乳年产量50.0万t[1],产奶量是衡量奶牛泌乳性能的主要指标,为保障产奶量稳定,分析并控制其影响因素是基本途径。影响产奶量的因素[2-4]主要包括内因(奶牛品种、生理因素等)和外因(气象环境因素、饲养管理因素等),在奶牛品种、生理因素和管理条件相对稳定可控的情况下,气象因素是影响奶牛产奶量的重要因素[5-6]。江苏地区气候特点显著,夏季炎热高温,降水集中,雨热同期;冬季寒冷干燥,降水较少;春秋短促,气象条件多变。江苏地区独特的气象条件给奶牛的生长发育和产奶带来诸多影响。

有学者就气象因素与产奶量的关系已进行了诸多研究。Trajchev等利用线性混合模型,发现高温易导致产奶量大幅下降[7];West等基于数理统计法发现,温度、湿度和温湿度指数对产奶量影响较大[8];魏学占等利用相关分析发现,温湿度、气压是乌兰浩特地区春秋季节奶牛产奶量的主要影响因子[9];陈志英等基于多元线性回归定量分析气象因素对黑龙江地区产奶量的影响。结果表明,温度、湿度和日照影响较大[10]。由此可见,学者大多利用相关分析和数理统计方法研究气象因素对产奶量的影响,方法多侧重于气象单因素的影响及定性分析,但气象因素之间存在协同作用,最终影响产奶量,因此有必要分析气象多要素对产奶量的影响。

多数研究利用泌乳曲线分析奶牛个体泌乳规律,从而建立产奶量预测模型。Brody提出简化指数模型拟合泌乳曲线,Wood考虑环境因素提出不完全伽玛函数模型;王雅春等添加系数和校正值对Wood模型进行改进[11],此外泌乳曲线拟合模型还包括逆多项式模型[12]、多项式回归模型[13]、Wilmink 模型[14]等。由此可见,学者主要是针对个体的泌乳规律进行研究,针对某牛场或某地区逐日或逐月产奶量的预测研究较少[15],考虑温度、湿度等气象因素下预测产奶量的报道较少。

综上所述,本試验从产奶量与气象因素的角度,首先利用主成分分析法研究气象因素对产奶量的影响,并与传统相关分析的结果比较,确定影响江苏地区产奶量的主要气象因素和关键时期;然后基于气象因素与产奶量的关系,构建考虑气象因素下的基于BP(back propagation)神经网络的产奶量预测模型,并分析模型预测准确度。研究结果对江苏地区奶牛管理和牛奶生产提供环境控制依据具有重要意义。

1 材料与方法

1.1 研究资料

本研究选取南京卫岗乳业有限公司泗洪牧场2017—2019年奶量记录资料,资料内容包括荷斯坦奶牛逐日信息数据、逐日牛奶总产量,并根据泌乳奶牛数量计算逐日产奶量(以下简称产奶量);选取泗洪气象站(站码58135)相应时间序列的气象观测资料,观测要素包括日平均温度、日最低温度、日最高温度、日平均相对湿度、日平均风速、日累计降水量、日最低能见度、日照时长、气压。为保证资料一致性、准确性,共保留775组数据。

1.2 研究方法

1.2.1 主成分分析法 主成分分析(principal component analysis,简称PCA)是一种将多指标问题转化为较少综合指标的统计方法,基本思路是借助正交变换,将分量相关的原随机变量转换为分量无关的新变量。在处理实际问题时,当变量个数众多且变量之间关系复杂,分析问题难度增加,借助主成分分析法可重新组合成无关的综合变量[16]。主成分分析法广泛应用于动植物、生态等方面,近年来在奶牛饲养及其产奶量预测[17-18]上也有研究,方法可在不损失太多相关信息的基础上进行全面多性状分析,选择效果突出。

本研究利用主成分分析法分析气象因素对产奶量的影响步骤如下:

(4)求解相关矩阵R的特征方程,得p个特征根λ1≥λ2≥…≥λp。

确定主成分数量为m个,使累积贡献率达80%左右,且各主成分特征根一般须大于1。

1.2.2 BP神经网络模型 人工神经网络(artificial neural network,简称ANN)利用非线性模拟技术拟合输入输出相互关系,BP神经网络应用最为广泛。BP神经网络由Rumelhart和Celland于1986年提出,是一种按误差逆传播算法训练的多层前馈网络,算法基于Delta 学习规则,利用梯度搜索技术,通过反向传播不断调整网络的权值和阈值,最终实现网络的实际输出与期望输出的均方差最小化[19-20]。BP神经网络结构简单、仿真能力强、易于实现,为考虑气象因素的产奶量预测提供了新的途径[21]。

本研究采用3层网络结构的BP神经网络模型(图1),其拓扑结构包括输入层、隐含层、输出层,每层由一定数量的神经元构成,能够执行简单并行运算。本研究输入层为经分析后的主成分气象因素,输出层为产奶量,关键是确定隐含层层数与节点。若隐含层节点数过少,则BP网络获取有效信息少,容错性差;若节点数过多,则BP网络样本中非规律信息,泛化能力下降,因此确定合适的隐含层节点数非常重要[22]。学者提出大量确定方法,如试凑法、奇异值法和经验公式法等,本研究拟采用4种经验公式,并对比选取结果较好的隐含层节点数,公式为:

2 结果与分析

2.1 气象因素对产奶量的影响

气象观测数据经标准化处理、相关系数矩阵计算、特征根方程求解等,计算得出相关系数矩阵特征值和贡献率(表1)。根据主成分因子选取原则,前3个成分特征根均大于1且累积贡献率为79.43%,可反映气象因素的大部分信息,因此将前3个成分作为主成分,并计算得出其特征向量。程序运行于MATLAB R2014a中。

由表2可知,在第1主成分中,日平均温度、日最低温度和日最高温度载荷值较大且为负值,气压特征值也较大但为正值,江苏地区长时间序列下温度越高,气压越小,可知产奶量与温度呈明显负相关,这是由于荷斯坦奶牛耐冷不耐热,最适宜温度为10~16 ℃,当温度超过25 ℃时,奶牛出现呼吸急促、食欲不振,产奶量受到影响,因此可将第1主成分作为温度因子。在第2主成分中,日平均相对湿度较大且为负值、日最低能见度和日照时长较大且为正值,江苏地区能见度与天气良好相关性强,且产奶量与湿度呈负相关、与日照时长、能见度呈明显正相关,这是由于气温超过25 ℃时,奶牛主要依靠蒸发散热,湿度越大,与蒸发面水汽压和空气水汽压之差越小,蒸发散热量越小,奶牛产生剧烈热应激,影响产奶量[23],因此可将第2主成分作为天气因子。在第3主成分中,日平均风速和日累计降水量较大且为负值,可见产奶量与风速、降水量呈负相关,这是因为降水和大风过程常伴随降温、增湿,湿冷的天气易导致产奶量下降,因此可将第3主成分作为雨量因子。

为对比传统方法,本研究同时基于SPSS 22进行产奶量与气象因素相关分析。由表3可知,温度、湿度、降水量、能见度与产奶量的相关关系与主成分分析法所得结果一致,但相关分析中日照时长、气压与产奶量无明显相关性,这与主成分分析得出的结果不一致,分析原因可知相关分析割裂了日照时长、气压与天气、温度的协同关系,而仅仅考虑了产奶量与其相关关系,这与实际情况不符;主成分分析法充分考虑了气象因素之间的关系,分析结果更符合实际情况。根据3个主成分的特征向量,可得主成分与气象因素的方程:

2.2 考虑气象因素下的产奶量预测

本研究构建考虑气象因素下基于BP神经网络的产奶量预测模型,为排除时间因素对预测模型的影响,改进样本选取方法。首先将775个样本数据随机打乱顺序,然后选取其中700个作为训练样本,75个作为检验样本。模型输入层为经主成分分析后的气象因素,输出层为产奶量,隐含层节点数由经验公式计算并经试凑法验证取19个节点。为防止过度训练,在设置训练参数时,迭代次数设定为 1 000,学习率为0.01,以均方根误差(root mean square error,简称RMSE)作为训练停止指标,当RMSE小于0.01时停止训练,完成BP神经网络模型的建模,程序运行于MATLAB R2014a中,得到训练样本模拟结果和检验样本预测结果。

由图2可知,训练集、验证集和测试集的计算值与目标值之间的相关系数为0.78、0.67、0.73,700组训练样本相关系数达0.75,训练结果優良。由图3可知,在检验样本中,考虑部分误差较大值,相对误差≤20%共有71个检验样本,占比94.67%,相对误差≤10%共有48个检验样本,占比64%,75个检验样本的预测值与真实值的决定系数达0.65,相对误差达9.48%。由此可知,构建的产奶量预测模型结果精确性、稳定性均较好,同时操作性优良。

3 结论与展望

本研究利用主成分分析法研究气象因素对产奶量的影响,并与传统相关分析结果比较,确定影响江苏地区产奶量的主要气象因素和关键时期,最终得到3个主成分因子,分别为日平均温度、日最低温度、日最高温度和气压所表征的第1主成分(温度因子),日平均相对湿度、日最低能见度和日照时长所表征的第2主成分(天气因子),日平均风速和日累计降水量所表征的第3主成分(雨量因子);产奶量与温度、湿度呈明显负相关,与风速、降水量呈负相关,与日照时长、能见度呈明显正相关;与传统相关分析法相比,主成分分析法更充分考虑气象因素的协同关系,分析结果更符合实际情况。基于气象因素与产奶量的关系,构建考虑气象因素下基于BP神经网络的产奶量预测模型,模型预测结果显示检验样本平均相对误差达9.48%,考虑部分误差较大值,产奶量预测模型精确性、稳定性均较好。

基于主成分分析法确定影响江苏地区荷斯坦奶牛产奶量的主要气象因素和关键时期,在实际生产中,可由牧场管理人员、工作人员与气象服务部门交流对接,及时掌握影响关键时期和转折天气,更好制定和采取奶牛管理和牛奶生产的举措。基于BP神经网络的产奶量预测模型中,今后研究除考虑气象因素外,同时可考虑人工因素和管理因素,进一步提高预测准确性。

参考文献:

[1]孙宏进.推动江苏奶业高质量发展[J]. 中国畜牧业,2019(14):40-41.

[2]朱 坤,刘佳佳,查满千,等. 不同速度的音乐对奶牛血液激素水平和产奶量的影响[J]. 江苏农业科学,2017,45(14):123-125.

[3]马捷琼,刘缠民,陈 宏,等. 徐州荷斯坦牛NRAMP1基因多态性与产奶量通径分析[J]. 江苏农业科学,2007(1):116-118.

[4]马燕芬. 影响奶牛产奶量的因素[J]. 农家顾问,2008(7):48-49.

[5]姚焰础,江 山,肖 融,等. 热应激对荷斯坦奶牛体温和呼吸的影响[J]. 中国畜牧杂志,2012,48(11):59-62,75.

[6]张志登,敬盈嘉,刘 影,等. 热应激对泌乳奶牛生理指标及生产性能的影响[J]. 中国畜牧杂志,2020,56(4):169-172.

[7]Trajchev M,Nakov D,Andonov S.The effect of thermal environment on daily milk yield of dairy cows[J]. Macedonian Veterinary Review,2016,39(2):185-192.

[8]West J W,Mullinix B G,Bernard J K.Effects of hot,humid weather on milk temperature,dry matter intake,and milk yield of lactating dairy cows[J]. Journal of Dairy Science,2003,86(1):232-242.

[9]魏学占,唐红艳,杨忠霞,等. 气象条件对奶牛产奶量的影响及对策[J]. 内蒙古气象,2009(3):23-26.

[10]陈志英,阴 妮,池相河.气象因素对黑龙江省奶牛产奶量影响分析[J]. 现代畜牧兽医,2017(7):44-48.

[11]王雅春,陈幼春,柏 荣,等. 奶牛泌乳曲线的拟合及其模型参数的遗传分析[J]. 畜牧兽医学报,1999,30(5):399-404.

[12]张文龙. 新疆三个品种牛泌乳曲线的分析及产奶量校正系数的制定[D]. 乌鲁木齐:新疆农业大学,2013.

[13]Kocak O,Kiz B.Comparison of different lactation curve models in Holstein cows raised on a farm in the south-eastern Anatolia region[J]. Archiv fur Tierzucht,2008,51(4):329-337.

[14]Otwinowska-Mindur A,Ptak E,Jagusiak W,et al. Modeling lactation curves of Polish Holstein-Friesian cows.Part Ⅰ:The accuracy of five lactation curve models[J]. Journal of Animal and Feed ences,2013,22(1):19-25.

[15]李 欣,溫 万,王新燕,等. 基于ARIMA模型对宁夏地区奶牛月平均产奶量的预测[J]. 黑龙江畜牧兽医,2016(23):99-102.

[16]张 鹏. 基于主成分分析的综合评价研究[D]. 南京:南京理工大学,2004.

[17]王新峰,刘云芳,李明强,等. 主成分分析在奶牛产奶量选择中的应用[J]. 中国草食动物,2002,22(1):8-9.

[18]陆呈委,邓廷贤,谭正准,等. 奶水牛乳房线性性状主成分分析研究[J]. 中国牛业科学,2016,42(2):1-3.

[19]刘彩红. BP神经网络学习算法的研究[J]. 西安工业大学学报,2012,32(9):723-727.

[20]张永超,赵录怀,王 昊,等. 基于环境气体信息的BP神经网络苹果贮藏品质预测[J]. 江苏农业学报,2020,36(1):194-198.

[21]李友坤. BP神经网络的研究分析及改进应用[D]. 淮南:安徽理工大学,2012.

[22]蔡荣辉,崔雨轩,薛培静. 三层BP神经网络隐层节点数确定方法探究[J]. 电脑与信息技术,2017,25(5):29-33.

[23]古少鹏,高斌战,袁建琴,等. 温度风速对奶牛产乳量的影响[J]. 当代畜牧,2001(4):10-11.王裕玉,徐 跑,张志伟,等. 不同养殖模式对黑鲷生长、血清生化指标及抗氧化性能的影响[J]. 江苏农业科学,2020,48(23):155-160.

猜你喜欢

预测模型BP神经网络主成分分析
基于神经网络的北京市房价预测研究
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用