基于支持向量机回归的蛋鸡产蛋率预测模型
2019-10-25李飞蒋敏兰
李飞 蒋敏兰
摘要:蛋鸡产蛋率受生物、化学、物理以及人为等多方面因素影响,准确地预测蛋鸡产蛋率的变化趋势,建立蛋鸡的产蛋率预测模型对蛋鸡养殖具有重要的意义。将蛋鸡采食量、蛋鸡鸡龄、体质量、温度、光照时间以及是否服用营养素等6类影响因子进行处理,作为支持向量机(SVM)的输入数据,对蛋鸡的产蛋率进行预测,得到了一个稳定性好、适用范围广、预测结果准确的蛋鸡产蛋率模型,且预测结果符合蛋鸡的实际产蛋情况;同时为评估和分析SVM蛋鸡产蛋率预测模型的性能,以同样样本建立BP神经网络的预测模型,并用网络训练、测试用时、均方误差MSE以及相关系数r作为预测模型性能的评价指标。结果表明,基于支持向量机的蛋鸡产蛋率预测模型精度和耗时均优于神经网络预测模型。
关键词:蛋鸡产蛋率;预测模型;支持向量机回归;神经网络
中图分类号: S126 文献标志码: A 文章编号:1002-1302(2019)13-0249-04
随着“数字农业”[1]在中国的不断推进,中国蛋鸡产业化及规模化生产[2]有了较大发展,但与发达国家的蛋鸡养殖相比,我国的蛋鸡养殖不够数据化和智能化[3],还处于传统养殖阶段向智能化过度阶段。在国内,养殖户关心的是饲料、鸡蛋价格等浅显的数据,却忽略了一些更为重要的数据,如蛋鸡鸡舍的环境参数、产蛋率、料蛋比以及无法立即出售的鸡蛋新鲜度的检测等。这些数据不仅能反映某一阶段蛋鸡的养殖情况以及全局的效益,更是养殖企业下一阶段生产投入的重要依据。其中,蛋鸡的产蛋率是养殖企业最为关心的问题,准确地预测产蛋率的变化趋势、建立蛋鸡的产蛋率预测模型对蛋鸡养殖具有重要的意义。
产蛋率是一个受生物、化学、物理以及人为多方面影响的复杂系统,产蛋率呈非线性的变化,传统的方法很难建立一个精确的产蛋率预测模型。近年来,有不少学者研究并证明了外界的环境参数会对蛋鸡的产蛋率有一定影响[4-7],温度、光照等外界环境因素以及蛋鸡的采食量、鸡龄、体质量等都会影响蛋鸡的产蛋率。因此,结合某些环境影响参数,产蛋率的变化是有规律可循的。然而,以往的研究也存在不足:一是偏重产蛋率与某单一参数的相关性,没有系统地分析多方面因子对产蛋率的影响;二是没有重视产蛋率的经济价值和企业的效益性,建立蛋鸡的产蛋率预测模型。随着检测技术的多样化和精度的提高,通过对检测数据的处理和分析,并借助近年来发展迅速的机器学习方法,建立基于机器学习的产蛋率非线性预测模型,使产蛋率的预测随着上述多参数的变化成为可能[8]。
支持向量机(SVM)是Cherkassky等在统计学习理论的基础上提出的一种机器学习方法[9-10]。迄今为止,SVM在金融、医学以及图像等领域[11-13]均有成果。上述研究表明,SVM在小样本、高维度的情况下,对数据的分类和拟合能够产出较优的结果。目前,SVM在农业领域的研究也逐渐兴起[14-16],如农产品分类、水产养殖以及病虫害预测等。本研究以SVM回归理论为核心,针对产蛋率研究方面存在的不足,建立一种基于SVM回归的蛋鸡产蛋率预测模型。本研究记录并处理了2批海兰褐蛋鸡从开始产蛋直至出售期间共378 d的产蛋率以及蛋鸡采食量、蛋鸡鸡龄、体质量、温度、光照时间以及是否服用营养素等6类影响因子的数据;随后将第1批海兰褐蛋鸡的影响因子和产蛋率数据作为训练样本,带入SVM的输入端和输出端,得到蛋鸡产蛋率的预测模型;之后将第2批海兰褐蛋鸡用于验证SVM预测模型的精度:将第2批蛋鸡的6类影响因子数据作为测试样本带入训练好的SVM模型的输入端,得到第2批蛋鸡共378 d 的产蛋率预测值;最后通过比较蛋鸡产蛋率的实际值和预测值,反复调试SVM模型性能,得到一个稳定性好、预测精度高的蛋鸡产蛋率模型。
1 支持向量机产蛋率预测模型
1.1 支持向量机回归
2 基于SVM回归的蛋鸡产蛋率预测
2.1 试验数据来源及处理
本研究探讨的蛋鸡产蛋率预测模型的数据来源于安徽省亳州市正大蛋鸡养殖場。为保证预测模型的准确性和科学性,本研究记录2批海兰褐蛋鸡从开始产蛋直至蛋鸡售出期间,蛋鸡每天的产蛋率以及各项影响产蛋因子的数据,第1批海兰褐蛋鸡作为训练样本,第2批作为测试样本,采样时间为2016年10月28日至2017年11月12日。其中第1批蛋鸡为9 889羽,第2批为9 777羽。
由于2批蛋鸡的数目不同,而且在研究的过程中2批蛋鸡存在自然死淘,本研究采用1 d的蛋鸡总产蛋量除以蛋鸡总数,得出蛋鸡的日产蛋率。本研究采集的6种蛋鸡产蛋率影响因子样本也须要处理:(1)蛋鸡采食量,本研究用1 d的蛋鸡总采集量除以蛋鸡总数,作为采食量数据;(2)蛋鸡体质量,由于养殖场体质量为1周采集1次,采用Lagrange插值法,得出蛋鸡每天的体质量。Lagrange插值法是一种多项式插值法,可以给出一个恰好穿过二维平面上已知点的多项式函数,根据这个多项式,可以估计出蛋鸡每日的体质量。(3)是否服用营养液,本研究将药物混于水中,以保证服用营养液时,每羽蛋鸡都能服用。(4)温度,由于温度的不稳定性以及平均温度难以精确测出,用鸡舍最低温度和最高温度表示温度与蛋鸡产蛋率的关联性。光照时间可以准确监控、记录。至此,处理完所有需要的数据,得出7组影响蛋鸡产蛋率因素的数据(表1)。
2.2 支持向量机核函数选择和参数优化
SVM回归的关键在于核函数类型的选择,避免了在实行非线性回归时,低维空间样本数据映射到高维空间的复杂度,且不同的核函数会导致SVM的推广性能的不同[17]。本研究选取使用较为广泛的多项式核函数和高斯核函数:
对于不同类型的核函数,产生的支持向量的个数变化并不大,但核函数的相关参数对模型的预测性能有重要影响。在使用多项式核函数时,须要设置惩罚因子C以及多项式核阶数d 2个控制变量,而高斯核函数须要设置惩罚因子C和核函数宽度σ。为达到上述核函数参数的最优化,本研究使用网格搜索法和交差验证结合的方法来寻找最佳的核函数参数。
网格搜索法具有较高的学习精度、算法简单、容易实现并且可以搜索到划定网格中的最优解。该方法将2个参数分别取M、N个值,对M×N个参数的组合,分别训练不同的模型,再估计其学习精度,从而在这些组合中得到学习精度最高的一个组合作为最优参数。交叉验证作为一种消除样本随机性产生的训练偏差的统计学方法,将训练数据分为K个子集,以其中任意一个子集作为测试集,将其他的(K-1)个子集作为训练集从而得到决策函数。通过不重复循环直至每个子集都作为测试集被预测1次,最后取整体均方误差的平均值作为最终预测误差,从而规避了过拟合问题。综合SVM仿真速度和预测模型的准确率,本研究采用十折交叉验证寻找最优参数组合。多项式核函数及高斯核函数寻优结果详见表2。
2.3 基于SVM的产蛋率预测模型
本研究预测模型和数据处理基于MatLab2016a环境编程
由图1和图2的预测模型可知,多项式核函数和高斯核函数的预测结果和实际样本拟合度较高,且产蛋率上升下降的趋势吻合,说明基于SVM建立的蛋鸡产蛋率预测模型具有可行性和可信度,且具有很强的现实价值。由此可以看出,多项式核函数在产蛋率前期的预测性能并不是很好,波动性较大,此处与高斯核函数差距较大。
2.4 预测性能比较结果
为进一步评估和分析SVM蛋鸡产蛋率预测模型的性能,本研究使用BP神经网络建立产蛋率模型用来与SVM回归预测的性能作对比,结果如图3所示。
本研究在比较不同模型对同一蛋鸡产蛋率样本,采用了均方误差MSE和相关系数r作为预测模型性能的指标,均方误差的值越小,代表预测模型性能越好,相关系数的值越接近1,说明预测结果和实际值之间相关程度越高。计算公式为:
对比表3的不同核函数SVM和BP神经网络预测结果,SVM的预测性能在各项指标上均优于BP神经网络,尤其是在样本的训练时间上,SVM有着巨大的优越性。对比高斯核函数和多项式核函数可知,高斯核函数在该预测模型性能比多项式核函数高。综上,SVM预测模型具有较高的预测精度以及推广性。
3 结论
本研究基于SVM回归理论,提出了一种蛋鸡产蛋率预测模型,可归纳为以下几个方面:(1)以往研究偏重产蛋率与某单一参数的相关性,多影响因子研究较少。本研究针对这一情况,建立了蛋鸡产蛋率与温度、光照、体质量、采食量等6个影响因子的映射关系。(2)结合SVM回归理论,本研究提出了蛋鸡产蛋率预测模型,從试验结果可以得出结论,本预测模型预测精度较高,具有可信度和很强的推广性。(3)为进一步评估SVM蛋鸡产蛋率预测模型的性能,本研究以同样的样本用BP神经网络建立产蛋率模型作为对比,并设置相关评价指标。性能比较结果证明,基于SVM的蛋鸡预测模型性能优于BP神经网络,本预测模型稳定性好、适用范围广、预测结果准确。
本研究提出的基于SVM的预测模型,不仅仅局限于蛋鸡产蛋率的预测,其他禽类产蛋率同样适用于本预测模型方法。本预测模型具有很强的实用价值,值得推广并投入实际应用。
参考文献:
[1]Karner E. The future of agriculture is digital:showcasting e-Estonia[J]. Frontiers in Veterinary Science,2017,4(4):151.
[2]杨 宁,秦 富,徐桂云,等. 我国蛋鸡养殖规模化发展现状调研分析报告[J]. 中国家禽,2014(7):2-9.
[3]何万领. 蛋鸡养殖数据化与智能化需求[J]. 农业知识:科学养殖,2015(8):27.
[4]于晶华,于晶芳,于 萍. 蛋鸡产蛋性能的影响因素及解决办法[J]. 现代畜牧科技,2017(3):33.
[5]Otwinowska-Mindur A,Gumulka M,Kania-Gierdziewicz J. Mathematical models for egg production in broiler breeder hens[J]. Annals of Animal Science,2016,16(4):1185-1198.
[6]时 凯,陈长宽,卞红春,等. 不同养殖模式及光照度对蛋鸡产蛋率的影响[J]. 江苏农业科学,2016,19(2):254-255.
[7]严华祥,蔡 霞,徐志刚,等. 高产蛋鸡100周龄生产性能观察[J]. 中国畜牧杂志,2015,51(8):85-89.
[8]笪英云,汪晓东,赵永刚,等. 基于关联向量机回归的水质预测模型[J]. 环境科学学报,2015,35(11):3730-3735.
[9]Cherkassky V. The nature of statistical learning theory[J]. IEEE Transactions on Neural Networks,1997,8(6):1564.
[10] Cortes C,Vapnik V. Support-vector networks [J]. Machine Learning,1995,20(3):273-297.
[11]Chapellen O,Haffner P,Vapnik V N. Support vector machines for histogram-based image classification[J]. IEEE Transactions on Neural Networks,1999,10(5):1055-1064.
[12]Chen Y J,Liu Y Y,Zhao G Z,et al. Chinese traditional medicine recognition by support vector machine (SVM) terahertz spectrum[J]. Spectroscopy and Spectral Analysis,2009,29(9):2346-2350.
[13]Ding Y S,Song X P,Zen Y E. Forecasting financial condition of Chinese listed companies based on support vector machine[J]. Expert Systems with Applications,2008,34(4):3081-3089.
[14]Liu T L,Su Q Y,Sun Q,et al. Recognition of corn seeds based on pattern recognition and near infrared spectroscopy technology[J]. Spectroscopy and Spectral Analysis,2012,32(6):1550-1553.
[15]Tang J L. Maize seedling/weed multiclass detection in visible/near infrared image based on SVM[J]. Journal of Infrared and Millimeter Waves,2011,30(2):97-103.
[16]Deng X Y,Wang Q H,Chen H,et al. Eggshell crack detection using a wavelet-based support vector machine[J]. Computers and Electronics in Agriculture,2010,70(1):135-143.
[17]奉国和. SVM分类核函数及参数选择比较[J]. 计算机工程与应用,2011,47(3):123-124,128.