APP下载

基于大数据统计的土壤养分含量预测模型设计

2020-08-03王廷超王国伟安宇

现代电子技术 2020年8期
关键词:预测模型

王廷超 王国伟 安宇

摘  要: 针对传统预测模型预测土壤养分含量精度低的问题,设计基于大数据统计的土壤养分含量预测模型。使用光谱采集仪采集土壤养分含量数据,对数据进行平滑、标准化和正交化处理,消除影响预测精的数据。对处理后的光谱图进行分析,总结土壤养分大数据规律,明确在反射曲线突变处的不同波段对应不同含量的土壤养分。重复多次后,完成对模型精度的校验,实现基于大数据统计的土壤养分含量预测模型的设计。通过与传统模型的对比实验,验证设计的模型能够提高大约3倍的预测精度,更适用于对土壤养分含量进行预测。

关键词: 预测模型; 土壤养分含量; 大数据统计; 模型设计; 光谱分析; 模型测试

中图分类号: TN911.34?34; TP273               文献标识码: A                      文章编号: 1004?373X(2020)08?0012?03

Design of soil nutrient content prediction model based on big data statistics

WANG Tingchao, WANG Guowei, AN Yu

(College of Information and Technology Science, Jilin Agricultural University, Changchun 130118, China)

Abstract: A soil nutrient content prediction model based on big data statistics is designed to improve the low accuracy of traditional prediction model in predicting soil nutrient content. The data of soil nutrient content is collected with the spectral acquisition instrument, and the data is smoothed, standardized and normalized to eliminate the influence of prediction precision. The processed spectrogram is analyzed to summarize the rule of big data of soil nutrients, and it is clear that different bands at the abrupt change of reflection curve correspond to different contents of soil nutrients. The checking of model precision is completed after repeated for many times, and the design of soil nutrient content prediction model based on big data statistics is realized. The experimental results verify that, in comparison with the traditional model, the designed model can increase the prediction accuracy by about 3 times, and is more suitable for the prediction of soil nutrient content.

Keywords: prediction model; soil nutrient content; big data statistics; model design; spectrum analysis; model measurement

0  引  言

土壤養分含量影响当地植被、作物的生长态势,进而影响土壤所在地的水土条件。充分了解土壤养分含量,对于农业发展意义重大。土壤养分含量决定土地生产力,通过对其的预测,可以更科学地决策土地使用方式,选择适宜技术手段对土壤养分含量进行调整[1]。随着现代科学技术快速发展,遥感、地统计学等方法手段,亦可实现对土壤养分含量的预测。传统土壤养分含量预测模型,由于使用实验室分析数据,不仅在数据采集阶段耗费时间长、成本高,而且因为预测模型预测依据数据不具有实时性,导致预测精度低、预测周期长。

大数据统计是海量数据分析数据间规律的基础。大数据出现使得土壤养分含量预测能够有更为强大的数据分析基础[2]。本文设计的土壤养分含量预测模型基于大数据统计进行设计。

1  模型设计

如图1所示,本文设计的土壤养分含量预测模型为实现对土壤养分含量的高精度预测,使用采集到的土壤养分含量数据为样本数据,通过对样本数据的一系列处理,得到处理结果并根据处理结果反演出土壤养分含量,实现对土壤养分含量的预测,完成土壤养分预测模型的设计。

1.1  土壤养分含量数据采集

本文采集土壤养分数据使用光谱采集仪,利用土壤中不同养分含量对光谱仪检测光的折射、反射后的光谱不同,得到土壤的光谱。使用采集仪自带软件,得到土壤光谱数据[3]。将目标区域根据土壤上植被、作物、水含量等不同条件进行高密度划分。采集时,将光谱采集仪的光纤探头固定在三脚架上,将土壤整平,探头水平距土壤约5 cm,与水平夹角大约为45°,将采集目标中心点与光源中心点重合[4]。定期使用标准板对探头进行定标,完成土壤养分含量数据采集。尽管在采集过程中尽可能减弱外界因素干扰,土壤本身会存在一定影响预测精度的因素,采集的土壤养分含量数据需进行数据处理。

1.2  土壤养分含量数据处理

针对光谱测量土壤养分含量数据中一部分由于无关因素干扰导致的数据偏差,使用平滑方法去除噪声;对数据进行标准化处理来降低误差;利用多远散射校正和求导提取光谱有效信息[5]。

使用卷积平滑方法,利用最小二乘拟合系数作为数字滤波函数的各项参数,对原光谱进行卷积平滑处理。通过卷积平滑后的光谱数据消除了光谱中的高频随机误差,经过拟合后的信号信噪比提升,完成了光谱数据噪声处理[6]。平滑处理后的土壤养分含量数据,通过二次微分,消除隐藏谱带特征,去除谱带中的重叠,二次微分公式如下:

式中:g为微分宽度即查分度;x为在进行微分前的光谱吸光度;X为微分后的光谱吸光度。按照式(1),分别对数据进行一阶和二阶微分。由于光的干涉性,采集的土壤养分含量光谱数据微分后,会缩短微分光谱峰值的宽度,进而在较窄的峰值处更强调光谱吸收效果[7]。光谱数据中的光漂移去除,凸显出包含信息的光谱数据源。

两次微分后数据需通过数据标准化,对因光的散射现象产生的误差进行校正。根据SNV校正理论,在同一光谱中,不同波长点的吸光度数值应满足正态分布[8]。因此,按照式(2)对土壤养分含量数据做标准正态化处理:

式中:s为正态标准化后的数据;x为未处理数据;[μ]为光谱平均值;[σ]为光谱数据标准偏差。正态标准化后,数据均值为0,标准差为1。消除了因线性平移产生颗粒度和附加散射影响[9]。

测量土壤养分含量时,数据采集难免会受到温度、空气湿度、土壤含水量等干扰因素影响。通过使用EPO算法,将不需要的干扰量投射到正交空间,从而实现滤除干扰的目的[10]。假设n条测量光谱组成二维空间S,则光谱表现形式为:

式中:C为土壤养分物质产生的光谱效应,即需预测的数据;G为外界无法根除的变量因素引起光谱效应,且C与G相互独立,G为需要消除的干扰;R为独立冗余部分,不对最终预测结果产生影响[11]。用采集仪获取土壤养分含量数据时,只外部干扰参数变化,需检测的养分物质不变,影响变量正交处理后,映射到二维空间,一维空间数据为只包含土壤养分含量信息数据。对经过一系列处理后的数据进行分析,实现对土壤养分含量预测。

1.3  土壤養分含量数据分析

图2  光谱反射曲线

从图2可以看出,光谱波段在350~780 nm时,光谱反射率的增长速度较快,波段在520~600 nm的绿色光增长最为明显,其次是波段为450~520 nm的蓝绿波段和640~700 nm的红色波段。由于提供土壤养分的有机物质对可见光波段有明显影响,因此对光谱曲线做包络线消除处理。处理后的反射光谱,能够更清晰地显示土壤反射光谱的吸收特征[12]。

分析包络线消除处理后的曲线,出现明显吸收峰的波长值,对应不同土壤养分含量反射光谱波段[13]。从光谱反射曲线,反射率突变位置为特征位置。选取突变位置的光谱反射率,两点间反射率差值与波长差值的比值,为特征光谱波段的趋势斜率[14]。校验预测结果精度,计算真实值与预测值之间的差值,经过多次计算取平均值,得到预测土壤养分含量的相对误差区间[15]。实际最终预测值为光谱预测值在相对误差区间的上下取值。至此,完成基于大数据分析的土壤养分含量预测模型设计。

2  模型测试

为验证本文模型的精度,设计对比实验。本文设计的模型为实验组,传统模型为对照组,实验变量为不同土壤养分含量,控制实验变量唯一。

2.1  测试内容

实验对象为野外采集土壤表层至10 cm以内的40份土壤样本。剔除样本内的石子、植物根系等杂质。从40份样本中分取一部分送入实验室,经过溶液萃取等方法,获取上清液,从而得到实际土壤样本养分含量数据。将分取后的40份土壤样本平均分为两份,在如表1所示的实验环境下,使用实验组和对照组两个预测模型进行预测,得到实验结果。

2.2  测试步骤

为简化实验步骤,从野外采集土壤样品,在实验室完成实验。将实验用地根据植被、土壤类型等分区,按照50 cm×50 cm的规格对土壤进行划分。使用干净无菌的取样器材,取表层至深度10 cm的土壤样品,放入无菌密封袋中。设定土壤养分为有机类物质,使用烘干机对土壤样品进行烘干,并过筛。将每份土壤样品留取一部分,送入化学实验室,使用检测仪器精准确定各土壤样品的养分含量。按照养分含量高低降次排序编号,为保证养分含量真实值为线性,人工向样本中添加化学物质进行养分含量纠正。将剩余土壤样品均分为两份,实验组和对照组模型同时完成土壤养分含量预测。使用Matlab软件处理实验组和对照组模型的预测结果与真实值离散度,并绘制结果图。

2.3  测试结果

以实验室验出养分含量实测值为基线,实验组和对照组预测值为离散数据点,结果如图3所示。分析图3可知,相比对照组数据点,实验组数据点更靠近真实值曲线,离散情况要好于对照组数据点,数据相对误差小。计算两组数据点与真实曲线拟合度,实验组为0.125 7,对照组为0.378 2,说明实验组的预测精度约为对照组的3倍。综上所述,本文设计基于大数据分析的土壤养分含量预测模型能够提高传统预测模型精度近3倍,更具有优越性。

3  结  语

土壤养分含量是决定土地生产力的关键因素,使用科学技术手段来提高土壤养分含量的预测精度,一直是研究人员重要目标。大数据为提高土壤养分含量提供了新的支撑。针对传统预测模型精度低的问题,本文设计了基于大数据的土壤养分含量预测模型,通过对比实验验证了本文设计的预测模型能够有效提高近3倍的预测精度,更具有优越性。

参考文献

[1] 王永祥,王鹏.基于大数据的Web入侵风险预测[J].现代电子技术,2017,40(18):158?160.

[2] 时元宁.基于大数据分析的消费额度估计模型[J].现代电子技术,2018,41(24):156?158.

[3] 史金梅,夏伟.基于大数据分析的学生最优选课方案模型的设计与实现[J].现代电子技术,2017,40(14):30?32.

[4] 朱佳佳,胡登利,洪秀琴,等.基于时空大数据的甲型肝炎发病率分布特征分析及预测模型[J].中华疾病控制杂志,2018,22(11):62?65.

[5] 赵丹.基于大数据分析的运动损伤估计模型设计[J].现代电子技术,2017,40(17):101?104.

[6] 焦志伦,金红,刘秉镰,等.大数据驱动下的共享单车短期需求预测:基于机器学习模型的比较分析[J].商业经济与管理,2018(8):16?25.

[7] 李俊颖,李新举,吴克宁,等.济宁引黄复垦区不同年限土壤养分变化预测[J].土壤学报,2018,55(6):1358?1366.

[8] 杨煜岑,杨联安,王晶,等.基于多元线性回归模型的土壤养分空间预测:以陕西省蓝田县农耕区为例[J].土壤通报,2017,48(5):1102?1113.

[9] 冷喜武,陈国平,蒋宇,等.智能电网监控运行大数据应用模型构建方法[J].电力系统自动化,2018,42(20):115?122.

[10] 姜小刚,王海阳,郝勇,等.基于ArcGIS和Vis?NIR脐橙园土壤养分含量分布图预测研究[J].光谱学与光谱分析,2016(z1):128?129.

[11] 蒋烨林,王让会,李焱,等.艾比湖流域不同土地覆盖类型土壤养分高光谱反演模型研究[J].中国生态农业学报,2016,24(11):1555?1564.

[12] 祁亚琴,张显峰,张立福,等.基于高光谱数据的農田土壤养分含量估测模型研究[J].新疆农业科学,2018,55(3):47?51.

[13] 王苗苗,陈洪松,付同刚,等.典型喀斯特小流域不同植被类型间土壤养分的差异性及其空间预测方法[J].应用生态学报,2016,27(6):1759?1766.

[14] 张楚天,杨勇,贺立源,等.基于环境因子和联合概率方法的土壤有机质空间预测[J].土壤学报, 2014(3):666?673.

[15] 石媛媛,邓明军,唐健,等.基于空间分析的森林土壤养分分级方法[J].草业科学,2016,33(6):1112?1117.

猜你喜欢

预测模型
基于矩阵理论下的高校教师人员流动趋势预测
基于支持向量回归的台湾旅游短期客流量预测模型研究
基于神经网络的北京市房价预测研究
中国石化J分公司油气开发投资分析与预测模型研究
基于IOWHA法的物流需求组合改善与预测模型构建
基于小波神经网络的GDP预测
区域环境质量全局评价预测模型及运用
组合预测法在汽车预测中的应用
基于预测模型加扰动控制的最大功率点跟踪研究
我国上市公司财务困境预测研究