APP下载

基于Vis—NIR光谱的土壤质地BP神经网络预测

2015-08-06王德彩张俊辉

天津农业科学 2015年8期
关键词:土壤质地BP神经网络主成分分析

王德彩+张俊辉

摘 要:为快速、准确地获取土壤质地信息,提出了应用Vis-NIR光谱结合BP神经网络的建模方法。以河南封丘县的86个土壤样本为研究对象,以原始光谱和微分光谱主成分为输入变量,建立土壤粘粒和砂粒的BP神经网络预测模型,并将其预测结果与多元线性逐步回归模型进行比较。结果表明:基于原始光谱主成分的BP人工神经网络预测结果最好,优于多元逐步回归模型,预测粘粒和砂粒的RMSE分别为1.62和6.52。BP神经网络所建模型训练时间短、准确度也较高,能实现对土壤质地的高效预测。

关键词:Vis-NIR光谱; BP神经网络;主成分分析;土壤质地

中图分类号:S153 文献标识码:A DOI 编码:10.3969/j.issn.1006-6500.2015.08.002

土壤质地是影响土壤肥力的一个重要因素,同时土壤质地影响一系列陆面及大气过程,如土壤—植物—大气相互作用、土壤侵蚀过程、土壤溶质迁移过程等[1-2]。快速获取土壤质地信息,对现代农业管理和生态环境治理具有重要意义。土壤反射光谱特性与土壤的理化性质有着密切的关系,土壤组成物质的多样性以及土壤中每种组成物质的独特光谱特性,使各类土壤的光谱曲线都具有自己的特征[3]。随着光谱技术的发展,为土壤属性的快速获取提供了新的途径。近红外光谱和可见光近红外(Vis-NIR)光谱被广泛用于快速测试土壤质地、有机质等[4-9]。目前,基于土壤光谱的土壤属性预测,大多采用偏最小二乘回归、多元逐步回归等线性预测方法,而土壤质地与反射光谱之间的关系复杂,存在随机性和非线性。简单的线性回归模型难以模拟土壤质地和反射光谱信息间存在的复杂关系,一定程度上会限制预测精度的提高。

人工神经网络是由大量的神经元连接而成的非线性系统, 具有并行分布处理、 自组织、自适应、 自学习的特点, 适于处理动态的、随机性、 非线性数据[10],将神经网络应用于Vis-NIR光谱土壤质地预测模型建立的研究尚不多见。本研究采用人工神经网络方法,建立土壤质地数据的Vis-NIR光谱预测模型,同时探讨不同光谱预处理形式对预测结果的影响,可为土壤质地数据的快速获取提供方法参考。

1 材料和方法

1.1 研究区与采样分析

封丘县处于北纬34°53′ ~ 35°14′、东经114°14′ ~ 114°46′之间,暖温带大陆性季风气候,年平均气温16.0 ℃,年平均降水量615.1 mm。封丘地势平坦,海拔65~72.5 m。主要土壤类型有风沙土、两合土和淤土等。在研究区,按照3 km × 3 km正交网格布设样点,采样深度为0~20 cm,共采集样品101个。土壤质地采用激光衍射法 (Beckman Coulter LS230,USA,测试粒径范围0.04~2 000 μm测定[11], 按美国制进行分级:砂粒 (2~0.05 mm),粉粒 (0.05~0.002 mm),粘粒 (< 0.002 mm)。

1.2 土壤光谱测量及预处理

运用美国ASD 公司的FieldSpec 3地物高光谱仪测量土壤样品的反射光谱数据,操作过程在黑暗环境的实验室进行,每个样品旋转4次,每个角度扫描5次,共20次,取平均值作为样本光谱。每次测量前进行标准白板校正。因为350~380 nm、2 400~2 500 nm之间的数据信噪比比较低[12],所以本研究只对380~2 400 nm波段的反射光谱进行分析。本研究光谱变换形式包括一阶微分和二阶微分。微分变换均采用Savitzky-Golay 多项式,在Unscrambler 软件中完成。对原始光谱和经一阶微分和二阶微分处理后的数据,提取主成分,选取分析后的多个主成分作为初始输入变量,进行建模以及模型验证,主成分分析在SPSS19.0中完成。

1.3 模型建立

采用分层机械取样法,样本数据分成光谱建模数据集和光谱模型预测数据集。研究区共有101个样本点,将其分为2个数据集,其中建模样品数占2/3,验证样品数占1/3。对于质地数据,根据3倍标准差法去除质地数据中的异常数据。砂粒、粘粒含量具体建模样点见表1。

1.3.1 BP人工神经网络 BP人工神经网络的建立在Matlab软件中实现,采用人工神经网络工具箱中的3层BP神经网络,该网络有输入层、隐含层、输出层组成,隐含层采用“S”型logsig函数,输出层采用线性传递函数。对所建模型进行训练,以确定模型的权值矩阵和阈值矩阵。为确定适宜的模型结构,取不同的隐含层神经元数和训练迭代次数进行训练。

1.3.2 多元逐步回归模型 借助SPSS软件,采用多元线性逐步回归分析(MLSR)方法,建立土壤质地含量高光谱预测模型。多元逐步回归模型主要用于与神经网络预测模型进行精度比较。

1.4 模型评价指标

评价所采用的指标有平均误差(Mean Error, ME),平均绝对误差(Mean absolute error, MAE),均方根误差(Root mean of squared error, RMSE),测定值标准偏差与标准预测误差的比值RPD(Ratio of standard deviation to standard error of prediction)为模型评价参数。当RPD>2时,表明模型具有极好的预测能力;当1.4

2 结果与分析

2.1 土壤粘粒含量和砂粒含量统计特征分析

如表1所示,粘粒含量和砂粒含量全部样本平均值分别为10.95%,21.52%。粘粒含量和砂粒含量建模样本均包含了全部样本的数据分布范围,代表性好。这6组样本偏度和峰度均在0~1.18之间,样本土壤粘粒含量和砂粒含量数据接近正态分布。

2.2 BP神经网络建模结果

用BP人工神经网络的方法,输入层分别为原始光谱、光谱一阶微分、光谱二阶微分的主成分,对每个模型经过多次训练,3种光谱形式的神经网络模型中,除“PCS”砂粒原始光谱模型的隐层数为2,其余模型隐层数均为1。各自最佳模型如表2。

由表2可知,粘粒模型中,RPD均大于1.40,其中原始光谱模型RPD最大,为2.21,原始光谱模型RMSE最低,为1.62;砂粒模型中,砂粒的3个模型RPD均小于2,原始光谱模型RPD最大,其中砂粒二阶微分模型的相对分析误差为1.35,(小于1.40)表明模型无法对样品进行预测,原始光谱模型RMSE最小,为6.52,远低于光谱二阶微分模型的9.24。综合RMSE、RPD、ME、MAE这些指标来看,粘粒和砂粒原始光谱模型效果较佳。图1给出了最佳模型对应的粘粒含量和砂粒含量预测值与实测值1∶1线散点图,实测值和预测值沿1∶1线具有较好的分布规律,显示了较好的预测精度。土壤质地之所以能影响土壤的光谱反射率,一方面是因为土壤颗粒大小本身对土壤光谱的影响,另一方面是由于粘粒矿物的波谱差异[14]。在微分处理过程中,可能消除掉了原始光谱所获取的因土壤颗粒大小引起的细微特征差异,因此并不能提升质地预测精度,适应于土壤质地预测的新的光谱预处理方式有待进一步研究。

2.3 PLSR建模及预测结果

以原始光谱的主成分为输入变量,采用多元逐步回归的方法,建立模型并获得模型预测结果,如表3所示。

粘粒含量和砂粒含量多元逐步回归模型中粘粒模型R2均较高(大于0.60),但粘粒含量和砂粒含量预测误差指标,RMSE、ME、MAE均高于基于原始光谱主成分的BP人工神经网络模型,尤其粘粒含量预测RMSE为3.31,远高于1.62(BP人工神经网络模型预测RMSE),且RPD小于1.4,表明模型不适于预测粘粒含量。因此,BP人工神经网络在土壤高光谱土壤质地预测中优于多元逐步回归。

3 结 论

通过实测得到封丘县101个土壤样本的高光谱反射率和土壤质地,运用人工神经网络和多元逐步回归方法建立粘粒、砂粒含量的反演模型。BP神经网络模型优于多元逐步回归,是一种高效的预测方法;研究还表明,相比一阶微分和二阶微分光谱,原始光谱保存了更丰富的信息,更适于预测土壤质地。

参考文献:

[1] 吴龙刚, 王爱慧, 盛炎平. 土壤质地对中国区域陆面过程模拟的影响[J]. 气候与环境研究, 2014, 19(5):559-571.

[2] 朱卫红, 铁双贵, 孙建军,等. 不同土壤质地及播种深度对甜玉米出苗潜势的影响[J]. 河南农业科学, 2005(11):35-36.

[3] Ben-Dor E. Quantitative remote sensing of soil properties [J]. Advances in Agronomy, 2002, 75:173-243.

[4] 曾庆猛, 孙宇瑞, 严红兵. 土壤质地分类的近红外光谱分析方法研究[J]. 光谱学与光谱分析, 2009, 29(7): 1 759- 1 763.

[5] 白燕英,魏占民,刘全明,等. 基于高光谱的河套灌区农田表层土壤质地反演研究[J].地理与地理信息科学,2013,29(5):68-71.

[6] 王德彩,邬登巍, 赵明松,等. 平原区土壤质地的反射光谱预测与地统计制图[J].土壤通报,2012,43(2):257-262.

[7] 何绪生.近红外反射光谱分析在土壤学的应用及前景[J].中国农业科技导报,2004,6(4):71-76.

[8] 徐永明,蔺启忠,王璐, 等.基于高分辨率反射光谱的土壤营养元素估算模型[J].土壤学报,2006,43(5):709-716.

[9] 郭斗斗,黄绍敏,张水清,等.多种潮土有机质高光谱预测模型的对比分析[J].农业工程学报,2014(21):192-200.

[10] 朱大奇. 人工神经网络研究现状及其展望[J].江南大学学报:自然科学版, 2004, 3(1):103-110.

[11] 李学林, 李福春, 陈国岩,等. 用沉降法和激光法测定土壤粒度的对比研究[J].土壤,2011,43 (1):130-134.

[12] 何挺,王静,林宗坚,等. 土壤有机质光谱特征研究[J].武汉大学学报:信息科学版, 2006(11): 975-980.

[13] Chang C W, Laird D A, Mausbach M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J].Soil Science Society of America Journal,2001,65 (2):480-490.

[14] Waiser T H, Morgan C L S, Brown D J, et al. In situ characterization of soil clay content with visible near-Infrared diffuse reflectance spectroscopy [J]. Soil Science Society of America Journal, 2007, 71 (2):389-396.

猜你喜欢

土壤质地BP神经网络主成分分析
中国土壤质地分类系统的发展与建议修订方案
基于机器学习方法的宁夏南部土壤质地空间分布研究
基于MATLAB GUI的土壤质地类型自动识别系统
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
豫中不同土壤质地烤烟烟叶中性致香物质含量和感官质量的差异