基于LS-SVM的养殖水体氨氮含量分析预测模型
2017-03-01居锦武
居锦武
(四川理工学院计算机学院,四川自贡 643000)
基于LS-SVM的养殖水体氨氮含量分析预测模型
居锦武
(四川理工学院计算机学院,四川自贡 643000)
养殖水体的氨氮含量是水产养殖中的关键水质指标,是评价水体污染情况的基本测量项目。设计一种自动氨氮监测系统,自动抽取水样并定时测量,使用最小二乘支持向量机算法(LS-SVM)建立了分析预测模型,LS-SVM最小二乘支持向量机算法增强了泛化能力,减少了异常样本的预测偏差,提高了预测学习的精度。对基于神经网络模型、基于LS-SVM模型进行了仿真比较,结果显示LS-SVM模型具有更优良的分析预测效果。
支持向量机;水产养殖;氨氮;分析预测模型;比色法;光强
随着水产养殖业的快速发展,养殖水体的污染情况越来越严重。各种饵料、化学物质、药物、排泄物残留在水体中,经腐败和分解,引起水体水质的严重劣化,使水体中氨氮等有害物质含量上升,造成养殖对象发病或死亡,严重影响产业的发展。我国《渔业水质标准(GB 11607—1989)》中规定,氨氮质量浓度小于0.02 mg/L时,对鱼类的生命活动没有影响。养殖水体中铵离子(NH4+)的质量浓度不允许超过5 mg/L。
笔者设计的自动氨氮含量监测系统[1]基于HJ535—2009标准。其基本原理是将被测水样与纳氏试剂混合,纳氏试剂与水样中的氨反应,采用紫外线光度计对生成的化合物进行光度测量,吸光度与水样中的氨氮含量成正比,从而计算出水样的氨氮含量。此方法的优点为所需试剂种类少、生成化合物速度快、吸光度分辨率高,是一种简单高效的测量方法,特别适合设计成自动氨氮含量监测系统。
纳氏试剂比色法的缺点为试剂成本较高、测量数据量少、测量过程易受环境变化等不可预见因素的影响[2],重复性误差<±10%,数据可靠性还需提高。建立数据分析预测模型是提高数据可靠性的常用方法,常用的分析预测模型包括神经网络[3-4]、支持向量机[5]等,神经网络一般要求使用大量数据作为训练样本,采用比色法测量氨氮含量所得数据样本较少,符合支持向量机的特点。基本支持向量机(SVM)的泛化能力不足,对于异常样本数据,预测数据偏差较大。最小二乘支持向量机(LS-SVM)[6]对其进行了改进,优化了模型函数,具有更好的预测速度和效果。
笔者在设计自动氨氮监测系统时,针对测量数据的准确性波动问题,将LS-SVM算法应用到测量结果的分析中,建立了养殖水体氨氮含量测量结果的分析预测模型,获得了较好的效果。
1 支持向量机
Vapnik等于20世纪90年代提出支持向量机(SVM)方法,该方法是一种机器学习方法,通过遵循结构风险最小原则,提高学习机的泛化能力,即使在统计样本数量较少的情况下也能得到良好的统计结果。LS-SVM由Suykens等提出,改变了SVM使用的约束条件,同时使用新的目标优化函数,改变风险控制函数,进一步改善了泛化能力[7-8]。
设有训练集D,内部包含N个样本,将D表示为:{(x1,y1),(x2,y2),…,(xN,yN)}。其中x、y分别为输入、输出。通过1个非线性映射φ(),将样本数据从原空间映射到另一个高维特征空间φ(x),新空间表示为φ(x)=[φ(x1),φ(x2),…,φ(xN)]。在空间φ(x)中设置最优决策函数y(x)=ωφ(x)+b+ξk,函数中的ω、b分别为权值向量、阈值。LS-SVM的目标优化函数[9]为:
s.t. yk=φ(xk)ωT+b+ξk。
(1)
式中:C是用于平衡误差与复杂度的正则化参数,误差分量ξk≥0,k=1,2,…,N。
对式(1)函数采用Lagrange法求解:
(2)
式中:αk(k=1,2,…,N)为Lagrange乘子,分别对ω、b、ξ、α求偏导=0,即
(3)
设Ω为N×N对称方阵,即
(4)
定义核函数k(xi,xj),满足以下Mercer条件:
Ωij=k(xi,xj)=φ(xi)φ(xj)i,j=1,…,N。
(5)
LS-SVM的回归模型为:
(6)
选择径向基核函数(RBF)作为核函数,模型具有学习速度快的特点,公式为:
(7)
整个算法中有2个可调参数,即正则化参数C、σ核宽度参数。在确定2个参数的值时,通常先采用搜索法选择参数,再采用交叉验证法进行最小误差寻优,这样能够确定最佳的参数对。这2个参数将影响算法的泛化性能和学习能力。
2 养殖水体自动氨氮监测系统
养殖水体自动氨氮监测系统基于纳氏试剂比色法测量水体的氨氮含量,其系统设计结构见图1,监测系统的实物照片见图2。整个监测系统由IPC、PLC、LCD、比色计、反应瓶、液量器、注射泵、多通阀及多种试剂等组成。IPC通过LCD显示人机界面,通过PLC控制液量器和多通阀的工作,同时通过比色计读取反应瓶的色度数据,再计算氨氮质量浓度。其基本操作流程为:(1)控制电磁阀,接入水样,驱动注射泵,水样进入液位计量器;(2)液位达到规定值后切换电磁阀,水样送入反应器;(3)切换电磁阀,掩蔽剂进入计量器,达到规定液位后再进入反应器;(4)切换电磁阀,纳氏试剂抽入计量器,达到规定液位后再进入反应器;(5)等待10 min,测量比色计的输出数据,即为测量光强;(6)切换电磁阀,反应后的溶液排到废液瓶中;(7)切换电磁阀,反应器抽入蒸馏水,测量比色计的输出,即为参比光强;(8)将废水排到废液瓶中。
3 测量结果与分析
基于比色法设计的自动氨氮监测系统,氨氮含量计算的数据来源包括参比光强、测量光强。选取40组标准氨氮溶液,其含量从0 mg/L递增至10 mg/L,间隔0.25 mg/L。系统测量的总样本数据为40个,奇序列为训练样本,偶序列为测试样本,部分测量数据见表1。使用神经网络模型和LS-SVM模型分别建立分析预测模型,仿真试验数据见表2。
使用神经网络模型和LS-SVM模型分别对水体氨氮含量进行预测,氨氮实际含量与2组预测结果的对比见图3。
表1 部分样本数据
表2 仿真试验结果
由表2、图3可知,神经网络模型预测结果的相对误差极值为 12.69%,平均值为6.43%;LS-SVM模型预测结果的相对误差极值为2.91%,平均值为1.32%。可见,使用LS-SVM预测模型获得了更高的精度。
4 小结
设计了一种养殖水体自动氨氮监测系统,并将LS-SVM技术应用于测量结果的分析预测中。数据预测结果与实际含量的比较表明,该模型是有效的预测模型,用于实际的数据分析预测工作可明显提高数据的准确率。LS-SVM预测模型的可变参数较少,只需确定正则化参数C和核宽度参数σ,可使用交叉验证法确定2个参数的值。LS-SVM预测模型的精度高,可广泛应用于数据分析预测模型的建立。
[1]马淑勍,梁 滨. 利用自动分析仪测定水中氨氮的方法研究[J]. 山东化工,2015(44):62-64.
[2]俞继梅. 纳氏试剂测氨氮影响因素的分析和研究[J]. 江西化工,2013(4):11-14.
[3]童敏明,张 愉,齐美星. 基于BP神经网络的可燃混合气体分析方法的研究[J]. 计量学报,2006,27(2):169-171.
[4]侯迪波,陈 玥,赵海峰,等. 基于RBF神经网络和小波分析的水质异常检测方法[J]. 传感器与微系统,2013,32(2):138-141.
[5]黄 苜,程小平. 基于支持向量机回归料子滤波器的运动员实时跟踪方法[J]. 西南大学学报(自然科学版),2008,30(5):165-169.
[6]曾 燕,成新文,王红旗,等. 基于加权最小二乘支持向量机的下水道可燃气体分析[J]. 西南师范大学学报(自然科学版),2014,39(9):94-99.
[7]Suykens J,Vandewalle J. Least squares support vector machine classifiers[J]. Neural Processing Letters,1999,9(3):293-300.
[8]Wen W,Hao Z,Yang X. A heuristic Weight-Setting strategy and iteratively updating algorithm for weighted LeastSquares support vector regression[J]. Neurocomputing,2008,71(16/18):3096-3103.
[9]Suykens J,Vandewalle J. Recurrent least squares support vector machines[J]. IEEE Transactions on Circuits and System,2000,47(7):1109-1114.
10.15889/j.issn.1002-1302.2017.02.061
2015-11-18
四川省院士(专家)工作站基金(编号:2014YSGZZ01);企业信息化与物联网测控技术四川省高校重点实验室基金(编号:2014WYY01)。
居锦武(1976—),男,上海人,硕士,副教授,主要从事嵌入式计算机系统设计研究。E-mail:jjwmail@163.com。
TP391
A
1002-1302(2017)02-0210-03
居锦武. 基于LS-SVM的养殖水体氨氮含量分析预测模型[J]. 江苏农业科学,2017,45(2):210-212.