基于紫外-可见光谱的水质COD检测方法研究
2023-01-04赵旻
赵旻
(长江水利委员会水文局,武汉,430010)
0 引言
众所周知,水资源是任何生命活动所需的必需条件,我们生活的地球表面上有约71%都被水覆盖,但是地球上的绝大部分水资源都在海洋中,将近97%的水资源都为海水,我们人类可以直接饮用的淡水资源十分有限。随着改革开放以来,我国的经济有了飞速的发展,同时城镇化、工业化的飞速发展带来的能源紧缺问题也愈发严重,尤其是水资源的紧缺。根据最近的世界水论坛会议公布的联合国水资源评估报告[1],每天在世界各地的江河湖泊中被倒入将近200吨的生产生活垃圾,导致水体生态系统遭到了严重的破坏。水资源紧缺,淡水污染严重和生态系统被人类严重破坏,这三个问题共同影响,使全世界范围内的农业发展受阻和工厂停产,严重地影响了人类社会的可持续发展,对人类的生存带来了前所未有的危机[2-5]。
目前世界上主流的表征水质污染程度的方法是使用水体有机物含量综合指标,表1中给出了三个主要的指标。从上述内容我们可以得出,把我国的水资源作为长期监测对象,不但可以有效地保护水资源,还一定程度地控制了水资源的污染和浪费;在长期的水质监测中还可以判断出水资源的污染情况,进而为我国国民提供安全放心的水质环境,切实履行习近平总书记提出的“绿水青山就是金山银山”的可持续发展理念。
表1 表征水质有机物的综合指标
在表1中提到的水质监测参数中,水质的化学需氧量(Chemical Oxygen Demand,COD)是一个比较重要的检测参数,水质COD的含义是在一定的检测条件下,氧化1L测试水样品中还原性物质所需要的氧化剂的质量,常用单位为mg/L,水质COD可以体现出水质被还原性物质的污染程度。我国早在2000年就把水质COD的在线检测以及分析仪器作为重点研发的水质质量监测仪器。
1 紫外-可见光谱法水质COD检测技术的基本原理
随着科技的进步和计算机的普及,不同种类的仪器和试剂都可以用在水质COD的监测中,目前水质COD的常用监测方法有三类,如图1所示。在众多的水质COD检测手段之中,光谱技术中的紫外-可见光谱法作为一种准确、快速、灵敏的检测技术,由于其样品用量较少,不需要化学试剂,没有二次污染而成为了水质COD检测中最常用到的方法。紫外-可见光谱水质COD检测的原理基于分子内部的运动规律,由于不同物质的分子结构不同,分子结构中特定的基团吸收紫外-可见光之后发生电子能级的跃迁,跃迁之后会有特定的吸收光谱线。因此,根据不同物质分子空间构型的差异,检测待测样品会在200nm~1100nm之间的波长范围内吸收光谱上的特定特征波长,特征波长的吸光度和高度两个参数可以得出待检测物质中的分子成分和含量。通过以往文献可知,当一束平行分单色光垂直地穿过无散射、均匀的溶液时候,吸光溶液的吸光度和吸光溶液的浓度和光程呈正相关,用数学表达式可以表示为朗伯-比尔定律,数学关系如公式1所示[6]:
图1 水质COD监测技术手段分类
式中I和Io分别代表入射光的强度和透射光的强度;ε,C和L分别代表测试溶液的吸收常数,浓度和光程。而综合分析吸光度的定义,可得到另一个表达式为:
而在实际的实验过程中,数学表达式(2)中的摩尔吸光系数K和光程L是恒定的常数,L代表溶液层的厚度,因此,可以得到溶液吸光度与浓度的线性函数关系。由于不同物质结构差异造成的特征吸收光谱的不同,即可通过数学表达式(2)中的函数关系构建基准曲线,通过基准曲线就可以得到关于水质检测的各个参数。
2 紫外-可见光谱法水质COD预测模型研究
2.1 紫外-可见光谱法实验设计
水质COD检测的信号往往十分的复杂多变,有很多的变量和多重共线性,所以直接用数学表达式(2)预测模型结果误差会很大。基于这个问题,本实验设计了一种紫外-可见光谱法水质COD检测试验方法。第一步先研究了一阶导数和平滑处理两种方法对实验模型预测的准确性,然后配制邻苯二甲酸氢钾水质COD标准液进行水质COD检测,通过朗伯-比尔定律分析溶液吸光度和样品水中COD的关系,然后通过最小二乘法回归算法,建立预测COD模型。
本实验所用紫外-可见光谱仪为UV360紫外可见红外分光光度计,测试的波长范围在185mm-3300nm,分光光度计的分辨率在0.1nm。分光光度计的检测器为光电倍增管/InGaAs/Cooled PbS。
2.2 紫外-可见光谱图预处理
产生紫外-可见光谱的光谱仪检测水质COD的原始数据中存在着一些干扰信号,包括噪音和采集到光谱的平移或者旋转。这些干扰信号会对预测模型的准确性产生很大的影响,所以为了减少干扰信号的影响和提高预测模型的准确性,必须要对光谱进行预处理,预处理可以分为基线校准和消除噪音[7]。
2.2.1 导数法
光谱仪采集到的原始数据中的一些干扰信号,包括光谱的平移、旋转或者其他变形现象,这时我们可以对执行频谱求一阶导数消除基线平移,对执行频谱求二阶导数可以消除频谱旋转。数学表达式如下[8]:
数学表达式(3)中E为真实吸光度,E′为表现吸光度,ΔE表示两者之间的固定偏差。对数学表达式(3)求导后得到:
公式(4)中λ是某一中心波数点,E(λ)为λ处的吸光度数值。由于本实验测试的为液体,采集样品时方法比较简单,所以执行频谱的旋转误差可以不用考虑,只用一阶导数就可以消除原始数据的基线平移。
2.2.2 平滑处理
频谱中的噪音是一种随机的高频信号,噪音越高,预测模型的准确性也就越差,所以必须要通过平滑处理来消除噪音的影响以提高预测模型的精准度。平滑处理一般可以用下面数学表达式来进行[9]:
公式(5)中,yi代表第k个点(即中心点)进行平滑前的数值,y*k为进行平滑处理后的数值,ai表示权重系数。
2.3 紫外-可见光谱法水质COD预测模型评价标准
只有利用合适并且精准的模型评价标准,才可以减小预测模型的误差,所以评价标准往往决定了最终预测模型的准确性。紫外-可见光谱法水质COD预测模型常用的评价标准有两个,分别是相关系数R2和均方根误差RMSE,两个评价标准的数学表达式分别为[10]:
两个数学表达式中:yi,act代表的含义是第i个样品实际值,yi,pre代表的含义是通过预测模型得到的预测值,n则表示测试的样本总数。在两个评价标准参数中,R2的值越接近1,表示预测模型性能越好,RMSE数值越小,则代表性能越好。
2.4 紫外-可见光谱法水质COD标准测试溶液实验
紫外-可见光谱法水质COD标准测试溶液为邻苯二甲酸氢钾溶液,各个浓度的标准测试溶液如表2所示。
表2 紫外-可见光谱法水质COD标准测试溶液浓度
通过表2中不同浓度的标准测试溶液,可以得到不同波长处的吸收特性。对表2中的不同浓度标准测试溶液进行光谱扫描,在相同的实验条件下,采集光谱图。为了减小实验误差,使得到的光谱更加平滑,本实验通过均值滤波的方法对谱线进行预处理,可得到图2。通过图2可以看到标准测试溶液在253mm处和277nm两处有明显的特征峰。单波长检测法是利用253nm处的点作为检测波长[5-6]。由于水质样品本身的存在差异,也会导致特征峰的差异,所以针对253nm的固定波长检测存在的缺陷。本实验首先在253nm点处建立特征波长与水质COD值间的关系,然后选取277nm作为特征吸收波长,得到与水质COD值之间的函数关系;最后通过得到水质扫描结果的最优波段(200-310nm之间),得到积分面积和水质COD值之间的关系。通过上述实验得到的不同水质样品浓度和在不同波长点的吸光度函数关系如图3-图5所示。
图2 紫外-可见光谱法水质COD标准测试溶液吸收光谱
图3 253nm处吸光度和标准测试溶液浓度关系
图4 277nm处吸光度和标准测试溶液浓度关系
图5 200-310nm吸光度积分与标准测试溶液浓度关系
通过图3-图5可以看到,当邻苯二甲酸氢钾标准溶液的浓度高于160mg/L时,253nm、277nm和200nm-310nm吸光度积分所对应的曲线都有向下弯曲的趋势,所以当标准测试溶液浓度过高时,曲线会偏离直线关系,不再符合朗伯-比尔定律。为了减小预测模型的误差,应该选取160mg/L以下的浓度建立标准曲线,可以看出拟合曲线是一条直线,所以设拟合函数为y=ax+b。函数关系中的x为邻苯二甲酸氢钾标准溶液的浓度,y为吸光度。表3中给出了拟合关系和上面提到的评价标准的相关参数。
表3 拟合曲线相关参数
通过表3可以看到,在253nm和277nml两处的相关系数分别达到了0.9946和0.9977,当相关系数R2达到0.9以上的时候,预测模型就可以认是“优秀”模型[11],说明我们建立的标准曲线在160mg/L的浓度以下误差不大,相关性较高。所以本文下面的实验均选用160mg/L以下浓度的水质样品,利用前面配置的水质COD标准溶液,一共52个水质样品,按照标准液的浓度从小到大放置,选取其中33个样品作为校正实验样品,剩下的19样品用作预测模型。
2.5 偏最小二乘法回归建模分析紫外-可见光谱法水质COD预测模型
偏最小二乘法(PLS)是一种多元线性回归方法[12],PLS首先要做的是对光谱矩阵进行分解(光谱矩阵X,浓度矩阵Y)。
T和U分别代表两个矩阵的得分矩阵,P、Q则是代表两个矩阵的载荷矩阵,E、F代表两个矩阵的偏最小二乘拟合残差矩阵,PLS接下来要做的是将T和U分别做线性回归,数学表达式如下所示[13]:
在对预测模型进行预测的时候,可以计算出未知水质样品的X未知和T未知,然后通过下面的数学表达式可以计算得到浓度预测值:
偏最小二乘法建模需要一个参数来表示预测能力的精确性,本文采用残差平方和PRESS作为判断的依据,两者的数值越小,就代表预测模型的精准度越高。在PLS建模中,选择不同的因子数,最小的PRESS值就会对应得到最佳因子数,本实验中两者的关系如图6所示。
图6 PLS模型与因字数关系
如图6所示,当因字数是4的时候,PLS模型的PRESS值到达最小值,所以本实验选择的最佳因子数为4。然后将获得的紫外-可见光谱进行回归分析,得到模型如图7所示。图7中得到的相关系数R2为0.9921,回归系数令人满意,校正标准差SEC=8.19mg/L,预测模型的标准差SEP=8.86mg/L。这个结果是没对紫外可见光谱进行预处理的结果,下面将原始实验数据通过平滑处理和导数处理,再次进行偏最小二乘法回归处理,得到表4结果。通过表4可以看出,通过导数法预处理的结果优于平滑处理的结果,因为导数预处理方法可以消除基线平移的影响。然后把19个预测集导入到预测模型中,得到预测值。预测值与真实值的对比如图8所示。
图7 PLS回归定标方程
图8 PLS拟合值与真实值对比曲线
表4 预测模型评价参数
两种预处理方法下的偏最小二乘法回归
从图8中可以得出偏最小二乘法回归预测模型精确度较高,误差在6%之内,基本到达了预期的准确度。
3 结论
本实验基于紫外-可见光谱法检测水质COD的检测方法进行了研究,提出了预测模型。首先设计了实验方案,通过不同浓度的COD检测标准溶液,得出了水质COD检测朗伯-比尔定律的适用范围,接着通过偏最小二乘法回归进行了预测模型分析,得出结论。偏最小二乘法回归预测模型精确度较高,误差在6%之内,基本到达了预期的准确度。