基于多维特征的环境监察数据异常识别研究
2022-11-22沈奇铭
沈奇铭
(湖州市生态环境局长兴分局 浙江 湖州 313100)
0 引言
从环境保护的角度出发,对环境进行监测成了分析环境发展趋势以及制定相关防治措施实施的重要基础[1]。在此背景下,对监察数据进行准确分析成了相关环境管理部门需要重点关注的问题之一[2]。值得注意的是,环境执法只有以真实的环境数据为基础才能够确保其合理性。受监察技术等多种因素的影响,监测数据中的异常值往往难以通过直观的方式获取到[3],不仅如此,在环境自身属性特征所涵盖的多个维度也使得环境监察数据异常的识别难度增加[4]。在此基础上,为了对环境状态做出准确判断,展开环境监察数据异常识别的研究是十分必要的[5]。针对该问题,需要综合分析环境的温度、气候等诸多因素带来的影响[6],以此分析环境监察数据异常识别值。由此不难看出,在对环境监察数据异常值进行分析的过程中,结合具体的影响因素,从多个维度进行全面分析是保障识别结果可靠性的重要基础。
为此,本文提出基于多维特征的环境监察数据异常识别方法,并通过试验测试分析验证了所设计方法的实际应用效果。借助本文的研究,希望可以为相关环境管理工作的开展提供有价值的参考。
1 环境监察数据异常识别方法设计
1.1 监察环境多维特征提取
在对单一监察环境数据异常情况进行识别时,单纯地根据数据的变化情况对其作出判断可靠性较低,在实际中,影响目标监察数据的因素是多元化的[7],而在多个因素的共同作用下,从宏观角度分析数据的动态变化是合理的。结合该理论,本文在进行数据异常识别前,提取了监察环境的多维特征。
假设环境监察数据为A,与其直接或间接相关的因素分别为B和C,则下述关系式成立:
其中,a表示环境监察数据的原始基准参量,w1和w2分别表示影响因素B和C对目标监察数据A的影响权重系数,k1和k2分别表示影响因素B和C对目标监察数据A的作用强度,λ表示环境监察目标的抗扰动系数,e表示环境监察目标的自衰减系数,该数据以实际的环境情况为基准,当监察环境自身具有静态属性时,e的取值结果为0。
在此基础上,分析当数据A变化时对应影响因素的各参量变化情况,通过这样的方式即可实现对影响监察目标各个指标作用特征的提取。但是需要注意的是,环境影响因素本身具有不稳定性,因此本文为了提高后续分析的准确性,以单位环境监察数据辩护值对应的影响因素参量为基准[8],对监察环境多维特征提取进行提取,其计算方式可以表示为
其中,ΔA表示环境监察数据单位变化量,TB表示影响因素B的特征参量,TC表示影响因素C的特征参量。
通过这样的方式,计算得到监察环境多维特征,为后续的数据异常识别提供判断基础。
1.2 环境监察数据异常识别
在上述基础上,本文对环境监察数据异常识别是根据目标数据与影响因素之间的拟合关系实现的。在1.1部分已经得到了不同因素的特征参量,那么,对环境监察数据的分析方式可以表示为
其中,A'表示实际的环境监察数据参量,ε表示理想数据结果与实际数据之间的差值。考虑到环境的发展本身具有一定的规律,因此在不受异常干扰的条件下,连续监察数据对应的ε应表现出相同的发展趋势,结合这一特点,本文以差值的变化程度Δε为基准对数据异常进行判断。
则认为此时的环境监察数据为异常值。根据本文设置的判断标准可以看出,为了确保识别结果的准确性,本文将2.0%设置为允许波动阈值范围,通过这样的方式避免由于过拟合情况导致的正常数据被识别为异常的情况。但是需要注意的是,由于不同环境、不同数据的监察标准不同,因此对于允许阈值范围可以根据实际情况进行差异化设置,以此确保识别结果与实际需求具有较高的一致性。
通过这样的方式,实现对环境监察数据异常的有效识别,为实际的环境管理工作提供可靠的决策基础。
2 应用测试与分析
在上述设计的基础上,为了能够更加直观地分析本文设计基于多维特征的环境监察数据异常识别方法的应用效果,进行了试验测试,并分别将王慎阳等[5]和左松林等[6]提出的识别方法作为测试的对照组,通过分析三种方法的识别结果,对不同方法的环境监察数据异常识别效果做出客观评价。
2.1 测试数据准备
本文以某区某污水处理厂污染物不同月份10天内的数据测量结果为基础训练数据,具体的数据信息如表1所示。
表1 监察数据统计表 单位:mg/L
在此基础上,对污水处理厂在监察期间的排污量、污水处理剂的使用量,以及具体的运行环境的温度参数、湿度参数进行统计。在此基础上,采用三种方法对于表1中的异常情况进行识别,以此获取不同方法下哪种环境监察数据异常识别效果好。
2.2 测试结果与分析
根据上述的基础数据,采用三种方法对异常数据进行识别。在评价识别结果阶段,本文将识别准确率作为具体的指标,其计算方式可以表示为
其中,P表示数据异常识别的准确率,x表示准确识别的异常数据总量,X表示实际异常数据总量。
以此为基础,统计了三种方法的识别结果,对应的具体情况如图1所示。
图1 不同方法识别结果对比图
从图1中可以看出,在三种测试方法中,王慎阳等[5]方法的识别准确率具有较高的稳定性,在测试的6组数据中,测试结果最大波动幅度为15.0%,环境监察数据异常识别的准确性始终稳定在55.0%~70.0%之间。相比之下,左松林等[6]方法虽然对部分测试组数据异常的识别结果准确率达到了75.0%以上,但是其表现出了较为明显的不稳定性。其中,对5月份数据异常的识别准确率仅为44.96%,处于较低水平。在本文方法的测试结果中,对数据异常情况的识别准确率始终稳定在80.0%以上,其最大值达到了90.0%以上,表明本文方法能够对环境监察数据中异常的有效识别,这是由于本文在对数据进行分析阶段,对影响监察数值结果的因素进行了综合分析,对数据异常的判断结果具有较高的准确性。
根据测试结果可验证,本文设计的基于多维特征的环境监察数据异常识别方法的准确率较高,可以在实际的环境数据分析中发挥其重要作用。
3 基于多维特征的环境监察数据异常处理与原因分析
3.1 异常处理
当出现数据异常状况的时候首先就要查出原因,依据环境、人为等因素进行分析,对于潜在问题要由异常数据出发,不能够忽略各种因素对数据进行分析。监测污染源涉及的数据通常采样5个,可以忽略其中2个。异常数据具有不同类型,有针对性地进行处理,监测数据与环境要保持一致性,详细说明存在的原因,同时将结果进行反馈,之后强化对环境的监测监管。误差导致的监测数据异常情况,可以在保障监测数据充足的前提下忽略异常数据,对于其他数据进行详细分析。当由于是忽略的数据导致的不充分状况的时候,可以重新进行监测,将数据需求进行补充,最大限度地保障数据的准确性。当异常数据的原因不能够确定的时候,重新监测,对于监测过程中涉及的仪器、条件、影响因素等都要详细地记录,保障再次监测获取到的数据能够追溯其源头,做出相关处理。
3.2 原因分析
由于行为不规范或质量不符合实际采集的样本,使得采集的数据与实际不符或与实际数据差异较大,监测数据与实际数据的偏差较大,如对水面、河流横断面、采样、排污口断面进行监测,此类数据往往是一般数据,无法真实反映河流的污染状况,这是由于采样地点不符合相关标准造成的。例如,在对除尘器部分进行采样时,如果仅对挡板上的灰尘进行采样和分析,则监测浓度通常非常高。样品采集后,需要将样品运至专门的环境实验室,无法进行现场监测和分析。这样,如果样品在运输过程中受到某些污染或天气因素的影响,分析结果的客观真实性将大大降低,并且获取的监测数据与真实数据存在很大差异。如果某些试剂有助于保存和运输,则不添加;需要强化的样品试剂未强化;需要冷冻运输的样品在运输和储存期间没有冷冻和交替污染,这导致获得的数据存在很大偏差。当采样时间和采样不符合相关环境监测标准的要求时,或者如果设备和仪器过时且无法收集和处理,则获取的数据不能代表分级数据或反映环境质量因素。如果采样时间符合要求,在生产排放不稳定的情况下,过短的采集时间往往无法采集排放的污染物。在低负荷运行的情况下,不仅监测数据容易出现异常,而且污染物也不会被收集。
4 防止环境监察数据异常措施
4.1 强化责任意识
环境监察队伍的建设要突出专业素质,树立责任意识,这样才能够保障环境监察结果的科学性,而对于监察人员的选拔也要实施高标准。监察人员的职业道德、责任体现出其爱岗敬业,环境监察各个环节都要严格遵守要求,在整体上把控监察流程。构建以增强监察结果为目标的工作模式,降低数据异常情况的发生。特别是在样品采集、运输、存储等过程,降低人为等因素的干扰。对专业知识要展开详细的学习,增强样品采集的真实性、代表性,明确样品缺失等问题,合理控制监察频率,选择合适的监察时间,依据环境实际情况做好生产技术的应用,使环境监察具有正确性。
4.2 提高监测专业水平
环境监察质量和数据准确性都能够体现出工作人员的专业水平,特别是在面对复杂环境状态下,数据处理的难度会进一步增加,这就要求监察人员能够以高水准开展环境监察工作。而环境监察机构要做好人才的引进工作,突出高素质、强责任心等人才的选拔。对于当前在职的监察人员也要开展全面的业务培训工作,保障一定数量的培训活动使监察人员在其中获取到新知识,监察人员对于数据处理、分析等能力也会随之提升,即便是面对突发数据异常情况也能够冷静的处理。及时淘汰旧设备,更新设备能够提高环境监察数据的准确性,环境监察机构要加大对于设备更新的资金投入,改善工作环境,使监察人员工作积极性提升,这也是减少数据异常的重要措施。
4.3 加强数据审核
数据异常会发生在环境监察的不同环节,而突出多维特征,建立多层次的数据审计体系能够减少数据异常情况发生的几率,环境监察机构要对数据异常情况进行追根溯源,在层层审计过程中能够确认环境监察报告存在的根本问题。针对发生的数据异常问题监察人员能够及时地展开调查,分析哪一环节出现异常,针对数据类型的差异化制定针对性解决措施,提供全新的可行性途径,最大化地降低类似事件在今后的工作中再次发生的概率。
4.4 样品运输与保存规范性
现场进行采样完成之后要立刻将其运送到环境监察实验室,而在这个过程中样品很容易受到外界因素干扰造成严重的污染,使分析结果真实性受到影响。而一些样品在运输中由于在低温环境会添加固定剂,这是为了能够保障监察数据不受到影响,但是由于工作疏忽等导致交替污染情况的发生,也可能在实验室检测当中出现误差。为了能够最大限度的杜绝类似事件的出现,要强化采样技术规范,在采样完成之后尽快投入到实验室进行分析,避免样品保存时间过长。
5 结语
作为环境监察数据处理的重要环节之一,对异常值进行准确识别是保障后续相关环境治理措施能够合理实施的重要保障。为了提升环境监察数据异常识别的准确率,本文提出基于多维特征的环境监察数据异常识别方法,从多个维度综合对环境监察数据进行分析,实现了对环境监察数据异常情况的准确识别。实验结果表明,该方法能够提高了环境监察数据异常识别效果,可以为实际的环境管理工作提供可靠的决策支持。通过本文的研究内容,希望可以为相关环境监察数据处理工作的开展提供有价值的参考,助力环境保护工作能够更加科学、合理地开展。