APP下载

基于One-Class SVM的青鳉鱼异常行为识别方法

2022-06-15罗毅王伟刘勇姜杰刘翠棉赵乐李歆琰李治国廖日红王艳王新春饶凯锋

河北工业科技 2022年3期
关键词:模式识别

罗毅 王伟 刘勇 姜杰 刘翠棉 赵乐 李歆琰 李治国 廖日红 王艳 王新春 饶凯锋

摘 要:为了更准确地解析青鳉鱼在突发污染环境中的行为变化趋势,提出了一种基于One-Class SVM模型的青鳉鱼异常行为识别方法。以青鳉鱼的生理及行为特征作为观测指标,将采集到的暴露在不同类型和濃度特征污染物下的青鳉鱼行为强度信号作为经验数据,利用直方图统计和主成分分析(PCA)对行为强度数据进行降维,实现行为特征提取,基于One-Class SVM构建模型,并以五水合硫酸铜和三氯酚作为特征污染物进行暴露实验对算法进行验证。结果表明,One-Class SVM模型可以准确地识别正常行为和污染物暴露时发生的异常行为;对于有机污染物最快可在10 min内完成预警,重金属污染物可在1 h内完成预警,并且污染物浓度越高,模型的识别效果越好。识别方法可对水源突发性水质污染进行更有效的监测和预警,也可为水污染应急决策提供技术支撑。

关键词:环境质量监测与评价;模式识别;青鳉鱼;异常行为;One-Class SVM

中图分类号:X832   文献标识码:A

DOI: 10.7535/hbgykj.2022yx03008

Abnormal behavior recognition method of medaka based on One-Class SVM

LUO Yi1,WANG Wei2,LIU Yong2,JIANG Jie2,LIU Cuimian1,ZHAO Le3,LI Xinyan3,LI Zhiguo3,LIAO Rihong4,WANG Yan4,WANG Xinchun4,RAO Kaifeng5,6,7

(1.Shijiazhuang Environmental Monitoring Center,Shijiazhuang,Hebei 050022 ,China;2.CASA Environmental Technology (Wuxi) Company Limited,Wuxi,Jiangsu 214024,China;3.Hebei Province Ecology Environmental Monitoring Center,Shijiazhuang,Hebei 050037,China;4.Beijing South-to-North Water Diversion Loop Management Division,Beijing 100176,China;5.Research Center for Eco-Environmental Sciences,Chinese Academy of Sciences,Beijing 100085,China;6.State Key Joint Laboratory of Environment Simulation and Pollution Control,Beijing 100085,China;7.Key Laboratory of Drinking Water Science and Technology,Research Center for Eco-Environmental Sciences,Chinese Academy of Sciences,Beijing 100085,China)

Abstract:In order to analyze the behavior change trend of medaka in sudden polluted environment more accurately,an abnormal behavior recognition method of medaka based on One-Class SVM model was proposed.Taking the physiological and behavioral characteristics of medaka as observation indexes,the behavioral intensity signals of medaka exposed to different types and concentrations of characteristic pollutants were taken as empirical data.The dimension of behavioral intensity data was reduced by histogram statistics and principal component analysis (PCA),so as to realize the extraction of behavioral features.The model was constructed based on One-Class SVM,and the algorithm was verified by exposure experiments with copper sulfate pentahydrate and trichlorophenol as characteristic pollutants.The experimental results show that the One-Class SVM model can accurately identify normal behavior and abnormal behavior during pollutant exposure.For organic pollutants,the early warning can be completed within 10 minutes at the fastest speed,and for heavy metal pollutants,the early warning can be completed within 1 hour.In addition,the higher the pollutant concentration is,the better the recognition effect of the model is.The identification method can carry out more effective monitoring and all-round early warning of sudden water source pollution,and provide technical support for water pollution emergency decision-making.97DEF0DC-E8E7-487A-8B28-365E44187B9B

Keywords:

environmental quality monitoring and evaluation;pattern recognition;medaka;abnormal behavior;One-Class SVM

在水源水质监测领域,有2种应用较为广泛的技术手段,一种是理化指标监测方法[1-2],通过定量或定性的分析方法,有针对性地测定水中有害物质及其浓度。常见的监测指标有常规五参数、COD、氨氮和少数几种重金属离子等[3-5],但理化指标分析技术所能检测到的污染物种类和毒性远远低于已知的污染物总数。另一种是生物监测方法[6-7],通过生物传感器监测水体内受试水生生物不同水平上的生物行为学指标变化,反映水质综合毒性。相对于传统的理化指标监测方法,水质生物监测技术可以连续实时监测水质安全状况,更直观可靠地反映水环境长期污染的影响,并且具有无试剂二次污染的优点。

生物的种类很多,目前已有的研究物种有发光菌、藻类、大型溞、鱼类等[8-10],其中鱼类作为更高等的生物,与人类对环境污染物的反应更加接近,因此在水环境污染生物监测技术中应用最为广泛。其中,李志良[11]研究青鳉鱼在不同类型污染物暴露下的行为变化规律,结果表明鱼的行为强度与污染物的暴露浓度和暴露时间有明显的相关性;梁鸿等[12]采用生物传感器监测青鳉鱼在不同浓度重金属铜暴露下的行为响应数据,研究重金属对生物行为变化的影响,得到的行为反应模式符合环境胁迫阈值模型;贾贝贝等[13]用计算机视觉技术监测并提取青鳉鱼生理和运动特征,分析这些特征和水质变化之间的关系,建立了鱼类行为特征提取与分析模型;刘翠棉等[14]将直方图统计算法应用于青鳉鱼行为特征提取中,实验结果表明该方法能够高效表征污染物暴露实验前后鱼的行为变化趋势,为后续青鳉鱼异常行为识别提供了参考。这些研究结果皆表明将青鳉鱼应用于水环境污染监测预警是可行的,但是现有的研究文献都没有构建生物行为数据与特征污染物之间的关系模型,自动化地去提取鱼类行为特征并识别污染物暴露时青鳉鱼发生的异常行为,达到生物监测预警的效果。

本文提出了一种基于One-Class SVM的青鳉鱼异常行为识别算法,通过将不同特征污染物存在的一定时间段内的青鳉鱼行为经验数据作为训练集,对后续行为数据进行预测分类,进而准确有效地识别正常行为和污染物暴露时发生的异常行为。

1 实验方法

1.1 实验装置

本文采用双层生物行为传感器(如图1所示),传感器的上层是放置标准模式生物的暴露层,下层是空白对照层。当特征污染物通过水流从传感器的输入端进入,再从输出端流出会形成一个标准流水暴露实验环境。传感器的上下两层各放置了4个与腔体平行且两两成对的电极片,采用316L不锈钢镀铬材料制成,在传感器内形成一个低压高频电场。选用符合毒理学实验要求的标准模式青鳉鱼作为指示生物进行暴露实验。青鳉鱼在传感器中充当电阻的作用,其个体及位置的不同会导致电阻不同,特征污染物会对青鳉鱼行为造成影响,从而在鱼游动的过程中电流会发生改变,将检测到的电流信号通过模数转化器量化后输出到上位机,即可获取青鳉鱼行为电信号数据。传感器的采样频率为50 Hz,每秒可获取20个行为强度数据。通过分析采集到的青鳉鱼行为强度信号可以监测青鳉鱼在遭遇水质污染时自发产生的回避行为响应,表现在信号上即为行为异常。

1.2 实验数据采集

在流水环境下监测暴露在特征污染物中的青鳉鱼行为信号的变化情况,实验过程中使用五水合硫酸铜和三氯酚作为特征污染物,暴露开始前保证有4 h左右的正常行為数据,具体暴露实验细节如表1所示。所有实验标准样品都是从中国标准样品中心购买,实验结束后都按照国家规定的废液处理方法进行处理。

实验过程中,将特征污染物对青鳉鱼的48 h半数致死浓度 (50% lethal concentration , LC50)作为1个毒性单位(toxic unit,TU)。实验设定2个浓度组,分别为1 TU和5 TU,其中五水合硫酸铜的毒性质量浓度为1 TU=7.9 mg/L,三氯酚的毒性质量浓度为1 TU=2.3 mg/L。针对每个浓度的特征污染物都采用8个通道的生物行为传感器进行平行测试,每个通道中放置3条青鳉鱼,实验结束后将8个通道数据叠加平均,作为该次暴露实验的最终行为数据。实验过程中不投加食物,并控制每个通道的水体流速为2 L/h。数据采集软件和算法在工控机中运行,工控机的基本配置如下:处理器为D525 1.80 GHz,2 GB RAM;操作系统为Windows XP。

1.3 特征描述

在采用青鳉鱼的行为信号监测水质状态的过程中,鱼的异常行为是值得关注的目标。总结发现,实际运行中鱼主要在受到外界环境噪声的影响、进入或退出生物钟的影响以及真正的环境污染造成的影响等情况时,会集中发生异常行为。

1)环境噪声的影响

在线监测设备一般具有各种配套硬件,比如水泵、电路控制等,尤其是水泵在工作的时候会发出很大的声响,通常噪声会造成鱼类暂时性听力损伤,分析能力下降,有些噪声甚至可能杀死鱼类。对于环境监测而言,如果青鳉鱼不能在一个良好的环境下生存,那么它对某些有毒物质的反应就会受到极大影响。截取环境噪声影响下1 h的传感器行为信号数据(如图2所示),横坐标为时刻,纵坐标为青鳉鱼的行为信号强度。在受到环境噪声影响时,鱼的行为信号有较为明显的变化趋势。

2)生物钟的影响

鱼类在生活节律上与人比较类似,白天活动、夜间休息。图3显示了正常运行时采集到的青鳉鱼7 d行为信号,横坐标为时间(单位:min),纵坐标为青鳉鱼的行为信号强度。由图3可知,青鳉鱼每天基本会在固定的时间点进入和退出生物钟,进入生物钟时行为信号下降到一定的程度后维持在一个较低的水平上波动;而退出生物钟时,行为信号会恢复到进入生物钟之前的强度,也可能恢复后的行为信号强于或弱于前一天的信号,长时间运行后行为信号总体上会是一个慢慢下降的过程。异常信号的产生分为进入和退出生物钟2个时刻,这都与污染物暴露时青鳉鱼的行为响应相似。97DEF0DC-E8E7-487A-8B28-365E44187B9B

3)污染物的影响

青鳉鱼在遭遇不同类型和浓度的污染物时,早期暴露的一种典型“应激”状态是突然“兴奋”,运动行为强度逐渐增强并达到顶点,随后其运动状态的强度出现降低,乃至最终的死亡,整个过程鱼的行为信号有别于正常时刻的行为。图4为利用1 TU三氯酚作为特征污染物进行暴露实验采集到的青鳉鱼行为信号强度数据,红色虚线为暴露开始时刻。从时间轴上看,青鳉鱼的行为趋势符合中毒后的行为响应规律,而且污染物浓度越高越明显。当传感器中无指示生物时,有机特征污染物是不会引起电流信号(振幅和频率)变化的,而重金属类污染物只会引起信号(振幅)一定程度的变化,对青鳉鱼中毒后的毒性行为变化模式无影响,因此也不会影响后续的模型识别。

1.4 特征提取和降维

图5 a)和图5 b)分别显示了具有代表性的1 min正常行为信号和1 min异常行为信号。在电信号加持的情况下,青鳉鱼在传感器内的运动是无序且不可预测的,但从振幅和频率变化上能够看出,正常和异常行为信号之间的曲线有较为明显的区别,振幅和交替密度完全不同。

由于监测设备1 s采集20个数据,按照每分钟判断一次,1 min内的数据是1 200个点,相对于训练模型来说,维数太高容易引起样本不足,而且从图5中也可以看出,用振幅和交替频率就能表达1 min内青鳉鱼的行为特征,因此需要对1 min内的数据进行降维。本文收集监测设备在安全的水质中运行2 h的青鳉鱼行为强度数据作为经验数据,将每分钟的数据作为一个样本,先统计样本的直方图信息,再通过主成分分析(principal component analysis,PCA)[15]方法将其降到一维,保留直方图中特征值最大的特征向量,获取最终的行为特征。图6所示为利用PCA方法对1 TU三氯酚的青鳉鱼行为强度数据处理后得到的特征曲线,暴露实验开始前以及未产生显著变化的行为信号都被压缩在一个平稳的状态,而暴露后行为变化比较剧烈的位置被凸显出来。

1.5 One-Class SVM模型的构建

One-Class SVM(one-class support vector machine)[16-17]是一种比较经典的机器学习分类算法,将所有训练数据点与零点在特征空间分离开,并且最大化分离超平面到零点的距离,产生一个能够获取特征空间中数据的概率密度区域。当测试数据点处于训练数据生成的超平面内时返回+1,处于其他区域返回-1。其形式化描述为

minω∈F,ξ∈Rt,ρ∈R12ω2+1vt∑iξi-ρ,subject toω·φxi≥ρ-ξi,ξi≥0,(1)

式中参数v是[0,1]之间的一个比值,即为训练样本中最后被分类为负样本的比例,本文采用默认值0.01,选用RBF作为核函数。

在青鳉鱼的异常行为识别中,真正污染事故的模拟比较困难,需要构建一个对于训练样本数据紧凑的分类边界,然后通过负样本来进行实验。因此,利用One-Class SVM建立青鳉鱼的异常行为识别模型,建模流程如图7所示。在实时运行的系统中,将更换青鳉鱼后2 h内的传感器行为信号数据当作正样本,通过特征提取后进行模型训练,对后续的青鳉鱼行为信号数据每分钟进行预测分类,判断水质污染状况。

2 实验结果和分析

2.1 不同特征污染物对青鳉鱼行为的影响

重金属是生物体自身生存所必须的元素,但毒性浓度达到一定指标后,便会对生命体产生毒性效应,同时也会对水和土壤造成污染。5 TU铜离子条件下的青鳉鱼异常行为识别结果如图8所示,其中图8 a)为采集到的原始行为信号数据,图8 b)为One-Class SVM模型的识别结果。由于污染物暴露后青鳉鱼的呼吸等生理特征受到了影响,行为信号开始慢慢减弱,当毒性效应累积到1.5 h左右后青鳉鱼开始逐渐死亡,One-Class SVM模型在暴露实验开始后1 h识别到鱼类行为数据出现明显的下降趋势,因此给出了准确的预警。

三氯酚是化工的重要原料,同时也是有机污染物中的高毒物质,对环境影响巨大,美国环境保护署已经确定三氯酚为疑似致癌物。图9显示了在5 TU三氯酚条件下的青鳉鱼异常行为识别结果,从原始行为信号可以看出,有机物对鱼的毒性作用机制不同于重金属,三氯酚通过刺激鱼类的神经,使暴露后的青鳉鱼出现挣扎的现象,导致行为强度逐渐变大,达到峰值后一段时间内才会出现死亡现象。由于青鳉鱼的行为信号强度出现明显的上升趋势,One-Class SVM模型在暴露实验开始后10 min就快速给出了准确的预警。

2.2 不同浓度三氯酚对青鳉鱼行为的影响

不同浓度的三氯酚分别作用于青鳉鱼的生存环境后,都会导致青鳉鱼的行为发生相应变化,但不同浓度污染物对其造成的行为响应程度是不同的。对比图9 a)和图10 a)的行为信号可以发现,5 TU三氯酚使青鳉鱼的行为变化趋势更为剧烈快速,几分钟即可上升到峰值,而1 TU三氯酚则需要0.5 h甚至更长时间。因此,One-Class SVM模型的识别结果也会存在一定差异。图10 b)显示了1 TU三氯酚的异常行为识别效果,与图9 b)比较可以发现,5 TU的三氯酚预警时间可實现暴露后10 min,而1 TU的三氯酚预警时间则在32 min。这与理论及实际观察的青鳉鱼行为特征响应相吻合,污染物浓度越高,青鳉鱼的行为响应越快速,上升趋势越明显,One-Class SVM模型的识别效果越准确。这个发现可为水质在线生物预警提供依据。

2.3 经验数据对模型的影响

每批青鳉鱼在放入传感器时,其行为变化是不可控的,如果参与训练的样本经验数据太少,青鳉鱼正常活动中的一些正常的波动信号数据就会比较少,反映到模型训练上便是得到的模型在后续的预测中会将一些正常的波动识别为异常信号。当然经验数据越多,所能包含的正常波动也就越多,后续预测也就越准确。图11中的b)—d)分别显示了以1,2,3 h经验数据为样本建模时,One-Class SVM模型对5 TU三氯酚数据的识别效果。可以看出,识别为-1的第1个点理论上应该为行为异常的预警点,但是1 h或者2 h的经验数据所训练出来的模型往往在暴露开始前就会识别出一些异常,随着经验数据的增多,模型预测时会避免误识别。虽然在暴露开始前会识别到异常行为,但这并不影响算法给系统的预警结果,通常检测到异常后不会立刻预警,而是要检查第1次异常后会不会连续几分钟都识别到行为异常,如果都产生异常,此时才会真正发出预警,否则会被算法忽略掉。因此,综合考虑后选用2 h青鳉鱼行为强度数据建立异常行为识别模型,避免采集建模数据的时间过长。97DEF0DC-E8E7-487A-8B28-365E44187B9B

3 结 语

本文以不同类型特征污染物的青鳉鱼行为信号数据为基础,分析了青鳉鱼的行为响应模式并构建了青鳉鱼异常行为识别模型。研究结果如下。

1)不同类型的污染物对青鳉鱼的行为影响是不同的,青鳉鱼对有机污染物比较敏感,从暴露开始到出现异常行为的时间间隔非常短,而重金属对鱼的呼吸具有累积效应,导致青鳉鱼的行为慢慢减弱直至死亡。

2)结合直方图信息统计和PCA降维的特征提取方法能够表征青鳉鱼的行为变化趋势,为模型构建提供了有效的基础数据。

3)不同浓度的三氯酚和铜离子实验结果表明,One-Class SVM模型能够有效地预警水质突发污染事故,同时用于训练建模的经验数据越多,所能覆盖的青鳉鱼正常行为波动也就越多,误报警的次数也会相应减少。

综上所述,本文提出的利用One-Class SVM实现对青鳉鱼在突发污染事故中异常行为进行识别的方法,在模型训练阶段无需人工标注异常行为,每次运维更换青鳉鱼后能根据该批次个体差异自动训练出一个新模型;同时,模型的参数少、准确率高,具有较强的鲁棒性和泛化能力,可为水质在线生物综合毒性监测预警技术和设备研发,以及水源突发性水质污染的预警与应急决策提供参考和支撑。

但是,目前该方法对损伤人体健康的低浓度有毒物质和慢性毒性物质的效果有限。因此,下一步的研究重点是,在该方法的基础上实现更多种类特征污染物尤其是低浓度污染物的监测预警。

参考文献/References:

[1] HILL D J,MINSKER B S,AMIR E.Real-time Bayesian anomaly detection for environmental sensor data[J].Water Resources Research,2007,45(4):450-455.

[2] LIU Shuming,CHE Han,SMITH K,et al.Contamination event detection using multiple types of conventional water quality sensors in source water[J].Environmental Science-Processes & Impacts,2014,16(8):2028-2038.

[3] 李治國.一起突发性地表水环境污染监测案例的分析与思考[J].河北工业科技,2016,33(3):265-268.

LI Zhiguo.Analysis and consideration of an environment emergency monitoring case for a sudden pollution of surface water[J].Hebei Journal of Industrial Science and Technology,2016,33(3):265-268.

[4] 张茜.水质自动监测参数分析及其在水环境监测中的应用[J].中国资源综合利用,2017,35(12):117-119.

ZHANG Qian.Parameter analysis of automatic monitoring of water quality and its application in water environment monitoring[J].China Resources Comprehensive Utilization,2017,35(12):117-119.

[5] 龚海燕.上海市典型水域水葫芦中重金属含量初步研究[J].环境监控与预警,2021,13(3):50-54.

GONG Haiyan.Preliminary research on heavy metal concentration in Eichhornia crassipes in typical waters of Shanghai[J].Environmental Monitoring and Forewarning,2021,13(3):50-54.

[6] 王子健,饶凯锋.突发性水源水质污染的生物监测、预警与应急决策[J].给水排水,2013,39(10):1-3.

[7] SWEIDAN A H,EL-BENDARY N,HEGAZY O M,et al.Water pollution detection system based on fish gills as a biomarker[J].Procedia Computer Science,2015,65:601-611.

[8] 何蕾,韩施悦,黄啟慧,等.水质在线生物监测技术研究进展[J].绿色科技,2021,23(22):98-103.

HE Lei,HAN Shiyue,HUANG Qihui,et al.Research progress of on-line biological monitoring technology for water quality[J].Journal of Green Science and Technology,2021,23(22):98-103.

[9] 计叶,吴雨蒙,许秋瑾.水环境的生物监测方法及其应用[J].环境工程技术学报,2019,9(5):616-622.

JI Ye,WU Yumeng,XU Qiujin.Biological monitoring method of water environment and its application[J].Journal of Environmental Engineering Technology,2019,9(5):616-622.97DEF0DC-E8E7-487A-8B28-365E44187B9B

[10]高问,武鹏鹏,王雅学,等.土霉素废水对斑马鱼的生物毒性效应研究[J].河北科技大学学报,2019,40(1):38-44.

GAO Wen,WU Pengpeng,WANG Yaxue,et al.Study of the biological toxicity of oxytetracycline wastewater on zebrafish[J].Journal of Hebei University of Science and Technology,2019,40(1):38-44.

[11]李志良.鱼类行为学在水质在线监测与预警中的应用研究[D].济南:山东师范大学,2008.

LI Zhiliang.The Research of the Water Quality On-line Warning System by Monitoring the Behavior Change of the Fish[D].Jinan:Shandong Normal University,2008.

[12]梁鸿,刘勇,饶凯锋,等.水环境中重金属铜暴露下青鳉鱼的行为响应[J].生态毒理学报,2016,11(6):345-352.

LIANG Hong,LIU Yong,RAO Kaifeng,et al.The behavioral responses of the medaka under the stress of heavy metal copper in water environment[J].Asian Journal of Ecotoxicology,2016,11(6):345-352.

[13]賈贝贝,邵振洲,王瑞,等.基于机器视觉的鱼类行为特征提取与分析[J].生态毒理学报,2017,12(5):193-203.

JIA Beibei,SHAO Zhenzhou,WANG Rui,et al.Extraction and analysis of fish behavior based on machine vision[J].Asian Journal of Ecotoxicology,2017,12(5):193-203.

[14]刘翠棉,饶凯锋,李婧,等.青鳉鱼的行为特征提取研究[J].生态毒理学报,2020,15(2):160-170.

LIU Cuimian,RAO Kaifeng,LI Jing,et al.Behavior feature extraction based on medaka[J].Asian Journal of Ecotoxicology,2020,15(2):160-170.

[15]LI Tao,LI Yongli,CHEN Xiaolong.Fault diagnosis with wavelet packet transform and principal component analysis for multi-terminal hybrid HVDC network[J].Journal of Modern Power Systems and Clean Energy,2021,9(6):1312-1326.

[16]ZHAO Yongping,HUANG Gong,HU Qiankun,et al.An improved weighted one class support vector machine for turbo shaft engine fault detection[J].Engineering Applications of Artificial Intelligence,2020,94:103796.

[17]郭金玉,李涛,李元.基于DW-ICA-SVM的工业过程故障检测算法[J].河北科技大学学报,2021,42(4):369-379.

GUO Jinyu,LI Tao,LI Yuan.Fault detection algorithm of industrial process based on DW-ICA-SVM[J].Journal of Hebei University of Science and Technology,2021,42(4):369-379.97DEF0DC-E8E7-487A-8B28-365E44187B9B

猜你喜欢

模式识别
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
基于视频的带电作业中组合间隙的智能检测
汽车外观造型创新设计遗传算法的应用
自动洁地机器人的设计
珠宝科技进步对珠宝鉴定的影响
分布式光纤传感边坡工程检测设计