流域水污染监测与溯源技术研究进展
2022-10-28魏潇淑陈远航高红杰张列宇
魏潇淑,陈远航,常 明,高红杰,张列宇
1.中国环境科学研究院,流域水环境污染综合治理研究中心,北京 100012 2.中国环境监测总站,国家环境保护环境监测质量控制重点实验室,北京 100012
人类活动和工业发展使大量污染物排入水体,对水环境造成严重污染。保护水生系统不受污染事件和日常废物排放的影响,需迅速有效地处理污染物,故评估水质特征和追踪污染物的来源对保护水生系统至关重要。水污染事件的污染物、污染源具有多样性、复杂性。当污染源排放成分不明确时,利用监测传感器获得的信息进行污染源识别,数据比较庞大,计算比较复杂,且不确定度大、耗时长,污染成分解析结果可能存在非唯一性。另外,流域中可能同时存在多点位污染,尤其是化学组分较相似的多点位污染。因此,如何快速、精准地进行污染源识别,是一项亟待解决的科学问题。为准确、高效地追踪污染物的来源,对水质进行快速监测评估是前提,此外,受水文过程、河流动态的影响,建立有效的溯源识别方法是关键。目前人工智能技术在水环境污染方面的应用主要体现在废水处理过程,在污染溯源方面应用较少,但数据挖掘和自学习能力使其在污染溯源方面具有较大的潜能。本文综述了国内外水质监测与污染溯源研究进展,论述了光谱分析法在水质监测方面的优缺点及应用现状,讨论了水污染溯源技术目前存在的问题,并分析了人工智能在水污染溯源方面的应用前景,对我国流域水污染溯源技术的发展提出展望。
1 水污染监测技术
随着现代测量技术及仪器的发展,越来越多的分析检测手段被应用于水污染溯源技术之中。表1总结了各种分析方法对水中污染物的检测特点,按检测原理可分为光谱法、色谱法、电化学法、质谱法,但绝大多数检测方法基于实验室,需要专业的实验员,对仪器本身及运维要求也比较高。实现水污染快速监测,建立监测预警机制,可以有效预防突发水污染事件。表2为各种水质快速分析仪的应用及特点,其中光谱法中紫外-可见、荧光和拉曼在实现水污染快速监测中应用最为广泛,故本文重点探讨了以上3种激发光谱在水污染监测方面的应用。
表1 各分析方法对水中污染物的检测特点Table 1 The characteristics of various analytical methods for contaminants in water
表2 各种水质快速分析仪的应用及特点Table 2 Application and characteristics of various rapid water quality analyzers
1.1 紫外-可见光谱法
紫外-可见光谱法是基于朗伯-比尔定律,利用物质的分子或离子对特定范围内(200~760 nm)电磁波吸收所产生的紫外可见光谱及吸收程度对物质的组成、含量和结构进行分析、测定和推断的分析方法,具有灵敏度高、准确度好、选择性优、分析速度快、无样品处理及二次污染等优点。由于其能够更好地实现浊度校正波长、减少散射干扰,有效提高检测精度,多年来一直被认为是一种快速检测水污染程度的好方法。
KHORASSANI等[1]利用便携式紫外分光光度计,结合适当的信号和反褶积方法,应用于河流中废水排放的检测,该项技术改进了便携式分光光度计的设计并促进了光谱分析计算程序的发展。LOPEZ-ROLDAN等[2]利用主成分分析方法,结合紫外-可见分光光度法测得光谱指纹和少量物理化学参数成功用于鉴别巴塞罗那市饮用水的不同水源。ASHERI-ARNON等[3]基于适合度,利用紫外分光光度法测量饮用水的紫外吸收度,建立了一种对饮用水污染事件进行早期检测的新方法,该方法具有足够的灵活性来识别被监测饮用水的污染来源,并在污染物超标时发出警报。WANG等[4]基于多波长紫外-可见光谱法研究了水中常见的大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌和肺炎克雷伯菌等4种不同类型的细菌,建立了基于支持向量机和细菌多波长UV-Vis光谱的细菌快速识别方法和模型,该方法可实现饮用水水源微生物的快速识别和预警。GUO等[5]利用紫外-可见吸收光谱和荧光光谱法对内蒙古乌梁素海不同采样点的溶解性有机质(DOM)进行了研究。结论指出,工业废水、生活污水和农业排水是湖中DOM芳香度变化的主要因素。TSOUMANIS等[6]将紫外吸收光谱反褶积法与水质现场/在线分析方法相结合,建立了一套可区分市政污水、医院污水和工业废水的水质在线监测系统。该方法采用原位探针监测基本理化参数,利用紫外吸收光谱反褶积法快速评估水中COD、悬浮物、硝酸盐和磷酸盐含量,并利用模式识别技术对污水来源进行分类。
紫外-可见光谱法可同时检测水中的硝酸盐、COD、TOC、硝氮、浊度和SS等指标,同时还可以对水质的整体污染状况进行预警,目前已被广泛地应用于水质快速检测、多参数分析、水质分类、水污染预警与溯源研究领域,是最主要的水质监测技术之一。
1.2 荧光光谱法
荧光光谱法是利用某种物质经特定波长的入射光照射后所发出的荧光特性和强度进行物质定性或定量的分析方法。水体中的大部分有机物(蛋白质、腐殖质、富里酸、类固醇、酚类、油、表面活性剂、维生素等)在可见光或近紫外光激发后,均会表现出特有的荧光发射[7],对测量得到的荧光光谱进行分析可以测定污水中有机物的综合指标。由于污染物种类和含量各异,污水的荧光光谱与水样一一对应,就像人的指纹一样具有唯一性,所以被称为污水的“荧光指纹”[8]。荧光光谱法已被用于各种水样(地表水、饮用水和废水)中有机污染物的检测。
DAI等[9]利用三维荧光光谱法通过扫描不同浓度的有机污染物,建立了荧光光谱分析和荧光参数的水污染预警图谱库,实现了水体有机污染物的在线监测。而CARSTEA等[10]通过对污水处理厂尾水进行实时在线监测,建立了荧光光谱与BOD之间的关系,所用便携式设备在不需要任何清洗的情况下可以连续运行1个月,且不需要后续数据的校正。CHEN等[11]采用三维激发发射矩阵(3DEEM)荧光光谱、碳氮比(C/N)和稳定同位素技术对呼伦湖有机质的来源进行了研究,碳氮比、δ13C和3DEEM表明呼伦湖大约90%的有机质来源于陆源物质,气候变暖、变干的趋势和长期强放牧是呼伦湖有机质和营养物质浓度高的主要原因。此外,DULLIUS等[12]采用全反射X射线荧光通过聚类分析和主成分分析评估了垃圾渗滤液对巴西Boi Pigu河流域水质的影响。NAKAR等[13]利用激发发射矩阵荧光法与偏最小二乘法相结合,实现了对地下水中大肠菌群、粪便大肠菌群、粪便链球菌的快速定量测定,并成功区分了大肠杆菌、枯草杆菌和铜绿假单胞菌。
荧光光谱分析法具有快速、灵敏度高、选择性好和对样品结构无破坏等特点[14],作为水质分析手段之一,在水污染溯源方面扮演着重要的角色。但荧光光谱存在光谱重叠问题,需要结合其他计量解析方法使重叠的光谱分离开,否则影响单一成分的提取和识别,在一定程度上影响结果的准确度。
1.3 拉曼光谱法
拉曼光谱是一种散射光谱,是分子振动结构的表征,称为“分子指纹”[15]。每一种物质都有自己的特征拉曼光谱,人们利用拉曼谱线的频率、强度和偏振度的不同,可以研究物质的结构和性质[16]。由于水的拉曼散射较弱,所以拉曼光谱可以检测水中绝大多数污染物,包括有机物、无机物和生物污染物[17]。
LY等[18]利用表面增强拉曼光谱(SERS)检测了在高浓度Fe3+、Ni2+和Zn2+干扰下电镀工业废水中的Cu2+,实现了碱性氯化法处理含氰废水中Cu2+的定量测定。ZHOU等[19]提出了一种在细菌细胞壁上原位合成纳米银粒子AgNPs表面增强拉曼光谱来检测饮用水中细菌的方法,研究发现细胞壁的zeta电位对细菌的拉曼光谱强度起决定性作用。SCHMIDT等[20]采用银溶胶表面增强拉曼光谱对海水中5种多环芳烃的混合物进行了检测,该团队通过增加底物的增强因子和SERS表面的富集特性提高海水中多环芳烃浓度的检测限。ZHENG等[21]通过将金纳米星偶联到有序的纳米银阵列上研制出一种便捷的SERS传感器,该传感器可将偶氮基团的SERS指纹图谱转换为亚硝酸盐,不需要任何抗体或适配体的帮助即可检测亚硝酸盐。由于在偶氮基所在的金纳米星和银纳米锥之间的缝隙处产生了强烈的热点,极大地放大了SERS信号,因此,该传感器对亚硝酸盐的检测具有较高的灵敏度和选择性。
虽然拉曼光谱技术在水质分析方面的应用目前尚不是很多,但因其快速、无损、灵敏度高、检测范围广等特点,在水质监测领域具有独特的优势,在水污染溯源方面也具有很大的潜力。除此之外,红外、电化学、色谱等在水质监测方面也发挥着至关重要的作用。每种分析方法都具有其独特的优越性,同时也具有一定的局限性。将各分析方法联用,快速、连续、准确地提供监测数据是快速实现流域污染溯源预警的前提,要实现水污染精准溯源,还需建立污染源识别的溯源方法。
2 水污染溯源方法
污染源识别就是利用已知污染物监测数据、河道水文参数,通过相应的污染源识别方法来确定污染物排放时间、地点和强度,以便提出减少和控制流域污染输入的措施,是流域水安全管理的重要内容之一。水污染溯源途径归纳起来有2种:①根据污染物的来源专属性及在环境中的持久性进行溯源;②综合污染源的污染特征,通过多元统计方法进行溯源。根据原理不同,可将溯源方法分为水质参数分析法[22-26]、示踪法[27-29]、水纹识别法[30-32]等。
2.1 水质参数分析法
水质参数分析法是比较成熟且应用广泛的水污染溯源方法,基于水体主要理化指标pH、氧化还原电位、电导率、化学需氧量、总氮、总磷、氨氮、金属等之间的相关性,通过模拟推演研究了解区域水污染特征,主要通过主成分分析、聚类分析和层次分析法等方法进行污染物的溯源解析。
LI等[33]利用多元统计分析法分析了中国汉江上游56个采样点水中微量金属的浓度,通过因子分析/多元线性回归(FA/MLR)模型确定了As、Pb、Se、V、Sb的来源,指出采矿、化石燃料燃烧和汽车尾气是地表水污染的主要来源。YANG等[34]收集了2009年和2010年温州市环保局监测温瑞塘河流域DO、COD、NH4+-N和TN的数据,主成分分析结果表明,城市、郊区和农村地区的水污染主要分别由生活污水、工业废水和农业面源污染引起的。LEE等[35]采用主成分分析(PCA)和正定矩阵因子分解法(PMF)对来自5个不同土地利用类型的20种化学物质的数据集进行分析,定性和定量地识别径流污染物的来源,指出农药和汽车尾气排放是该地区磷污染物的主要来源。而HELLAR-KIHAMPA等[36]采用层次聚类分析法分析了坦桑尼亚北部潘加尼河流域有机氯农药残留(OCPs)、多氯联苯(PCBs)和多溴联苯醚(PBDEs)的分布,指出OCPs和PCBs、PBDEs主要来源于甘蔗种植园和城市周围的工业活动。PEKEY等[37]则运用因子分析-多元回归模型确定了Dil Deresi河(Izmit Bay,Turkey)中重金属的来源,研究表明,涂料工业、污水、地质和交通道路径流对河流重金属污染的贡献率达83%。LIU等[38]采用水质指数(WQI)法和多元统计分析法对太湖水质数据集(2010—2014年)进行分析以确定水质的主要参数和潜在污染源,并利用绝对主成分得分/多元线性回归模型(APCS-MLR)和正矩阵因子分解(PMF)模型对西北湖泊的5个潜在污染源进行了识别。研究结果表明,各污染源对其水域的污染贡献率为农业面源污染(26.6%)>污水排放(23.5%)>工业废水排放和大气沉积(20.6%)>浮游植物的增长(16.0%)>降雨或风力扰动(13.4%)。
2.2 示踪法
示踪法是指通过对污染物进行标记,分析标记对象的迁移转化过程从而研究污染物的来源,主要分为同位素示踪法和微生物示踪法2类。
2)微生物示踪法。微生物示踪法是一种利用微生物在环境中的生化特性、遗传多样性及其特异性代谢产物确定其宿主来源的新技术。FLYNN等[43]利用微生物示踪剂评估了冬季土地使用限制对小流域河流源头水质的影响。根据16 S rRNA基因标记的拟杆菌跟踪显示,污水处理厂排放期间,上游河流中牛粪污染占主导地位;关闭期间,人为活动占主导地位。PARUCH等[44]同样利用此技术对被粪便污染的贮水池里的饮用水进行了分析,指出非人类(动物)来源的粪便污染占主导地位,69%来自马粪。JIANG等[45]通过人类病毒和大肠杆菌对加利福尼亚州奥兰治县的一个城市小流域的污染情况进行了分析。大肠杆菌毒素标记物揭示了鸟类、兔子和奶牛特有的毒素基因的存在,鸟类和野生动物的粪便、土壤改良剂和粪便大肠菌群的生长是造成下游地区粪便细菌污染的主要原因。SNCHEZ-ALFONSO等[46]从猪的肠道物中分离出一株可区分猪粪便污染的噬菌体宿主菌株(PZ8),并利用该菌种作为微生物源跟踪指示剂,对牛、猪屠宰场废水、城市污水和Bogot河的粪便污染源进行了评价。LABRADOR等[47]利用基于PCR基因指纹图库的微生物源示踪法判别Laguna湖粪便污染的来源,并评估了3种指纹标记物BOX-A1R、(GTG)5和REP1R-1/2-1的鉴别能力,研究指出,BOX-GTG可以作为湖中微生物源示踪法指纹图库rep-PCR的标记物。
此外,脂肪酸、粪甾醇、固醇、线粒体等生化物质[48-50]也被证实可作为一种特殊的生物标记物来替代同位素示踪进行河流中潜在污染源的释源。
2.3 水纹识别法
水纹识别法是指通过分析水中某些特征污染因子与各污染源之间的关系来识别水污染来源以及各来源的贡献。利用事先采集好的指纹,在对污染物进行源解析时,只需进行逐一对照,寻找相同特征的污染物,从而更好更快地确定污染源。
LI等[51]基于优化的Access污水化学指纹数据库(WCFD)对北京通州北运河周边工厂的污水数据和河流水质数据进行了分析,研究指出,该数据库具有较强的水质污染源识别能力和追踪时效性,且数据表、图表形式更直观、形象,便于操作和维护。ZHENG等[52]利用水污染指纹技术研究了华东地区(工业出口)和华中地区(工业接收)工业转移的污染,通过对河南高污染地区和长江三角洲增塑剂、多氯联苯、多溴联苯醚和磺胺或甾类化合物污染严重的地区进行指纹图谱分析,结果显示,导致水污染转移的工业类型可能有电子、塑料和生物医药行业。WU等[53]设计开发了基于MapInfo的突发水污染应急指纹污染源识别系统,该系统通过对事故水质检测结果与“指纹”特征数据库的比较,识别特定污染物的来源,并提出适当的预防和应对措施。HE等[54]开发了一种基于水纹识别法识别地下水污染源的新方法,该方法将待测样品的色谱数据引入指纹相似度计算软件,以污染源色谱图为参考,计算待测地下水色谱峰与污染源图谱的相似度,根据相似度对地下水污染源进行分析,用于判别相似度较高的污染源。BALSEIRO-ROMERO等[55]利用GC-MS对燃料分配站周围的土壤和地下水污染进行指纹识别,研究指出,污染物可能从储罐附近的土壤迁移到周围土壤,并沿西南方向渗入地下水。指纹分析还揭示了污染泄漏的连续性,推测这可能是一个从20世纪90年代中期开始的古老的污染源。BENKADDOUR等[56]对阿尔及利亚西北部的切里夫河水域污染的人为因素和自然因素进行了评估,指出高浓度的类色氨酸和类酪氨酸化合物是未经处理的城市生活污水指纹,城市生活污水是该水体有机污染物的主要来源,与工业和农业活动结合在一起,大大加剧了切里夫河和米娜河的水质恶化。
3 人工智能(AI)在水污染溯源预警中的应用
随着人工智能和计算机技术的飞速发展,河流污染的预警与溯源越来越智能化,对违规排放等环境违法行为的发现已不再是难以实现。AI技术对于指纹图谱的特征识别、提取、匹配和分类具有很好的辅助作用,可有效提升对污染物源解析的精确性和计算速度,并节约成本。机器学习是AI算法的核心,按照模型自主学习、自适应、数据集训练数据进行不断的学习和优化,最后通过分类器获得主要污染物类别,经过分类匹配追踪污染物来源。机器学习应用在水质预警和污染物溯源的相关研究越来越多,将成为新的研究热点。
人工智能算法在水污染溯源方面的应用模型主要包括人工神经网络(ANN)、支持向量机(SVM)、遗传算法(GA)、模糊逻辑(FL)以及它们的混合模型。人工神经网络(ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统,是基于历史数据、利用适用的训练算法来捕获自变量和因变量之间的非线性行为,从而对事物的发展进行预测[57]。支持向量机(SVM)是基于结构化风险最小化原理,按监督学习方式对数据进行二元分类的广义线性分类器[58-59]。由于收敛原理使其能够更好地回归输入值和输出值之间的关系,并对新的输入数据获得满意的性能,故支持向量机能够在分类和回归两方面都获得良好的泛化结果支持[60]。遗传算法(GA)是一类借鉴生物界的进化规律演化而来的随机化搜索方法[61]。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。模糊逻辑(FL)是一种通过模仿人的思维方式来表示和分析不确定、不精确信息的方法和工具,能够解决许多复杂而无法建立精确数学模型系统的控制问题[62]。
FARRELL等[63]将智能算法嵌入水下机器人中,通过污染团的发现、追踪、纠正、污染源的确定等过程实现了对加州圣克利口蒂岛附近海域污染源的识别。该项研究利用污染物浓度不断地修正机器人的搜索方向和步长,最终达到确定污染源的目的。ASHERI ARNON等[64]将人工智能算法引入基于适合度的紫外吸收光谱对污染事件进行早期检测的方法中,利用支持向量机分类器对未受污染和受污染的水进行分类,进一步扩大适合度,并利用特定监测站中水样吸光度特征进行初始化,无需机器学习,实现了随机、高变化水质中低浓度污染物的检测。该算法与紫外光谱相结合,可实现对任何供水系统饮用水污染的简单快速预警。FENG等[65]建立了利用小波分析和支持向量机同时预测水中酚类污染物浓度的方法。该方法应用分光光度法测定了典型酚类化合物的紫外-可见吸收光谱,利用小波分析进行光谱分析和重建,并通过支持向量机进行分类,识别出特定类型的酚类化合物。该研究为饮用水水源酚类化合物污染的预警提供了一种可行的方法。SRIVASTAVA等[66]利用多层人工神经网络(ANN)的逼近能力,根据其位置、强度和活动持续时间对地下水系统的未知源进行识别,并利用反向传播算法对神经网络进行训练,根据含水层中指定观测位置的模拟浓度数据识别源特征。KHORSANDI等[67]采用人工神经网络(ANN)、遗传算法(GA)和模式搜索(PS)等方法对未知污染源的位置、浓度和注入地表水的时间进行了研究,并通过在非棱柱形的水渠中注入不同形式的污染物进行各种假设的污染实例识别。研究结果表明,ANN具有较强的反向识别污染源的能力,能够准确识别污染源的注入过程。当存在多个污染源且对污染物浓度的评估存在误差时,GA和PS对污染源的识别具有更高的准确度。WANG等[68]建立了一种集成长短时记忆网络(LSTM)人工智能系统,利用互相关法和关联规则(Apriori)通过识别水质特征的变化来识别点源污染物排放的规律和异常波动,从而追踪工业污染源。该方法能够有效、准确地识别出不同流域中严重影响水质的污染物,并识别出排放污染物的行业,提高控制污染物排放和改善河流流域水质的能力。这种长短时记忆网络还可以在很大程度上有效预测船舶溢油轨迹,有针对性地为溢油应急战略规划提供科学依据[69]。
4 结语
多种水质快速分析仪虽然部分实现了快速、便携,但目前尚未有比较健全的实时在线监测系统对水质进行全面的分析。此外,水污染事件的污染物、污染源的多样性和复杂性,传统的溯源技术不能很好地确定其污染源类型。常规水质多参数污染源解析只能解析到水体主要受到污染的污染源类型,而不能精确确定单一污染源对水体的影响。同位素示踪法虽然已被较广泛地应用于环境污染物的溯源研究中,但对于持久性难降解有机化合物、新出现的复杂有机与无机化合物的溯源仍具有一定的局限性。微生物示踪法主要应用于粪便污染的溯源,传统的微生物检测方法主要基于实验室,不仅对工作人员、仪器设备要求高,而且需要花费一定的时间,对污染溯源无法做到及时响应。水纹识别法中污染物的指纹必须事先采集好,如果每个来源的指纹卡不是非常明显或显著,则很难以这种方式确定污染源的类型。人工智能技术由于可以解决动态环境问题中不确定性、相互作用和复杂性问题,数据挖掘、人工神经网络、支持向量机和模糊优化等方法已被成功应用于环境污染事件追踪溯源研究中,从而实现准确、智能地识别水质特征和追踪污染源的可能。虽然我国在人工智能水污染溯源方面的研究应用尚处于起步阶段,但人工智能与传统技术相结合将是流域水污染溯源的发展趋势。将人工智能与环境监测相结合,科学、准确、快速地对污染源的位置、源强、排放过程等进行识别,建立精准污染源识别方法体系,对保障水生态环境安全、明确和落实各方责任、实现流域水污染全面监管、为当地政府提供环境决策技术支撑具有重要意义。