A-D检验在取水户水量在线监测数据稳定性分析中的应用
2017-01-09蒋吉发
蒋吉发,刘 飞
(四川省水文水资源勘测局,成都,610036)
水资源管理
A-D检验在取水户水量在线监测数据稳定性分析中的应用
蒋吉发,刘 飞
(四川省水文水资源勘测局,成都,610036)
采用Anderson-Darling检验方法对国家水资源监控能力建设项目取水户水量进行在线监测,分析在线监测数据的正态性分布特征、置信度,由此确认监测数据是否稳定可靠。
Anderson-Darling检验 水资源 水量监测 正态性检验
1 概述
为实施最严格水资源管理制度,国家启动了水资源监控能力建设项目,其中最重要的就是对规模以上取用水户的取水量进行在线计量监测,作为对取水户用水总量考核和水资源费征收的重要依据。
取水户的取水方式既有泵站扬水,又有自流引水。计量监测设备既有安装在引水管道上的,也有安装在出水管道上的,还有安装在净水构筑物(设备)之间的。有的取水户只安装一个计量监测设备,有的取水户在不同取水管上分别安装计量监测设备;有的取水户已装有计量监测设备,有的取水户未安装计量监测设备;有的取水户既有计量监测设备还因人为调整,数据偏差较大。同时,取水户的取水量根据其供水对象不同,也呈现不同变化规律。供城镇生活用水的取水户白天取水量大、夜晚取水量小,夏季取水量大、冬季取水量小;供工业用水的取水户,取水量随企业生产情况、生产规律以及设备运转情况变化。因此,取水户水量在线计量监测设备采集的瞬时流量波动频繁,在不同时段取水量是不同的。
项目涉及取水户取水量较大,计量管径一般都在300mm~1400mm,较大的管径达2000mm左右。计量监测设备虽然在出厂时进行了检定,但受安装现场边界条件限制和安装调试误差影响,计量数据存在一定的误差。由于不能影响取水户的生产,也无法拆下计量监测设备送回专业检测机构检测,在项目规划建设时,又没有考虑由国家法定计量检测机构对新安装的计量设备进行现场在线校准检定。因此,如何判定安装的计量监测设备工作是否稳定、其计量数据是否稳定可靠,是取水户、项目单位、各级水行政主管部门非常关心的问题。如果在同一工况、同一时段内的累计取水量概率分布呈正态性分布,且置信度满足正态性检验要求,即可认为该监测点的数据是稳定可靠的。
2 Anderson-Darling检验
在现有正态性检验方法中,χ2和KS检验最为常用〔2〕。χ2检验对样本长度要求较高,通常在N>200情况下才能获得比较理想的检验效果;在分布参数未知并需要从样本估计的情况,KS检验的精度不高〔3〕。这些缺陷限制了传统分布检验算法在水量监测数据稳定性检验中的应用。
Anderson-Darling检验是正态性检验的一种,能够在较小样本(N>5)的情况下,对数据拟合度进行分析检验。通过计算样本分布函数(CDF)和经验概率密度函数(EDF)之间的二次AD距离,来衡量样本是否属于某一特定分布族,即判断原假设H0是否成立〔4〕。用F(χ)和Fn(χ)分别表示样本序列CDF和EDF,原假设H0为真,则表示样本χ1、χ2,…、χn同分布,且分布函数为F(χ;θ),θ为分布函数参数向量。
(1)
实际工程应用中,常用离散表达式(2)来计算Anderson-Darling距离,式中Zi=F(χi)为概率积分变换(PIT)函数。
(2)
表1
A-D检验正态性检验临界值
3 取水量A-D检验分析
3.1 基本情况
四川省成都市2012年度“国控”项目,涉及规模以上取用水户31户、74处水量监测点。取水户主要是供工业及城镇生活用水。该项目新装流量传感器41处,直接接入既有流量传感器33处。取水户水量在线监测数据通过RTU每隔5min采集一次,再通过GPRS/GSM传输至四川省水资源管理信息中心平台。2014年8月15日至10月30日,共计77天,监测点有效数据60处(统计分析期间,其余14处因取水户停产,取水量数据为0),单点总样本量22176。
通过对样本数据统计分析,受取水方式及取水系统工作运行方式影响,单点瞬时流量和时段取水量会不断发生变化。一天24h内每小时的取水量会不尽相同,在一年365天中每天的总用水量也不尽相同。
3.2 取水量变化规律分析
3.2.1 日水量变化影响
为了解不同时段的取水水量稳定性,按1h、3h、6h、24h五种时间间隔分析10个监测点水量数据正态性拟合程度(结果见表2)。随着对时间间隔的不断增加,取水水量数据的分布程度越拟合于经验函数(CDF)。以5101240005001监测点为例,分析的概率拟合度分布见图1。
表2 日变化检验分析(N=22176,α=0.05)
图1 5101240005001监测点监测数据正态性检验拟合分布
3.2.2 取水工况变化分析
取水户取水水量因受供用水需求、取水方式等因素影响,单位时段内的水量分布会呈单一正态性分布或复杂的离散-集中分布。有的取水户取水工况稳定,水量分布满足正态性检验;有的取水户工况复杂,水量会离散分布在不同水量区间内,在同一工况情况下,离散的水量区间内数据又呈现集中的分布情况。
以510108006001监测站为例,取水户监测水量在0~9000m3日水量区间和9000m3日水量区间,概率分布呈离散~集中分布(见图2、图3)。
图2 5101080006001水量(0~30000m3)概率分布
图3 5101080006001水量(0~30000m3)正态性检验拟合分布
按照在0~9000m3日水量区间和9000m3日水量区间,对510108006001监测站水量数据分别进行A-D检验(结果见表3)。经检验分析,两个日水量区间内的数据均满足正态性检验。
根据各取水户取水工况变化的不同,按照日水量时间间隔分析复杂工况下监测站水量数据正态性拟合程度,结果见表3。
表3 复杂工况下监测数据检验分析(N=22176,α=0.05)
3.3 检验成果
由于累计取水量时间间隔过短(1h、3h、6h),其取水量相对来讲不太稳定,但也不是取水时段越长越好,因为时段加长后可能出现不同的取水工况,其取水量也不稳定。本项目取水量数据按24h为时间间隔,且根据取水户取水工况进行正态性检验分析。通过对项目60处监测点的分析,44处监测点按整体工况分析通过检验,16处监测点按分解工况分析通过检验,其计量误差满足相关技术要求。
4 结论
4.1 通过对日水量变化及取水工作方式变化的分析,将Anderson-Darling检验方法引入到水量在线监测数据稳定性分析是可行的。
4.2 以24h取水量(时段累计水量)数据为分析样本数据,以取水户不同工况为分析情况,进行数据拟合度分析,其成果较为可靠,计量误差满足要求。
4.3 如果样本系列A-D检验满足正态分布,且置信度达到95%,则可认为其取水量监测数据是稳定可靠的。
〔1〕蔡 阳.国家水资源监控能力建设项目及其进展[J].水利信息化,2013,(6)∶5~10.
〔2〕王斌会,徐勇勇.正态性检验的图示方法及其应用[J].数理统计与应用概率,1996,(3):249~256.
〔3〕周洪伟.正态性检验的几种常用的方法[J].南京晓庄学院学报,2012,(5)∶13~18.
〔4〕张 维,于盛林,张 弓.基于Anderson-Darling检验的恒虚警检测[J]光电工程,2009,(2)∶39~44.
■
TU
B