城镇燃气供销差控制管理方法
2019-07-02杨辰晨
■ 杨辰晨
全球天然气消费在一次能源消费中占比趋于稳定,2017年,全球天然气消费占比23.36%,而中国占比则仅为6.60%,未来具备较大提升空间。据分析,未来30年,中国天然气将进入快速发展阶段,能源消耗量将保持高速增长,城镇燃气企业面临巨大挑战与机遇。从城镇燃气企业发展的角度来看,供销差率体现着燃气运营企业的管理效果和盈利能力,偷盗燃气是影响供销差率的重要因素,会给燃气企业带来重大损失,预防和打击偷盗燃气行为是企业的长期工作。
据统计,能源偷盗(能源公用事业公司往往同时经营电力和燃气配售业务,因此有的统称为能源偷盗)在发达国家造成的损失可达能源零售收入的0.5%~3%不等,在发展中国家的比例往往更高。国家发改委2017年6月发布的《关于加强配气价格监管的指导意见》对城市燃气的供销差率给出了新的明确规定:供销差率 (含损耗) 原则上不超过5%, 3年内降低至不超过4%。随着表端远传监控技术的发展,数据积累逐渐完善,城镇燃气用户数量多、现场检查工作量大,首先在后台利用数据挖掘辨识用气异常用户,而后进行重点现场核查,会大大提高打击偷盗气效率、降低成本。
本文以占据城镇燃气企业用气量较大的采暖锅炉房用户为例,对辨识异常用户的统计方法进行探索,以期为燃气企业利用大数据提供方法依据。
一、对于偷盗气用户识别的统计方法
国内关于辨识用气异常用户的相关文献非常有限,2019年李曼曼等发表的《餐饮用户用气量异常数据查询方法的研究与验证》一文指出,使用最小日用气时间作为辨识用气异常用户的指标,但是该指标受用户类型和经营状况的影响较大。
国内城市燃气企业对于异常用户的辨识均处于探索阶段,投入大量人力进行现场核查,尚未在后台形成有效的方法库。
本文借鉴目前对窃电异常用户的辨识方法,选择因子分析和神经网络两种方法进行探索。
(一)因子分析
因子分析法是从研究变量内部相关的关系出发,把一些具有复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。根据得出的因子表达式,把原始变量数据带入表达式得出因子得分值,根据因子得分在因子所构成的空间中把样品点画出来,形象直观地达到分类目的。
(二)神经网络
多层感知器是一种前馈人工神经网络模型,其将输入的多个数据集映射到单一的输出的数据集上。多层感知器的一个重要特点就是多层,通常将第一层称之为输入层,最后一层称之为输出层,中间的层称之为隐层。多层感知器并没有规定隐层的数量,因此可以根据各自的需求选择合适的隐层层数,对于输出层神经元的个数也没有限制。
二、采暖用户的指标库
针对于不同类型的用户,辨识用户用量异常的指标不尽一致,本文以我国某大型城市燃气企业的采暖锅炉房用户为分析对象,根据查表及远传采集监控系统的数据,得到7个对辨识异常用量有效的指标名称,并预测其合理值。
序号 指标名称 公式 合理值1 白天变异系数(8:00-19:00)C·V=(标准偏差SD/平均值Mean)×100% 最小值2 夜间变异系数(20:00-7:00)C·V=(标准偏差SD/平均值Mean)×100% 最小值3 白天和温度的相关性 相关系数 1 4 夜间和温度的相关性 相关系数 1 5白天单耗 单耗=供暖季耗用量/供暖面积/供暖季天数 最大值6夜间单耗 单耗=供暖季耗用量/供暖面积/供暖季天数 最大值7 白天夜间不平均值 白天和夜间不平均值=白天单耗/夜间单耗 2
三、实证分析
(一)因子分析方法
使用312个监控数据比较完整的采暖锅炉房,对上述7个指标进行因子分析,将变量降维,因子分析得出三个公因子,解释程度为74.92%,第一个因子和白天变异系数、白天和温度的相关性、夜间和温度的相关性,三个变量高度相关,可以称为调节因子;第二个因子和白天单耗及夜间单耗高度相关,可以成为单耗因子;第三个因子和夜间变异系数、白天夜间不平均值高度相关,可以称为嫌疑因子。根据因子载荷建立得分方程:
y=(1.845×调节因子+1.773×单耗因子+1.626×嫌疑因子)/5.244
按用户得分从高到低排序后,得分越高的采暖锅炉房用户代表用气最不规律,可以认为这种用户发生偷盗气的嫌疑较大,需要进行重点的现场核查。将已经确认的9个采暖锅炉房偷盗气数据带入得分方程,排名均在37名以前,所以可以认为此方法能有效筛选出疑似用户,按照顺序进行现场核查。
(二)多层感知器方法
在采暖锅炉房用户中,找到有远传数据的7个已确定的破坏燃气表偷盗气用户,和11个用量稳定且单耗较大、认为不存在偷盗气嫌疑的用户,计算白天变异系数、夜间变异系数、白天和温度的相关性、夜间和温度的相关性、白天单耗、夜间单耗、白天和夜间的不平均值,7个指标的值,使用多层感知器的方法,建立神经网络判断模型。
因为样本量较小,处理时间不足1秒,设置种子3以便模型可以重复使用,其中训练样本11个,测试样本4个,保持样本3个,输入层7个单位,隐藏层5个单位,输出层1个变量,分类1为偷盗气用户,分类2为用量正常用户。
分类
使用神经网络多层感知器的方法,可以看出保持样本错误百分比33.3%,有66.7%的用户可以正确预测进入相应分类。将此多层感知器模型应用于新发现的2户偷盗气用户,均被判别为偷盗气用户,所以此模型具有一定稳定性。
本文通过对某城市燃气公司采暖锅炉房用户的研究,总结出辨识异常用气用户的7个指标,使用因子分析和神经网络方法对采暖锅炉房数据进行数据分析。因子分析方法综合使用7个辨识异常用户的指标,得到因子得分方程,计算用户得分,得分越高的用户代表用气最不规律,需要进行现场排查。多层感知器方法通过对已知偷盗气用户的训练,得出神经网络模型,该模型预测错误率33.3%。使用两种方法验证已经发现的偷盗气用户,发现结果具有稳定性,可以应用于实践。
因子分析方法更适用于偷盗气数据较少的情况下,按照得分大小确定现场排查优先级;在具备较多偷盗气数据时,应用多层感知器的方法更能准确定位疑似偷盗气用户。