APP下载

应用皮尔逊相关系数算法查找异常电能表用户

2014-03-02吴旭鸣王爱凤

电力需求侧管理 2014年2期
关键词:皮尔逊台区用电量

王 涓,吴旭鸣,王爱凤

(泰州供电公司,江苏 泰州 225300)

电力网电能损耗率简称线损,是电力企业的一项重要综合性技术经济指标。它反映了一个电力网的规划设计、生产技术和运行管理水平,长期以来受到各级电力企业的重视。随着经济的发展及电力市场化的深入,为减少电网的运行成本,对电力网节能降损工作提出了更高的要求。用户电能表发生负误差超差时会导致台区线损偏高,如何准确定位异常电能表用户是各供电公司面临的实际问题。

1 线损电量与用户电量的关系

线损电量是指发电机发出来的电能经过输、变、配电设备输送到用户。由于这些输配电设备存在着电阻,因此电能通过时就会产生损耗,以热能的形式散失在周围的介质中。另外,再加上一部分客观存在的管理损耗,这2部分电能损耗就构成了电网的所有线损电量,简称为电网线损。

电网的总电能损耗可以分为可变损耗、固定损耗和不明损耗3类。可变损耗包括线路导线中的线损、变压器绕组中的线损(铜损)、电能表电流线圈中的线损;固定损耗包括变压器的铁损(空载损耗)、电容器的介质损耗、电能表电压线圈和铁心中的损耗;不明损耗包括用户违章用电和窃电损失、电网元件漏电损失、抄核收之差错损失、电能表误差损失。[2]其中可变损耗和固定损耗合起来又叫做理论线损(技术线损),不明损耗又叫做管理线损(营业损失),所有线损综合成为实际线损(统计线损)。

由线损电量的定义可知:线损电量=供电量-售电量。

由线损电量的分类可知:实际线损(统计线损)=理论线损(技术线损)+管理线损(营业损失)=可变线损+固定损耗+不明损耗。其中:不明损耗=用户窃电+电网原件漏电+抄核差错+电能表误差。

当用户电能表负误差、用户窃电、电网原件漏电或抄核差错过大时,都会导致不明损耗明显增大,从而导致该台区线损电量明显增大,线损率明显异常增大。

根据电能表计量误差率=(电能表抄见电量-用户实际电量)÷用户实际电量×100%可知,电能表计量误差=电能表抄见电量×(1-1÷(电能表误差率+1))。因此可见,用户的电能表计量误差与用户抄表电量线性相关。

假设排除了某台区下其他引起线损异常增大的原因,当某台区线损率异常增大时,就需要查找是由哪些用户的电能表计量不准确引起的。本文主要介绍了应用皮尔逊相关系数算法查找引起电量损失的存在较大负误差的电能表的方法。

2 皮尔逊相关系数算法

皮尔逊相关系数又称皮尔逊积矩相关系数、简单相关系数,它描述了2个定距变量间联系的紧密程度,用于度量2个变量X和Y之间的相关(线性相关),其值介于-1与1之间,一般用r表示,计算公式为

其中n为样本量,X、Y分别为2个变量的观测值。

若r>0,表明2个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明2个变量是负相关,即一个变量的值越大,另一个变量的值反而会越小。r的绝对值越大表明相关性越强。[3]

一般定义为

0.8<r≤1.0 极强相关

0.6<r≤0.8 强相关

0.4<r≤0.6 中等程度相关

0.2<r≤0.4 弱相关

0.0≤r≤0.2极弱相关或无相关

3 运用皮尔逊相关系数算法查找用户问题表计

根据以上分析,用户用电量与用户电量误差存在着线性关系,在排除其他因素或用户用电误差远大于其他因素产生的电量损失的情况下,台区线损与用户用电量也存在着线性关系,而皮尔逊相关系数正好是用来衡量2个变量之间线性关系的度量值。

因此,将一段时间以来台区线损电量与台区下各个用户的数据进行皮尔逊相关系数计算后,找出相关系数特别大的用户,将其作为疑似问题进行重点检查,往往可以快速查找出该台区下的问题表计。

以下是江苏泰州供电公司运用皮尔逊相关系数查找用户问题表计的实际案例。

某台区下共有21个用户,4月份该台区的线损率一直在10%~20%,居高不下。

在采用皮尔逊算法之前,要想查找出该台区异常电能表的用户,使用的方法是将每一户的用电量曲线与台区线损电量曲线进行比对,人工查找出比较类似的用户,再进行排查。这一做法的缺点有:工作量大,需要将根据每户的用电量与台区线损电量生成折线图。若台区下用户较多,工作量巨大,查找结果不精确。由于该方法是采用人工查看折线图的方式进行,属定性分析,对用户电量与台区线损电量的相关程度缺少定量分析。

现采用皮尔逊相关系数算法进行计算分析如下:将每日台区线损电量作为X,各用户每日用电量作为Y,分别计算每个用户用电量与台区线损统计的皮尔逊相关系数。因为4月7日至4月14日系统未能成功采集计算台区损失电量,根据皮尔逊相关系数计算方法,2个数列的值必须成对出现,故2个数列都应将4月7日至4月14日的数值舍去后进行计算皮尔逊相关系数,结果如表1。

表1 某台区4月份各用户用电量与台区线损的皮尔逊相关系数

由计算结果可以看出,用户5xxxxxx289的用电量与所在台区的损失电量高度相关,其皮尔逊相关系数高达0.9,而其他用户最高的也只有0.3。同时,也可以使用折线图来验证该用户与台区损失电量的相关情况,如图1。

图1 某台区损失电量与5xxxxxx289用户用电量变化折线图

由图1可以直观的感受到,该台区的损失电量与5xxxxxx289用户用电量的变化情况接近完全吻合,即台区的损失电量跟随5xxxxxx289用户用电量的变化而变化,同时也验证了皮尔逊相关系数的计算结果完全正确。

在查找出该台区的问题表计以后,泰州供电公司派人去现场勘查,并换回了该用户的电能表进行实验室检定,发现该电能表的误差达到-92.4%,表计存在严重负误差,更换表计后,该台区线损降至5%以下。

4 运用皮尔逊相关系数算法的优势

根据以上分析,使用皮尔逊相关系数算法查找异常电能表的方法是切实可行的,而且较以往人工逐户判别的方式优势明显。

(1)效率高。根据以上原理,只需将皮尔逊相关系数公式建立数学模型,将用电信息采集系统中的台区损失电量、用户日电量等信息导入建立的皮尔逊数学模型,很快就能计算出每个用户用电量或者组合用户用电量与台区损失电量的相关系数,并将结果按照相关系数递减排序,使得表计异常的用户能够被一目了然地列出,准确快速定位,效率很高。

(2)计算准确。皮尔逊相关系数算法属定量分析,将各个用户的用电量与台区损失之间的相关性进行定量计算,避免了定性分析的盲目性和不确定性。

(3)实用性强。由于在运行表计数量较大,尤其是低压用户,不可能对所有表计定期进行误差实测,通过皮尔逊相关系数算法可以准确定位误差异常电能表,增加了对低压用户运行电能表的管控力度,具有较强的实用价值。

5 注意事项

皮尔逊相关系数算法在查找异常电能表的工作中切实可行且优势明显,但在应用当中应该注意以下几个问题:

(1)数据量要足够大。数据量越大越能够更准确地反映出用户用电量与台区损失电量的关系,一般至少取9个以上的有效数据进行分析。

(2)数据必须成对出现。这是皮尔逊相关系数算法的要求,若数据不成对出现,则无法计算其相关系数,因此,当某天线损电量无法计算或用户电量未成功采集时,应将该天相应的数据都删除,然后才能进行计算。

(3)台区户变关系准确。取数据时间段内台区户变关系必须准确且固定。

(4)对于日用电量比较均衡的用户,可以选取不同季节的用电量进行比对分析。

(5)关注零电量用户。零电量用户比较特殊,根据皮尔逊相关系数算法,零电量用户与台区线损电量间的相关系数是无法计算的,应当对这类用户进行单独分析,不适用该方法。

(6)注意多个用户同时的影响。若台区中存在多个用户电能表异常,则在单户分析的基础上进行多个用户组合分析,即将多个用户的日电量累加后与台区线损电量进行计算皮尔逊相关系数,再进行分析。

(7)注意该算法的局限性。该算法仅能够分析用户用电量与台区线损的相关性,并非对所有窃电等能够引起线损增加的原因都能适用。如果某用户采用私接电线的方式窃电,所窃电能不经电能表计量,则该算法无法查找,因此在查找窃电时还应结合其他方法进行检查,达到降低线损的目的。

总之,皮尔逊相关系数算法在查找异常电能表用户中的应用非常成功,速度快、效率高、定位准、操作简便。泰州供电公司仅2013年4月份就从7个测试台区中查找出9户电能表高负误差,在更换电能表后,台区线损明显降低,这一计算方法为降低线损,提高效能提供了很大的帮助。

猜你喜欢

皮尔逊台区用电量
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
现代统计学之父:卡尔·皮尔逊
现代统计学之父:卡尔·皮尔逊
Excel在水文学教学中的应用
卡方分布的探源
1~10月全社会用电量累计56552亿千瓦时同比增长8.7%
降低台区实时线损整治工作方法
2014年全社会用电量
三合一集中器作为台区线损考核表计的探讨