APP下载

家庭用户相似邻里用电对比方法研究与应用

2019-10-23王永才林浩

微型电脑应用 2019年10期
关键词:用电量邻里电量

王永才, 林浩

(1.佛山供电局有限公司, 佛山 528000;2. )

0 引言

随着社会的进步和人们生活水平的提高,家庭用电占社会用电的比重日趋增大,增强居民节约用电的意识,进而引导其合理的用电成为节能减排的重要举措[1]。据心理学研究表明,特征相似的群体之间进行某一维度的对比,将更能激发群体成员的潜在心理意识。为了引出人们潜在的“节能意识”,依据家庭特征搜索出每个家庭的相似邻里群体,并将他们的用电情况进行对比分析,引起家庭用电大户们的重视,通过这种长期潜移默化的意识影响方式,进而达到节约用电的效果。但每个家庭的特征都有所差异,如:住房面积、家用电器、常住人口等。本文将重点阐述如何搜索识别出具有相似特征的邻里用户,并提供相似邻里用电对比的应用思路。

1 研究思路

如何识别用户的用电特征?近年来,国内众多学者围绕相关的课题开展了一些有益的研究,如刘政[2]等提出的基于特征相似度的家庭用电负荷识别方法,该方法提取家庭用电正常稳定运行时的功率、电流指标作为特征参数,利用提取的特征参数作为识别模板,通过比较待识别负荷特征参数与特征识别模板的相似度,并通过最大相似度原则确定家庭用电负荷的类别;陆俊[3]等提出的一种基于特征信息量的特征优选策略,实现了一种特征自适应的用户用电行为分析方法,完成优化的用户用电行为分析;赵腾[4]等提出的一种采用互信息与随机森林算法的用户用电关联因素辨识及用电量预测方法,根据不同用电模式对用户进行群体划分,并利用互信息矩阵从区域及行业经济数据、气候条件,以及电力价格等方面辨识与用户群体用电量相关联的因素,进而构建基于随机森林算法的用电量大数据预测模型;张素香[5]等提出的一种基于云计算的居民用电行为分析模型,对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重。

结合佛山供电局的实际情况以及对国内学者论著的研究总结发现,在实际生活中,家庭用电主要受收入水平、常住人口、空调、电热炉灶、电热水器等指标的影响。这其中,有些指标数据虽然很难直接获取,但我们可以从其他维度找到反映该指标的影响因素,从而辅助进行判断。例如,每个家庭的收入水平无法直接获取,但其所在的区域(即地理位置)在某种程度上却是经济收入高低的一种反映。类似地,每个家庭的人口数量也较难获取,但可以通过其住房面积或用电量来间接衡量。因此,我们选取地理位置、住房面积和空调用电量等作为寻找用电相似邻里的特征指标。此外,由于现阶段家庭用电抄表时间和周期不统一,所以,需要考虑电量对比口径的一致性问题,故而将抄表截止时间作为一个时间标尺。

2 相似邻里特征集

2.1 S1特征集

(1) 城市:根据用电地址可获取用户所在城市。

(2) 抄表截止月:将最新一期账单中最近一个月电量(完整的)的月份称为抄表截止月,确保相似邻里间在对比月都有相应的电量数据。

(3) 地理位置:通过技术手段获取该用户的用电地理位置,无法获取坐标的情况下,用市区作为地理位置的初始值。

(4) 住宅面积:根据用户的用电情况,利用支持向量回归模型对其住房面积进行预测。

2.2 S2特征集

用户是否安装空调对其用电结果有着直接的影响,也间接着反映出用户的收入支出水平。因而,我们需要对用户是否安装空调进行判断,其方式如下:

(1) 正常用户。如果该用户有最近12个月的电量数据且总空调电量大于200 kW·h,则该用户过去有空调,并打上空调标签。否则,打上无空调标签。进一步,对于无空调标签用户,在过去12个月的夏季(5~10月)时,若连续某几个月空调电量大于67,则说明已经安装空调,并打上空调标签。

(2) 异常用户。如果该用户没有12个月的电量数据,月基准电量以(11、12、3、4)中的任意两个月及以上电量的平均值代替。

2.3 S3特征集

电热炉灶:炊事使用的是燃气还是电;

热水装置:电热水器、燃气热水器、太阳能热水器、无;

家庭人口数:家庭常住人口个数。

需要注意的是,S3特征集数据可通过营销活动来收集。

3 相似邻里搜索的思路

假设相似邻里的用户个数为P(默认为P=100,可调整),相似邻里搜索是一个较复杂的过程,其具体步骤如下:

第1步:特征提取。提取A用户的初始特征集S,必须有城市、地理位置,抄表截止月(完整电量月),还可能有空调、电热水器等特征。

第2步:U型数据池。根据城市、抄表截止月和月电量范围条件,锁定有效搜索群体(记为:U型数据池),换句话说,同一城市、相同抄表截止月、抄表截止月的月电量在【10,max(2000,2Mi)】范围内的所有用户,其中Mi为抄表截止月的电量。

为了便于理解,现举例说明:佛山市A用户最近一期账单时间为8.12—10.11,且有8、9月份电量分别为460,402,则佛山市、抄表截止月为9、9月的电量在【10,max(2000,2×402)】范围内的所有用户作为U型数据池。

第3步:U型数据池用户数NT判断。计算出U型数据池的用户数为NT,并判断NT是否大于P?

(1) 在NT<=P的情况下,将A用户的“相似邻里度”字段置为NULL。

如果NT>=60%×P,则为NT个用户打上相似邻里标签,并按月进行节能邻居和一般邻居的电量计算,并转入第10步;

如果NT<60%×P,则剔除抄表截止月这一特征,计算出全市范围内的用户数Nmax。若Nmax>P,则按照面积差的绝对值大小选取前P名用户(注意:若排名相同,则随机选取);若60<=Nmax

(2) 在NT>P的情况下,转入第4步。

第4步:用户选取。根据A用户的地理位置由近及远选取一定数量用户N0(默认为1 000,可调整),且有N0<=NT。

第5步:特征差异值计算。计算N0用户与A用户地理位置的距离绝对值DN0、面积绝对差值的相对误差MN0(其中 ,As为用户A的面积,ai为NT中某一用户的面积)、空调匹配值、电热炉灶匹配值、电热水器匹配值和其它电器匹配值。

为了明确电器匹配值的计算方法,以空调匹配值计算为例:如果A用户无空调,则N0个用户中无空调的匹配值为1,有空调的匹配值为0,即同有同无都为1,否则为0。注意:若没有获取到A用户某些电器特征,则不考虑N0用户该部分电器的特征情况,换句话说,这部分电器特征不纳入评分计算范围。

第6步:计算每个用户的总分。按照一定的计分准则,为N0用户各特征差异值进行打分(见表1)。同时,计算出每个用户的总分,并按照由高到低的顺序进行排名。

第7步:总分大于0的用户量判断。统计出N0用户中总分高于0的个数S0,并判断S0是否小于P?若S0>=P,则转入第8步;否则,转入第9步。

第8步:提取相似邻里(S0>=P)。根据总分排名情况,取前P名用户(注意:将与最后一名总分相同的用户按照面积绝对差值的相对误差进行排序,选择误差较小的用户),给它们打上相似邻里标签,并为A用户在”相似邻里度“字段记录上第P名用户的分数。

第9步:提取相似邻里(S0

第10步:按月进行电量对比计算。以9月为例,将相似邻里9月份的月电量由小到大进行排序,得到有序的月电量E1、E2,…E25…EP(记为:Ei,其中i=1,2,…,P),进一步,判断Ei是否<=10?如果Ei<=10,且Ei<=10的用户个数L>50%×P,则剔除10 kW·h及以下用户后再计算节能邻居(前25%用户)和一般邻居(剩余75%用户)电量;否则,不剔除,将P个用户的月电量都用于节能邻居和一般邻居电量计算。

在上述相应步骤中,如果节能邻居月电量<=10 kW·h或一般邻居月电量<=10 kW·h,则表明该用户周围的邻里大多为空房用户。

为了便于理解,将相似邻里的整个搜索过程,其具体细节部分请参见上述的相应内容,如图1所示。

图1 相似邻里搜索流程图

4 家庭特征匹配评分准则

用户家庭用电特征的评分准则:特征的重要性越大得分越高,连续特征差异值越小得分越高,离散特征差异值越大得分越高。评分方式具体如下:

第一,连续特征差异值的离散化。将距离及面积绝对差值的相对误差离散化,同一离散区间用户得分相同。在某种程度上,距离在20 km以上或者面积绝对差值的相对误差在20%以上用户已经不再是我们非常关注的邻里群体。鉴于此,二者的初步划分方式为:

距离区间:在(0,20】范围内距离以1 km为单位划分20个等间隔区间,记为D1,D2…D20,而距离为0 km和20 km以上的区间可分别记为D0、D21。

面积绝对差值的相对误差区间:在(0,20%】范围内面积绝对差值的相对误差以2%为单位划分成10个等间隔区间,记为B1、B2…B10,而面积绝对差值的相对误差为0和20%以上的区间可分别记为B0、B11。

第二,电器匹配值得分。电器匹配值为0,则得分为0;电器匹配值为1,则空调匹配值得分K0>电热炉灶匹配值得分Z0>电热水器匹配值得分R0>其它电器匹配值得分Q0>0,且K0>Z0+R0+Q0,Z0

第三,距离和面积得分。距离得分随面积得分变化而部分变化,而面积的得分也受着电器匹配值得分的制约,它们之间相互制约相互影响,要想给予一个合理的得分较为困难。现阶段,我们采取的约束措施如下:

面积得分约束不等式:

(1)

距离得分约束不等式:

(2)

根据上述不等式(1)、(2)的约束条件,给出了各特征差异值的得分,如表1所示。

5 相似邻里对比应用

目前,该方法已在佛山供电局掌上营业厅APP等多个移动应用上使用。

5.1 基于用户行为心理学设计

斯坦福说服力科技实验室主任BJ Fogg曾经主导研究了关于用户行为心理学的一个课题,并定义了一个 “福格行为模型”。他这样阐述用户行为发生的条件:一个行为得以发生,行为者首先需要有进行此行为的动机和操作此行为的能力,接着,如果他们有充分的动机和能力来施行既定行为,他们就会在被诱导/触发时进行。BJ Fogg的行为模型重点在动机、能力、触发三个因素上[9]。

因此,本文的相似邻里对比应用基于用户行为心理学进行了设计,利用用户的比较、窥探心理,用户可以看到自己当期的用电量与相似邻居的比较结果,从而引起用电大户的重视,起到引导合理用电、节能减排的效果。

5.2 应用功能效果展示

以领奖台的方式直观展示最近一期的相似邻里用电量排名。分三种角色进行排名对比,包括节能邻居(相似邻里月电量排名前25%的所有用户电量的平均值)、一般邻居(在相似邻里中,非节能邻居月电量的平均值)以及我家用电量。此外,应用还提供相似邻里的特征解释,为用户提供涵盖住宅面积、周边距离和空调使用率的相似邻里特征信息展示。具体的应用效果如图2所示:

6 总结

本方法通过为每个用电家庭构建一个特征库,包括地理位置、住房面积、有无空调等,利用专家评分法对各家庭间的特征匹配程度进行打分,综合得分越高的家庭表示相似度越高,进而搜索出任何一个家庭的相似邻里群体。此外,应用在佛山供电局掌上营业厅APP上,计算出该群体的节能用户和一般用户的用电量,以便群体中的家庭用户作为参考对比,进而增强用户的节能意识,也为供(售)电企业提供了新的客户服务理念,在未来的配售电市场竞争中处于更有利的位置[6-8]。

表1 “相似邻里”特征差异值得分表

注:(1)在遵循评分准则的情况下,具体的分数值可以进行相应调整;(2)总分为负数的用户不参与排名计算。

图2 相似邻里用电对比效果图

猜你喜欢

用电量邻里电量
01 国家能源局:3月份全社会用电量同比增长3.5%
储存聊天记录用掉两个半三峡水电站电量
物联网智能燃气表电量自补给装置
国家能源局:3月份全社会用电量同比下降4.2%
黑白电视·邻里之情
“邻里党建”增强居民幸福感
“邻里党建”增强居民幸福感
你为邻里理发,我为你倒茶
节假日来电量预测及来电量波动应对策略