面向泛在物联网的电力营销大数据处理方法*
2020-04-30化振谦党三磊赵炳辉张永旺
彭 龙 化振谦 党三磊 赵炳辉 张永旺
(广东电网有限责任公司计量中心 广州 511547)
1 引言
随着电力技术的飞速发展,电力营销管理业务的范围逐渐扩大,其包括多种业务形式,比如抄表、缴费、电力营销作业、电力故障维修、计量点管理、电力信息服务等[1-4]。在应用时,由于电力营销系统具有较广的业务分布,并且大量的项目分布分散,业务形式繁多,电力信息采集量大,相邻系统件的耦合关联性比较强[5-7]。用户在进行业务处理就显得不够及时,时效性较差,系统之间的互联性不佳。因此,如何便捷、实时使用电力营销系统、提高电力营销系统的使用效率就成为当前电网用户亟待解决的问题。电力营销管理信息系统(Material management information system,MMIS)是供电企业提高经营管理效能和决策水平,向客户提供“优质、方便、规范、真诚”服务的重要条件[8-12]。
随着物联网技术在各个工业中的应用,这就为电力营销管理系统的应用提供了新的技术方向。通过将物联网技术与电力营销业务相结合,能够实现电力营销各项业务的集中化、实时化、精细化管理,使用户可以跨地域、跨业务范围地使用、管理电力系统[13]。物联网技术还能够使各种应用终端与电力营销管理系统形成互联网络结构,大大提高了电力营销数据的传输和交互能力[14]。基于此,本文基于物联网构建出电力营销管理信息系统(MMIS),增加了电力营销管理应用的范围。
2 总体架构设计
基于可扩展性、可用性、稳定性、安全性和互联性原则,构建出如图1 所示的架构图。在本系统设计中,MMIS 基于智能用电服务系统技术支撑平台而建立电力信息管理平台,其根据国家电力公司《电力营销管理信息系统设计规范(试行)》的要求[15],将电力营销管理信息系统大致划分4 个层面,分别为客户服务层、营销业务层、营销工作质量管理层和营销管理决策支持层。将MMIS 与物联网连接通信,通过物联网的方式实现信息互通。在物联网中,其包含应用层、网络层、感知层以及用户层。
在本文系统设计中,将物联层大致划分为三层,即物联网感知层、物联网网络层和物联网应用层。其中物联网感知层包含有不同的营销终端,用户通过营销终端使用、利用电力设备,并与电力设备进行通信。在物联网网络层,其应用了不同的通信方式(比如无线通信或者有线通信)。通过这种方式与不同的终端和移动营销平台实现信息互通(远程通信和近距离通信),如图2 所示。在常规电力通信中,通常采用基站、交换机和路由器实现数据通信,并采用以太网TCP/IP 通信协议。
在本文设计的方案中,可以采用多种通信方式。远程无线通信方式可以为CDMA、GPRS、2G/3G/4G网络、Mobitex 无线网络等。在移动营销终端内,通常还可以设置Mobitex 无线调制解调器,通过该解调器实现与Mobitex 基站的通信,Mobitex 基站还能够与以太网交换机以TCP/IP 方式互通信息,通信方式是通过Mobitex 协议包的形式完成。近程无线 通信可以为Zigbee 网络、RFID 射频识别、蓝牙通信、红外通信、WiFi 通信等。基于多种通信的方式有利于实现物联网电力营销管理系统,从而构建出信息畅通的互联模式。在物联网应用层中,主要实现与移动终端、移动营销互动平台之间的通信,其中包括移动作业、移动获知、移动服务和移动通信等。从而更有效地获取业务客户的相关信息,实现客户与支撑平台之间的通信[16-17]。
3 大数据处理方法
大数据软件平台主要包含客户服务层、营销业务层、营销工作质量管理层、营销管理决策支持层。在本文方案中,应用数据挖掘算法对MMIS 中各种不同类型的数据进行分类,使用户能够根据需求输出不同的目标数据,减少用户搜索数据的时间[18-19]。然后根据检索到的数据,再利用随机矩阵理论统计、分析MMIS 中数据库的数据,从而有效地分析出数据的信息的能谱和本征态,得出实际数据的随机程度,根据数值,揭示不同类型数据之间包含的事件特征之间的关系。从而实现系统管理、用电业扩管理、电费计算、电费审核、计量管理、工程管理、报表管理等各种功能,从而便于用户进行数据管理和应用,图3 为本系统软件的总体框图。MMIS 能够覆盖所属各地、市供电企业的广域网络。通过物联网技术实现上传下达数据的目的,满足用户获取数据信息的实时性。在任务开始时,MMIS 通过远程无线通信或其他通信方式接收电力设备底层数据,或者接收抄表信息。通信方式请参考上文介绍在此不做详细说明,下面针对数据的算法处理进行详细介绍。
3.1 数据挖掘算法
MMIS 中的数据库通常包含基础数据库、共享数据库以及决策数据库。在对这些数据库的数据类型进行处理时,选择采用决策树算法进行运算的原因在于,这种方法能够处理数据量比较大的数据,能够使用户从大量的数据库中快速选出用户期望的数据。下面对基础数据库进行说明。如图4 所示。基础数据库是各个业务子系统中业务信息的重要资产信息,它是建立其他数据库的基础。共享数据库的使用范围比较广,综合性较强,其包含的数据类型也较多。决策数据库使企业决策者执行决策、计算的常用数据。数据库作为电力营销管理系统的核心部分,各级MMIS 通过物联网交互数据错综复杂。用户在使用数据时,操作、处理数据的能力显得不足。
在本文技术方案中,选择使用决策树算法中的ID3 算法来构建决策树,从而实现对数据的分类。这种算法处理速度快,分类精确,并且能够根据用户选择的分类属性进行分类,最终输出分类的具体结果,下面对该分类步骤进行详细介绍。在分类时,首先要训练分类器,再将若干个弱分类器训练成强分类器,如图5 所示。
在选择分类器之后,通过确定决策树的节点和分支节点来建立决策树模型。如图6 所示,首先介绍数据组经验熵H(D)的计算公式
式中,i 为电力营销数据类型的个数;|D|是数据库集中所有样本个数;k 是目标变量的种类;|Ck|是该分类下的样本个数。
用户从所选的MMIS 数据库中计算数据库集的经验熵,并选择信息增益最大的特征作为当前分裂特征。
在所有的特征中,假设计算特征A 对数据库集 D 的经验条件熵H(D|A),则有计算特征A 的信息增益公式为
根据式(1)和(2)计算出经验熵选择决策树的根节点。在选择目前数据库集的分割特征属性时,使用信息增益度来计算。如果出现大信息增益度值的频率高,则表示在这个属性特征上,数据损失得较少,可将计算出的较大信息增益度值的属性置于决策树的上层,作为根节点来考虑,将较小信息增益度值的属性作为叶节点使用。根据上述方法确定的根节点和叶节点,从而建立数据模型。
3.2 随机矩阵理论
在进行了决策树算法之后,能够使用户有效地将不同营销数据类型按照一定的属性选择出来。在输出的数据中,如果要考察不同数据之间的关联性以及不同数据之间的关系,即通过各种数据之间的关联性进行评估电力营销不同大数据之间的关系,则需要对数据进行进一步的研究,因此引入了随机矩阵理论。本文设计的系统还能够统计、分析不同地区MMIS 数据之间的联系。在应用随机矩阵理论之前,首先引出相关性矩阵公式[9-12],如式(3)所示
在式(3)~(5)中,假设不同市、地区MMIS 数据库(诸如A 市MMIS 数据库中的基础数据库、B 市区MMIS 数据库中的共享数据库、C 市区MMIS 数据库中的决策数据库等)有M 种,数据库集合为:{P1, P2, P3, …, PM},参数(如电量电费数据、收费服务数据、负荷管理数据等)的数据有N 种,数据集合为:{Q1, Q2, Q3, …, QN},在评估时间窗区间范围内,连续测试T 次,其中将构成用户投诉的数据构建为矩阵D1,矩阵中,数据集合元素Pij为第i 个MMIS 数据库在j 时间下进行检测数值[20-22]。D2表示电能计量数据,比如电量电费数据、收费服务数据、负荷管理数据等。
4 应用与分析
下面结合具体案例,对本文设计的技术方案进行验证。在试验时,可采用LoadRunner 性能测试工具[23-25]。测试模型如图8 所示。
4.1 采用决策树数据验证
假设用户选择的MMIS 数据库集为D,基于上述论述,将最大信息增益作为最优特征而选择,然后生成极小熵决策树,计算出各特征A1、A2、A3、A4、A5对数据D 的信息增益,如表1 所示。
表1 中的D1和D2,D3分别表示在各个特征中取值为1、2 和3 的样本子集,基于式(1)计算出
表1 MMIS 数据库样本计算
根据上面的计算结果,特征A5的信息增益最大,即选择A5为根节点。将A5的取值将样本划分为3 个集合,S1={2, 3, 6, 8, 12, 13},S2={1, 5, 7, 14},S3= {4, 9, 10, 11, 15},集合S2已全部属于同一个类,不需要再分支,已成为叶子节点。采用类似的方法可确定其他根节点和叶子节点。利用上述数据集构建决策树如图9 所示。
通过上述决策树的建立,用户可以快速从MMIS 数据库中筛选出稽核表中的故障数据。经过试验,采用该算法数据检索速度提高了95%以上。
4.2 采用随机矩阵数据验证
在Matpower 的IEEE-118 节点的仿真系统中模拟各个市地区MMIS 数据库之间的关系。在样本数据库中,假设选择矩阵D1=80×150,D2=400×500,根据公式Dstd=[w1, w2, w3,…,wM+N]T计算求值,其中D1分别为不同市地区的基础数据库数据、共享数据库数据、决策数据库数据构成的矩阵。为了便于计算,将D1组建5 个矩阵,D2为电量电费数据、收费服务数据、负荷管理数据等(这些数据仅为示例说明),样本数据见表2。
表2 试验数据表
基于该样本数据表,将式(4)代入计算,得出
再将式(5)代入计算,得出
为了更加直接得出电量电费数据、收费服务数据、负荷管理数据等与各个市地区MMIS 数据库之间的关系,将其绘成曲线图,如图 10~12所示。
通过图10 可以看出,电费电量数据与各个市地区MMIS 数据库之间的关系,使用户获知电费电量数据异常情况。通过图11 可以看出,收费服务数据与各个市地区MMIS 数据库之间的关系,使用户获 知收费服务数据的异常情况。通过图12 可以看出,负荷管理数据与各个市地区MMIS 数据库之间的关系,使用户获知负荷管理数据的异常情况。上述仅仅是示例性说明,其他数据的评估以类似方法进行[26]。通过试验,用户在终端能够以最短的时间接收数据,并对数据进行筛选和分析,效果显著。
5 结论
本文基于物联网技术构建了电力营销管理信息系统架构,具有积极有益的效果。
(1) 用户通过远程/近程无线通信实现与不同的终端和移动营销平台的信息互通,使获取数据的及时性、实时性大大提高。
(2) 在电力营销管理软件平台,又通过数据挖掘算法建立数据模型,通过决策树算法对各个市地区MMIS 数据库进行样本学习、训练,使得多个弱分类器训练成强分类器,最终建立起成熟的决策树算法,使用户筛选数据的能力得到很大提高。
(3) 软件平台又采用随机矩阵理论对MMIS 数据进行分析,深化了对数据的感官认知,使得用户发现MMIS 数据更本质的规律,通过试验,具有明显的效果,为用户使用MMIS 提供了技术参考。
综上所述,本文采用的技术方案具有诸多优点,便于用户综合处理电力营销大数据。