基于多元回归模型的电力诉求影响因素
2019-06-11刘丞罗立宏
文/刘丞 罗立宏
1 简述电力诉求产生原因
电力诉求常发生于电力需求高峰期的夏季及电力设施整改期间。其诉求问题主要来源于突发的停电事件或电力故障报修后无法得到及时抢修导致的财产安全问题。通过研究客户诉求问题可以了解电力诉求的发展情况。
电力诉求的问题主要有以下几种类型:
(1)因计划停电导致的延迟/提前复电导致居民对停电安排时间、频率不满意问题;
(2)供电设备自身发生故障而停电,包括短路、过载、接地等引起上级设备跳闸停电,如断路器、剩余电流动作保护器的保护性跳闸;
(3)用户设备因在复电后引起损坏无法启动,要求赔偿财产损失;
(4)其它外部因素影响,如自然灾害、恶劣天气、外力破坏等引起停电。
表1:模型回归结果
2 搭建数据指标
2.1 数据特征
对电力运营数据来说一般有一下几个特征:
(1)数据量大且规律复杂。
(2)电力故障的区域分布广,发展规律多元。
(3)受到多种因素的影响且作用方式不尽相同。
因此,在对电力诉求数据进行分析研究前,需要对不同的电力诉求数据进行分区,分别挖掘各分区内客户电力诉求规律。
2.2 数据聚类
本文采用K-means聚类方法对各月份的电力故障事件造成的不同影响进行聚类,分析不同时间与空间电力事故造成的影响。K-means算法是一种经典的基于距离的聚类算法,采用距离作为相似性的指标。经实验,对电力运营数据中不同月份上的各指标数据共24433个样本进行统计处理,得出聚类个数为5时,轮廓系数较大。利用以上不同类别结果,有针对性的应对各种不同用户群体提供具有针对性的服务方案。例如:第1类数据停电次数最大,主要分布于郊区,应设备进行检修排查,更换老化设备;第2类数据区域影响指数较大,主要分布与城区,可加强与客户建立良好的沟通等。
2.3 数据指标
建立诉求影响评价指标,是研究电力诉求影响因素差异性及主要性的前提。因此提取适合的数据指标是关键。基于停电事件的数据情况及对业务的理解,电力诉求影响数据指标主要包括平均时长(h/次),平均缺供电电量(kW·h/次),客户影响数量(户/次),区域影响指数及时间点影响指数。其中区域影响指数定义为电力故障影响用户数与故障所处区域的用户数的占比,以及故障事件涉及的台区或者线路的数量的乘积。时间点影响指数定义为电力故障事件的月份以及不同的时间点造成的不同影响。
3 搭建回归分析模型
多元回归分析是一种常用的统计分析方法。其本质是在大量数据观察的基础上,建立起因变量与自变量之间的回归关系函数模型。通过上述建立的数据指标,结合历史诉求和历史供电类数据信息,可对电力诉求产生的环境、关键点、消亡痕迹等进行整合,多方面多角度挖掘问题本源和形成规律。在诉求问题挖掘上,主要有以下工作步骤:
(1)拆分各类原始清单字段维度信息,细化数据颗粒度。
(2)诉求区域、停电区域逻辑关联。
(3)故障报修、停电时间、故障停电满意度逻辑关联。
(4)建立科学的分析模型,梳理停电处理全过程,找出薄弱环节,经过科学方法分析停电产生的客户诉求因素影响敏感度。
3.1 搭建模型
为了更好的探求电力诉求中的影响因素,本次研究将诉求量设置为因变量,将诉求因素设置为解释变量,通过建立多元线性回归模型来研究这些影响因素和电力诉求量之间的关系。模型公式构建如下所示:
其中,SQ、TDSC、KH、DL、QY、TDZS分别代表电力诉求量、停电时长、影响客户数、损失电量、区域影响指数、时间点影响指数。a为模型常数项,β1-β10为影响因素的系数,ε为模型的残差。
3.2 模型结果
如表1所示,从这些影响因素的标准化回归系数大小来看,停电时长的系数依然最大,说明停电时长对诉求量的影响最大,其次停电影响指数、影响客户指数;排在后两位的是损失电量指数和区域影响指数。
4 结束语
本文通过结合对电力数据已有的研究,选择了多个影响因素,研究了电力诉求影响因素,通过建立模型来判断这些因素的影响程度。经数据验证后,模型结果真实可靠。本次研究探明了电力因素对于居民电力诉求的影响程度,更好的让供电部门采取相应措施。