基于数据挖掘的客户电量流失预测方法
2018-05-24吕思蒙
吕思蒙
客户流失,在电力系统中称之为客户销户,即客户因自身原因希望终止与供电企业的供用电关系而办理销户手续。根据原国家电力工业部1996年发布的《供电营业规则》第三十二条和三十三条规定:客户销户,须向供电企业提出申请。供电企业应按下列规定办理:1)销户必须停止全部用电容量的使用;2)客户已向供电企业结清电费;检查用电计量完好性后,拆除接户线和用电计量装置;4)客户持供电企业出具的凭证,领还电能表保证金与电费保证金;办结上述事宜,即解除供用电关系。
电力一直以来处于垄断地位,2015年3月中共中央、国务院印发《中共中央国务院关于进一步深化电力体制改革的若干意见》(中发[2015]9号)和《关于推进售电侧改革的实施意见》,根据文件精神要求通过开展售电侧改革试点,引入社会资本竞争,未来电力企业面临社会资本对客户市场的竞争。未来客户可以根据电价、服务体验等因素对供电对象进行选择,因此电力企业需要通过现有强大的客户基础信息数据,对客户流失问题开展研究,并对流失进行预测,为制定相应的服务策略争取增量客户市场提供决策依据,同时也能为政府机构开展经济形势分析提供参考。目前针对用电客户流失的相关研究较少,往往通过人工经验预测流失电量,没有系统的流失电量计算方法,使得预测流失电量对预测人的经验要求非常高,故需设计一种用电客户流失电量预测方法,以估算客户流失给电力企业带来的电量。
客户电量流失预测
本文设计的基于数据挖掘的客户电量流失的预测方法,主要包含以下四个步骤:
(1)对用电客户进行分类;
(2)根据步骤(1)的分类,得到每类用电客户在预测月流失的预测客户流失数;
(3)获取每个用电客户的历史用电量,根据历史用电量计算得出每类用电客户在预测月的平均用电量;
(4)根据每类用电客户在预测月的平均用电量和每类用电客户在预测月流失的预测客户流失数计算得出全体用电客户在预测月的总流失电量。
其中,用户客户的传统分类方法主要有:
1)按照供电区域分类。供电区域和电力市场有明显的对应关系,把位于同一区域的客户划分为同类。
2)按照客户规模分类。就是根据客户的用电量大小、电压等级高低、容量大小作为依据进行分类。
3)按照客户性质分类。客户性质分类包括按产业、按行业、按负荷重要性、按耗能程度、按用电潜力分类。
4)按照电价分类。按照执行电价的对象不同可分为:居民生活、非居民照明、大工业、非普工业、商业、农业生产、其他。
5)按照信用等级分类。
6)按照经济贡献率分类。
但是就目前供电企业对电力客户的细分主要存在以下问题:缺乏考虑客户的用电行为;细分指标单一,只能从某方面反映客户的价值;细分方法可操作性较差,分类结果不能直观反映客户的真实价值,无法满足市场营销的需要。具体说明如下:
1)缺乏考虑客户的用电行为
一个客户存在多种属性及特征,主要归纳成3类:社会属性、经济属性和客户行为。对客户进行细分的时候,企业可以根据实际需求选择不同的属性。
随着智能电网建设的推进,用户多元化需求对现有营销方式提出新的挑戰,尤其是进入个性化的“一对一”营销时代,更需要科学的客户行为细分。因此,基于现有客户服务数据资源,从电力客户的客户行为人手,综合考虑客户多方因素,对于更好的认识客户,增强企业营销服务和实现营销精益化管理都具有重要意义
2)电力客户细分指标单一
在电力客户细分工作中目前主要采用的是定性分类方法,对定量分类方法的应用并不多见,能将两种方法有机结合的客户分类方法更为缺乏。事实证明,定性分类方法由于营销人员的主观原因和经验所限,缺乏对客户的全面了解,分类结果往往比较粗糙,难以发现不同类别客户之间的区别,难以真正发挥客户分类的作用,不利于进一步开展营销服务和客户开发等工作。而定量方法通常是对客户信息进行统计和计算来对客户进行分类,分类结果解释性比较差。
用电信息采集系统和数据仓库的建设完善,客户数据将会越来越丰富和复杂,为构建结合定性和定量的细分方法提供了基础。但对于有些复杂的数据,传统分类方法无法精确解读,而随着数据挖掘技术水平的提高,有效解决了这一难题,其分类结果能很好地贴近人类的思维方式,使分类更加科学化和规范化。
3)电力客户细分可操作性较差
目前,国内电力市场建设还不完善,对电力客户细分的研究更多是停留在理论研究阶段,脱离实际营销市场,不能满足现代电力市场营销活动的需要。同时,由于分类方法过于简单,客户细分结果模糊、可操作性较差,不能反应电力客户的用电行为,实际的操作意义不大。
近年来,各省市供电局陆续开展了信息采集系统的建设工作,客户的用电数据呈爆炸式增长,为智能化客户细分方法的研究和应用奠定了基础。现在应用较多的方法主要有以下几种:
1)聚类分析。聚类分析在数据挖掘技术中是一个非常重要的研究领域,是一种无监誓的、具有探索性的分类技术,它是在没有任何先验知识的前提下,按照一定规则将数据集划分成不同的簇,使得同一个簇中的样本之间的相似程度较高,而不同的簇之间的样本之间的差异程度大。目前聚类分析在营销分析、信息检索、数据统计等多个领域得到了广泛的应用。
2)人工神经网络。人工神经网络是模仿生物学中人体的神经网络结构和运行原理而建立起来的一种计算模型,整个模型由一些相互联系的神经元组成,这些神经元的功能在于处理和传递信息,其连接方式直接决定着信息在网络中传递和信息的属性。通过模拟人脑的学习、记忆和处理问题等方式,对神经网络进行客户细分方面的训练,神经网络就可习得客户数据处理方法,并且根据相应细分要求,对数据进行合理分类。
3)拟合分析。采用拟合分析进行客户细分的过程是:首先对样本的偏好进行评估,在此基础上将有相同或相似偏好的样本划分为一类。原始的拟合分析仅以表面特征为细分指标,随后不断地向屯、理特征过渡。相应地细分技术也从事前细分向事后细分转移。在不断改进之后,拟合分析成为最受欢迎的细分方法之一。
4)因素分析。因素分析是现代统计学中一种重要而实用的方法,它是多元统计分析的一个分支。因素分析是通过对指标体系内部结构及相关性的研究,借助一定的统计技术,将原始指标转化为与之信息等价的、独立的新指标系列,即因子集合,以此反映出事物内在关系的、固有的、决定事物本质特征的因素。
电力市场环境的复杂性决定了没有哪一种细分方法可以适应于所有情况,在进行客户细分前要根据细分目标选择适合的方法。同时,市场环境与客户样本的不断变化决定了不存在一劳永逸的细分方法。
经过对比分析,聚类分析中的K-means算法由于具有操作简单、易于实现和效率高等优点,K-means算法是快速聚类法中的一种,是由麦奎因提出的,实质上该算法是基于簇中对象的平均值,为了能达到全局最优,基于划分的聚类要求穷举所有可能的划分;基于该算法的客户分类实现步骤为:(1)将n个客户用电的历史数据分成K个初始客户类型,确定各初始类的中心,一般采用均值作为中心;(2)定义以样本的个数为维度的空间里的一种距离;(3)计算某个客户用电样本与各中心的距离,选择距离最小的那个中心所在的类作为该客户用电样本应当划入的类;(4)重新计算失去该样本和取得该客户用电样本的类的中心;(5)对其他所有客户用电样本都以同样的方法来重新归类和确定类别中心;C6)重复这一过程直至所有客户用电样本均不能再重新分配为止;通过k-means聚类方法能够实现利用客户历史用电数据实现对电力用户类型细分操作,算法的输入为客户的历史用电数据,其输出为客户细分类型;本文将采用K-means算法进行客户细分。
本文提出一种基于数据挖掘的客户电量流失的预测方法,并针对目前客户分类方法的不足分析,提出基于K-means算法的聚类客户细分方法。(上接第066页)实训室建设必须与企业岗位需求配套,以培养学生专业技能为目的。目前,重庆公共运输职业学院已完成城市轨道交通技术中心和铁路综合实训基地建设,该实训基地建设有150米长钢轨线路,配套接触网设备、车辆设备和室内外信号设备,在该实训基地可以完成上述信号基础实训项目。
4.2实训项目优化
(1)信号机点灯电路故障处理:该实训项目需培养学生识图和故障处理能力,能够读懂进站信号机、出站信号机、调车信号机、正线防护信号机等信号机室内配线,能够理清继电器内部组合和侧面端子配线走向。通过教学,让学生掌握点灯电路故障处理流程,形成如何快速判断室内外故障思维,通过电压测量,能够解决室内断线故障、错线故障、混线故障等。
(2)转辙机控制电路故障处理:该实训项目培养学生能够处理ZD6型、ZYJ7型、S700K型转辙机室内外电路故障,通过电压测量,判断室内继电器控制电路及室外自动开闭器、移位接触器、安全接点等常见故障点。
(3)转辙机设备安装与调试:该实训项目培养学生能够对室外转辙机设备定反位密贴、缺口进行调试的能力。能够通过观察和练习,快速判断螺距调节距离,同时掌握室外转辙机设备基础结构和动作过程。
(4)继电器组合焊线:该实训项目要求学生能够根据室内配线图,对继电器内部组合、继电器侧面端子进行焊线,在焊接线时注重焊线和配线工艺,避免配线的搭焊,同时学会常用工具使用,养成安全生产意识。
(5)进路的排列与解锁:该实训项目要求学生能够熟练掌握列车进路和调车进路的排列方法,学会如何利用调车信号机兼作变更按钮形成变更进路,同时掌握总取消、总人解、区段故障解锁、上电解鎖、道岔单锁、道岔封闭、引导进路等基本操作。
随着我国城市轨道交通和高速铁路的快速发展,轨道交通职业院校人才培养质量直接关乎企业生产效率和生产安全,因此如何培养高质量的轨道交通一线通信信号技术人才是摆在职业院校面前的重要问题。培养高质量一线操作人才,需要对实训设备加大投入,加强行业师资培养和引进,注重实训课程项目优化,以赛促学,不断提升实训课程教学水平。