基于大数据的优质客户识别模型研究
2020-08-03卢艳艳
卢艳艳,马 超,李 静
(国网河北省电力有限公司信息通信分公司, 石家庄 050000)
0 引 言
随着电改工作的深入,特别是2018年国网公司提出“构建以客户为中心的现代服务体系”后[1],电网企业面临的优质服务需求增加,市场开拓竞争压力加大。因此,为优质客户提供特色服务,提高客户满意度,增强客户对电网企业的忠诚度和依赖黏性成为各售电主体竞争优质客户的主要手段和策略[2]。精准定位优质客户,并为优质客户提供差异化优质服务,抢占优质客户资源市场,是电网企业保持长期可持续发展的必然选择。
通过优质客户识别,主动了解优质客户的服务需求,为重要的优质客户提供差异化、专业化及个性化的服务,能够在提高客户满意度的同时提高优质客户的黏性,快速占领高价值优质客户市场,增强企业的竞争优势与核心竞争力,有利于公司在电力市场改革中占据主动地位,实现电力公司与优质客户的双赢;综合分析处理优质客户数据,准确把握用户负荷特性,是做好电力规划、计划、生产运行工作的重要基础,也为电网企业实施需求侧管理、有序用电提供依据[3-4]。
但以人工方式进行数据分析存在工作量大、分析不全面、人工判断多、结果缺乏可靠支撑等问题[5]。因此,亟需应用大数据挖掘技术对相关数据开展科学、深入的分析与挖掘,为优质客户的识别和精准特殊服务提供有力数据支撑。
1 架构设计
1.1 应用架构
应用架构如图1所示。基于大数据的优质客户识别和精准特色服务应用总体上分为数据获取、客户特征指标管理、优质客户管理、客户服务需求分析、服务策略管理、精准服务等6个应用模块。
图1 应用架构
1.2 数据架构
数据架构如图2所示。从全业务数据中心所接入的营销系统、用电采集系统中获取电量、电费、交费、负荷等基础数据,经统计计算分析,将统计结果保存到该模型的Oracle数据库中。通过大数据分析识别优质客户,采集分析客户需求信息,管理服务策略数据,提供精准服务。
图2 数据架构
1.3 技术架构
技术架构如图3所示。应用开发层采用基于云部署的微服务架构波塞冬平台,采用微服务架构解决传统应用的高耦合度,实现解耦并组件重用;展示层采用前后端分离模式,使用Echarts作为展示组件实现可视化分析展示。
图3 技术架构
2 模型管理
2.1 建模过程
2.1.1 数据获取
该模型从营销、采集、财务、PMS等系统中获取数据,每次分析数据量达1 000余个字段、3.2亿条原始用电数据。通过收集用电客户经济、发展、属性、行业、信用、负荷等6个维度36项指标的业务数据,综合分析各种影响客户综合价值的因素,建立客户价值评价特征指标体系。通过客户集中研讨及客户调研,实现样本用户优质性判别,为模型训练提供数据基础。
2.1.2 数据处理
对收集到的用户数据进行数据质量分析,通过数据超限值检验、特征有效性检验、数据空值检验,对数据进行清洗。同时,利用大数据特征工程对原始数据进行数据提取、转换处理。
2.1.3 数据分析
通过客户集中研讨及客户调研,实现样本用户优质性判别;应用随机森林等多种机器学习算法,开展模型训练及验证,形成优质客户识别模型;将模型训练成果集成在信息化系统中,定期开展优质客户识别;通过专家监督开展模型判定结果纠正,从而通过不断完善模型训练样本集的途径实现模型迭代升级。
2.2.4 模型部署应用
由于该模型数据分析所用的原始数据需要从全业务数据中心获取,全业务数据中心需要与用电采集系统、营销业务应用系统、短信平台进行数据交互,获取用户基础数据、用电业务数据并发送相关分析结果内容。因此,需要建设相关系统之间的接口。
模型部署完成后,通过数据接口收集用户特征数据,定期开展客户优质等级的判定,建立模型版本升级优化的长效机制。以专家监督开展模型判定结果纠正的方式,不定期对模型判定结果进行有效性分析,在分析结果的基础上,通过重新训练模型达到模型版本升级及优化的目的。
2.2 优质客户评定原则
优质客户识别模型将所有用户分为5类,分别是:非优质客户、一级优质客户(等级低)、二级优质客户(等级较低)、三级优质客户(等级较高)、四级优质客户(等级高)。
客户优质等级评定时,应用逻辑回归算法得到用户为优质客户的概率P及综合评分Y,其中概率P=1/[1+exp(-Y)],是关于综合评分Y的一个非线性函数。综合评分Y是一个连续变量,通过设置不同的综合评分区间,为进一步细分客户优质等级提供数值依据。
将全部客户通过逻辑回归算法进行综合评分,评分值Y按照从高到低进行排序,形成客户评分趋势图,将优质客户按照四分位法进行划分,确定4个等级优质客户评分区间,形成优质客户评级标准,根据客户Y值判定客户优质等级。
优质客户识别模型如图4所示。
图4 优质客户识别模型
3 实施效果
该模型实施后,将有效地识别优质客户,通过提供有针对性的精准特色服务,刺激优质客户用电需求,同时提供可靠和符合标准的电能服务,满足客户对用电服务的需求,从而提高用户满意度,增加客户黏性,为电力企业带来直接的电费经济收益。
以国网河北公司为例,全省高压客户共计19.6万户,其中优质客户约4.9万户。该模型实施后,通过针对性的服务,提升优质客户满意度和忠诚度,预期减少优质客户流失率0.2%,预期减少电量损失2 500×104kW·h/年。同时,预期争取增量优质客户用电电量2 000×104kW·h /年,直接经济效益1 368万元。该模型实施效果图如图5所示。
图5 实施效果图
4 结 语
基于大数据的优质客户识别模型,通过抓取客户用电特征和用电行为数据,依据36项评价指标,经过业务数据收集、清洗,应用逻辑回归算法作为优质客户识别和星级划分的模型,形成四级优质客户识别分级机制。并根据优质客户的行业特点、用电需求等信息为优质客户制定差异化、个性化的服务策略库,对有限的服务资源制定资源配置计划,有效指导各级管理部门开展服务资源调度安排,实现资源优化配置,有效增益现有资源的服务能力,促使电力企业整体服务水平得到有效提升。