基于连续用电量和缴费时间差的客户信用动态评价模型
2020-10-23谢宏伟郭崇慧陈海民李文杰
谢宏伟, 魏 伟, 郭崇慧, 陈海民, 李文杰, 陈 冲
(1.国网内蒙古东部电力有限公司,内蒙古 呼和浩特 010000; 2.大连理工大学 系统工程研究所,辽宁 大连 116024; 3.南瑞集团公司(国网电力科学研究院) ,江苏 南京 211106; 4.北京科东电力控制系统有限责任公司,北京 100000)
0 引言
社会飞速发展的今天,电是人们日常生活中赖以生存的必需品,所有人都是用电客户。而供电机构与金融贷款机构不同,金融贷款机构在贷款给客户之前,会先调查客户一系列相关详细信息,如客户基本情况、居住稳定性、工作稳定性、资产状况、负债状况、生产经营状况、社会信誉、道德品质等[1~4],再决定是否放贷。在电力行业中,电力公司目前只是对大客户的电资偿还能力进行了评估,而对普通居民的信用评级处于空白[5]。供电商几乎给所有有需求的客户供电,且不会通过调查客户的详细信息来决定是否给新客户供电。实际情况也是先给客户供电,根据客户日后的用电行为对是否继续给客户供电进行决策。
随着国家信息化的发展,国家电网推出并实现了多种便民缴费方式[6],例如,客户可以通过电力机构、金融机构(银行)或者第三方(支付宝)等线上线下多种方式完成缴费,使得缴费难问题几乎得到解决,同时不在规定时间内缴费的客户也越来越少。供电商只需针对特殊的少量的没有在规定时间内交纳电费的客户给予相应的惩罚或者激励措施,而绝大部分客户都在规定时间范围内完成电费交纳。如何对在规定时间内完成缴费的客户进行动态再评价,根据客户的实时信用值做出相应的激励措施和增值服务,更大范围内调动用电客户交纳电费的积极性,对提高供电商电费回收效率和社会稳定和谐有重要的作用。
目前主要用于信用风险评级的方法一般通过找到几项与客户相关的指标,用这些指标做层次分析模型、多元线性回归分析、逻辑回归分析、决策树模型以及神经网络模型等,进而对各个指标计算出一个权重值,根据构建好的模型,对每个客户进行打分,以分数的高低对客户进行信用分级,并且这些模型在客户风险评级领域已经取得了显著成果[7~12]。在这些传统的客户信用评价方法中,大多采用定性方法或者定性与定量相结合的方法对搜集来的客户综合信息进行统计分类与评价。这类方法在电力行业存在一定的缺陷,首先电力行业客户广泛而众多,各方面的综合信息量大并难于收集,并且客户的信息在不断变化,仅仅依靠客户固定的历史综合信息很难做出正确的评价,需要持续地收集客户动态信息,才能够做出实时的客户动态评价。其次,涉及到定性分析的方法中,大多掺杂了一些主观因素,而这些主观因素难以量化,虽然得到的评价模型效果很好但很难嵌入到实际的电力评价系统中。实时的客户动态评价方法能够帮助供电商做出快速的决策,而目前国内外的学者或供电机构对用电客户动态评价问题研究较少,更没对按时完成电费缴纳的客户群进行再评价和细分。
供电量和电费回收效率是供电商经营成果的主要指标,而客户交纳电费的积极性直接影响着电费回收指标的完成[13]。从供电商发布缴费日期到客户实际交纳电费日期所历经的时间间隔称之为缴费时间差,而客户缴费积极性可以由缴费时间差来衡量。在供电商供电量充足[14]、用电客户都在规定时间内完成缴费的情况下,需要对该客户群再进行一次细分。持续用电量高、稳定并且缴费时间差小的客户是供电商需要提供奖励的优质客户,而用电量高但缴费时间差很大的客户是供电商需要激励其积极性的客户。从供电商角度出发,在不考虑货币利率波动的情况下,从供电商发行交纳电费通知之日起,所有客户的单位用电量在任意单位缴费时间差内对供电商带来的潜在损失是固定值。综合客户用电量和缴费时间差两个因素,本文提出一种新的客户信用动态度量方法,此信用指标综合反应了客户的持续用电能力和缴纳电费的积极性,即持续高用电量并且缴费时间差小的客户信用值相对较高,持续高用电量但缴费时间差大的客户信用值相对较低。
1 用电客户信用动态评价理论模型构建
客户的用电量记录和缴费时间差记录同属于时间序列数据,对这些时间序列数据单纯的依靠传统统计建模方法,制定出固定的衡量指标,如均值、方差等,很难全面衡量数据的含义,同时也不能挖掘出时间序列数据背后固有的一些模式。利用时间序列数据特有的时间关联性,分析相邻数据间数据变化的模式,对客户用电量时间序列和缴费时间差时间序列数据进行多视角的综合分析与学习,一定程度上能够反应客户背后的信用变化。本文拟使用扩展的“S型”函数[15,16]对影响客户信用指标的相关因素进行整合并构建新的客户信用评价模型。
现实情况中,供电商或供电机构通过增加供电量对公司产生的效益和通过提高客户电费回收效率对公司产生的效益是不同的,不同的供电商或供电机构的侧重点也不一样。为了简化模型,本文做出一个最基本的假设,即在不考虑货币利率变化的情况下,从发行交纳电费通知之日起,客户的单位用电量在任意单位的缴费时间差内对供电商或者供电机构带来的潜在损失是固定值。比如,客户消耗100度电并且在3周完成交电费与客户消耗150度电并且在2周完成交电费,对公司带来的潜在损失是相等的,因为前者造成供电商100×3=300个单位的潜在损失,后者同样造成供电商150×2=300个单位的潜在损失。
1.1 模型参数描述
C0:客户初始信用值;Cmax:客户最大信用值;Ct:客户开户后第t个月的信用值,t=1,2,3,…;α:频繁不用电客户的最低信用值;β:频繁不用电客户的信用递减因子,β<0;γ:及时缴费客户的信用扩展因子,γ>0;ε:非及时缴费客户的信用缩减因子,ε<0;Qt:客户开户后第t个月的用电量,t=1,2,3,…;It:客户开户后第t个月的缴费时间差,t=1,2,3,…;Q:客户开户后每月的用电量形成的时间序列,Q=(Q1,Q2,…,Qt,Qt+1,…);It:客户开户后每月的缴费时间差形成的时间序列,I=(I1,I2,…,It,It+1,…)。
1.2 模型合理性假设
真实的电力系统数据复杂多变,为尽量满足大部分需求并建立相对统一的理论模型,根据上述情况分析,做出如下合理性假设。
假设1从供电商角度出发,单位用电量在单位缴费时间差内造成的潜在效益损失相等,即ΔQ·Δt值越大,给供电商造成的潜在效益损失越高,其中ΔQ表示单位用电量,Δt表示单位缴费时间差;
假设2新客户信用值相同,同为初始信用值c0;
假设3客户第t个月用电量为0,第t-1个月用电量非0时,相比于第t-1个月信用值,客户信用值下降;
假设4客户第t个月用电量为0,第t-1个月用电量也为0时,相比于第t-1个月信用值,客户信用值下降,但信用值不低于信用值α;
假设5缴费时间差为0时,客户用电量越高,信用值增加的越快;
假设6客户用电量和缴费时间差同时不为0时,第t个月的客户用电量与缴费时间差的乘积相比第t-1个月的乘积大,则信用值降低;否则,信用值升高。
1.3 用电客户信用动态评价理论建模
根据上述模型假设以及真实情况下客户用电量大小和缴费时间差的长短,对客户信用进行不同层级下的动态评价建模。要计算一个用电客户在第t个月的信用值,本文首先考虑了该客户在第t-1个月的信用值ct-1、第t-1个月和第t个月的用电量Qt-1和Qt,以及两个月对应的缴费时间差It-1和It五个因素,然后分别对相关变量在不同条件下进行分层建模,客户第t个月的信用评价的概念模型如图1所示。
图1 客户信用评价概念模型
模型1在第t个月用电量为零而第t-1个月用电量不为零的情况下,客户第t个月的信用值相对于第t-1个月信用值会以一定的幅度下降,定义客户信用递减因子β,(β<0),则当Qt=0并且Qt-1≠0时,客户第t个月的信用值计算方法为
Ct=Ct-1+β,t=2,3,…
(1)
并且当t=1时,客户信用值同为初始信用值C0。
模型2在第t个月与第t-1个月用电量全部为零的情况下,即客户出现了连续不用电的现象,此种情况下,客户第t个月信用值相比于第t-1个月信用值持续下降,根据实际情况,客户第t个月的信用值大于或等于用电客户的最低信用值α,(α>0)。综上,当Qt=Qt-1=0时,客户第t个月的信用值计算方法为:
Ct=max{ct-1+β,α},t=2,3,…
(2)
并且当t=1时,客户信用值同为初始信用值C0。
模型3当客户第t个月用电量不为零,而缴费时间差为零的情况下,即客户在最短的时间单位内交纳了第t个月的用电费用,此种情况的客户是供电商期望的理想用电客户,故该类客户第个月的信用值会以一定的幅度增长,增长程度随着第t个月与第t-1个月的用电量之差的变化而变化,增长程度满足以相邻两月用电量之差Qt-Qt-1为自变量的“S型”函数,但客户的信用值不会超过系统定义的客户最大信用值Cmax,此处定义及时缴费客户的信用扩展因子γ,(γ>0),则当Qt≠0并且It=0时,客户第t个月的信用值计算方法为:
(3)
模型4当客户第t个月用电量和第t个月的缴费时间差都不为零时,相比于客户用电量不为零而缴费时间差为零的情况,客户在一定程度上给供电商带来了一定的潜在损失。第t个月的潜在损失高于第t-1个月客户带来的潜在损失时,客户的第t个月信用值相对于第t-1个月的信用值会以一定的幅度下降,反之,则以一定的幅度上升,但客户的信用值不会超过系统定义的客户最大信用值Cmax。在假设1的条件下,客户给供电商带来的潜在损失与客户用电量和缴费时间差的乘积值直接相关,此处定义非及时缴费客户的信用缩减因子ε,(ε<0),则当Qt≠0并且It≠0时,客户第t个月的信用值计算方法为:
(4)
综合上述不同条件下的客户信用评价模型,得到本文关于用电客户的信用动态评价模型Ct(Qt,Qt-1,It,It-1,Ct-1)为:
(5)
其中t=2,3,…;此外,客户第一个月用电并缴费后的信用值C1为:
(6)
其中C0,Cmax分别为客户初始信用值和客户最大信用值,α,β,γ,ε分别是针对客户在用电量和缴费时间差不同情况下对客户信用进行评价的调整参数,这些参数可以依据不同的环境需求作相应的调整。
2 模型验证与应用
2.1 数据准备
为验证本文所构建的模型的有效性,本文将利用国家电网提供的赤峰市宁城县的用电客户真实数据对本文模型的有效性进行验证和分析。首先对赤峰市宁城县用电客户的交纳电费行为进行分析,如图2(a)所示,宁城县将近21万客户近两年内的月缴费行为记录中(约450万条缴费记录),在供电商发布交电费通知的当天完成缴纳电费的约68.83%;而在非当天交纳电费的记录中,99.79%的记录在距离供电商发布交电费通知的三周内全部交齐,只有0.21%的记录推迟到三周以外完成缴费,如图2(b)所示。
图2 赤峰市宁城县的用电客户缴费时间统计
先把宁城县用电客户在近两年内每个月份的所有用电量数据和缴费时间数据提取出来,根据实际情况对数据进行预处理,共得到4,520,780条有效数据,最后整合得到205,490个不同用电客户在2014年1月到2015年10月间的所有用电量和缴费时间差两种不同类型的数据。对于缴费时间差数据表,由于缴费时间差计算的是供电商发布缴费信息之日起到客户交纳电费之日的时间间隔,该时间间隔以天为单位。按照实际情况,客户在供电商发布缴费信息后,客户在缴费信息发布后的三天内交费的行为,都可视为客户在第一时间进行了交费,而客户在随后的一周时间内,即在第4到第10天内交费的行为可视为在相同缴费时间差单位内进行交费,依次类推,得到标准的客户缴费时间差表,如表1所示,经过表1单位间的转换,可以得到所有客户每个月份的标准缴费时间差。
表1 缴费时间差单位转化表
2.2 实验验证
运用本文提出的用电客户信用动态评价模型,并调整模型中的相应的参数,最终设定客户初始信用值C06,即合格分值;客户最大信用值Cmax10,即满分值;频繁不用电客户的最低信用值α=7,频繁不用电客户的信用递减因子β=-0.8,及时缴费客户的信用扩展因子γ=0.8,非及时缴费客户的信用缩减因子ε=-0.9,参数的设定在2.3节会做进一步的介绍。结合上述客户用电量、标准缴费时间差两种类型的数据,得到每个客户在2014年1月到2015年10月间每个月的信用值,20位随机抽样客户的具体信用值如表2所示,其中每个客户在每个月份下的数值表示该客户完成本月电费交纳后的实时信用值。供电商可以根据客户实时的信用值高低情况以及客户信用波动曲线趋势(如图3)及时地对相关客户进行相应的激励、奖励或者增值服务等。如对客户编号为1,5,8,11,13,14,15的高信用客户进行一些奖励;对客户编号为7,9,10,16,19,20的中等或中上等信用客户进行相应的激励措施,提高客户交纳电费的积极性;对客户编号为2,4,12,17的较低信用客户进行相应的提醒措施等。
表2 随机抽样客户在连续时间段内的信用值分布
图3 部分抽样客户的信用值波动曲线
为验证本文所提模型计算结果的合理性,本文从用电客户数据中选取了三个不同样例(如表3)对模型结果进行了合理性解释。样例A可以看出,用电量稳定且及时交费的用户,其信用值也会相对稳定,交费不及时会带来信用值的消减。样例B呈现出频繁性交费不及时现象和用电量连续为零现象,信用值会随着用电量和缴费时间差之乘积的波动而出现一定程度的波动,连续多次不用电时,客户的信用值会重新回到固定值。样例C用电量较为稳定但出现连续性交费不及时甚至拖延现象,其信用值会在一个较低范围内波动。
表3 三个不同样例的信用波动分析
为了验证本文所建立的客户信用评价理论模型的有效性,本文从全数据中随机抽取出五组样本,每组样本中都包含有50个不同用电客户的用电量数据和缴费时间差数据。三个领域专家分别对五组样本进行人工信用评价,对每个客户22个月内的两种数据做出一个整体评价,分为五个等级,A,B,C,D,E,依次表示优、良好、中等、一般和差。得到的最后评价结果作为标准结果,以此对本文提出的信用评价模型进行检验。
对抽样的五组样本,运用本文提出的信用评价模型,得到每个客户在每个月的信用动态评价值,然后求出每个客户在整个时间段内的信用值的均值作为该客户的整体信用值,计算公式为:
(7)
然后根据平均值的大小分别对每组中的客户进行信用排序和分类,按照不同值的大小对每组客户分成五个等级,评级标准如表4所示。
表4 信用值范围与信用等级对应表
依次与专家评价结果进行对比,得到每组中划分与专家划分相同的客户个数,如表5所示。观察可以得出,每组的正确率都在90%左右,其中没有划分正确的客户中,大多只相差一个等级;所有样本中的平均正确划分比例接近90%。
表5 实验结果与专家评价结果对比
实验结果和专家标准结果具有良好的一致性,对比结果说明了本文所建模型的合理性,可以给实际的用电客户信用评价提供一定的参考。
2.3 灵敏度分析
上述实验过程中,本研究对模型中的参数取值进行了合理性分析,即考察分析了参数的取值对最后实验结果与专家结果的符合程度的影响。本研究的主要参数为:客户初始信用值C0,客户最大信用值Cmax,频繁不用电客户的最低信用值α,频繁不用电客户的信用递减因子β,及时缴费客户的信用扩展因子γ,非及时缴费客户的信用缩减因子ε。其中C0、Cmax和α可以根据供电商对用电客户的评价标准来确定。对一位新客户,客户初始信用值设定为合格,即C0=6;对一位老用电客户,客户最高信用值设定为满分,即Cmax=10;对于一位频繁不用电的老客户,设定其最低信用值稍高于新客户初始信用值,即α=7。而对于剩余的三个参数,即β、γ和ε,本研究分别对其设定一系列的离散值进行实验,观察不同的取值对实验效果的影响。本研究采取固定任两个参数的情况下,在合理的取值范围内变动剩余的一个参数50次的策略进行灵敏度分析,实验结果如图4所示。
图4 参数灵敏度分析
从图4(a)可以看出,在参数γ和ε固定的情况下,β≤-0.79时,准确率趋于稳定。由图4(b)可知,在参数β和ε固定的情况下,γ∈[0.7,0.87]时,准确率相对稳定。由图4(c)可知,在参数β和γ固定的情况下,ε∈[-1.1,-0.73]时,准确率相对稳定。所以本实验中选择β=-0.8、γ=0.8以及ε=-0.9作为参考值对客户进行信用值评价。
3 结论
本文针对现实世界中用电客户信用评价问题进行了研究,主要对在规定时间内完成交费的用电客户群进行的一种信用等级再分类。在用电客户其它方面信息缺失,只有用电量信息和缴费时间差信息的情况下,本文利用扩展的“S型”函数对用电量信息和缴费时间差信息进行整合建模,得出一个能够度量客户持续用电能力和交纳电费的积极性的客户信用动态评价模型。本文把此模型应用到赤峰市宁城县客户数据中,通过参数灵敏度分析实验,设定相对稳定的参数值,最后得到的信用波动结果与客户的用电量波动情况和交费积极性变化等密切相关,可解释性强。最后随机抽样出一定量样本数据,通过与领域专家评判结果进行实验对比,得出此模型的评价结果与领域专家评价结果具有90%左右的一致性,也说明了本文所建立的用电客户信用动态评价模型的可行性。此外,相比于其它定性分析方法,此模型更具有客观性,计算过程中不融入主观思想,计算方法简单可靠。本文提出的模型可以方便地应用到真实世界中供电商对用电客户的信用评分系统中用电客户信用评价系统中,可以为供电商提供实时的客户信用状态值,辅助供电商做出相应的决策。