基于时间序列建模的电力营销客户交易行为分析*
2020-04-11方正云廖洁萍段明明
方正云,杨 捷,杨 泓,廖洁萍,段明明
(中国南方电网 云南电网有限责任公司,昆明 650011)
电力服务单位通过电力营销实现创收增利.为了满足社会公众的需求,电力商品与其附加服务的生产、输送、分配、销售贯穿整个营销过程.随着市场变化以及服务模式的转变,我国电力服务单位的营销模式也需在新的形势下做出变革.改革主要体现两方面:一方面要进行电力体制改革和智能电网建设;另一方面要兼顾电力市场需求和客户满意度.新模式下的电力营销需要增供扩销,扩大客户服务的功能,确定不同客户群体对电力电能的消费和使用能力,从而起到引导电力服务单位生产、运营的作用.因此,通过分析不同客户的用电消费行为模式,制定针对性的运营策略,判断和分析营销状态,提出客观、即时、准确地决策意见对于提高电力单位在能源市场中的配额,创造更多的经济以及社会效益意义重大[1-5].
针对电力营销中客户行为的风险评估和建模,由于同时涉及客户行为影响力以及克服心理反应的建模,需要使得营销分析更符合人类认知模式,即实际接触客户行为的随机性和模糊性,从而实现对电力营销状态的精准评估.本文基于模糊集理论和概率论云模型[6-7]来定量描述电力营销客户对象的行为,并对价格敏感度、投诉率、欠费率、销售变现天数以及忠诚度这5个参数的变化波动情况进行离散余弦变换,再利用云建模并结合云测度定量化描述每个客户在营销过程中的特征.同时结合聚类或者分类算法实现客户分级与销售状况评估,为电力营销管理决策提供支持.
1 现有技术与云模型
利用适当的营销服务调整来创造价值,近年来受到电力服务单位越来越多的关注.研究着眼点包括对电力营销目标市场和供电企业营销状态的动态分析评价,对售电量及其影响事件的因素分析挖掘,对电力客户实时履约能力判断以及对供电企业营销业绩效果考核等.其引用的评估手段从类别上可以大致划分为3种,分别为基于模糊集理论、基于概率论与数理统计以及人工智能技术.采用的分析模型涉及模糊评判法、物元模型、聚类技术、因素关联模型、排序算法、主成分分析法、神经网络算法以及熵权法等.然而,目前市场电力服务单位营销数据在表征方式、类别等特性上均存在明显的差异.营销分析评估在具体实施时存在难以量化、采用数据定性分析困难的情况,这主要是由于大多营销策略均是采用自然语言描述的,具有天然模糊性和不确定性.然而,基于模糊集理论的评价方法容易忽略隶属函数本身的不确定性,且隶属度函数的构造和生成因为使用者的偏好而存在不同,从而容易降低对评价对象认知的客观性.单纯使用概率统计理论方法,虽然在建模和分析难度上最低,却难以有效量化自然语言描述的各种概念.通过人工智能方式得到的分析结果虽然对样本组成的鲁棒性更强,但中间生成的参数和模型的实际物理意义难以明确,且参数调整和建模本身难度更高,在实际使用中,计算代价以及硬件成本也较为昂贵[8-11].
云模型是通过统计分布去定量化描述一个定性概念,其中,定性概念C的任意一次随机出现可以表示为x,也称为一个云滴.x对C的确定度为u(x),u(x)属于0~1自然分布中的随机数,x在论域上的分布即生成一个云模型,进一步通过计算云期望J及熵I来描述其基本特性.超熵L是云模型特有的数字特征,是熵I的不确定性度量.云期望、熵以及超熵也是云模型中最常用的云测度.
2 离散余弦变换
离散余弦变换是将待分析数据投影到一组余弦正交基上的变化方法.采用其对随时间变化的用户数据进行处理主要是因为余弦变换能够有效地将反映波动变化的数据成分分量与偶然的数据有效分离,且通过变换后,数据整体的能量变得更加集中,反应出的数值特点也更加容易通过统计等分析进行处理[12-13].X表示一个客户行为采样信号,对应的离散余弦变换矩阵为B,B为一个M×M的变换矩阵,则对应的离散余弦变换为
Y=BX
(1)
3 反向传播神经网络算法
云测度需要进一步通过适当的聚类/分类模型进行无督导或者督导学习,从而达到识别不同客户类型的目的.神经网络算法作为一种模拟自然信息处理流程的机器学习模型,能够更好地适应多特征融合分类的使用场景,特别是将其模拟为神经元工作方式,每一个神经元对多输入信息加权处理,并叠加整合向下一层进行传递.而层与层之间通过一个开关函数实现非线性传递,利用样本标签信息和实际分类结果之间的误差,构造误差能量与权重之间的损失函数,再通过误差能量对权重系数求导,以一阶梯度为零点,在局部凹函数的假设下,优化得到最佳权重[14-15].
反向传播神经网络算法在实际使用时,一般优先构造生成目标函数,得到实际输出与期望输出的误差均方.在均方误差最小原则下,构造出目标函数的凹解集合,使用梯度下降或者其他寻优算法得到最优权重,获得极小值点.反向传播神经网络一般包括至少一个隐层结构,每个隐含层中具有若干隐单元Vj(j=1,2,…,J0)连接其前向输入单元ξk(k=1,2,…,K)以及后向输出单元Oi(i=1,2,…,I0).定义wjk为从输入单元ξk到隐单元Vj的配置权重系数,从隐单元Vj到输出单元Oi的配置权重系数为Wij,ω={W,w}用于表示权重系数矩阵;上标μ用于区分输入类型,μ=1,2,…,P;g1和g2为激活函数,实现不同隐含层之间的光滑连续过渡.
对确定输入模式为μ,隐单元j的输入可以表示为
(2)
其后向输出为
(3)
单元i的前向传递输入表示为
(4)
整合传递激活函数得到
(5)
其中,单个单元目标误差函数为
(6)
单元i总误差均方函数表示为
(7)
其中,优化迭代权重的调整方向为梯度的负方向.ω增加变化为ω+Δω,使误差迭代减小,最后收敛得到全局极值点.从隐含单元到输出单元梯度变化表达式为
(8)
从输入单元到隐含单元梯度变化表达式为
(9)
ωnew=ωold+Δω
(10)
梯度下降算法的长调节因子一般是人为确定的,也可以通过共轭梯度或者随机梯度等方式自动生成.例如在模拟退火、蚁群、鸟群等智能优化算法中,其下降步长可以是集群或者多个方向计算得到的平均值,从而提高整体算法的性能和鲁棒性[16].本文所采用的神经网络算法输入变量是客户云模型计算得到的云测度,考虑到实际建模的复杂度和计算代价,采用两层隐含层的结构进行实际配置,生成最后用于分类识别的计算模型.神经元上、下两层之间采用全连接的方式建立其映射路径,激活函数选取软阈值的S形函数.
4 数据采集及结果分析
电力营销客户状态等级可以具体划分为“优、良、中、劣”4个档,对应1~4级.通过云模型分析采集得到的客户数据,并转化生成相应的云测度指标,其中,用户等级划分主要依据专家经验得出.计算评估的数据集合包括了实际采集得到的473例样本,每个样本的时间观测周期为每月一次,连续采集了近5年的数据.因为实际数据中存在部分数据点缺失或者明确记录错误等情况,剔除了其中21例样本,并对剩余的452例样本中的数据点进行了缺失值补充,补充值为该数据点前后数值的加权平均值.
“优、良、中、劣”4档在进行神经网络训练计算过程中,被具体标记为1、2、3、4进行相应的类别划分.在训练计算过程中,训练数据集中采用督导训练的方式,每个类别和它对应的特征分别作为输出和输入.
在进行神经网络计算过程中,每个特征参数的传递连接权重被计算归一化,即权重取值范围为0~1.梯度下降的步长取值范围为10-3~10-5量级.以客户的销售变现天数为示例,图1给出了客户销售变现时间波动趋势图.根据图1可以看出,客户数据在不同时间内存在时变特点,对其进行离散变换,同时分析其数据分布的云模型,得到对应的结果分别如图2、3所示.
图1 客户销售变现时间Fig.1 Customer sales cash-in time
图2 离散余弦变换结果Fig.2 Results of discrete cosine transformation
图3 云模型分布Fig.3 Cloud model distribution
通过图2余弦变换得到的数据结果可知,除了存在一个零频率分量外,在其他周期频率上也存在波动变化,如图2圆形框图中所示.该波动从一定程度上反映出客户行为特点,可以提取作为客户行为分析指标.
图3中每个数据实现即表示一个云滴,可以直观地观测出其行为应属于一个二元混合正态云模型.数据分布在53 d以及54 d上存在双峰,说明了观察数据销售变现天数的统计特性,对应图1具体体现为前一段时间和后一段时间销售变现天数的区别.图3仅仅作为一个示例给出,其它的监测参数也同样存在随时变化的曲线,可以建模生成相应的云滴统计模型.
结合前文提及的计算期望、熵以及超熵计算公式,提取452例样本的云测度以及余弦变换后的波动特征进行对应的分类识别判断.进行50次随机二折交叉验证,每次抽取的训练样本量为所有样本量的一半,采用另外一半样本进行模型结果验证,得到的对比分类测试结果如表1所示.
表1 训练集与测试集对比Tab.1 Comparison between trainingand testing data sets %
从表1可以看出,数据通过云测度提取再经过后向反馈神经网络进行训练后,可以有效区分不同类别的客服数据,其平均检测精确度可达95%以上.
5 结 论
本文提出了采用云模型结合后向反馈神经网络进行电力运营客户交易行为研究的方法.通过云测度连续提取价格敏感度、投诉率、欠费率、销售变现天数以及忠诚度这5个参数的变化波动情况,并将其作为特征向量,输入神经网络中进行训练,最后得到能够进行自动识别的分类模型.通过对电力营销客户状态等级的分类识别,可以有效鉴别出当前服务质量水平以及是否具有改进空间.在得到的分类等级为“中”及以下时,可以及时调整服务方式,加强监督管理,该方法具有良好的推广性.