基于套餐隐式评分与用户画像的电力套餐推荐方法

2023-03-13王韵楚林振智马愿谦

电力系统自动化 2023年4期

张智，王韵楚，林振智，马愿谦，卢峰，杨莉

（1.浙江大学电气工程学院,浙江省杭州市 310027；2.国网辽宁省电力有限公司电力科学研究院,辽宁省沈阳市 110055；3.浙江理工大学信息科学与工程学院,浙江省杭州市 310018）

0 引言

新一轮电力体制改革以来,中国电力市场开放程度不断加深。2021 年,国家发改委发布《关于进一步深化燃煤发电上网电价市场化改革的通知》［1］,要求有序推动工商业用户全部进入电力市场,加快培育合格售电主体。竞争性电力市场中,用户选择权的放开催生了各具特色的零售电价套餐［2］,相关学者也从用户的用能特性［3］、需求响应［4］与购电决策［5-6］等角度对电力零售套餐设计开展了广泛研究。然而,从国外电力市场运营经验来看,过于复杂和多样化的零售套餐也给用户带来了理解上的困难,影响了用户寻找更优套餐的积极性。

电力套餐推荐作为一种双赢的售电公司增值服务,能够破解用户寻求售电代理过程中的售电公司繁多、电费机制复杂等问题,同时帮助售电公司提高用户黏性、吸引潜在用户,正成为电力零售市场的研究热点。现有电力套餐推荐方法多采用“用户特征提取-相似用户判定-套餐评分预测-电力套餐推荐”的协同过滤（collaborative filtering,CF）逻辑结构。例如,文献［7］提出了基于差异化特征提取的用户分层聚类方法,按用户用能水平与用电行为是否多变对其进行分类,为不同类型用户定向推送套餐。文献［8］设计了基于加权递增项目覆盖率的用户特征子集筛选算法,以用户对套餐的已知评分判定用户相似性,进而采用协同过滤推荐算法在特征子集内预测目标用户对套餐的评分。文献［9］考虑用户对套餐容量电价、峰谷电价等不同属性的偏好,提出了基于用户行业负荷特征和多属性效用的电力套餐混合推荐方法。文献［10］以用户在不同季节与工作日/非工作日的用电量构建用户画像,采用模糊C均值法对用户进行分类,将相似用户购买频次最高的套餐推荐给目标用户。相比之下,文献［11］提出了基于负荷特征标签与双层邻近传播聚类的相似用户判别方法,采用多粒度犹豫模糊语言集与差异化权重模型量化用户对套餐多属性的评价信息,为目标用户推荐综合满意度最大的电力套餐。文献［12］以家用电器使用时长作为居民用户的用电特征,根据相似用户的套餐价格评分为目标用户推荐电力套餐；在此基础上,文献［13］提出了基于贝叶斯混合协同过滤的套餐推荐方法,采用贝叶斯概率矩阵分解算法应对用户家用电器使用数据缺失的问题。可见,现有研究多以用电量、电器使用信息或套餐评分提取用户特征。然而,根据国家发改委和能源局印发的《售电公司管理办法》［14］,售电公司获得代理用户授权后方可查询其历史用电数据。对潜在电力客户,考虑到数据隐私与用户意愿,售电公司获取其历史用电数据或用户对特定套餐的显式评分存在现实难度。如何通过用户方便提供的数据信息发掘其负荷需求与消费偏好,已成为售电公司在套餐推荐过程中亟须解决的问题。

对此,本文提出了基于套餐隐式评分与用户画像的电力套餐推荐方法。首先,以套餐特征标签与用户的套餐历史购买行为表征其消费偏好,构建计及偏好衰减的用户-套餐标签画像模型。然后,以皮尔逊相关系数和欧氏距离表征用户的分时负荷和总负荷水平特征,提出基于双尺度负荷聚类与轮廓系数（silhouette coefficient,SC）的套餐标签差异化赋权方法,量化套餐标签与用户负荷的关联关系。在此基础上,构建基于加权欧氏距离与标签画像的用户相似度评价模型,根据相似用户的负荷数据预估目标用户的套餐电费,实现电力套餐的协同过滤推荐。

1 计及偏好衰减的电力用户-套餐标签画像模型

1.1 电力套餐特征标签

国外电力零售市场的网上售电平台或套餐比价网站多以标签的形式对零售套餐进行标记。如英国售电公司Scottish Power 推出的Green-Fixed 套餐在比价网站上标有固定电能价格、无退出费以及100%绿色能源等标签［15］。美国得州电力市场用户通过网上平台Powertochoose［16］查询不同套餐的电力事实标签（electricity fact label,EFL）,并获得详细的套餐各项属性。部分典型电力套餐特征标签如表1 所示。

表1 典型电力套餐特征对比Table 1 Comparison of features of typical electricity plans

考虑到用户的套餐购买行为受套餐电能价格、售电公司转换成本、用户环保偏好与套餐品牌效应等因素的影响［17］,本文从如下6 个维度提取套餐特征标签:

1）定价方式标签:以美国得州电力市场为例,套餐定价方式一般包括固定费率、可变费率和指数费率3 种模式。固定费率套餐适用于季节性用电量差异较大且电价波动承受能力较低的用户；可变费率套餐多为短期套餐,电能价格呈月度变化；指数费率套餐则较为少见。例如,美国休斯敦某区域用户可选择的174 种套餐中,固定费率套餐达152 种,其余均为可变费率套餐。

2）分时价格标签:根据峰谷时段的电能价格差异可将固定或可变费率套餐进一步划分为分时电价（time-of-use price,TOU）和统一电价套餐两类,部分实行夜间或周末用电折扣的统一电价套餐,如东京电力公司实行的周末优惠套餐［18］,也可视作分时电价套餐。对可灵活调整生产安排或折扣时段负荷水平较高的用户,选择分时电价套餐更为经济。

3）平均电价标签:用户在给定电力套餐下的平均电价与其用电量、峰谷时段价格、输配电费和固定电费等属性相关,是影响用户的套餐购买意愿的关键因素。考虑到不同电力套餐在定价方式、分时价格和固定电费等属性上的差异,套餐比价网站多以500、1 000、2 000 kW·h 等典型用电量分档下的套餐预期平均电价为标签,向用户展示不同套餐的经济性差异,如表1 所示。对同一电力套餐,其预期平均电价随用户用电量的变化而变化,因而可从用户的套餐历史购买行为中发掘用户的用电需求。

4）绿电比例标签:全球“碳达峰∙碳中和”的发展目标提升了用户的可再生能源电力使用意愿与需求,例如制造业用户可通过获取“绿色电力”标签达到产品标准或提高品牌溢价,扩大市场份额。为此,售电公司提供的电力套餐通常承诺不同比例的可再生能源电能份额以吸引用户,以提供零碳、无污染绿色电力为主旨的售电公司更是提供100%可再生能源套餐以满足特定用户的消费需求。套餐绿电比例正成为影响用户购买决策的重要因素。

5）退出费标签:为保障自身的合理收益、提高市场占有率,售电公司普遍为长周期的固定费率套餐设定套餐退出费。例如,美国YEP Energy 公司为其固定费率套餐设定了175 美元的套餐退出费；TXU Energy 公司按套餐的合同周期设定退出费,3 年期固定费率套餐的退出费最高可达395 美元。用户购买的套餐的退出费越高,其合同周期内的套餐转换意愿越低。套餐退出费既反映了用户对售电公司或套餐属性的认可程度,也反映了该用户的消费惰性。

6）售电公司排名:售电公司品牌效应引发的信任感知是用户选择不同售电公司的重要影响因素。对此,套餐比价网站Energyhelpline 提供知名供应商“Big Name Suppliers”选项供用户筛选套餐,网上售电平台Powertochoose 则按半年内用户的投诉情况对售电公司进行星级排名,排名靠前的售电公司提供的电力套餐更容易获得小型工商业和居民用户的青睐。此外,电力套餐付费方式、合同周期等属性也可对用户的套餐购买行为产生影响。为简化模型且不失一般性,本文中仅以上述套餐标签构建用户画像模型。

1.2 基于套餐隐式评分的用户-套餐标签画像模型

用户画像是根据用户人口属性、行为习惯和兴趣偏好等信息抽象出的标签化的用户模型,可用于提供个性化服务,如信息推送、购物推荐等［19］。用户历史购买的消费品属性特征能够反映其需求与偏好［20］,因而在电力套餐推荐领域,通过套餐特征标签构建用户画像具有可行性。

套餐推荐系统可通过显式评分和隐式评分两种方式获取用户对套餐属性的偏好信息,建立基于套餐标签的用户画像。显式评分通过对用户的问卷调查获取其对套餐属性/标签的评分,结果解释性较强,但实际中用户通常不愿意花费时间与精力提供反馈［21］；相比之下,隐式评分是指用户对套餐的购买、点击、收藏等实际行为［22］,更容易被售电公司获取并用于用户消费偏好辨识。因此,本文以用户历史套餐购买行为衡量其对套餐属性的偏好,通过可量化评分的套餐标签构建用户画像。

套餐标签可按数据类型分为标称型、数值型和序数型［9］。为使所构建基于套餐特征标签的用户画像具备可比性,首先采用标准化评分的方式对不同数据类型的标签进行预处理。数值型套餐标签可划分为成本型和效益型两类:成本型标签的值越小越有利,如套餐平均电价与退出费；绿电比例等效益型标签则与之相反。因此,对数值-成本型标签j按标签值进行标准化的表达式为:

标称型标签仅有0-1 两种状态,固定费率、统一电价标签评分取Lmin,可变费率、分时电价标签评分取Lmax。序数型标签如售电公司排名等,可按比价网站提供的星级评分等比例计算得到。

用户u在n个可选套餐中购买套餐i,则其获得套餐i对应标签j的标准化评分。根据用户的套餐历史购买行为,其获取套餐标签j的累计评分越高,表明该用户偏好套餐对应属性的可信度越高。在此基础上,考虑到零售市场初期用户对套餐的认知变化与消费偏好转变［23］,构建计及偏好随时间衰减的用户-套餐标签画像模型,表示为:

式中:Pu,j为用户u标签j的画像评分；Te为用户提供的套餐历史购买信息数；hi,u,t为0-1 变量,表示用户u在第t次购买套餐时对套餐i的购买决策,hi,u,t=1表示用户u当次购买套餐i；Li,j为套餐i标签j的标准化评分；β为用户偏好的时间衰减系数,β≥0 且β越大表明用户近期的套餐购买行为对用户画像的重要性越高。

式（3）考虑了用户在不同时期购买相同套餐时所获套餐标签评分的差异性,从而避免用户当前的负荷需求或消费偏好被早期的套餐购买行为所掩盖,实现了套餐历史购买信息数量与质量的平衡。

2 基于用户画像的电力套餐协同过滤推荐

2.1 电力套餐推荐的两阶段实施框架

本文所提基于协同过滤的套餐推荐方法通过用户群体的画像匹配发掘目标用户的用电偏好,进而筛选出最优套餐完成推荐。所述方法包括套餐推荐模型的离线构建与目标用户的套餐在线推荐两个阶段,如图1 所示。

图1 基于协同过滤算法的电力套餐推荐实施框架Fig.1 Implementation framework of electricity plan recommendation based on collaborative filtering algorithm

离线阶段构建套餐推荐模型。其中,样本集用户源于已与售电公司建立零售服务关系的电力用户,售电公司可根据用户授权掌握其历史用电信息。由售电公司通过其他合理方式获得历史用电信息及套餐购买信息的用户也可视为样本集用户。在离线阶段,售电公司根据样本集用户的历史用电信息与套餐购买信息构建用户-套餐标签画像,按负荷曲线对用户进行分类,并根据用户簇中套餐标签的分布特征对标签进行差异化赋权。套餐标签权重与样本集用户画像被输入套餐在线推荐系统。

套餐在线阶段以目标用户提供的套餐历史购买信息构建用户标签画像,并据此匹配样本集中的相似用户。在此基础上,根据样本集中相似用户的历史负荷信息预测目标用户在不同套餐下的预期电费,最终为目标用户推荐电费最省的套餐。

2.2 基于双尺度负荷聚类与轮廓系数的套餐标签赋权方法

由于具备相似用能习惯的用户对套餐属性的偏好相近,所提套餐推荐方法的核心是根据用户画像筛选目标用户的相似用户,进而通过相似用户的负荷信息预测目标用户的套餐电费。为此,首先对样本集用户的用电行为进行聚类分析。

现有研究对用户用电行为的分析多关注于负荷曲线形状［3］,具备相似负荷曲线形状的用户对分时定价方式或电费折扣形式表现出一致偏好。然而,考虑到固定电费与电能价格,用户的预期电费还受到总负荷水平的影响。这就要求对用户负荷曲线的聚类须兼顾曲线形态与幅度两方面的差异性,以反映用户的分时负荷与总负荷水平特征。

对此,本文采用基于双尺度相似性的用户负荷聚类算法［24］,分别以皮尔逊相关系数和欧氏距离衡量不同用户在负荷曲线形态和负荷水平这两方面尺度的相似性,其表达式分别为:

综合考虑用户负荷曲线的形态和整体负荷水平的双尺度特征,构造用户负荷曲线的综合相似距离,其表达式为:

在此基础上,采用基于密度的有噪空间聚类应用（density-based spatial clustering of application with noise,DBSCAN）算法［25］对用户负荷曲线进行分类,得到样本用户的典型负荷曲线及用户分类结果。

进一步,为建立套餐标签与用户负荷的关联关系,考虑套餐标签在以负荷曲线为基础的样本用户聚类簇中的分布特征,以用户簇中标签j的轮廓系数［26］反映其重要程度。用户u的画像标签j与同簇其他用户的画像标签j的评分差异越小、与其他簇用户画像标签j的评分差异越大,则套餐标签j的轮廓系数越大。

以U表示样本集用户集合,Uu表示用户u所属的用户聚类簇,Uv表示任意其他用户v所属的聚类簇,则基于双尺度负荷聚类的套餐标签j的轮廓系数可表示为:

套餐标签j的轮廓系数sj越大,表明该标签与用户负荷的关联度越高,在用户画像相似性评估中的权重越大,则套餐标签j的权重可表示为:

式中:ωj为套餐标签j的标准化权重；J为套餐标签个数；定义为套餐标签的量化权重；ωmin为套餐标签的量化权重下限。

2.3 基于用户画像的电力套餐在线推荐

电力用户访问套餐在线推荐系统获取套餐推荐方案。根据用户提供的套餐历史购买记录等信息,推荐系统构建目标用户-套餐标签画像。考虑到套餐标签与用户负荷关联程度的差异性,采用加权欧氏距离衡量目标用户与离线阶段生成的样本集用户画像的相似性,其表达式为:

式中:Su,v为用户u与v的相似度。

套餐推荐系统筛选与目标用户相似度最高的k个样本用户,根据其历史用电负荷数据预测目标用户的负荷需求,则目标用户u在τ时刻的负荷可表示为

式中:Uu,k为与用户u相似度最高的k个用户构成的集合。

在此基础上,目标用户u购买套餐i的预期电费可表示为:

套餐推荐系统计算目标用户在不同套餐下的预期电费并排序,为其推荐电费最省的Top-N套餐。若目标用户对套餐属性有明确需求,可在过滤对应套餐属性后,从剩余可选套餐集合中筛选套餐进行推荐。

2.4 电力套餐推荐算法有效性评估

为验证所提基于套餐隐式评分与用户画像的电力套餐推算方法的有效性,以推荐的Top-N套餐经济性评分均方根误差（root-mean-squared error,RMSE）和推荐准确率［12］评估套餐推荐结果。定义用户u对套餐i的经济性评分为套餐电费的标准值,其表达式为:

式中:ru,i为用户u对套餐i的经济性评分；I为用户可选电力套餐总数。

推荐Top-N套餐的经济性评分的RMSE 可表示为:

式中:IR为推荐Top-N套餐经济性评分的RMSE值；UT为测试集用户集合；为按目标用户u预期负荷计算得到的套餐i的经济性评分；Ru,N为向目标用户u推荐的Top-N套餐构成的集合。

套餐推荐准确率定义为所推荐的Top-N套餐中用户实际电费最省的N个套餐的所占比例,其表达式为:

式中:IP为Top-N最经济套餐的推荐准确率；Tu,N为用户u实际负荷数据下的Top-N最经济套餐集合。Top-N套餐经济性评分的RMSE 越小、推荐准确率越高,则推荐算法的性能越强。

3 算例分析

3.1 仿真设计

为获取用户的套餐历史购买信息用于仿真验证,首先对不同用电和消费习惯的用户的套餐选购行为进行合理假设［10］。在满足套餐属性需求的基础上,理性用户应购买预期电费最省的套餐。然而,考虑到套餐信息搜集成本以及用户对套餐属性的主观偏好,其套餐购买行为可能偏离理论上的最优经济决策。为此,以效用函数衡量用户购买套餐的满意度,用户获得套餐效用越高,其选购该套餐的倾向性就越大［27］。以套餐预期电费为基础,定义用户u购买套餐i获得的效用为:

式中:ηu,i为用户u选购套餐i获得的效用；C*u,i为用户u在套餐i下的标准化电费；φu,i,j为用户u对套餐i标签j的偏好修正系数,具体如下。

1）定价方式偏好:仅考虑固定、可变费率套餐,假定月用电量随季节变化较大的用户更愿意购买固定费率套餐,从而规避电价高峰季节的电费波动风险。则用户对套餐定价方式标签的偏好修正系数可表示为:

2）分时电价偏好:设定分时电价套餐为峰-谷分时模式,低谷时段（22:00—次日07:00）用电量较大的用户更倾向于购买分时电价套餐,从而降低套餐电费。则用户对套餐的分时价格标签的偏好修正系数可表示为:

3）绿电比例偏好:用户对套餐绿电比例的偏好主要受到其行业特点与绿电消费意愿的影响。为简化模型,考虑工商业与居民用户的负荷水平差异,以年用电量模拟用户的行业分类。假设工商业比居民用户具有更高的绿电偏好,同时考虑不同用户的绿电比例偏好的随机性,则用户对套餐绿电比例的偏好系数可表示为:

4）售电公司品牌偏好:考虑用户电费与其信息搜集成本的差异性,负荷水平较低的居民或小型工商业用户更容易受到品牌效应的影响,偏好购买知名售电公司提供的套餐,而大用户对套餐电价更为敏感,受售电公司品牌效应的影响较低。则用户对售电公司排名标签的偏好修正系数可表示为:

式中:Qcu为用户u的成本型标准化年度用电量。

5）套餐退出费偏好:从国外电力零售市场的实际情况来看,中小型用户实行购电选择权的比例普遍不高,如英国居民用户更换售电公司的年平均比例仅为13%,其中约30%用户更换售电公司的目的是购买长期供电套餐［28］。据此,本文假定用户具有消费惰性,在所购套餐合同周期内不更改套餐或转换售电公司；套餐退出费标签作为扰动信息,用于验证所提基于双尺度负荷聚类和轮廓系数的套餐标签差异化赋权方法的有效性,即φu,i,j=0。

在此基础上,采用基于效用最大化理论的离散选择模型仿真用户的套餐购买行为［4］,且假设当套餐预期效用小于平均套餐效用时该套餐不会被用户u选择。则用户u选购套餐i的概率可表示为:

为验证所提套餐推荐方法的有效性,对上述套餐属性进行分档枚举设计。模拟4 类典型用户的月度负荷曲线（双峰、峰平、晚峰和避峰）,用户负荷曲线聚类结果如图2 所示。其中,双峰型和晚峰型用户以小型工商业和居民用户为代表；避峰型用户以夜间错峰用电的工商业用户为代表；峰平型用户多为商场写字楼用户,并细分为3 个子类,聚类中心用户的月平均用电量分别为2 179 kW·h、1 530 kW·h和937 kW·h。其他参数取值为:Lmax=5,Lmin=1,Te=6,β=0.2,αP=0.5,αE=0.5,ωmin=0.2,k=10,φj,max=0.05,φj,min=0,μm=20,N=5。

3.2 典型用户套餐推荐结果

给定参数下仿真得到套餐标签重要性权重ωj如表2 所示。由于同簇用户对套餐分时价格、不同用电量下的平均电价等属性表现出一致偏好,对应套餐标签的重要性权重较高（≥0.123）。相比之下,套餐退出费标签则难以用于区分用户的负荷水平,标签权重较低。由此可知,所提基于双尺度负荷聚类与轮廓系数的套餐标签赋权方法能够实现套餐标签的差异化赋权,支撑套餐推荐系统筛选用户套餐历史购买记录中的有效信息,生成用户-套餐标签画像支撑电力套餐推荐。

表2 套餐特征标签的重要性权重Table 2 Importance weight of electricity plan feature label

所提套餐推荐方法下典型用户的套餐推荐结果如表3 所示。表中所涉套餐仅考虑定价方式与分时价格属性差异,且将固定费率的统一电价（记为FU,fixed-uniform）套餐划分为FU-base 至FU-2000共7 个分档,分别适用于月用电量0～750 kW∙h 至2 000 kW∙h 以上的用户；固定费率的分时电价（记为FT,fixed-TOU）套餐采用相同的分档模式。如表3所示,在所提套餐推荐方法下,不同用户的套餐推荐结果与其负荷曲线及月用电量等用电特征相匹配,用户选购所推荐的套餐有利于降低其电费支出。此外,对比用户U1、U4和U5的套餐推荐结果可知,当用户的月用电量相近时,所提推荐方法能够辨识用户的负荷曲线特征,若为双峰型用户U1与峰平型用户U4推荐FU-750 套餐,为晚峰型用户U5推荐FT-750 套餐,从而实现对不同分时负荷需求用户的差异化套餐推荐。

表3 典型用户的电力套餐推荐结果Table 3 Result of electricity plan recommendation for typical users

3.3 用户偏好时间衰减系数对套餐推荐精度的影响分析

电力套餐推荐系统根据用户提供的有限的套餐历史购买信息构建用户-套餐标签画像。用户偏好时间衰减系数β越大,则用户近期购买的套餐对用户画像标签评分的影响越大,从而影响到所提套餐推荐算法的推荐精度。

图3 对比了不同偏好时间衰减系数β下的套餐推荐精度。可见,随着β逐步提高,套餐推荐准确率指标IP先增大后减小,均方根误差指标IR先减小后增大。当不考虑用户偏好衰减时（β=0）,用户在不同时期购买的套餐对其画像标签评分的影响相同,而实际上用户早期的套餐选购行为与其真实偏好的偏差较大,故套餐推荐精度较低；当用户偏好时间衰减系数β较大时,可视为按用户最近购买的套餐生成用户画像,考虑到用户消费行为存在随机性,该画像将无法全面反映用户对套餐属性的具体偏好,同样使套餐推荐精度下降。当模型中用户偏好时间衰减系数β取0.2 时,套餐推荐精度达到最大值,Top-N最经济套餐的经济性评分的最小均方根误差为0.015,最大推荐准确率达88.8%。

图3 不同偏好衰减系数下的套餐推荐精度对比Fig.3 Comparison of electricity plan recommendation accuracy with different preference attenuation coefficients of users

3.4 用户套餐历史购买信息与相似用户个数对套餐推荐精度的影响

套餐推荐系统根据用户提供的套餐历史购买信息与样本集用户的负荷信息实现目标用户的最经济套餐推荐。图4 对比了所提方法在不同的套餐历史购买信息数Te和相似用户个数k下的套餐推荐精度变化。随着用户提供的套餐历史购买信息增多,基于套餐隐式评分的用户画像能够更加准确地反映用户的负荷需求与消费偏好,从而提高电力套餐的推荐精度。当目标用户可提供的套餐选购记录增多时,所推荐套餐的经济性评分均方根误差指标IR由0.076（Te=1）下降至0.013（Te=6）,平均套餐推荐准确率由64.8%提高至89.6%。

图4 不同相似用户个数与套餐历史购买信息下的套餐推荐精度对比Fig.4 Comparison of electricity plan recommendation accuracy with different number of similar users and historical purchase information of electricity plans

相比之下,若用户提供的套餐历史购买信息有限,则可能造成用户画像失真。此时,适当增加相似用户数量k能够提高套餐推荐精度。如图4 所示,当用户仅能提供单次套餐购买记录（Te=1）时,套餐推荐准确率首先随k增大而提高,并在k=6 时取得最大值65.7%；随着k进一步增大,样本集相似用户与目标用户的画像偏差逐步增大,所推荐的套餐将逐渐偏离用户实际的最经济套餐,导致套餐推荐准确率下降。此外,对比图4 中Te=1 和Te=6 的仿真结果可知,随着用户提供的套餐历史购买信息增多,用户标签画像更加精准,能够在一定程度上缓解相似用户个数k增大导致的套餐推荐准确率下降问题。据此,售电公司应根据用户提供的套餐历史购买记录灵活调整相似用户个数k等模型参数,从而保障套餐推荐精度。

3.5 不同套餐推荐方法的套餐推荐精度对比

为验证所提基于套餐隐式评分与用户画像的套餐推荐方法的有效性,图5 对比了不同推荐方法下的套餐推荐准确率。套餐标签赋权方面,本文所提基于双尺度负荷聚类与轮廓系数的套餐标签赋权方法缩写为DSM（double scale clustering and SCbased method）；熵权法（entropy weight method,EWM）按用户簇内画像标签的信息熵确定权重［29］,标签信息熵越大则表明用户簇内标签评分的离散程度越小、标签与用户负荷的关联程度越大；均一权重法（uniform weight method,UWM）对套餐标签采用相同的权重ω=0.125。在所提套餐标签赋权方法下,对样本用户负荷曲线分别采用欧氏距离聚类（Euclidean distance clustering,EDC）和余弦距离聚类（cosine distance clustering,CDC）,得到差异化的套餐标签权重用于套餐推荐。以标签化画像为基础,基于内容的推荐（content-based recommendation,CBR）方法将用户与套餐视作同质的标签评分向量,通过解决基于标签评分的用户-套餐分类问题,向用户推荐具有相似标签评分的电力套餐。

图5 不同方法下的电力套餐推荐精度对比Fig.5 Comparison of electricity plan recommendation accuracy for different methods

由图5 可知,所提套餐推荐方法与对比方法的套餐推荐准确率IP依次为90.6%、88.5%、88.4%、90.1%、90.3% 和59.8%。一方面,相比于CBR 方法,基于套餐隐式评分与用户画像的协同过滤推荐方法能够准确地识别用户的用电需求,推荐准确率更高；另一方面,所提方法在用户负荷曲线聚类与套餐标签赋权方面也更具优势,相比于EWM、UWM、EDC 以及CDC 等方法,所提方法的套餐经济性评分均方根误差指标IR分别下降了20.4%、21.4%、3.2%和4.7%。仿真结果表明,所提基于套餐隐式评分与用户画像的电力套餐推荐方法能够实现面向差异化用能需求用户的套餐推荐,且相比于其他推荐方法具有更高的套餐推荐精度。

4 结语

售电公司可根据用户的套餐历史购买行为等隐式评分发掘用户的负荷需求与消费偏好,进而推荐电力套餐。为此,本文考虑用户偏好随时间衰减的特点,构建了基于套餐隐式评分的用户-套餐标签画像模型,并提出了基于双尺度负荷聚类和轮廓系数的套餐标签差异化赋权方法。在此基础上,采用标签加权欧氏距离衡量用户画像的相似度,通过相似用户的历史负荷信息预测目标用户的套餐电费,为其推荐最经济的电力套餐,提高了售电公司的套餐推荐精度。此外,从仿真结果也可以看出,所述套餐推荐算法仍受限于用户能够提供的套餐历史购买信息数量,且暂未考虑除经济因素以外的用户套餐属性偏好。因此,下一步的研究可以考虑通过完善套餐标签体系、调整套餐推荐目标等方式对售电公司电力套餐推荐方法进行改进。