基于并行分类算法的电力客户欠费预警
2016-06-28陈羽中郭松荣陈宏李婉华郭昆黄启成
计算机应用 2016年6期
陈羽中 郭松荣 陈宏 李婉华 郭昆 黄启成
摘 要:针对供电企业“先消费后付款”的经营模式可能造成用电客户因失信引发的欠费风险,需要在用电客户欠费行为发生之前实时快速地分析海量的用电用户的数据,给出潜在的欠费客户名单的问题,提出一种基于并行分类算法的电力客户欠费预警方法。首先,该方法使用基于Spark的随机森林(RF)分类算法对欠费用户进行建模;其次,根据用户以往历史用电行为和缴费记录使用时间序列进行预测得到其未来用电和缴费行为特征;最后,使用之前得到的模型对用户进行分类得到未来潜在高危险欠费用户。将该方法与并行化后的支持向量机(SVM)算法和在线序列极限学习机(OSELM)算法进行对比分析,实验结果表明,所提方法相对于对比算法在准确率上有较大提高,便于电费回收管理人员进行提前催缴,确保电费回收的及时性,有利于电力企业进行客户欠费风险管理。
关键词:欠费预警;随机森林;并行算法;时间序列;海量数据
中图分类号: TP311.5 文献标志码:A英文标题