基于改进决策树的停电敏感度分析
2020-04-22程慧张瑞张世科史冬妮付凤平
程慧 张瑞 张世科 史冬妮 付凤平
摘 要:当重要用户或敏感用户发生停电事件时,电网企业将面临较大压力,所以对用电敏感用户进行准确辨识,降低停电对其带来的损失具有重要意义。提出了采用蚁群算法优化决策树算法,主要从属性离散化,启发信息,信息素更新等方面进行优化。通过UCI数据库的分类数据建立仿真对比实验,与传统的SVM和决策树方法进行实验对比,验证了本文所提方法具有更高的分类准确性。将所提方法与传统的SVM和Logistic算法进行仿真对比,验证所提方法更适用于用户停电敏感度的分析。
关键词:蚁群算法; 决策树; 停电敏感度; 分类
中图分类号: TM7
文献标志码: A
Abstract:If the power failure happens to important or sensitive users, the power grid enterprises will face on great pressure. Therefore, it is of great significance to accurately identify sensitive users and reduce the loss caused by power failure. An ant colony optimization decision tree algorithm is proposed, which is mainly optimized from the aspects of attribute discretization, heuristic information and pheromone updating. The simulation comparison experiment was established through the classification data of UCI database, and compared with the traditional SVM and decision tree methods, which verifies the higher classification accuracy of the proposed method in this paper. The proposed method in this paper is compared with the traditional SVM and Logistic algorithm to verify that it is more suitable for the analysis of user's power failure sensitivity.
Key words:Ant colony algorithm; Decision tree; Power failure sensitivity; Classification
0 引言
降低由停電导致的投诉可以大大压缩工单受理次数,对供电质量提升影响比较大[1-2]。因此基于当前工单信息,深入建模挖掘停电敏感的规律和影响因素,评估停电敏感性,从而确定计划停电的重要因素,实现每条线路停电计划的安排有科学理论支撑可遵循,具有重大意义[3-4]。
敏感客户的研究不同于一般的定性分类问题,目前研究比较少,并没有明确的模型和可借鉴的方法。现有的停电敏感度研究,基本都是选中影响指标,通过测试数据建立测试模型,确定指标权重,计算得到是否属于敏感情况[5]。文献[6]从电力公司提取客户的用电数据,确定对用户影响较大的属性,采用逻辑回归方法建立客户用电敏感度的分析模型,仿真结果验证了该方法能够准确的对用户停电敏感度进行预测[6]。文献[7]从电网企业采集影响用户停电的相关数据,采用优势分析法确定主要影响因素,建立基于k-support稀疏逻辑回归的停电敏感性预测模型[7]。文献[8]对数据进行预处理之后,确定每隔属性的权重,提出了一种改进的随机森林算法,用于辨别停电用户的敏感程度[8]。文献[9]根据客户的用电数据信息,采用熵值法对客户敏感度进行分析,并将敏感用户做标签识别,提高电力企业服务质量[9]。
为了对客户停电敏感程度进行分析,本文提出了一种改进的决策树方法,建立用户停电敏感度分析模型,以提高电力企业的服务水平。
1 停电敏感度数据预处理
采用改进的决策树方法对用户进行停电敏感度分析的时候,主要包括数据预处理,特征选取,建立停电敏感度分析模型。停电敏感度的流程图如图1所示。
3 算例仿真
3.1 算法验证
为了验证本文所提的蚁群算法优化决策树算法的有效性,选取UCI数据库10组数据进行仿真对比实验,UCI数据库的数据集如表1所示,ACO-C4.5, C4.5和SVM算法的分类结果如图3所示。
3.2 基于改进决策树的用电敏感度分析
采用本文所提方法对居民用户进行停电敏感用户分类。选取某地区电力公司的供电数据作为样本数据。停电敏感度的分类结果如图4所示。
当蚁群优化的决策树选择6分支,7层决策层的时候,与SVM和Logistic算法进行分类效果对比,对比结果如表2所示。
4.3 结果分析
从图3可以看出,在处理相同的数据时,本文所提的蚁群算法优化的决策树模型,比传统的决策树和SVM算法具有更高的分类准确度,验证了本文所提方法的有效性。
如图4所示为当分支数为固定值的时候,决策层数量从2到9时的各个指标所占百分比。图4中的a,b,c的R值不能确定停电敏感用户。图4中的f,g,h层数到达6,7的时候,P,R,A能够达到准确率。通过对比图4中的决策层数和分支数可以发现,当调和平均数大于80%的时候,能够达到决策树分类的准确度。通过计算调和平均数F,可以知道,满足条件的决策树结构为:决策层数为6的时候,分支数为7,8,9;当决策层数为7的时候,分支数为6,7,8,9;当决策层数为8的时候,分支数为6,7,8,9;当决策层数为9的时候,分支数为4,5,6,7,8,9。
从表2可以看出,ACO-C4.5比SVM和Logistic具有更好的识别精度召回率,且FPR和FNR较小,更适用于停电敏感用户的判定。
5 总结
为了提高停电敏感度预测精度,提出了采用蚁群算法优化决策树模型的方法,经过UCI数据库的仿真实验,验证了本文所提的改进的决策树方法比传统的SVM和决策树算法具有更高的分类准确度。在采用ACO-C4.5建立停电用户敏感度分析模型的时候,通过实验可得分支数与决策层数和准确度之间的关系。对比实验,验证了ACO-C4.5更适合停电敏感用户的判定。
参考文献
[1]
卢恩,鲁晓军,龙霏,等.电力系统停电风险评估指标及方法[J].电力自动化设备,2015,35(3):68-74.
[2] 郭贤,郭贺,程浩忠,等.考虑用户停电损失的微网网架规划[J].电工技術学报,2014,29(8):301-308.
[3] 刘自发,张在宝,杨滨,等.电网大停电社会综合损失评估[J].电网技术,2017,41(9):2928-2940.
[4] 曹一家,曹丽华,黎灿兵,等.考虑大停电风险的输电网扩展规划模型和算法[J].中国电机工程学报,2014,34(1):138-145.
[5] 于群,石良,曹娜,等.广义极值理论在大停电事故损失负荷预测中的应用[J].电力系统自动化,2016,40(8):71-77.
[6] 耿俊成,张小斐,袁少光,等.基于逻辑回归模型的电力客户停电敏感度评分卡研究与实现[J].电力需求侧管理,2018,20(3):46-50.
[7] 耿俊成,张小斐,孙玉宝,等.基于K-support稀疏逻辑回归的停电敏感度预测[J].计算机与现代化,2018(4):68-73.
[8] 谢国荣,郑宏,林伟圻,等.基于改进随机森林算法的停电敏感用户分类[J].计算机系统应用,2019,28(3):104-110.
[9] 蔡丽华.基于机器学习技术的电力停电敏感客户标签体系[J].农村电气化,2018(5):40-43.
[10] 王道明,鲁昌华,蒋薇薇,等.基于粒子群算法的决策树SVM多分类方法研究[J].电子测量与仪器学报,2015,29(4):611-615.
[11] 刘晓娜,封志明,姜鲁光.基于决策树分类的橡胶林地遥感识别[J].农业工程学报,2013,29(24):163-172.
[12] 张棪,曹健.面向大数据分析的决策树算法[J].计算机科学,2016,43(S1):374-379.
[13] 李擎,张超,陈鹏,等.一种基于粒子群参数优化的改进蚁群算法[J].控制与决策,2013,28(6):873-878.
[14] 张成,凌有铸,陈孟元.改进蚁群算法求解移动机器人路径规划[J].电子测量与仪器学报,2016,30(11):1758-1764.
[15] 游晓明,刘升,吕金秋.一种动态搜索策略的蚁群算法及其在机器人路径规划中的应用[J].控制与决策,2017,32(3):552-556.
(收稿日期: 2019.10.16)