基于XGBoost算法的电网二次设备缺陷分类研究
2019-05-30陈凯南东亮孙永辉夏响
南京信息工程大学学报 2019年4期
陈凯 南东亮 孙永辉 夏响
摘要:电网二次设备缺陷严重程度的精确判断可为设备的运行和维护提供重要依据.针对电网二次设备缺陷数据特征量多、人为判断难度大、易出错等问题,提出基于XGBoost(eXtreme Gradient Boosting)的二次设备缺陷分类方法,提高二次设备缺陷分类的准确率.首先,对二次设备历史缺陷数据进行去异常值、编码等一系列预处理工作,并筛选出与设备缺陷相关性高的特征建立特征指标集;然后,利用历史缺陷数据对XGBoost模型进行训练和参数寻优;最后,用训练好的分类模型实现二次设备缺陷的准确分类.本文采用某电厂二次设备缺陷数据对所提算法进行算例分析,并与传统分类器(决策树、逻辑回归等)进行比较,结果表明XGBoost可以实现对二次设备缺陷程度的精确判斷,进而可以很好地辅助检修人员进行设备的维护与管理.
关键词:XGBoost算法;二次设备;缺陷分类;机器学习