变电站故障诊断的联合优化算法及其性能评估
2024-12-19潘科
摘 要:本文提出一种进行变电站故障诊断的联合优化算法,并对其性能进行评估。对数据进行处理,选择故障诊断模型,设计联合优化算法,构建完整的研究框架。针对性能测试,本文选用某变电站历史故障数据作为测试集,比较支持向量机(Support Vector Machine,SVM)、随机森林模型以及联合优化算法的准确率。单独使用SVM和随机森林模型的准确率分别为 89.5%和91.2%,采用联合优化算法后准确率为94.3%。与传统单一模型相比,使用本文方法准确率更高,尽管使用联合模型和迭代优化使计算复杂度增加,但是在实际应用中其计算复杂度仍然在可以接受的范围内。
关键词:变电站;故障诊断;联合优化;性能评估
中图分类号:TM 63 " " " " " " " 文献标志码:A
传统的故障诊断方法主要依赖于人工经验和定性分析,随着现代技术的发展,在故障诊断中,数据驱动方法发挥重要作用。董文康等[1]利用深度强化学习构建了设备维护和备件订购的联合决策模型,并在实际风电场中验证了其优越性。杨晓梅等[2]提出基于可变需求的批量化生产和视情维修的联合策略,采用更新报酬理论构建了联合决策模型。刘勤明等[3]研究在多产品情况下设备生产与维修计划的优化,提出碳排放生产计划与维修决策的联合决策模型。沈斌等[4]针对预防性维修问题提出参考役龄进行预防性维修与设定缓冲区库存的联合决策模型。叶鸿庆等[5]研究在双供应商情况下的设备维护与备件订购联合决策模型。郭羽含等[6]提出使用产能和库存进行约束,针对周期性批量生产和非周期性维护计划的联合决策模型。陈洪根等[7]研究基于可用度的预防维修和均值控制图的联合决策模型。成克强等[8]分析了基于质量约束的生产调度和设备维护的联合决策模型。本文提出一种基于联合优化算法的变电站故障诊断方法,并对其性能进行评估。
1 算法设计
1.1 数据获取与预处理
各种内部和外部因素导致变电站在运行过程中会出现设备老化、连接失常等故障。故障诊断的目标是及时发现和定位故障,以采取有效措施防止故障扩大化、严重化,保证设备正常运行。在变电站故障诊断中,数据的质量直接影响诊断的准确性。设置阈值,超过阈值的数据作为异常值进行处理,采用最小-最大缩放或Z-score标准化方法将不同量纲的数据转换为同一个尺度,以避免某些特征对模型训练的过大影响。
1.2 随机森林算法
变电站故障的主要判定指标是其相应的故障信息,使用随机森林模型可以进一步确认潜在的异常模式或者异常点。构建随机森林模型的基本组件是决策树,构建随机森林的具体过程即持续构建连续多个决策树。假设有某个包括一定信息的样本点,如公式(1)所示。
A=[xi,yi] " " " " " (1)
式中:A为训练样本数据集;xi为样本点i的输入变量,即在特定监测点内环境电流、电压、温度、湿度和设备状态等一系列常见监测数据的合集;yi为样本点i的标签。
A、xi能够与识别后的分类标签yi相关联,这些指标可以是连续变量或非连续变量。其标签如公式(2)所示。
i=1,2,...,k " " " " "(2)
式中:k为类别数量。
随机森林模型能够有效地对数据进行分类,在数据点划分为正常和异常状态的过程中起到重要的作用。利用随机森林模型能够建立一个复杂的决策边界,以区分正常运行和潜在故障状态。在划分属性的过程中,算法会遍历当前所有剩余特征属性并计算分类结果,构建最小Gini指数以确定划分标准和结果。 Gini 指数计算过程如公式(3)所示。
(3)
式中:Gini(t)为基尼不纯度,即1与ck平方和的差值,反映划分节点后的子节点集合不确定性;的作用是描述分类标准的确定性;t为指定类别;ck为具有k个类型的数据集中属于t的样本所占的比例。
基于决策树构建随机森林模型,在进行装袋操作的过程中使用总训练样本2/3容量的子集作为训练样本,以避免过拟合。拆分后样本的Gini指数计算过程如公式(4)所示。
(4)
式中:G(X,t)、Gini(XL)和Gini(XR)分别为A、左侧分支XL和右侧分支XR的Gini指数;X为一种特定的分类方式,基于t将A分为左右2个分支即|XL|、|XR| ;|X| 、|XL| 和|XR| 分别为A、XL和XR的样本数量。
由于装袋算法重复进行多次试验,不同子集以及未被选中样本之间进行交叉验证,进一步检验了构建决策树的准确度,避免其他交叉验证手段可能带来的问题。因此,随机森林模型可以测量每个特征对模型预测准确性的贡献来评估特征的重要性。在变电站数据中,可以确定哪些传感器数据是故障诊断的关键数据,优先使用这些特征进行进一步分析并监测。
1.3 支持向量机算法
在变电站数据中,使用支持向量机(Support Vector Machine,SVM)来区分正常运行状态和可能的故障状态,使工程师能够快速、准确地进行故障诊断。
根据公式(1)讨论大量样本点散落于平面空间中,其分割直线如公式(5)所示。
(w∙x)+b=0 " " "(5)
式中:w为给定分类直线的法方向;x为函数横坐标值,其作用是描述直线特征;b为偏置项,决定分类直线与原点的距离。
SVM能够在高维特征空间中构建最优超平面,将数据点分为不同的类别,即转化为对这个直线参数的优化问题,如公式(6)所示。
(6)
采用凸优化方法,其对偶形式如公式(7)所示。
ai≥0,i=1,2,...,l " (7)
式中:l为样本点的总数;i、j为任意样本点;yj为样本点j的标签;ai为样本点i的拉格朗日乘子;aj为样本点j的拉格朗日乘子;xj为样本点j的输入变量。
在处理线性和非线性数据方面,SVM的泛化能力良好,其能够应用于不规则的故障模式中并解决复杂的数据分步问题,在实际应用中更加可靠、稳健。
为了提高故障诊断的准确性,本文提出了一种基于SVM和随机森林模型的联合优化算法。使用训练数据分别训练SVM和随机森林模型来得到初始模型。对2种模型的输出结果进行加权融合,并进行交叉验证来确定权重。采用迭代方法不断调整模型的参数和权重,使融合模型的诊断准确性更高。联合优化算法能够综合利用SVM和随机森林模型的优势,提高故障诊断的准确性和稳定性。
2 性能测试
2.1 数据集获取
为了验证本文算法的有效性,选择某变电站的历史故障数据作为测试数据集。数据集包括多种类型的故障信息,例如线路故障、设备故障和通信故障等,输入数据使用其环境电流与电压作为关键变量,输出数据为故障类别。样本共有10 000条记录,随机抽取70%作为训练样本,30%作为测试样本。
一方面,利用已经确定好的重要特征构建多决策树,在每个决策树中进行独立预测,汇总结果,完成异常值检测以及分类任务。使用训练样本构建测试模型,如公式(8)所示。
D=[xi,yi] " " " " " " "(8)
式中:D为训练数据集。
利用随机抽样的子集构建决策树,T棵决策树组成随机森林,对每棵树t来说,其输出yi是基于xi的独立预测结果,根据公式(3)、公式(4),当每次迭代生成新树时,利用抽样技术来增加多样性,并阻止过拟合现象发生,提高整体泛化能力以及诊断准确率,最终利用投票后平均结果获得整体预测结果yiRF。
另一方面,使用SVM单独建立1个支持向量机模型,利用公式(8)中的训练集以及核函数 K(xi,yi)对输入特征xi进行非线性映射,根据公式(5)~公式(7)构建分类超平面,并在其中添加选择好的环境因素作为输入属性,获得预测结果 yiSVM。
分别使用SVM、随机森林模型并采用联合优化算法区分不同类型的故障,调整核函数和超参数来提高模型性能。联合优化算法能够优化支持向量机和随机森林模型,提高故障诊断准确率。利用加权融合不同算法的输出结果得到yi=αyiRF+(1-α)yiRF,其中α是权重参数。以上步骤结合SVM、随机森林和联合优化算法,当处理该问题时能够更全面、深入地研究系统状态下的算法性能。使用测试样本对模型进行验证,并评估其准确性、精确度以及其他指标。根据结果调整参数以提高预测效果。
2.2 独立优化算法
基于随机森林模型的优化结果(如图1所示)得到了系统内的约束条件分析结果。结果表明,电流和电压水平对系统的约束条件影响较小,在低电流或高电压的情况下,系统仍然能够保持正常的设备运行状态。只有当电压偏差稍微增大(例如超过2 V),负向电流为1 A时,系统才可能出现故障。当电流偏差超过0.3 A时,如果负向电压偏差超过1 V,那么其也可能是故障的征兆。故障的主要特征是电流异常增大,当超过1.5 A时,表明系统可能出现故障。基于SVM的优化结果(如图2所示)得到与随机森林模型相似的结果。在3个参数参与构成输入数据的条件下,SVM模型能够有效区分故障与非故障状态,具体来说,SVM的分类平面可以识别异常的高水平电流和电压,这类异常值通常随着功率大幅度衰减,为故障定位提供有力的参考。
2.3 联合优化算法
基于此,本文利用对比试验分别评估了使用SVM、随机森林模型以及运用联合优化算法在故障诊断中的性能,测试结果见表1。
测试结果表明,在故障诊断的准确性和稳定性方面,运用联合优化算法优势明显。对SVM和随机森林模型分别进行初始训练,再进行加权融合,利用迭代优化调整参数和权重,最终得到高效的故障诊断模型。在测试中,联合优化算法的准确率为98.7%,明显高于单一模型,SVM的准确率为92.4%,随机森林模型的准确率为95.1%。
进一步分析表明,联合优化算法能够综合SVM和随机森林模型的优点。在处理高维数据、处于小样本情况的过程中,SVM表现优秀,在解决非线性问题和防止过拟合方面,随机森林模型有优势。利用加权融合和迭代优化,在不同条件下,运用联合优化算法的诊断准确性和稳定性都很高。特别是在复杂故障场景中,联合优化算法能够更准确地识别和分类故障类型,鲁棒性较强。在数据量较大的情况下,使用联合优化算法能够在合理时间内完成故障诊断,计算效率和实时性很高,满足变电站实时监控和故障预警的要求。
3 结语
本文提出了一种基于联合优化算法的变电站故障诊断方法,并对其性能进行评估。试验结果表明,联合优化算法能够有效提高故障诊断的准确性和稳定性。
参考文献
[1]董文康,吴雨芯,姚琦,等.基于深度强化学习的海上风电机组状态维护与备件库存联合优化[J].太阳能学报,2023,44(12):190-199.
[2]杨晓梅,白钰.基于可变需求的EPQ与视情维修联合优化[J].工业工程,2023,26(6):138-146.
[3]刘勤明,彭舒悦,王雨婷,等.考虑碳排放的多产品下设备维修计划与生产计划联合优化研究[J].机械设计,2023,40(1):47-55.
[4]沈斌,李芳,吕文元.考虑役龄的预防性维修计划与缓冲区库存联合优化决策[J].工业工程,2022,25(4):91-99.
[5]叶鸿庆,苏华德,郑美妹,等.考虑双供应商的维护和备件订购联合决策优化[J].上海交通大学学报,2022,56(10):1359-1367.
[6]郭羽含,冯玥,刘万军,等.有限产能和库存的生产批量与双模式维护联合优化[J].计算机集成制造系统,2022,28(9):2894-2908.
[7]陈洪根,李诗宇,闫鑫,等.基于可用度的预防维修和均值控制图联合优化模型[J].现代制造工程,2022(2):1-9,51.
[8]成克强,戴青云,王美林.基于质量约束的生产调度与设备维护联合优化模型分析[J].制造业自动化,2022,44(1):160-163,190.