基于多任务支持向量机的能源互联网数据深度融合方法

2023-04-07吴武清曾志武

计算机应用与软件 2023年3期

郭政吴武清刘源曾志武杨玎

(国网江西省电力有限公司建设分公司江西南昌 330000)

0 引言

能源互联网是以智能电网为基础,由众多分布式可再生能源组成。能源互联网包含众多电力电子技术以及信息与通信技术,以分布式智能能量管理系统为基础,控制分布式能源设备令水、气、电、热等众多能源实现互补[1],实现用能效率最高的目的。能源互联网包含海量设备运行状态、电气参数、储能监控等实时监测数据,需众多传感器实时采集设备各项信息[2],为了更好地完成后期数据处理以及智慧能源系统动态控制,需要实时感知与高效的数据融合方法配合。能源互联网相关用户数量巨大,数据采集来源众多,电力网络覆盖范围固定,电力系统成本造价高,传统的数据处理方法无法处理能源互联网海量数据[3],存在较强冗余干扰。随着传感器技术快速发展,众多高科技技术已广泛应用于电力系统中,能源系统内智能电网发展极为迅速,能源互联网数据处理问题,受到众多研究人员重视[4-5],为保证智能电网稳定运行,能源互联网数据融合的高效性、安全经济性以及运行可靠性极为重要。一些学者也提出了较好的方法。

于华楠等[6]研究基于压缩感知的综合能源数据处理,利用压缩感知方法处理综合能源数据,实现了对综合能源数据的有效处理,但该方法对于多任务环境下的信息兼容性融合并未做深入研究;杨启京等[7]研究大电网未来态一体化模型构建和融合技术,针对大电网未来态势对数据实施融合,实现网省一体化的未来模型融合的高效管理,但是其信息融合粒度单位相对较大,对于多任务环境下的信息融合需求尚未能完全满足要求。支持向量机方法是目前广泛应用于电力、航空等众多领域中的高效方法,针对目前能源互联网发展现状与趋势[8],研究基于多任务支持向量机的能源互联网数据深度融合方法,利用多任务支持向量机方法深度融合能源互联网海量数据,提升能源互联网海量数据融合的稳健性,具有较高的抗干扰性能,为能源互联网领域各类应用提供数据与理论支持。

1 多任务支持向量机的能源互联网数据深度融合

1.1 多任务支持向量机算法设计

支持向量机算法建立目标函数时需满足训练样本错分最小化要求,其公式如下:

式中:xi表示给定样本集;yi表示类别标签;N表示样本数量;w与b均表示决策函数;δ(xi)表示核函数。采用支持向量机分类时,不同种类样本容量差异较大,利用支持向量机分类面偏移数量较少样本实现整体样本低错分率。选取不同样本平均错分率最低为原则[9],为避免分类面偏移,所获取分类面不同类间距最大化时需实现数量较多的类至分类面距离应大于数量较少的类至分类面距离,可得目标函数如下:

式中:N+表示数量较少类样本数量;N-表示数量较多类样本数量;u+与u-均为调节不同样本错分比例常数;λ2为令数量较多的类至分类面距离大于数量较少的类至分类面距离的常数。

众多数据具有共性数据域但分布存在差异是多任务学习特性[10],将支持向量机内各数据分组视为子任务,建立多任务支持向量机学习模型。多任务学习时众多子任务决策模型应存在较大相似性,多任务支持向量机运算过程中需保证全部学习机间全局差异最小化并实现子学习机的局部最优化。用p0与pr分别表示公共决策函数以及修正函数,此时各子任务决策函数fr公式如下:

fr=pr+p0

(3)

进一步获取决策函数公式如下:

fr(x)=w×δ(x)+b+wr×δr(x)+sr

(4)

式中:sr表示决策系数。其中p0=w×δ(x)+b表示全部样本的决策函数;pr=wr×δr(x)+sr表示相应各子任务的修正函数。可得多任务支持向量机最终目标函数如下:

(5)

为提升多任务支持向量机应用于能源互联网数据深度融合时的融合性能,给出如下说明:

(2) 修正函数与公共决策函数的核函数可完全相同或存在差异。

(3) 依据支持向量机划分属性特征形式生成子任务,多任务支持向量机算法包含支持向量机可通过样本结构信息获取最终结果特性[11],还可利用挖掘样本异常信息提升深度融合的泛化能力。

(4) 支持向量机算法的目标函数利用修正函数表示松弛变量,松弛变量需大于0,修正函数需同时大于0,而多任务支持向量机算法中修正函数可体现不同任务间差异,无须令修正函数大于0。

1.2 能源互联网数据深度融合的应用

能源互联网数据的深度融合指一个或多个信息源数据通过关联、综合等处理方式令所获取最终数据为精确估计,以上文算法为基础的数据深度融合过程如下:

设H1、H2、…、Hn表示X的n个分块数据,将分块数据利用H*=f(H1,H2,…,Hn)变换处理,此时X为实体且其具体数值未知,能源互联网数据深度融合是指利用最优的f令从H1、H2、…、Hn内所获取数据最终决策为最佳。

能源互联网数据深度融合过程主要包括数据层、特征层以及决策层融合,各层数据融合具体内容如表1所示。

表1 数据融合内容

(1) 数据层融合。数据层融合中数据为能源互联网内原始数据,包括反映能源生产的数据、反映能源配送转换的数据、反映能源消费交易和调控的数据、对能源互联网有影响的社会经济环境数据以及表征能源互联网的参与者———人的特征的数据。能源互联网内原始数据具有内容丰富,数据精准的特点,但原始数据运算量较大,通过数据预处理可提升数据深度融合的精度。

(2) 特征层融合。提取数据层融合所输出数据的特征向量,令所提取特征向量可保留重要数据,经过特征层融合所处理数据可能造成数据损失,降低原始数据精确性。

(3) 决策层融合。决策层融合是将不同信息源通过决策获取最终融合信息,选取多任务支持向量机方法应用于能源互联网数据决策层融合中,决策层融合具有所需通信带宽小且适应性高的特点。

能源互联网内存在大量电力系统诊断、生产、监测、调度等海量数据,数据具有较高的分散性,且存在众多冗余数据[12],智能电网部分子系统数据具有隔离性且结构存在较大差异,众多状态信息无法有效挖掘进一步利用,数据中具有的潜在信息无法应用于分析以及优化系统中。将数据深度融合方法应用于能源互联网数据决策以及处理中,可从不同层面处理相关数据,令融合后数据具有较高价值以及较高的信息密度,能源互联网数据深度融合结构图如图1所示。

图1 数据融合总体结构图

数据层所采集能源互联网数据决策属性以及条件属性互信息计算后经过特征层融合处理后作为多任务支持向量机的输入层[13],分块处理输入数据源为多个任务,利用多任务支持向量机算法通过设置阈值实现决策阶段,完成独立任务决策计算后重启任务阶段,直至全部输入全部处理结束,将所输出全部决策层任务合并,合并后结果即为最终融合结果。

多任务支持向量机算法的能源互联网数据深度融合具体过程如下:

(1) 数据离散化。数据层融合选取无监督离散化方法处理所采集能源互联网的无标签数据,无监督离散化方法利用聚类方法保持输入数据相关性不变情况下划分数值值域为众多离散区间。

利用K-means聚类算法依据邻近性特点以及特征值分布特性划分不同数据的簇[14],依据自顶向下分裂原则分裂不同数据的簇,通过自底向上原则合并所分裂各簇,直至划分至目标数量。

能源互联网内枚举量、开关量等离散变量融合前无需离散化处理,其他数据均需要实时离散化处理[15]。通过离散化处理降低内存空间,减少输入输出操作,提升数据深度融合效率。

(2) 矩阵化处理输入数据。用向量H=(d1,d2,…,dm,t)表示采集时间为t时的输入数据,其中m与di分别表示维数以及第i维数据取值。设时间为t时能源互联网监测数据矩阵如下:

固定时间段k个设备监测数据M如下:

(3) 特征层融合利用互信息变量选择算法提取数据分类特征,明确多任务支持向量机算法输入量。

(4) 将已确定的输入量输入决策层融合的多任务支持向量机内,利用支持向量机实施数据的决策级融合,并将最终融合结果输出。

2 实例分析

为检测本文研究基于多任务支持向量机的能源互联网数据深度融合方法深度融合能源互联网数据准确性和精度,采用10个温度传感器在线监测能源互联网内某电力系统变电站设备温度,10个温度传感器每隔20 s采集一次能源互联网数据,每分钟获取3次设备温度数据采集结果。

能源互联网内电力设备各部件温度在线监测对电力系统稳定运行具有重要意义,温度传感器可采集变压器油温、发电机定子温度、开关柜内部温度等众多温度信息,智能电网内输配电设备长期于高电压大电流状态运行时,容易造成母线压接处老化、设备表面氧化腐蚀等众多问题,可靠的数据处理手段可有效避免事故发生。

统计所采集能源互联网智能电网运行120分钟数据,数据样本总数量为50 642个,其中,前60分钟的25 321个数据样本作为训练样本,实验用不同传感器不同时间窗口显示数据如表2所示。

表2 传感器采集信息单位:℃

续表2

统计多任务支持向量机算法中参数u为不同大小时本文方法训练精度,统计结果如图2所示。

图2 不同参数u时训练精度对比

图2测试结果可以看出,u为7.5时,本文方法训练精度可高达99.7%;u为1.5时,本文方法训练精度低至48.6%;u为15时,本文方法训练精度低至59.4%。依据以上统计结果可知,u设置为7.5时,本文方法训练精度最高,因此采用本文方法融合能源互联网数据时,选取u为7.5。

为直观展示本文方法融合性能,选取压缩感知方法(参考文献[6])以及未来态一体化方法(参考文献[7])作为对比方法,采用不同方法融合10个传感器融合结果如表3所示。

表3 不同方法融合结果(%)

续表3

由表3可以看出,采用本文方法融合能源互联网数据的融合效果明显优于压缩感知方法以及未来态一体化方法,本文方法融合能源互联网数据的平均绝对误差仅为0.51%;压缩感知方法以及未来态一体化方法融合能源互联网数据平均绝对误差均高于2.5%,对比结果有效验证本文方法具有较高的深度融合效果,本文方法采用多任务支持向量机方法可高效融合所采集能源互联网数据,通过子学习机的局部最优化,实现数据深度融合,不受误差较大的干扰数据影响,所融合结果误差较低。

为进一步验证本文方法深度融合性能,选取融合准确率、融合灵敏性、融合特效性作为本文方法融合性能的评估指标,融合准确率可体现能源互联网数据融合总体正确率,融合灵敏性可有效体现正确融合真正样本的百分比,融合特效型可体现正确融合真负样本的百分比。

式中:TP与TN分别表示真正、真负样本数量;FP与FN分别表示假正和假负的样本数量。

采用三种方法融合能源互联网数据融合准确率对比结果如图3所示。

图3 融合准确率对比结果

采用三种方法融合能源互联网数据的融合灵敏性对比结果如图4所示。

图4 融合灵敏性对比结果

采用三种方法融合能源互联网数据的融合特效性对比结果如图5所示。

图5 融合特效性对比结果

通过图3-图5实验结果可以看出,采用本文方法融合能源互联网数据的融合准确率、融合灵敏性以及融合特效性均高于压缩感知方法以及未来态一体化方法,采用本文方法融合能源互联网数据的融合准确率均高于99%,而采用压缩感知方法以及未来态一体化方法融合能源互联网数据的融合准确率均低于99%;采用本文方法融合能源互联网数据的融合灵敏性以及融合特效性均高于98%,而采用压缩感知方法以及未来态一体化方法融合能源互联网数据的融合灵敏性以及融合特效性均低于98%。对比结果说明采用本文方法融合能源互联网数据具有较高的融合准确率、融合灵敏性以及融合特效性,有效验证本文方法的深度融合有效性。这主要是因为所提方法利用互信息变量选择算法,提取数据分类特征,将所提取特征作为决策层融合多任务支持向量机输入,实现了以特征为依据的信息融合,提高了融合效果。

为进一步验证本文方法的抗干扰性能,在传感器所采集数据中加入10 dB白噪声,统计采用三种方法深度融合加入10 dB白噪声能源互联网数据的最小均方误差,对比结果如图6所示。

图6 加入噪声后融合结果

图6实验结果可以看出,采用不同方法深度融合加入10 dB白噪声的能源互联网数据时,本文方法融合能源互联网数据最小均方误差均低于1%;采用压缩感知方法以及采用未来态一体化方法融合能源互联网数据的最小均方误差均高于1.5%。实验结果说明本文方法在加入噪声干扰时仍可以保持较高的融合性能,可有效避免白噪声干扰,具有较高的融合稳定性。这主要是因为所提方法建立了多任务支持向量机学习模型,在深度学习的基础上进行信息绒复合,在很大程度上避免了噪声干扰引起的融合不稳定的情况。

3 结语

利用多任务支持向量机算法实现能源互联网电力大数据融合,提升智能电网管理的智能性以及科学性。通过实验验证所研究方法具有较高的融合性能以及抗干扰性能,所研究方法可有效避免能源互联网内故障干扰数据以及噪声干扰,待融合数据波动性较大时仍可实现能源互联网数据高效融合,复杂情况下仍具有良好的能源互联网数据深度融合效果,可应用于能源互联网电力大数据高效融合中。