APP下载

融合多特征参数的电力工程数据应用智能算法设计研究

2023-11-10黄亚飞陈青云张辽庞杰

电子设计工程 2023年21期
关键词:智能算法特征参数权值

黄亚飞,陈青云,张辽,庞杰

(1.国网甘肃省电力公司,甘肃兰州 730030;2.国网白银供电公司,甘肃白银 730400;3.国网酒泉供电公司,甘肃 酒泉 735000)

近年来随着各类自动化及信息设备越发齐全,对电力工程投资的合理性、精准化要求也愈加严苛。科学测算电力工程数据和经济指标,且分析影响工程投资的关键因素,有利于辅助后期施工,并及时进行管控,从而预测风险、避免损失[1-2]。

最初的电力工程数据分析手段为基于类比与回归思想的传统成本估算法,包括生产能力指数法(Productivity index method)和朗格系数法(Lange coefficient method)。20 世纪80 年代,基于现代数学理论的电力工程数据分析方式逐渐兴起。其主要包含蒙特卡洛法(Monte Carlo Method,MCM)及模糊数学法(Fuzzy Mathematics Method,FMM)等[3-4]。但上述方法构建的模型均较为复杂,且运算量也偏大,因此应用效果并不理想。而人工智能技术的发展,为电力工程数据的分析及应用带来了新思路[5]。采用智能算法来分析电力工程数据,以提高分析效率及准确性成为了当前的研究热点。

针对上述问题,该文基于融合多特征参数技术,开展了电力工程数据应用智能算法设计,进而实现对工程数据的准确分析。

1 电力工程数据多特征参数提取

1.1 电力工程数据参数

电力工程数据参数较多,诸如工程所在地、建筑面积、工程数量、建设单位及人工单价等。过于庞大的参数会对智能算法的效率造成影响,甚至导致模型失去准确性。

因此,该文提出采用线性判别分析(Linear Discriminant Analysis,LDA)来提取电力工程数据的特征参数,实现主成分分析。由此既保留了变量的主要信息,又简化了智能算法模型输入的数据量,从而提高算法的效率及准确性。

1.2 基于LDA的多特征参数提取

LDA 是数据分析中最经典的方法之一,其主要目的是减少数据的维度,并使数据信息尽可能多的被保留[6]。

假设原始数据集B=(x1,y1)(x2,y2),…,(xn,yn),其中xn为m维向量。原始数据集B可被分为K个类别B1,B2,…,Bk,…,BK,Bk中包含Nk个数据样本。则LDA算法包括以下几个步骤:

1)分别计算K个类别及整个原始数据样本的均值,计算方式如下:

式中,μk为第k个类别数据样本的均值;υ则为整个原始数据样本的均值。

2)计算整体、类内及类间共3个散度矩阵,则有:

式中,At为整体散度矩阵,Ak为第k个类别的类内散度矩阵,Aw是所有类别的类内散度矩阵之和,Ab为类间散度矩阵。

3)求解Aw-1Ab矩阵特征值。其计算方式为:

式中,λ为Aw-1Ab矩阵的特征值。

4)计算投影矩阵。将Aw-1Ab矩阵的特征值按从大到小排序,筛选出前h个特征值λ1,λ2,…,λh。并计算其特征向量w1,w2,…,wh,从而实现m维数据向h维数据的映射:

式中,x′为降维后的数据。

2 电力工程数据智能算法设计

该文设计了遗传算法(Genetic Algorithm,GA)优化极限学习机(Extreme Learning Machine,ELM)的电力工程数据应用智能算法,其具体框架如图1 所示。

图1 智能算法框架设计

该算法首先通过线性判别分析来融合多特征参数的电力工程数据,并消除参数间的相关性且实现指标变量的降维。其次通过GA-ELM 构建电力工程数据预测模型,同时遗传算法会优化极限学习机的初始权值与偏置。最终,在保证预测精度的情况下实现对电力工程数据的预测。

2.1 传统ELM算法

极限学习机具有单隐层前馈型网络结构,其特点是可随机生成隐含层参数。且在初始化完成后,仅需调整隐含层神经元的个数即可满足相应的计算需求[7-8],其主要结构如图2 所示。而传统的BP(Back Propagation)神经网络则需根据误差反馈不断调整输出层权重,故相较而言ELM 的训练速度更快且过程也较为简洁。

图2 单隐层前馈型网络结构

假设样本训练集个数为n,隐含层数量为l,神经网络的输出Y=[y1,y2,…,yk] 。设图2 中的输出函数为F(a,x,η)为输出函数,对于线性叠加型隐藏层节点有F=f(aixj+ηi),则输出矩阵Y为:

其中,f为核函数,n表示输出变量的个数,ai表示输入权重,γin表示输出权重,ηi表示第i个隐含层的阈值。

将样本的训练集输入到初始的人工神经网络中,便可得到隐含层输出矩阵为D。进一步得到输出权值γ为D+Y,其中D+为D的伪逆矩阵。

2.2 改进算法设计

由于ELM 随机生成输入层与隐含层的连接权值及隐含层的阈值,所以在训练过程中易受随机性的影响而导致其稳定性较差。而遗传算法受种群进化模式的启发,通过优胜劣汰的规则,最终获得最优解[9-10]。因此,可采用GA 算法对ELM 的输入层与隐含层的连接权值、隐含层阈值进行寻优,从而优化网络结构并提高ELM 的性能[11-13]。GA-ELM 的建立步骤如下:

1)初始化遗传算法的相关参数。设置最大迭代次数、染色体基因上下界限、变异因子。由ELM的初始输入层连接权值ωi、隐含层初始阈值bi组成染色体。

2)计算第i个染色体适应度fi>F。ELM 中引入染色体对应的输入层连接权值及隐含层初始阈值,通过样本训练得到预测值,进而获得初始化种群单个染色体的均方误差(MSE),即为染色体适应度。

3)比较每个染色体当前适应度fi>F与最佳位置Fb。若fi>Fb,则当前适应度较高,故将用当前适应度Fb更新群体所发现的最佳位置Fb。

4)进行变异、交叉和选择操作,更新每个染色体基因。当最佳适应度达到设定阈值,即停止寻优过程。通过GA 算法得到的最优输入连接权值a与初始阈值η后,再利用γ=D+Y即可计算出模型预测值。

综上所述,文中所设计的电力工程数据智能算法求解流程如图3 所示。

图3 智能算法求解流程

3 算例分析

文中以2020 年某省200 个配电工程数据为样本,建立了基于所提智能算法的电力工程数据分析模型。并按4∶1 的比例将数据划分为训练集和测试集,且将15 个影响配电工程数据结果的因素作为输入变量。

3.1 特征参数提取

采用数据处理工具SPSS(Statistical Product and Service Solutions)[14]对200 个样本及15 个影响因素进行分析。通过计算15个影响因素的特征值,并将其从大到小进行排序,再提取前h个特征值,从而确定提取的主要影响因素。15 个影响因素的对应的特征值计算结果,如表1 所示。需要说明的是,由于前7 个影响因素的特征值均大于1,而后8 个影响因素的特征值则小于1,故提取前7 个影响因素作为特征参数。

表1 影响因素对应特征值

3.2 模型训练

在Matlab 环境下[15-16],利用所提的GA-ELM 算法训练神经网络。以样本集中的160 项配电工程数据作为训练样本,剩余40 项则作为测试样本。先通过训练集样本来训练网络,再将测试集样本输入至训练好的网络中对模型性能进行测试。图4 为模型的拟合曲线,其中横坐标为电力工程数据测试集样本编号,纵坐标则是样本数据分类号,二者均为无量纲的值。由图可知,测试样本预测值与真实值误差较小,预测值曲线与真实值曲线的趋势大致相同,且吻合良好。

图4 模型的拟合曲线

3.3 模型对比

为了验证该文算法的优越性,与其他3 种算法的性能进行比较。对比算法包括LDA-ELM 算法、未经过LDA 数据预处理的ELM 算法以及GA-ELM算法。4 种算法的拟合曲线,如图5 所示。可以看出,ELM 和LDA-ELM 模型的预测值与真实值差距大于其他两种算法。而GA-ELM 模型的拟合程度虽与前两种算法相比较高,但仍低于该文算法模型。由此可知,文中模型的预测精度最高。

图5 多种模型拟合曲线

利用训练好的网络对影响电力工程数据结果因子的灵敏度进行分析,以考察各因素对电力工程数据指标预测值的影响程度,分析结果如表2 所示。通过对预测值改变量的绝对值进行排序,可见第3 个主成分对于电力数据的预测影响最大。

表2 灵敏度分析结果

综合上述分析结果,证明了基于LDA 主成分分析及GA-ELM 电力数据的分析模型具有良好的预测精度、稳定性及泛化能力。

4 结束语

文中利用线性判别分析融入电力工程多特征参数,构建了一种融合遗传算法与极限学习机的电力工程数据分析模型。通过仿真分析表明,所提智能算法模型在电力工程数据分析方面的性能优于对比算法。且该算法在实际应用中能够准确监测电力工程施工投资所涉及的各项数据,并进行预测分析,从而为企业的投资决策提供技术指导。但由于文中构建的电力工程数据分析模型,所融合的智能算法有限。因此在下一步研究中,将融入更多的智能算法对电力工程数据进行分析。

猜你喜欢

智能算法特征参数权值
一种融合时间权值和用户行为序列的电影推荐模型
神经网络智能算法在发电机主绝缘状态评估领域的应用
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
基于超像素的图像智能算法在矿物颗粒分割中的应用
CONTENTS
从鸡群算法看群体智能算法的发展趋势
基于PSO-VMD的齿轮特征参数提取方法研究
基于权值动量的RBM加速学习算法研究
改进的多目标快速群搜索算法的应用