APP下载

基于最小二乘支持向量机的太阳能集热效率预测

2020-09-15蒋卫涛民2雄2朱永灿马一迪

工业加热 2020年6期
关键词:热效率适应度遗传算法

蒋卫涛,李 民2,姚 雄2,朱永灿,马一迪

(1.西安工程大学电子信息学院,陕西 西安 710048; 2.陕西省水利电力勘测设计研究院,陕西 西安 710001)

随着社会经济的飞速发展和科技的不断进步,能源问题和环境问题已成为全世界面临的突出问题。大力推广清洁、可再生能源,采用高效的节能技术正是解决这一问题的重要方法之一。太阳能作为一种新能源,因为其具有取之不尽、用之不竭、无环境污染等诸多优点而受到各行各业的关注。太阳能的开发利用中,太阳能集热是最成熟、实际应用最多且在经济上能与常规能源竞争的一种可再生能源利用技术[1-3]。

由于太阳能集热的效率会受到太阳辐射量、日照时长、气温等因素的影响,而不同地区太阳辐射量、日照时长、气温等因素也各不相同,因此利用太阳辐射量、日照时长、气温等因素对太阳能集热效率进行预测,对选择太阳能集热站选址将有着重大的意义。

由于太阳能集热效率受辐太阳辐射量、日照时长、气温等多因素影响,具有很强的随机性,所以预测的难度非常大。目前对非线性预测的方法有多种,如灰色预测(Grey Model,简称GM)、线性回归(Linear Regression)、时间序列、人工神经网络(Artificial Neural Network,简称ANN)、马尔可夫(Markov Chain, 简称MC)等等[4-8]。但是,这些方法都在理论或者应用当中存在不足,例如:时间序列方法中的高阶模型参数估计难度大,而低阶模型预测精度低;灰色预测只适合于指数增长的预测;ANN存在过拟合、样本需要量大以及局部极小等问题等问题。支持向量机(Support Vector Machine,简称SVM)作为一种智能的预测方法,在小样本、非线性、高维模式识别等问题的解决上表现出许多特有优势,已经在光伏发电、核反应堆功率预测、变压器温度预测以及电力负荷预测等多领域有着广泛的应用[9-12]。最小二乘支持向量机(Least Square Support Vector Machine, 简称LSSVM)是SVM的改进算法,在继承SVM的优势的同时,可以降低SVM的计算复杂度,提高运算效率。

因此,本文采用LSSVM对太阳能集热效率进行预测,首先对得到的数据进行归一化处理,利用遗传算法(Genetic Algorithm,简称GA)对LSSVM参数进行优化,训练得到基于LSSVM的太阳能集热效率预测模型。

1 最小二乘支持向量机回归及其优化原理

1.1 最小二乘支持向量机回归基本原理

SVM是由Vapnik等人在20世纪90年代后期提出的[13],是一种基于统计学理论的机器学习方法。SVM是基于结构风险最小化原则,寻找最优回归超平面,设训练的样本为{xi,yi},i=1,2,…,n,xi∈Rd,则该样本超平面的表达式为

ωTφ(x)+b=0

(1)

式中:ω为权值矢量;b为阈值。

SVM将寻找最优超平面问题可以归结为求解如下优化问题:

(2)

(3)

式中:C为惩罚参数,ξi为非负松弛因子。对式(3)引入拉格朗日乘子并依据卡罗需-库恩-塔克条件可求解如下线性问题:

(4)

式中:Y=[y1,y2,…yn]T,α=[α1,α2…αn]T,IV=[1,1,…1]T,Ωij=yiyjK(xi,xj),i,j=1,2,…,n为核矩阵,K(xi,xj)为核函数,IN为单位矩阵。利用最小二乘求出α和b后,可得LSSVM的预测函数为

(5)

式中:αi为拉格朗日乘子;b为分类阈值。

LSSVM通过核函数定义的非线性变换将输入空间变换到高维空间, 并在这个高维空间中寻找输入变量和输出变量的线性关系, 因此核函数的选择严重影响着LSSVM的预测精度,常用的核函数有:线性核函数、多项式核函数、高斯径向基核函数(RBF)、Sigmoid核函数。本文选择高斯径向基核函数(RBF)为核函数,如式(6)所示:

(6)

式中:σ是高斯核宽度。在LSSVM的预测模型中,惩罚参数C和核参数σ2是影响LSSVM性能最大的两个参数。因此,本文采用遗传算法对LSSVM参数进行优化,寻得最优参数。

1.2 遗传算法

GA是优良的智能优化算法,在1975年,最初由美国Michigan的Holland提出[15],是一种通过模拟自然进化过程搜索最优解的方法。由于GA的整体搜索策略和优化搜索方法在计算时不依赖梯度信息或其他辅助信息,只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法可以对LSSVM参数进行寻优。其基本原理如下:

遗传操作包括三个基本算子:选择、交叉和变异[16]。

综上所述,对于BPH合并原发性高血压的患者,在常规治疗基础上加用非那雄胺治疗,在改善症状、缩小PV及降低PSA水平的同时,明显减少机体IL-6、MMP-1、CRP炎症因子的水平。由于本研究样本量小,患者服药种类,高血压年限不等等因素可能干扰研究结果,需加大样本量、细化分组及增加观察年限来进一步明确非那雄胺的疗效及BPH同原发性高血压的关系。

(1)选择:从群体中选择优胜的个体,淘汰劣质个体的操作叫选择。目前,最常见且最简单的选择方法是轮盘赌选择法,在该方法中,各个个体的选择概率和其适应度值成比例。设群体大小为n,其中个体i的适应度为fi,则i被选择的概率为

(7)

个体适应度越大,其被选择的概率就越高,反之亦然。个体被选择后,可随机组成配对,以供后面的的交叉操作。

(2)交叉:遗传算法中起核心作用的是遗传操作的交叉算子,交叉操作就是把两个父代个体的部分结构加以替换重组而生成新个体。交叉算子根据交叉率将种群中的两个个体随机地交换某些基因,能够产生新的基因组合,期望将有益组合在一起。最常用的交叉算子为单点交叉,具体操作是:在个体串中随机设定一个交叉点,实行交叉时该点前或后的两个个体的部分结构进行互换,并生成新个体。

(3)变异:变异算子的基本内容是对群体的个体串的某些基因座上的基因值进行变动。一般来说,变异算子首先对群中所有个体以事先设定的变异概率判断是否进行变异,其次对进行变异的个体随机选择变异位进行变异。

2 太阳能集热效率预测模型建立

2.1 数据准备和预处理

本文选择格尔木地区某1年的月平均数据作为训练数据,下一年的月平均数据作为测试数据,通过训练数据训练太阳能集热效率预测模型,通过测试数据检验预测模型的性能。由于数据之间相差较大,会影响训练的效果,因此在训练前必须对训练数据进行预处理。本文首先对训练数据进行归一化预处理,将输入量都归一化到[0,1]区间内,其具体的归一化公式如式(8)所示:

(8)

式中:Xmax、Xmin分别为采集到月平均气温、月平均日照时数、月平均太阳总辐射量和月平均日照百分率的最大值和最小值,Xi表示月平均气温、月平均日照时数、月平均太阳总辐射量和月平均日照百分率。

表1所示为太阳能集热效率预测模型的输入和输出参数。从表1可以看出,月平均气温、月平均日照时数、月平均太阳总辐射量、月平均日照百分率作为输入参数,太阳能集热功率作为输出参数。图1表示某一年的输入变量曲线。通过图1的测试数据输入变量曲线,利用训练得到的预测模型对下一年的月平均太阳能集热功率进行预测。

表1 预测模型输入输出

图1 测试数据输入变量曲线

2.2 遗传算法优化LSSVM

针对LSSVM参数难以确定的问题,本文采用遗传算法对LSSVM参数惩罚因子C和核参数进行优化,其优化的步骤如下:

(1)初始化种群,对个体进行编码,基因序列为惩罚因子C和核参数,生成随机种群。其中种群最大规模为20, 参数C和的寻优范围都设定为[0,100]。

(2)设置最大进化代数为200,并确定适应度函数,利用样本数据进行训练测试,根据规则计算个体适应度。本文将实际光热效率与预测出来的光热效率的均方误差作为遗传算法的适应度函数,其具体表达式如式(9)所示:

(9)

(3)当种群最优个体达到满足条件或达到终止迭代次数时退出寻优过程,得到优化解。跳转至第5步,否则进入下一步。

(4)对当代存活的种群执行选择、交叉、变异得到下一代种群,返回第3步判断。其中,交叉概率为0.5,变异概率取0.9。

(5)得到最优惩罚因子C与核参数。并代入到LSSVM中通过训练样本训练得到预测模型。

2.3 基于GA优化LSSVM的太阳能集热效率预测模型

本文通过GA优化LSSVM参数,得到基于LSSVM的太阳能集热效率预测模型。首先将获取到的原始数据分为训练数据和测试数据,为避免训练数据的差异性,对训练数据进行归一化处理,通过归一化后的训练数据训练太阳能集热效率预测模型,在训练的同时利用遗传算法对LSSVM参数进行优化,最后确定预测模型。图2所示为基于LSSVM的太阳能集热效率预测模型流程图。

图2 基于GA优化LSSVM的太阳能集热效率预测模型流程图

3 实验仿真与结果分析

本文以月平均气温、月平均日照时数、月平均太阳总辐射量、月平均日照百分率作为基于GA优化LSSVM的太阳能集热效率预测模型的输入参数,预测太阳能集热功率。通过遗传算法对LSSVM进行参数寻优,经过200次迭代后,可以得到如图3所示的适应度曲线,从图3可以看出,经过多次调整后,适应度MSE最终稳定于0.051 9。此时得到的最优参数,Cbest=2.203 6,best=0.000 953 68。将得到的最优参数代入预测模型中,就得到了基于LSSVM太阳能集热效率最优预测模型。

图3 适应度曲线

利用相同的数据集,分别对ANN和时间序列进行训练和测试,将其得到的预测结果与LSSVM进行比较,比较的结果如图4所示。通过图4结果曲线的对比可知,基于LSSVM的太阳能光热效率预测模型的预测精度明显高于ANN预测模型和时间序列预测模型。

图4 不同方法对比图

为了能够更全面地评价LSSVM的太阳能光热效率预测模型的预测性能,本文采用两种不同的评价标准对结果进行评价比较,它们分别是平均绝对百分误差(Mean Absolute Percentage Error, 简称MAPE)和均方根误差(Root Mean Squares Error,简称RMSE)。当误差越小时,MAPE和RMSE越小,模型性能越好。MAPE和RMSE的表达式如式(10)和式(11)所示:

(10)

(11)

表2 预测误差对比 %

结合MAPE和RMSE两种不同的评价标准,进一步比较LSSVM、ANN、时间序列这三种模型在太阳能光热效率预测方向的性能,其对应的预测结果评价标准如表2所示,从表2可以看出,在训练和测试阶段LSSVM预测模型的RMSE和MAPE值均小于ANN和时间序列的值,这意味着LSSVM预测模型的预测结果更接近真实值。因此,综合图4和表2可以看出,LSSVM预测模型比ANN预测模型和时间序列预测模型具有更小的预测误差,其预测结果也更接近真实值。

4 总 结

本文提出了一种基于LSSVM的太阳能集热效率预测模型,利用训练数据对LSSVM预测模型进行训练,遗传算法进行LSSVM参数寻优,以月平均气温、月平均日照时数、月平均太阳总辐射量、月平均日照百分率作为预测模型输入对太阳能集热效率进行预测,并将结果与ANN预测模型和时间序列预测模型进行对比,比较结果表明,LSSVM预测模型具有更小的预测误差,RMSE和MAPE值分别为0.68和1.25。综上表明,LSSVM预测模型可以很好地应用于太阳能集热效率的预测。

猜你喜欢

热效率适应度遗传算法
改进的自适应复制、交叉和突变遗传算法
一种基于改进适应度的多机器人协作策略
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于空调导风板成型工艺的Kriging模型适应度研究
软件发布规划的遗传算法实现与解释
基于改进的遗传算法的模糊聚类算法
基于改进多岛遗传算法的动力总成悬置系统优化设计
丰田汽车公司的新型高热效率汽油机
丰田汽车公司推出热效率达38%的低燃油耗汽油机系列
通过改善燃烧和降低摩擦提高微型车发动机的热效率