APP下载

遗传算法优化支持向量机在大坝变形预测中的应用

2016-10-27沈哲辉沈月千

大地测量与地球动力学 2016年10期
关键词:大坝遗传算法向量

沈哲辉 黄 腾 沈月千 郑 浩

1 河海大学地球科学与工程学院,南京市佛城西路8号,211100



遗传算法优化支持向量机在大坝变形预测中的应用

沈哲辉1黄腾1沈月千1郑浩1

1河海大学地球科学与工程学院,南京市佛城西路8号,211100

建立大坝变形预测的支持向量机模型,并用遗传算法对支持向量机模型的核函数参数、惩罚参数和损失参数进行优化。将同一优化方法不同支持向量机核函数、不同优化方法同种支持向量机核函数进行横向对比,将BP神经网络、自回归AR(p)模型、多元回归分析法和周期函数拟合法进行纵向对比。结果表明,该GA-SVM(RBF)模型不仅能较好地预测大坝的变形趋势,而且能大幅提高预测精度。

大坝变形因子;支持向量机;遗传算法;优化;预测

本文用遗传算法(genetic algorithm,GA)[1]来优化支持向量机(support vector machines,SVM)[2-3]的参数,并建立了大坝变形预测的GA-SVM模型。通过实例,对比分析了本文算法、BP神经网络、自回归AR(p)模型、多元回归分析法和周期函数拟合法。

1 支持向量机模型

支持向量机是一种以结构风险最小化原则为基础的机器学习算法,通过解一个线性约束的二次规划问题得到全局最优解,因而不存在局部极小值的问题,保证了收敛速度[4]。

本文采用径向基RBF核函数(高斯核函数)。通过参数的选择,其可以适用于任意分布的样本,是目前支持向量机中应用最广泛的一种核函数[5]。选择合适的损失参数ε、惩罚参数C和核函数参数σ是支持向量机能成功为研究对象建模的关键。

为了验证RBF核函数的优势,本文采用多项式核函数建模进行对比。

2 基于GA-SVM的大坝变形预测模型

2.1建立训练样本集

结合文献[6-7],把水压分量H(库水位)、温度分量T(观测时的气温)、周期分量t1、t2、t3(为时间t的函数)、时效分量t、lnt等7个影响因子作为大坝变形的影响因素。

周期分量的表达式为:

(1)

大坝变形的SVM模型表达式为:

f=x(t,lnt,t1,t2,t3,T,H)

(2)

2.2GA优化SVM参数

采用GA优化SVM的3个参数,其优化过程如下。

1)适应度函数的选择。适应度函数是个体对环境的适应能力的表达,其与目标函数有关。本文的目标函数选为均方误差:

(3)

式中,R0为实测值,Rm为拟合值。

2)初始化GA参数。初始化最大进化代数、最大种群数量、选择概率、交叉概率和变异概率等。

3)编码。确定支持向量机3个参数的编码区间,设置参数C的寻优区间为(0,100],设参数ε的寻优区间为[0,1],参数1/σ的寻优区间为[0,1 000]。对其进行二进制编码,产生一组代表这3个参数的染色体,即为初始种群。

由渗透率试验结果可知,煤样含水量越大,液氮增透效果越好,为了探究液氮影响煤岩渗透率的形式,笔者从微观角度进行了研究,由于篇幅有限,仅分析干燥与饱水煤样进行液氮冷浸前后的扫描电镜结果。所用扫描电镜设备为JSM-6390LV,其放大倍数最高可达300 000。

4)遗传算子操作。①选择:是指在群体中选择生命力强(适应度大)的个体,产生新的群体的过程。②交叉:是指两队相互配对的染色体按照某种方式进行部分基因座的交换,从而形成两个新的个体,使种群不断有新鲜个体产生,从而对搜索空间中的新区域进行搜索,防止陷入局部最优。③变异:将个体染色体编码串中的某些基因座上的基因值用改基因座的其他等位基因来替换,从而形成一个新个体。它能保证遗传算法的有效性,决定遗传算法的局部搜索能力,维持群体的多样性,防止出现早熟现象。④重插入:为了确保最适应个体在每一次传播到下一代的数目保持不变,需要随机重插入固定数量的新个体。

5)遗传算法的终止。由于遗传算法的随机搜索性,找到一个明确的收敛性判别准则是困难的。本文算法终止条件采用预先设定的代数。

用GA对训练集优化,得到最优的SVM 3个参数。再根据未来大坝的7个影响因子,训练SVM模型预测未来大坝的变形。

3 实例分析

以福建省某梯级水电站第三级大坝的表面水平位移引张线测点15在2008-01-01~2012-12-01期间每月1日的60期监测数据作为历史数据进行建模,预测2013-01-01~2014-08-01的20期数据。

以大坝的长周期历史变形数据进行建模。7个影响因子之一的时效分量t序列较长,例如2008-01-01作为第1天,那么2012-12-01编号则为1 431。若t直接参与建模,其相对于其他6个影响因子的数量级较大,导致模型过分拟合,预测能力下降。所以,对样本数据进行归一化处理[7]:

(4)

式中,ξ为原始样本数据,ξmin、ξmax分别为样本集中的最小值、最大值,ξ′为归一化后的值。

当迭代代数为100时,MSE基本达到收敛,得到最优的惩罚参数C=4.981 6,损失参数ε=0.174 7,核函数参数倒数1/σ=0.077 2。

为验证遗传算法具有更好的优化能力,采用网格优化的方法对支持向量机(RBF核)参数进行优化。

将不同支持向量机核函数相同优化方法的对比和相同支持向量机核函数不同优化方法的对比一起并称为横向对比。GA-SVM(多项式核)法得到的最优的惩罚参数C=48.684 6,损失参数ε=0.425 3,核函数参数coef=14.740 9,q=6.765 1;网格-SVM得到的最优惩罚参数C=9.189 6,损失参数ε=0.148 2,核函数参数倒数1/σ=0.049 0。

将本文的GA-SVM(BRF)模型与BP神经网络、自回归AR(p)模型(其中AR(p)模型采用FPE准则定阶,最终定阶为p=4)、多元回归分析法和周期函数拟合法[9](经计算得a=-0.110 6,b=-0.094 5,c=6.062 8)进行纵向对比。

横向对比预测曲线见图1。由图1看出,各条SVM模型预测曲线都与原测数据变化一致,但显然使用RBF核函数的SVM预测曲线更加贴合原测数据,说明高斯核函数优于多项式核函数;GA优化下的SVM预测曲线和网格优化下的SVM预测曲线比较接近,但从表1中可以算出,GA-SVM(RBF)预测相对误差绝对值的平均值为2.30%,网格-SVM(RBF)预测相对误差绝对值的平均值为2.36%,所以GA-SVM(RBF)是优于网格-SVM(RBF)的。

图1 横向对比预测曲线Fig.1 Horizontal contrasting prediction curve graph

纵向对比预测曲线见图2。由图2可以看出,GA-SVM(RBF)模型预测结果明显更加贴合原始监测数据,GA-SVM和BP神经网络预测趋势和原测数据基本一致,但AR(p)、多元回归分析法和周期函数拟合法几乎未体现出趋势性。所以对于大坝来说,通过其变形因子对变形量进行建模比用单一变形量建模更加合理。

图2 纵向对比预测曲线Fig.2 Longitudinal contrasting prediction curve graph

由表1计算出GA-SVM(RBF)预测相对误差绝对值的平均值为2.30%,BP神经网络预测相对误差绝对值的平均值为3.70%,AR(p)预测相对误差绝对值的平均值为4.03%,多元回归分析预测相对误差绝对值的平均值为13.88%,周期函数拟合法预测相对误差绝对值的平均值为3.59%。

综合横向对比和纵向对比,GA-SVM(RBF)模型不仅较好地预测了变形的趋势,而且预测相对误差也最小。可见,GA-SVM(RBF)模型是一种比较优秀的大坝变形数据建模预测方法。

表1 预测数据对比

4 结 语

1)根据大坝变形影响因子与大坝变形之间的关系,用支持向量机对历史数据进行建模,并用具有较好的全局搜索能力以及良好的可扩展性等优点的遗传算法优化支持向量机参数,得到最优的大坝预测支持向量机模型。此优化方法避免了凭经验或试算法选取支持向量机的三参数,从而引起欠学习或过学习的现象。

2)在大坝变形预测领域,支持向量机采用的RBF核函数明显优于多项式核函数。

3)在大坝变形预测领域,采用遗传算法对支持向量机的三参数进行全局寻优,比传统的网格寻优有优势。

4)对于大坝长周期数据进行建模分析,对数据进行归一化是极其必要的。

5)对于大坝来说,通过其变形因子对变形量进行建模比用单一变形量建模更加合理。

6)对比BP神经网络、自回归AR(p)模型、多元回归分析法和周期函数拟合法,本文方法不仅更好地预测了变形趋势,而且能大幅提高预测精度。

[1]雷英杰.MATLAB遗传算法工具箱及应用[M]. 西安:西安电子科技大学出版社,2014(Lei Yingjie. MATLAB Genetic Algorithm Toolbox and Application[M].Xi’an: Xidian University Press, 2014)

[2]吕开云. 黄河小浪底水利枢纽大坝变形预测方法研究与分析[D]. 北京:中国矿业大学, 2012(Lü Kaiyun. Research and Analysis about the Deformation Forecasting Methods of Yellow River Xiaolangdi Water Hydropower Dam[D]. Beijing: China University of Mining and Technology, 2012)

[3]翟信德. 基于支持向量机的大坝变形预测研究[D]. 合肥:合肥工业大学, 2007(Zhai Xinde. Research on Dam Displacement Forecasting Model Based on Support Vector Machine[D]. Hefei: Hefei University of Technology, 2007)

[4]唐亮贵,程代杰.基于小波的支持向量机预测模型及应用[J]. 计算机科学,2006,33(3):202-204(Tang Lianggui,Cheng Daijie.A Forecasting Model via Support Vector Machines Based on Wavelets[J]. Computer Science, 2006, 33(3):202-204)

[5]姜慧研,王晓丹,周晓杰, 等.基于SVR的回转窑烧成带温度软测量方法的研究[J]. 系统仿真学报,2008,20(11):2 951-2 955(Jiang Huiyan,Wang Xiaodan,Zhou Xiaojie,et al.Study on Soft Sensor for Temperature of Burning Zone Based on SVR[J]. Journal of System Simulation, 2008, 20(11): 2 951-2 955)

[6]吴中如.水工建筑物安全监控理论及其应用[M]. 南京:河海大学出版,1990(Wu Zhongru. Safety Monitoring Theory & Its Application of Hydraulic Structures[M].Nanjing:Hohai University Press, 1990)

[7]陈伟. 遗传算法与神经网络在大坝安全监测中的应用研究[D]. 西安:长安大学, 2009( Chen Wei. Genetic Algorithms and Artificial Neural Networks Apply in Dam Security Monitoring[D]. Xi’an: Chang’an University, 2009)[8]朱伟,石超峰,李楠.基于遗传算法优化支持向量机的再生混凝土抗压强度预测模型[J]. 中外公路,2014,34(1):311-314(Zhu Wei,Shi Chaofeng,Li Nan.The Recycled Concrete Compressive Strength Prediction Model Based on Support Vector Machine Optimized by Genetic Algorithm[J]. Journal of China & Foreign Highway, 2014, 34(1):311-314)

[9]吴富梅,杨元喜.基于高阶AR模型的陀螺随机漂移模型[J]. 测绘学报,2007,36(4):389-394(Wu Fumei,Yang Yuanxi.Gyroscope Random Drift Model Based on the Higher-Order AR Model[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(4):389-394)

About the first author:SHEN Zhehui, postgraduate, majors in precision engineering measurement and data processing, E-mail:1280381222@qq.com.

Dam Deformation Monitoring Prediction on Support Vector Machine Optimized by Genetic Algorithm

SHENZhehui1HUANGTeng1SHENYueqian1ZHENGHao1

1School of Earth Sciences and Engineering, Hohai University, 8 West-Focheng Road, Nanjing 211100, China

A SVM model is established for predicting dam deformation, and optimizing the kernel function parameter, penalty parameter and loss function parameter through the genetic algorithm. We use this model to analyze the long period deformation monitoring data and make predications. In this paper, we compare horizontally different kernel functions of support vector machine using the same optimization method, and the same kernel function of support vector machine using different optimization methods. The results show that GA-SVM(RBF) not only can well predict the dam deformation trend, but also improves the prediction accuracy over contrasting BP neural networks, AR(p), multiple regression analysis and periodic function fitting longitudinally.

dam deformation factors;support vector machines;genetic algorithm;optimizing;prediction

College Postgraduate Research and Innovation Project of Jiangsu Province, No.KYLX15_0478.

2015-09-22

沈哲辉,硕士生,主要从事精密工程测量与数据处理研究,E-mail:1280381222@qq.com。

10.14075/j.jgg.2016.10.018

1671-5942(2016)010-0927-03

P258

A

项目来源:江苏省普通高校研究生科研创新计划(KYLX15_0478)。

猜你喜欢

大坝遗传算法向量
向量的分解
聚焦“向量与三角”创新题
大坝:力与美的展现
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
向量垂直在解析几何中的应用
软件发布规划的遗传算法实现与解释
基于改进的遗传算法的模糊聚类算法
向量五种“变身” 玩转圆锥曲线
正式挡水的马来西亚沐若大坝