APP下载

基于贡献度-极限学习机理论算法的输电线路工程造价预测

2015-11-16张家忠

中国科技信息 2015年2期
关键词:贡献度学习机神经网络

张家忠

基于贡献度-极限学习机理论算法的输电线路工程造价预测

张家忠

张家忠 危雪林 李冰清

江西博微新技术有限公司

引言

工程造价预测是工程造价控制的前提,是工程项目可行性研究的基础,也是招投标制定标底的依据,因此工程造价预测成为工程建设中首要解决的问题。快速而又准确地进行工程造价的预测,对于工程项目的管理实践具有重大的理论意义和现实意义。本文采用贡献度-极限学习机这些数学方法构成输电线路工程造价预测模型,并证明该理论与方法的科学性,进而研究解决工程造价预测效率不高这一难题。

传统的造价预测一般使用机理型的构建造价预测物理模型,近些年来,随着智能算法的兴起,很多学者开始将灰色关联理论、BP神经网络和支持向量机(Support Vector Machine,SVM)等方法应用于对工程造价预测,虽然在各个领域都取得了一定的效果,但方法本身仍存在不足:灰色模型(如GM(1,1),GM(1,N)等)适用于小样本,具有运算简单等特点,但其对样本的分布规律有较严格的要求;神经网络对非线性系统有良好的逼近能力,但难以确定该模型的结构,难以掌握网络训练水平,模型求解容易陷入局部最小值,且对连接权系数初值敏感,模型参数不易寻找,过度依赖设计技巧。SVM方法具有可靠的理论基础,能克服神经网络的上述不足,较好地解决小样本、非线性、高维数等实际问题,因此,本文选取极限学习机模型作为输电线路工程造价预测的预测模型。

贡献度理论

为了构建造价预测模型,首先需要在输电线路造价费用构成模块中,分析各费用项对工程总造价贡献度的大小,根据其对工程总造价贡献的大小,对各费用项进行排序。在工程造价预测时,优先考虑贡献度较高的费用项,在这里提出费用贡献度的概念。

费用贡献度原理:研究各分项费用对总费用构成影响的大小。定义分项费用贡献度模型为

在实际的分析中,可对贡献度进行赋权累加分析,直到贡献度系数区间趋于稳定。

极限学习机模型(ELM)

极限学习机(Extreme Learning Machine,ELM)是由Huang等人提出的一种新的性能优良的机器学习算法,该方法摒弃了传统的调整神经网络权值的策略,不但避免了陷入局部最小化的风险,而且极大地提高了网络的学习速度和推广性能。相关研究表明,ELM和SVM有近似的预测精度,但其参数易得,运算速度非常快,在学习速率上有明显优势。

极限学习机回归原理

极限学习机算法描述

ELM确定隐含层神经元个数和激励函数g(x),对于每一组随机生成的w 和b ,都可计算出一个唯一的β与之对应。具体步骤如下:

对网络的输入权值wi和隐层节点偏置值bi进行随机赋值,i=1,2,…,M;

计算隐层输出矩阵H ;

输电线路工程造价预测

数据预处理

输电线路工程造价费用构成主要包括费用、量、价、技术条件等。因此,造价预测研究采集数据来源自各网省《国家电网公司输变电工程造价分析数据收集表(2013-2014)》,数据共采集2013-2014年各网省输变输电线路工程,其工程数量128个、造价分析数据20736个。因为采集到的数据中存在部分数据计算方式不同、数据单位不统一、数量级不统一等问题,需对样本工程数据进行预处理。数据预处理常用方法为归一化方法,关于数据的归一化,很多文献都有详细的介绍,本文不再单独介绍。

贡献度分析

依据预处理后样本工程数据,利用matlab软件,计算“决算.静态投资”与造价预测指标的贡献度。取每个预测指标与静态投资贡献度的绝对值,贡献度绝对值相等的指标,其对静态投资的影响是相同的。将相关系数优化,同时统计有效样本工程数。

贡献度系数值越大,表明两者之间的关联度越大。初始贡献度不足以说明两者之间绝对的关联度。根据统计学习理论,通过贡献度累加,二次分析预测指标与静态投资的贡献度。

通过贡献度初始优化和赋权优化,得出贡献度区间[0.6,0.7]的概率为赋权系数0.8的界限,即对静态投资的贡献度系数应大于0.6,则根据贡献度分析,可得造价预测主要指标包括:线路长度合计(折单)(0.761)、杆塔.总基数(基)(0.603)、杆塔.直线塔(基)(0.653)、导线.线材量(t)(0.886)、土石方量.基坑(0.736)土石方量.接地(0.738)、基础混凝土总量(m3)(0.718)、基础钢材量(t)(0.886)。

隐含层结点分析

根据极限学习机预测理论,首先需确定隐含层神经元个数。通过多次实验,进行累加计算,直到隐含层个数趋于稳定值。经过多次实验和累加计算,发现误差和最低的神经元层数基本确定在26,因此,将平均误差隐含神经元个数确定值为26。如图1所示。

图1 多次待定隐含层个数预测误差平均

造价预测及评价

样本工程数量128个,由于主要指标数据缺省,有效样本工程数量为75个。选取前60条工程数据作为训练样本,后15条工程数据为检验样本(工程编号为A001-A015)。应用极限学习机造价预测模型对工程静态投资进行预测,预测结果如图2。

图2 造价预测分析蓝色:实际造价值;红色:预测造价值。

结语

综合输电工程造价预测结果,证明极限学习机可用于造价预测,由于采集样本贡献度仅为80%,且样本数据可能有误,因此预测绝对百分误差在20%左右可接受。使用样本数据进行神经网络和支持向量机进行造价预测,绝对百分误差分别为31.3%和24.7%,证明了极限学习机算法在预测精度上较神经网络和支持向量机的优越性。

在算法时间复杂度方面,神经网络算法训练迭代10000次,用时22s,支持向量机预测用时14s,极限学习机为保证预测精度,预测500次取均值,仅用时27s,平均预测一次只需0.054s,因此极限学习机的运算速度较神经网络及支持向量机较优。

10.3969/j.issn.1001-8972.2015.02.054

猜你喜欢

贡献度学习机神经网络
基于递归模糊神经网络的风电平滑控制策略
国有林业产业对地区经济发展贡献度的动态演绎分析
基于思维进化优化极限学习机的滚动轴承故障的智能诊断
神经网络抑制无线通信干扰探究
基于贡献度排序的肾透明细胞癌串扰通路分析
基于神经网络的中小学生情感分析
联合作战太空作战力量体系贡献度仿真分析框架研究
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
武器装备体系能力贡献度的解析与度量方法