APP下载

基于BAS-SCA-BP 模型的高校建筑工程项目投资估算研究

2022-11-17雍秀珍

工程管理学报 2022年5期
关键词:约简粗糙集神经网络

雍秀珍,黄 山,袁 维

(兰州交通大学 土木工程学院,甘肃 兰州 730050,E-mail:1247957218@qq.com)

自我国实施高校扩招政策以来,高校招生规模逐年扩大,为了满足高校教学、科研工作对校舍规模的需求,国内高校建设项目也进入了前所未有的发展时期。高校建设项目经费投入越来越大,伴随而来的投资风险也越来越大,因此如何在项目建设初期对项目投资进行精准、高效的估算对项目决策及投资控制极其重要。

目前,传统工程投资估算方法估算精度低已成为建设项目投资控制的制约因素之一。为此许多学者开始将BP 神经网络应用于工程造价估算领域。但标准BP 神经网络在实际应用中易陷入局部极值,且存在收敛速度慢和预测精度低的问题[1]。赵维树等[2]运用天牛须搜索优化BP 神经网络来构建装配式建筑投资估算模型,获得了优于标准BP 神经网络模型的预测精度和鲁棒性。蒋红妍等[3]针对高层住宅工程,采用灰关联分析与粒子群优化BP神经网络相结合的方法,构建了PSO-BP 神经网络造价估算模型,实现了对高层住宅造价的快速估算。张飞涟等[4]提出用遗传算法优化ELM 参数的GA-ELM 预测模型,并应用于轨道交通工程的投资估算中,从而实现了快速准确的投资估算。杜志达等[5]用人工蜂群算法(ABC)调谐LS-SVM 算法核心参数来构建成本估算模型,通过实例证明该模型实现了估算精度和建模效率的双重提高。虽然上述估算方法在一定程度上取得了良好的预测结果,但目前利用BAS-SCA 改进BP 神经网络来建立投资估算模型的方法尚未有学者研究。并且,目前基于智能算法优化BP 神经网络所构建的投资估算模型的研究对象主要是交通工程、住宅工程、电力工程,鲜有以高校建筑工程项目为对象的研究。

基于此,本文通过分析高校建筑案例、相关文献并结合显著性理论获取影响工程造价的特征参数[6],以粗糙集为降噪工具,对初始参数进行降噪,将与工程造价有显著相关性的因素提取出来,去除冗余因素,降低输入数据维数,从而缩短BP 神经网络训练所需时间,提高其预测精度。并通过融合改进天牛须和正余弦双重优化算法改进BP 神经网络构建投资估算模型,将约简后的工程特征作为模型输入,工程总造价作为模型输出,使工程项目在决策阶段实现快速、精确的造价估算,为项目可行性研究及融资方案的制定提供理论依据。

1 工程特征的选取及样本数据的获取

1.1 基于粗糙集的工程特征指标选取

工程特征选取是影响投资估算模型效率及预测精度的关键问题。本文全面检索建筑工程造价影响因子相关资料,结合项目显著性成本理论,从建设项目内部属性和外部影响因素方面综合分析,确定了高校建筑工程造价的20 个显著性影响因素:包括结构类型、基础类型、三级钢筋占比、砌筑材料、门窗类型、内墙装饰、外墙装饰、天棚、楼地面工程、防水工程、保温工程、抗震设防烈度、安装完备程度、项目管理水平、总建筑面积、建筑高度、建筑层数、工程造价指数、埋深、工期。

为了避免上述得到的造价影响因子过多而造成数据冗余问题,采用粗糙集理论对影响因子约简[7],其目的是在不改变系统的分类或决策能力的基础上删减冗余属性,降低特征指标的维度,使工程问题的研究得以简化。利用粗糙集理论对工程特征进行属性约简时,决策表中的属性值需要用离散数据表示[8]。因此,本文通过对工程实例的分析,将除抗震设防烈度外的文字描述性特征用数字1~5 表示,抗震设防烈度用数字1~4 表示。然后按其定额水平和对单方造价的影响程度,从小到大排序给出相应的量化数据,量化方式如表1 所示。

表1 工程特征量化表

1.2 基于粗糙集的特征指标约简

1.2.1 样本数据获取

决策表的基本结构是以工程造价影响因子作为条件属性,工程总造价为决策属性。通过粗糙集软件Rosetta 对总建筑面积、建筑高度、建筑层数、工程造价指数、工期、埋深进行离散化。本文以甘肃省兰州市高校建筑项目(包括高校教学楼及宿舍楼)为研究对象,在查阅大量高校建筑典型案例的基础上,收集了兰州市高校2010~2020 年竣工的60组已建项目的最终决算数据。排除不必要和多余的信息后,获得了50 组有效数据,建立初始决策表,节选前10 个样本如表2 所示。

表2 初始决策表

1.2.2 属性约简

利用Rosetta 软件对初始决策表进行属性约简,在运算结果中选出频数大于40 的特征(见表3)[9],得到结构类型,基础类型等14 个主要特征指标,将约简得到的14 个特征作为神经网络的输入向量。

表3 初始特征约简表

2 投资估算模型的建立

2.1 BP 神经网络

BP 神经网络的核心原理在于通过调节各神经元间的权值使误差从隐含层,逐层反传到输入层,即达到信号正向传播至误差反向传播的过程。通常,BP 神经网络设置成三层或三层以上,由输入层、隐含层和输出层组成,其网络基本结构如图1所示。

图1 BP 神经网络基本结构

2.2 BAS-SCA 原理

BAS-SCA 是为了解决标准正余弦优化算法在搜索过程中存在计算精度低、易陷入局部最优值等问题,提出的一种双重搜索优化算法。其将动态自适应权重机制引入标准正余弦算法,以平衡全局搜索与局部搜索,提高收敛速度;结合指数型函数和余弦函数组成一种新的转换参数模型来替换传统的线性衰减函数;将天牛须算法的搜索机制由固定步长搜索改为变步长搜索,并与改进的正余弦算法相融合,实现了双重搜索寻优。在提高正余弦搜索的精度和速度的同时尽可能地跳出局部最优解从而有效避免陷入局部极值问题。

2.3 BP 神经网络的改进

BP 神经网络[10]与其他智能算法相比,其最明显的优势是在整个网络训练时无需引入任何新的参数,其主要是利用误差函数来不断地调节网络的初始参数[2]。但由于初始权值和阈值采用随机方式得到,一旦选取不当将对网络训练结果造成很大影响。为此,本文采用融合改进天牛须和正余弦搜索双重优化算法[11]对标准BP 神经网络的初始权值和阈值经过初优处理后应用于网络的训练中,进而构建最终的网络训练模型。具体流程如图2 所示。

图2 BP 神经网络改进流程图

2.4 BAS-SCA-BP 神经网络模型的建立

有理论已证明,具有三层结构的BP 神经网络能在闭集上以任意精度逼近任意的n维到m维的非线性映射[12]。因此,本文采用三层BP 神经网络,包括输入层、隐含层和输出层。其输入层节点数为14,输出层节点数为1,隐含层节点数结合经验公式如下:

式中,m为隐含层神经元节点数,n为输入层神经元节点数;l为输出层神经元节点数;a是[1,10]之间的一个常数。从而确定隐含层节点数为12。因此网络结构为14-12-1,目标误差为0.001,总迭代次数为1,000。隐含层激活函数为logsig:输出层激活函数为tansig:

BAS-SCA 算法[11]能有效提高网络训练性能并避免由于初始参数随机化而导致网络容易陷入局部极值的问题,具体步骤如下[10]:

Step 1:确定BP 神经网络结构。

Step 2:初始化BAS-SCA 算法参数,最大迭代次数为500,搜索维度dim=n×m+m×1+m+1,以及种群规模N为30。

Step 3:根据参数的限定范围,随机初始化种群X=rand(dim,1),以均方误差MSE 作为适应度评价函数,算法迭代停止时适应度函数值最小的位置即为全局最优值。

Step 4:计算自适应权值w(t)和递减参数r1[13],更新最优个体位置及对应的适应度值。

式中,T为最大迭代次数;t为当前迭代次数。

式中,α为一个常数,本文中取0.05。

式中,t为当前迭代次数;是t次迭代过程中第i个粒子处于第j维度下的最佳位置;r2、r3、r4是3个参数,r2变化范围在[0,2π],r3变化范围在[-2,2],r4变化范围在[-1,1];为t次迭代下的目标点。

Step 5:将Step 4 得到的最优位置通过变步长0δt和下式进行二次搜索寻优更新,并计算适应度值。

式中,f(x)是适应度函数;sign 是判读天牛须之后搜索方向的函数,若右侧适应度较高,则sign 函数取1,天牛须会继续朝此方向前进,否则,向反方向移动。x代表搜索空间,如下式:

式中,xr代表右向的搜索空间;xl代表左向的搜索空间;d t是某个特定时刻对应的天牛须搜索区域,为天牛须搜索方向矢量归一化公式。其中,rand 函数表示一个随机函数;j代表当前位置的维度。

Step 6:判断所获位置是否超出Step 3 所设参数范围,若是,输出上一次未超出边界的最优解;反之,则继续执行下一步骤。

Step 7:采用贪婪策略[14]并用下式判断最终的最优个体位置,若经过二次搜索后的个体更优,则替换当前个体,反之不替换。

式中,f(X)为在位置X处求得的适应度函数。

Step 8:判断是否满足BAS-SCA 算法迭代次数上限,若满足,则输出最优个体位置及最优解;否则继续执行Step 4。

Step 9:将所得最优权阈值带入标准BP 神经网络进行训练,训练后得到高校建筑投资估算模型。

3 预测结果与对比分析

3.1 网络输入数据的处理

本文在Matlab 环境中先将前文得到的50 组样本数据随机划分为43 个训练样本和7 个预测样本;再将粗糙集属性约简得到的结构类型、基础类型等14 个指标作为网络输入,总造价作为网络输出,构建BAS-SCA-BP 神经网络模型进行工程造价估算。约简后的样本数据选前10 组如表4 所示。

表4 原始样本数据节选

3.2 Matlab 仿真分析

本文采用Matlab 2020a 软件实现BAS-SCA 的寻优,以及标准BP 神经网络、BAS-SCA-BP 神经网络的模拟及预测工作,预测效果如图3 和图4 所示。相比于标准BP 神经网络,BAS-SCA-BP 神经网络的拟合结果接近于真实值,误差很小。由此说明,BAS-SCA 算法对BP 神的优化效果良好。

图3 BP 神经网络预测结果

图4 BAS-SCA-BP 神经网络预测结果

为了进一步测试BAS-SCA-BP 神经网络估算模型在高校建筑工程投资估算中的应用效果,并对比本模型和其他估算模型应用于高校建筑项目投资估算时的优势。本文选择基于遗传算法优化的BP神经网络模型[15]和基于天牛须搜索优化的BP 神经网络模型[16]与BAS-SCA-BP 神经网络模型进行综合对比,主要从相关系数(R2)、平均绝对百分比误差(MAPE)及平均绝对误差(MAE)3 个角度对模型的预测效果进行综合对比分析。GA-BP 和BAS-BP 神经网络预测结果如图5 和图6 所示。

从图5 和图6 可以发现,BAS 和GA 优化的估算模型预测拟合效果也比较好。BAS-BP 的预测结果优于GA-BP。将标准BP 神经网络、GA-BP、BAS-BP 及BAS-SCA-BP 神经网络预测结果进行对比分析,结果如表5 所示。

图5 GA-BP 神经网络预测结果

图6 BAS-BP 神经网络预测结果

分析表5 可知,BAS-SCA 优化后的BP 神经网络模型的预测效果与标准BP 神经网络模型相比有很大的改进,BAS-SCA-BP 对预测样本集的拟合效果很好,R2达到0.9994,MAPE 为0.81,误差很小。BAS-BP 和GA-BP 拟合效果次之。而未经改进的标准BP 神经网络拟合效果较差,且鲁棒性较低,综合来看BAS-SCA-BP 效果最佳。这说明,采用BASSCA 算法对BP 神经网络改进之后,能克服标准BP神经网络易陷入局部最优和预测精度低的缺点。综合以上分析来看,本文提出的BAS-SCA-BP 神经网络模型,可以满足高校建筑在投资决策阶段对估算的精度要求,应用于高校建筑投资估算是合理可行的。

表5 不同模型预测结果对比

4 结语

本文利用BAS-SCA 双重优化算法改进BP 神经网络,并将粗糙集理论与BAS-SCA-BP 神经网络模型相结合用于高校建筑投资估算中,结果表明将粗糙集作为特征降噪工具,可以消除工程特征冗余,降低神经网络复杂度,能够提高模型预测准确度。此外,预测结果显示:BAS-SCA-BP 模型的预测误差在± 4%以内,且平均绝对百分比误差在1%以内,这表明,采用BAS-SCA 算法优化的BP 神经网络模型的预测效果相较于标准BP 神经网络估算精度明显提高。同时,与其他优化算法改进后的BP 神经网络模型相比,精度及鲁棒性也有所提高。综上所述,BAS-SCA-BP 神经网络模型的建立对于高校建筑项目投资估算是科学有效的,对项目前期投资决策有较高的参考价值。

猜你喜欢

约简粗糙集神经网络
基于Pawlak粗糙集模型的集合运算关系
神经网络抑制无线通信干扰探究
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定