基于CBR的公路工程造价估算模型
2020-06-18李俊达李远富王广开
李俊达,李远富,王广开
(1.西南交通大学 土木工程学院,四川 成都 610031;2.西南交通大学 高速铁路线路工程教育部重点实验室,四川 成都 610031)
0 引言
目前,我国公路工程建设已成规模,并且今后建设力度依然巨大。至2016年年末,我国高速公路总里程已经超过13万km,且预计2017年内新建5 000 km 高速公路[1]。公路工程持续快速的发展必将会导致巨额的工程建设投资。整个建设项目的实施包括投资决策阶段、招投标阶段、设计阶段、施工阶段和竣工阶段,从造价控制的角度来看,节约投资的可能性在项目投资决策阶段由100%迅速下降,直至施工阶段的10%左右,其后变化就十分平缓[2]。因此,在工程项目投资决策阶段快速准确地对工程造价进行估算对于项目造价控制意义重大。
在过去数十年间,我国公路建设的工程实践积累了丰富的典型案例,这里包含了大量知识和经验,如果在新建公路项目的工程造价估算中无视这些案例,势必是一种浪费资源的行为。利用历史工程案例对工程造价进行估算的方法国内外学者曾进行过各种不同的尝试与探索,具有一定的成果积累。Turochy[3]等依据密西根州18个工程项目构建了公路工程线性衰退模型,尽管此模型可以快速估算公路工程造价,但精确度低。李驰宇[4]分析公路工程造价的影响因素,总结出了公路工程项目的11个主要特征并建立了基于BP神经网络的造价估算模型。陈小龙[5]等以上海地区18个住宅项目的相关造价数据为基础,建立了估算建筑造价的多元回归方程。Petroutsatou[6]等统计分析了某地高速公路从1998—2004年间33条总长46 km隧道历史工程数据,建立了两种神经网络估算模型,即多层前馈网络和衰退神经网络。Sun[7]等利用典型工程特征信息结合应用模糊数学建立了工程造价估算模型。王宇鹏[8]系统分析了我国公路行业1996版和2011版建设项目投资估算办法中费率费用指标计价规则的差异性,论证了现行费率费用指标计价规则存在的不合理性,提出了改进方案及建议。王芳[9]等以陕西省高速公路建设费用作为研究对象,通过数理统计方法建立了一种造价估算模型。
案例推理 (Case-based Reasoning, CBR)是人工智能领域中一种利用历史案例对新问题进行求解的推理技术,起源于Schank[10]提出的动态记忆理论。它模拟专家解决问题的思路,将历史案例视作经验,对新的目标问题进行求解,其求解主要过程包括案例的检索(Retrieve)、案例的重用(Reuse)、案例的修正(Revise)和案例学习(Retain),即经典的4R-循环。目前,CBR现已在控制、医学及决策支持等领域取得了成功应用[11-16]。
本研究利用案例推理技术,建立一种公路工程造价估算模型。该模型的优势包括:采用OWA算子对公路工程特征属性进行赋权,避免了专家打分过程中由于主观原因产生的极值对结果造成过大影响;针对检索出的相似案例无法直接被用于求解的情况,利用BP神经网络对相似案例进行训练,提高了估算精度;利用历史工程案例进行工程造价的估算,即使是在工程资料、市场信息等影响因素不太清晰的投资决策阶段,仍然能取得较为准确的估算结果。
1 模型分析
1.1 案例的表示
严格来说,任一公路工程特征属性都会对公路项目的工程造价造成影响,考虑到的特征属性越全面,自然案例也就描述得越清楚,但这样可能会使相似案例的检索产生偏差[17]。因此,应尽量选取相互独立的工程特性来描述案例,减少不必要的特征属性。利用文献[4]中总结的11个公路工程特性作为描述工程项目案例的特征属性,如表1所示。
表1 公路工程项目案例特征属性Tab.1 Feature attributes of highway project cases
这些特征属性分为字符型和数值型,数值型特征属性可直接采用原始值来表示;字符型特征属性则需要其进行量化:特征属性A9路面结构材料通常分为沥青混凝土路面和水泥混凝土路面两类,分别取值0.8和0.6;特征属性A10地形地貌可分为平原、微丘区、重丘区3类,分别取值0.2,0.5和0.8;特征属性A11所在地区可按中国各省份分别取值0.3,0.6和0.9。对于同一工程项目的不同地段存在不同特征属性时,则采用加权求和的方法[4]。
所以,设C={C1,C2,…,Cn}为公路项目案例集,C1,C2,…,Cn为n个公路工程案例,任一案例可以表示为Cj=[cj1,cj2,…,cj11],cj1,cj2,…,cj11为各特征属性原始数值,为避免量纲的影响,利用公式(1)对各特征属性的原始值进行标准化处理,得到的结果为特征值rjk。因此,可以用rj={rj1,rj2,…,rjn}表示标准化处理后的案例。
(1)
1.2 基于OWA算子的公路工程特征属性赋权方法
由于各特征属性对工程造价影响不同,因此在相似案例检索中的重要程度也就不同,所以应对各特征属性进行赋权。
目前常用的赋权方法(如专家打分法、TOPSIS法、层次分析法等) 多基于专家的主观判断进行打分,然后得出权值。这些方法得到的结果容易受专家主观偏好产生的极值影响,如果不对这些极值进行处理,很难保证权值的合理性。针对这一问题,基于OWA(Ordered Weighted Averaging)算子来计算各公路工程特征属性的权值。OWA算子是一种群集结方法,它由Yager教授于1988年提出[18],具有量化表示因素间影响的作用[19],将其引入到权值计算中可以减少上述极值对权值结果的不利影响,其计算步骤如下:
(1)邀请z名专家根据自身知识与经验给出各公路工程特征属性Ai的重要性分值,并将结果由大及小排列,得到数组h1≥h2≥…≥hk≥…≥hz。
(2)利用排列组合数对数组(h1,h2,…,hz)进行处理,得到赋权向量βk:
(2)
式中,根据二项式定理,
(3)
(3)利用赋权向量βk对数组(h1,h2,…,hz)进行加权求和,得到公路工程项目特征属性Ai的绝对权值w′i:
(4)
(4)将绝对权值w′i归一化得到相对权值wi:
(5)
1.3 基于灰色关联分析的相似案例检索
在CBR中,如何快速准确地从案例库中检索出目标案例的相似案例,是利用案例进行推理的关键[20]。相似案例的检索是通过目标案例与案例库中各案例间的相似度来进行的。常用的案例相似度计算方法有两种,一种是基于目标案例与相似案例之间“距离”的几何模型方法[21],另一种是灰色关联分析法[22]。前者侧重于计算案例间的绝对相似度,若可行,则通常较为简单快捷;后者则基于整个案例库,计算的是案例间的相对相似度,可以适用于更多情形,因此本研究利用灰色关联分析法计算相似度,其方法如下。
首先,目标案例r0和案例rj某一特征属性的相似度ξj(k)可以表示为:
(6)
式中,ρ为分辨系数,引入它是为了避免计算受极值影响,通常ρ∈[0,1],一般取ρ≤0.5。
最终两个案例的相似度sj为:
(7)
1.4 基于BP神经网络的重用
检索到相似案例以后,便可利用相似案例对目标案例的工程造价进行推理。CBR的本质是利用相似案例的特征属性与解的关系对目标案例进行求解,这类似于一种回归。BP神经网络是一种回归分析模型[23],当样本足够多时,它便会呈现出强大的自适应特征。同时,足够多的案例样本也是CBR模型能够实现有效推理的必要条件之一,因此满足BP神经网络的使用前提。所以本研究基于BP神经网络进行案例重用。
BP神经网络的结构主要包括输入层、隐含层、输出层和各层之间的传递关系。本研究的BP神经网络模型中,输入层包含11个元素,对应1.1节中总结的11个公路工程特征属性;输出层包含1个元素,即工程造价;隐含层节点数为2×11+1=23,最终建立的模型如图1所示。BP神经网络的学习过程分为正向传递和反向传递。正向传递时,输入层信息经隐含层传递至输出层。若输出层输出较期望结果差异较大,便进入反向传递,并利用误差逐次修正各层间的连接权值,然后再次进行正向传递。上述过程迭代多次后可使模型输出结果不断向期望值靠拢,直到满足要求,输出目标案例工程造价估算值。
图1 BP神经网络框架Fig.1 Framework of BP neural network
2 实例应用
利用文献[4]中23条高速公路预决算资料[4],案例C0作为目标案例,案例C1~C22作为案例库,对本研究提出的模型展开实例验证。需要指出的是,由于不同年份工业生产成本水平不同,需要不同年费案例造价费用根据2000年生产消费水平进行换算,各案例原始特征值及根据我国国家生产价格指数(PPI)换算后的造价如表2所示。
首先利用式(1)对各特征值进行标准化处理。然后利用OWA算子对公路工程特征属性进行重要性打分,在专家打分时,为使打分结果更加规范和统一,规定打分结果为0.5的整数倍,数值区间为0~10.5位专家给出的公路工程项目特征属性的得分和根据式(1)和式(2)计算得到的绝对权值和相对权值如表3所示。
由表3中的数据,利用式(6)~(7)分别计算目标案例0与案例1~22之间的相似度,结果如表4所示。
表2 各案例特征值与造价Tab.2 Eigenvalues and cost of each case
表3 各特征属性得分结果Tab.3 Scoring result of each characteristic attribute
表4 相似度计算结果Tab.4 Similarity calculation result
以0.7为相似度的阈值,检索出的相似案例有14个,即C1,C2,C3,C4,C8,C9,C11,C12,C13,C14,C15,C16,C19,C20。以上述14个案例为样本,在matlabR2015b中构建如图2所示的BP神经网络。调用matlab工具箱,设置相关参数:选用Premnmx函数进行归一化处理,传递函数均选用tansig函数,训练函数选用traingdm函数,反归一化函数选用Postmnmx,最大学习次数为10 000次,目标误差为6.5×10-4,初始学习速率设为0.01。
将该网络对样本进行训练,经过6 540次迭代后,误差小于目标误差6.5×10-4满足设定的精度要求,训练停止。BP神经网络训练误差曲线如图2所示。
图2 BP神经网络训练误差曲线图Fig.2 Training error curve by BP neural network
用训练后的网络对目标案例0的工程造价进行结果为1 794.90万元/km的估算,这与竣工结算后得到的实际值1 725.81万元/km相比,相对误差仅4.003%。这说明该模型具有良好的估算精度,能为投资决策提供参考依据。
3 结论
本研究出于在投资决策阶段将历史公路工程案例用于对新建公路工程造价进行估算的目的,考虑到工程投资决策阶段工程资料与信息不够详细明确的问题,建立了一种基于案例推理的公路工程造价估算模型。该模型通过历史工程案例对新建公路工程造价进行估算,其实质是充分挖掘蕴含在工程案例中的实践经验与知识,是对我国长达数十年的路网建设过程中取得的工程成果的二次利用。
通过实例分析得到了以下结论:
(1)该模型仅需新建公路工程项目的11个特征指标便能实现对其工程造价的估算,构造方法简便、直观,有利于该模型的应用。
(2)利用OWA算子计算各特征属性权重可以避免常规赋权方法在专家打分过程中由于专家主观偏好产生的极值对结果产生过大影响的问题,所得权重更科学、客观。
(3)在案例重用中,采用BP神经网络根据相似案例对目标案例造价进行估算,充分发挥了BP神经网络强大的自适应和自学习能力,估算结果也更为精确、可靠。
(4)经实例分析,效果理想。证明了该模型的有效性和合理性,即使是在工程资料、市场信息等要素不太明确的投资决策阶段,仍然能取得准确的估算结果,可以当做公路工程前期投资决策阶段的估算工具,具有推广及应用价值。