APP下载

基于BP神经网络的建筑施工事故非线性组合预测

2015-12-29王旭峰沈斐敏

关键词:建筑业灰色死亡率

王旭峰,沈斐敏

(福州大学土木工程学院,福建福州 350116)

0 引言

建筑业是我国国民经济的支柱产业之一,2013年建筑业总产值已达159 313亿元.然而由于行业特点、工人素质、管理难度、文化观念和社会发展水平等原因,建筑业安全生产形势严峻,已经成为我国所有工业部门中仅次于采矿业的最危险的行业[1].因此,提高建筑业安全生产管理水平,减少从业人员生命财产的损失具有重大意义.事故预测作为安全管理工作的一个重要内容,是指在对已发生事故的历史资料进行统计、分析和处理的基础上,应用一定的预测技术和手段,对预测对象的安全状况和趋势进行预测和预报[2].它能为生产企业制定安全生产目标和安全管理部门进行宏观决策提供理论和技术支持.

当前,应用于安全事故定量预测的方法主要包括时间序列预测法、马尔科夫预测法、灰色预测法、神经网络预测法、回归分析预测法等,其中每种预测方法都有其自身的特点.如果单单依据预测误差的大小或者操作复杂性的难易就将某种预测法摒弃或排除,这可能会失去安全事故预测中的大量有效信息[3].组合预测可以综合利用各种预测方法提供的有用信息,以有效提高预测精度,改变由于各预测模型自身局限性带来的预测误差[4].但如何建立有效的组合预测模型,实现各种预测方法的优势互补,从而达到预测精度的提高,仍然有待进一步研究.

因此,本文根据1999-2011年建筑施工事故统计数据的特点,选用非线性回归、三次指数平滑、灰色预测法分别建立单项预测模型.并以综合利用各单项预测模型所提供的有效信息为基础,建立线性组合预测模型,并建立基于BP神经网络的非线性组合预测模型.对上述各预测模型的拟合与预测精度进行比较,证明所建非线性模型能够有效实现各单项预测模型的综合利用,其拟合及预测精度均比其它模型有了较明显的提高.最后用其对未来几年我国建筑施工事故进行了预测.

1 预测指标的确定

参考近年来研究建筑施工事故预测的文献,当前用来衡量建筑业安全生产水平的指标主要有单一指标,如建筑事故次数[5]和建筑事故死亡人数[6],选择这类指标在一定程度上体现了行业安全生产水平,但同时存在未综合考虑生产规模的问题.例如同期相比北京的建筑事故次数以及死亡人数数据比西藏的要高,但不能简单据此判断北京的建筑业安全生产水平比西藏的低,应该同时考虑到两地建筑业规模之间的区别;以及复合指标如百万工时事故次数[7-8],这类指标能够较为综合地体现某时段的行业安全生产水平,但工时数据往往由各施工企业单独统计,并未对外公开.因此,本文选择综合考虑事故死亡人数以及建筑业总产值的复合指标百万元产值死亡率用来衡量建筑业安全生产水平[9],也将之作为本文的预测研究对象(详见表1).

表1 1999~2013建筑施工事故统计数据Tab.1 Construction accident statistics from 1999 to 2013

2 单项预测模型

以1999-2010年全国建筑施工事故百万元产值死亡率为样本建立单项预测模型,以2011-2013年数据作为模型预测精度的检验,其拟合与预测曲线如图1所示.从图1可看出,样本数据呈现明显的非线性,因此所有的线性预测模型都不予考虑.

图1 各预测模型的百万元产值死亡率拟合与预测曲线Fig.1 Fitted and forecasted curves of mortality of per million output value using different models

2.1 非线性回归模型

应用SPSS软件对样本数据进行曲线估计,其中指数曲线所建模型的判定系数R2=0.916,F=109.6,sig=0,模型显著,拟合精度高[9],所得的预测模型为:其中:t为预测时间;x^t为时间t时的预测值.

利用上述模型所得计算结果见表2,其拟合平均误差为14.36%,预测平均误差为24.20%.拟合及预测误差均较大,这是由实际数据与理想曲线有较大偏差造成的,因此非线性回归的精度往往较低.

表2 各预测模型的百万元产值死亡率拟合与预测数据Tab.2 Fitted and forecasted data of mortality of per million output value using different models(人·百万元-1)

2.2 指数平滑

指数平滑法只需要历史数据资料,是一种比较简单易行、能快速地获得结果的预测方法,三次指数平滑是在二次平滑值的基础上又进行了一次平滑,从而使其能够跟踪时序的非线性变化趋势[9-10].考虑到样本数据是非线性的时间序列,选择三次指数平滑法对其进行拟合.

指数平滑加权系数a代表模型对时间序列变化的反应速度[11],本文经过试算比较,取a=0.48.另根据经验取初始平滑值为1999年百万元产值死亡率.应用Matlab建立预测模型,所得计算结果见表2,其拟合平均误差为31.37%,预测平均误差为5.67%.其拟合误差较大,预测精度较高,这是因为前期数据的时序变化率较大,而后期其时序变化率逐渐趋于稳定造成的.

2.3 灰色模型

灰色系统理论是邓聚龙教授1982于年创立的[12],灰色预测方法己广泛应用于各个领域的预测之中,适合于随时间序列变化不大的数据序列的预测[7,13].应用Matlab建立灰色预测模型,所得计算结果见表2,其拟合平均误差为3.68%,预测平均误差为10.48%.其拟合精度较高,预测误差较大,但其对2011年及2012年的预测误差均小于5%,这与灰色预测模型预测区间较短[3]的特点相符合.

3 组合预测模型

3.1 线性组合预测模型

当式(2)中p取1时,就得到线性加权组合预测模型.建立该模型的关键在于确定各单项预测模型的权重.本文以预测误差平方和最小为准则[15-16]求解上述问题,即:

其中:et为时间t时组合预测值与实际值的误差;xt为时间t时的实际值;x^t为时间t时的组合预测值.

式(2)、(3)所确定的是一个具有线性约束的非线性函数最小值问题,利用Matlab编制程序,以前述各单项模型的计算结果作为输入值,可得各单项预测模型权重系数,所得线性组合预测模型如下:

其中:x^2t为时间t时的三次指数平滑预测值;x^3t为时间t时的灰色模型预测值.所得计算结果见表2,其拟合平均误差为5.26%,预测平均误差为9.33%.

3.2 基于BP神经网络的非线性组合预测模型

上述线性组合模型是式(2)中p值取1的结果,是最简单的形式.p的取值大小势必会影响组合预测模型的精度,但如何确定p的最优值目前还没有一个明确的方法[15],即p取何值才能实现各单项模型的最优组合依然有待研究.然而,如果能够在避开p取值问题的同时有效利用各单项模型的信息,就能从另一个角度进行组合建模,而BP神经网络恰好具备实现这一思路的特性.

BP神经网络,是基于误差反向传播算法的人工神经网络.由于BP神经网络具有高度的非线性映射能力、有很强的容错性和很快的处理速度、强有力在线自学习和自适应能力,因此它可以实现输入和输出的任意非线性映射[17-18].即在实现各单项预测模型拟合、预测值与实际值的非线性映射的同时,不用考虑上述p的取值,也不用求解各单项预测模型在组合模型中的权重,只需确定合适网络结构以及激活和训练函数,就能够构建基于BP神经网络的非线性组合预测模型.

预测模型构建分三步:

1)输入因子与输出因子.将前文所构建的三种单项预测模型对1999-2010年的拟合结果作为输入因子,各年的实际百万元产值作为输出因子,从而确定模型的输入节点数为3;输出节点数为1.

2)激活函数和训练函数.激活函数采用tansig-purelin,训练函数选择带自适应学习率和动量的用梯度下降法的训练函数traingdx.网络进行训练时,学习速率选为0.01,训练次数上限为10 000次,训练精度要求为 0.000 1.

3)隐含层神经元数目.理论证明3层BP神经网络,当各层神经元均采用S型函数,可满足任意复杂的非线性函数拟合逼近问题[19].因此本文选择3层BP神经网络模型,即3-j-1结构.当前对于隐含层神经元数目j的确定还没有统一的结论,但普遍认为增加隐含层神经元数目可以提高模型的精度,主要的观点有[20-21]:

其中:j为隐含层神经元数目;s为输入层节点数;l为输出层节点数.

结合上述观点,分别取隐含层神经元个数为10、20、30和40进行了模拟训练,结果表明,只有当隐含层神经元个数为30个时,该网络的收敛速度及训练精度能够满足要求(见图2),进而取隐含层神经元为29、31进行模拟训练,得到与上一步相同的结论,因而最终确定的是3-30-1的神经网络结构.

利用Matlab编制程序,所得计算结果见表2,其拟合平均误差为0.46%,预测平均误差为1.88%.

图2 不同隐含层神经元网络训练结果Fig.2 The training results of neural network with different hidden layer

4 结果及分析

利用所构建的单项及组合预测模型进行计算,所得结果见表2.由表2可得以下3个主要结果.:

1)对于各单项预测方法而言,拟合精度较高的不一定预测精度也高,反之拟合精度较低的,也可能预测精度却比较高.证明了各单项预测方法都有其自身特点的论点.

2)线性组合预测模型的拟合与预测精度均较高,但其拟合精度低于灰色模型,预测精度低于三次指数平滑.证明线性组合在一定程度上综合了各单项预测方法提供的信息,但并不是最优组合模型.

3)基于BP神经网络的非线性组合预测模型的拟合及预测精度较之其它预测模型均有明显提高.因此,该组合模型较好地综合利用了各单项预测方法提供的信息,有效地提高了拟合和预测精度,将BP神经网络应用于非线性组合预测模型的构建是可行的.

鉴于前述,应用基于BP神经网络的非线性组合预测模型,以1999-2013年数据为样本,对2014-2016年全国建筑施工百万元死亡率进行了预测,结果见表3.

表3 2014-2016年百万元死亡率预测值Tab.3 Forecasted results of mortality of per million output value from 2014 to 2016

5 结语

1)以提高全国建筑施工事故的预测精度为目的,根据统计数据的特点,以百万元产值死亡率为预测对象,分别建立了非线性回归模型、三次指数平滑模型、灰色预测模型,以最小误差平方和为准则建立了线性组合预测模型,基于BP神经网络建立了非线性组合预测模型.

2)拟合及预测结果证明各单项预测模型都有其自身特点,均能提供部分有效信息,线性组合模型在一定程度上综合利用了各单项模型的信息,但不是最优组合模型.

3)基于BP神经网络的非线性组合较好地利用各单项模型所提供的信息,拟合及预测精度较其它模型均有明显提高.证明应用BP神经网络进行非线性组合建模是可行的.

4)应用基于BP神经网络的非线性组合预测模型对2014-2016年全国建筑施工百万元死亡率进行了预测,结果表明,今后几年建筑安全生产的发展将会较为平缓,需要从管理或技术角度进行创新,以提供新的发展动力.

猜你喜欢

建筑业灰色死亡率
动物“跨界”建筑业
走路可以降低死亡率
甘肃建筑业将采用清洁能源降低碳排放
春季养鸡这样降低死亡率
新冠肺炎的死亡率为何难确定?
毕赛端 “从事建筑业,我乐在其中”
浅灰色的小猪
急性烂鳃、套肠、败血症…一旦治疗不及时,死亡率或高达90%,叉尾鮰真的值得养吗?
灰色时代
她、它的灰色时髦观