随机森林算法在建筑供应链风险评价中的应用
2017-09-04赵亚星王红春
赵亚星,王红春
(北京建筑大学 经济与管理工程学院,北京 100044)
随机森林算法在建筑供应链风险评价中的应用
赵亚星,王红春
(北京建筑大学 经济与管理工程学院,北京 100044)
将随机森林算法应用到建筑供应链风险评价中,建立了基于随机森林的建筑供应链风险评价模型,并通过实例验证,证明了该方法在建筑供应链风险评价应用中的可行性,为建筑供应链的风险评价提供了一种新的思路。
随机森林算法;建筑供应链;风险评价
1 引言
“横向一体化”思想形成了一条从供应商到制造商再到分销商、零售商的贯穿所有企业的“链”[1]。这条“链”把所有相邻企业连接起来形成供应链,供应链上的节点企业必须同步、协调运行,才能使供应链上所有企业受益,这就是供应链管理思想。供应链的思想最开始出现应用于制造业,上世纪80年代末开始,在建筑行业引进供应链管理的思想。根据美国建筑业有关资料统计,有效地进行建筑企业供应链管理可以使项目总成本降低30%以上。但是供应链管理作为一种新的建筑项目管理理念与方法,在提高项目效益的同时也增大了建筑供应链的风险。因此进行有效的建筑供应链风险管理显得尤为重要。
目前国内外对供应链风险评价及管理的研究已取得一些进展,程书萍等[2]针对传统工程风险管理与控制的不足,站在工程供应链的视角,从六个方面进行了工程供应链风险源的识别,并提出了应对策略。姜军等[3-6]运用模糊数学的相关理论建立了工程供应链风险评价指标体系,通过熵权法、AHP法等确定权重进行工程供应链风险的模糊综合评价。李晓燕等[7]将模糊层次分析方法应用到水利工程项目的风险评价中,并用工程实例验证了该方法的可行性。李静等[8]提出了基于三角模糊数的模糊网络分析方法,并将其应用到海上风电项目的风险评价。李美云等[9]运用模糊集理论和故障树结合,对引起建筑供应链失效的各风险因素进行分析,建立了建筑供应链失效的故障树。权俊珲[10]在传统失效模式与影响分析(FMEA)方法的基础上考虑了风险可控度,形成FMECA方法,实现对工程供应链风险的识别和评价。杨斯玲等[11]采用区间层次分析法进行指标赋权,依据约束理论和集对分析理论实现EPC建筑供应链不同范围不同层次下的风险管理。王娜等[12]运用BP神经网络进行风险评估,为建筑供应链风险评估提供了有力的支撑。刘志强等[13]在对EPC建筑供应链进行风险分析的基础上,构建了基于支持向量机的建筑供应链风险评价模型并进行了应用研究。
这些研究成果中运用的风险评价方法大致可以分为两类:第一类是传统的工程项目综合评价方法,应用最为广泛,但是其主观性强而且手工计算繁琐。第二类是智能化方法,典型代表是BP神经网络,该算法容易过度优化而且计算结果不稳定。随机森林算法的分类依据和神经网络不同,它的投票机制加强了分类器的准确率,而且它能够处理很高维度的数据,模型泛化能力强。本文将随机森林算法引入到建筑供应链风险评价中来,通过实例证明了该算法在建筑供应链风险评价中的可行性。
2 建筑供应链风险指标体系构建
2.1 建筑供应链风险
建筑供应链是“从业主的有效需求出发,以总承包商为核心企业,通过对信息流、物流、资金流的控制,从原材料采购开始至施工、竣工验收到交付使用后的维护等全过程中,将原材料供应商、工程机械设备供应商、设计分包商、施工分包商、业主等连成一体的功能网链结构模式。”由于建筑业是一个生产过程相似但产品种类截然不同的订单式生产活动,不同的建筑产品有不同的生产地点、不同时间和成本约束,因此,建筑供应链与制造业供应链具有完全不同的特征[14]。建筑供应链具有集中性、临时性、复杂性等特征。
建筑供应链存在于建筑产品生产的整个生命周期过程中,同时包括整个生命周期中的所有过程和组织。下游的客户(业主)的需求、设计方案的变化,上游的供应商不能按时提供原材料、机械设备,雨雪天气等导致工期延误,施工技术导致质量问题等都会造成建筑供应链效益低下。建筑供应链风险无处不在,无时不有。供应链主体企业进行协同合作的过程往往是一个互动博弈的过程,既包括各主体企业之间的利益博弈,还有各主体企业和供应链整体的利益博弈。因此建筑供应链风险具有互动博弈性和合作性。从供应链的角度分析,建筑供应链风险还具有传递性,建筑产品的设计、生产、完成等过程由多个节点企业共同完成,而供应链的链式结构会使每个节点企业的风险通过供应链流程在各节点间传递。而且供应链越长,中间过程越多越复杂,信息共享就越困难,建筑供应链风险的牛鞭效应就越严重,供应链效率相应的就会越低。
2.2 建筑供应链风险评价指标建立
从供应链管理的角度分析,建筑供应链的参与主体包括业主、总承包商、设计和施工分包商、材料设备供应商等。以项目总承包商为中心,建筑供应链的风险主要集中在总承包企业的内外部环境、分包商的设计与施工、供应商的材料设备采购等方面。根据指标体系设计的科学性、系统性及全面性原则,文章将建筑供应链总承包商的风险分为建筑设计分包商风险、材料设备供应商风险、建筑施工供应商风险以及总承包商企业外部风险和内部风险五个风险指标。其中二级指标有13个,分别是建筑设计分包商风险指标包括建筑及结构设计风险、与其他组织协调性;材料设备供应商风险指标包括供应商资信、物价变化、合同履约;建筑施工供应商风险指标包括项目工期风险、工程质量风险、项目成本风险、施工安全风险;企业外部风险指标包括政治社会和经济法律两方面;企业内部风险指标包括技术因素和管理因素两个方面。
3 基于随机森林模型的建筑供应链风险评价
3.1 随机森林
随机森林模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法,是取代神经网络等传统机器学习方法的新模型。作为一种组合分类器,如图1所示,其算法基本思想是[15]:①采用bootstrap抽样技术从原始数据集中抽取n个训练集,每个训练集的数据数量可以和原数据集数据数量相同或者略小。②为每一个训练集分别建立分类回归树,共产生n棵决策树构成一片“森林”,这些决策树均不进行剪枝。③在每棵树生长过程中,并不是选择全部M个属性中的最优属性作为内部节点进行分支,而是从随机选择的m≤M个属性中选择最优属性进行分支。在决策树生成过程中,m的值保持不变。④集合n棵决策树的预测结果,采用投票的方式决定新样本的类别。
图1 随机森林基本思想
3.2 样本数据的获取
本文中模型训练所需数据使用了文献[13]中用于建筑供应链风险评价的案例数据,给出了20个核心企业对应建筑供应链风险的13项评价指标的初始数据值,其中专家评价值为测试目标值。在文献中获取数据基础上,将数据输入随机森林模型之前将原始样本数据进行处理,使其转化为闭区间[0,1]上的无量纲性指标值,在操作中采用的数据处理方法为归一化。模型训练所使用的原始数据具体见表1所示。结合前面建立的评价指标体系,对原始数据中的前16个企业的供应链风险状况进行分析,并对后4个企业面临的风险进行预测。
为了更直观地了解所有样本总的风险水平,首先将初始数据中专家评价值分为三个类别:第一类为低风险,评价分值落在0.4以下;第二类为中风险,评价分值落在0.4-0.7之间;第三类为高风险,评价分值落在0.7-1.0之间。
3.3 供应链风险评价以及结果分析
建筑企业供应链风险评价过程是一个从定性到定量再到定性的过程,将定性因素经过随机森林模型转化为定量结果输出,然后综合评价集和输出结果对建筑企业供应链风险作出定性评价。与初始值处理一致,评价集设为低风险(<0.4),中风险(0.4-0.7),高风险(>0.7)三个等级。本例中,用户设定的最大树深度(生长树的数目)Ntree为500,在每一个分裂节点处样本预测器的个数mtry=3。运用Matlab7.8.0程序进行仿真计算,将表1中前16组数据作为训练样本对网络进行训练,后4组数据作为测试样本对建立的网络进行仿真检验。
表1 初始数据
选取前16组数据作为训练集样本数据对网络进行训练,得到的训练结果值与期望输出值的比较见表2。
表2 训练结果与期望输出的比较
从训练结果与期望输出的比较可以看出模型训练已经完成,对于训练集样本数据的训练正确率均达到100%。运用训练好的模型,将测试集4组数据输入到模型中,得到测试样本的输出与目标输出也到达预期要求时,该模型就可以对企业供应链风险进行评价。测试输出及评价结果见表3。
由表3可以看出,模型对于测试集的4组样本数据测试结果正确率均达到100%,而且可以直观看出原始数据中第17、18个企业面临的风险水平较高,应引起足够重视;第19个企业面临的风险水平为中等,应采取一定措施应对风险;第20个企业面临的风险水平较低,也要采取一定措施尽量降低风险造成的损失。
表3 测试结果及风险排序
4 风险应对与控制
在评估了相关风险之后,风险管理人员应当采取一定的措施应对风险,以求将风险降至可接受的程度。首先,需要根据风险程度以及影响效果等制定风险应对计划,然后按照风险应对计划执行,并不断确定和交流对照原计划所取得的进展,定期报告风险状态,最后不断校正偏离计划的情况,并将校正的相关内容记录下来。风险应对的措施有四种:风险回避、风险降低、风险转移和风险自留。随着建筑供应链的运作与发展,环境的变化可能使原来评估的风险发生变化,也可能产生新的风险,因此需要对风险管理的执行情况不断检查、评价、指挥和协调。
对总承包商来说,制定风险应对计划需要确定由建筑供应链上的哪些节点企业负责处理每项风险,以及采取什么措施,并对其进行监控。例如,本文案例中的项目工期风险、工程质量风险、项目成本风险和施工安全风险应由建筑施工分包商负责处理,为控制风险可采取的具体措施有:选择业务素质高、经验丰富的总承包负责人管理项目;严格择优选择承包队伍;采用科学合理的方法对施工质量、安全、成本进行跟踪监控。建筑结构设计的风险主要来自于建筑设计分包商,可以通过健全和完善图纸会审机制实行动态设计,严格择优选择设计单位,通过设计方案优选、设计方案可实施性研究以及在全寿命周期内进行设计沟通等实现对整个项目的设计管理。材料设备供应商的风险主要通过严格选择供应伙伴、多元采购、合理库存与利益分配机制等策略来应对。
在整个项目全寿命周期内严格按照风险应对计划逐步落实,并跟踪观测实施结果。如果风险应对计划的效果显著,则重新进行建筑供应链风险因素识别;如果风险应对计划的实施没有解决问题,则重新制定风险应对计划,直到风险消除或风险发生后的影响降至可接受范围内。
5 结论
风险管理是建筑工程项目成功的关键,风险评价又是风险管理的重要内容。文章把随机森林算法应用到建筑供应链风险评价过程中来,建立了基于随机森林的建筑供应链风险评价模型,通过对某建筑供应链上的核心企业面临的风险评价实例进行验证,文章得到了以下结论:
(1)文中运用随机森林算法模型对20个核心企业所对应的建筑供应链风险进行评价,可以得出随机森林模型的评价结果与文献[13]中运用SVM算法分类结果一致,这表明随机森林算法在建筑供应链风险评价中应用的可行性。
(2)从风险评价得到的结果可以直观看出,原始数据中第17、18个企业面临的风险水平较高,应引起足够重视;第19个企业面临的风险水平为中等,应采取一定措施应对风险;第20个企业面临的风险水平较低,也要采取一定措施尽量降低风险造成的损失。
(3)本文中用到的原始数据是通过对建筑供应链上核心企业进行调研与专家咨询相结合的方式获取的,这使得风险评价具有一定的主观性,在以后的研究中需要继续改进,寻找一定的方法避免风险评价的主观性。
[1]马士华,林勇.供应链管理[M].北京:机械工业出版社,2010.
[2]程书萍,张德华,李真.工程供应链风险源的识别与控制策略研究[J].运筹与管理,2012,(4):244-248.
[3]姜军.基于多层次模糊综合评价法的工程供应链风险评价[J].公路交通科技,2014,(10):126-129.
[4]李敉,郑芳.模糊综合评价法在工程供应链风险管理中的应用[J].物流工程与管理,2013,(11):82-84.
[5]肖文珍,刘振元,钟卫华.工程供应链风险的多层次模糊综合评价[J].科技进步与对策,2010,(19):158-160.
[6]范力勇.建筑供应链风险管理体系研究[J].物流科技,2010, (4):93-95.
[7]李晓燕,姜艳丽,马清瑞.基于模糊层次分析法的水利工程项目风险性综合评价[J].科技创新导报,2016,(8):34-35.
[8]李静,孙亚胜.模糊网络分析在海上风电项目风险评价中的应用[J].辽宁工程技术大学学报(自然科学版),2011,(1):96-99.
[9]李美云,宋乔.建筑供应链风险模糊故障树评估[J].辽宁工程技术大学学报(自然科学版),2014,(7):927-931.
[10]权俊珲.FMECA法在工程供应链风险评价中的应用[J].人民黄河,2016,(7):119-122.
[11]杨斯玲,蒋根谋.基于约束理论和集对分析的EPC建筑供应链风险管理[J].技术经济,2016,(8):111-117.
[12]王娜,杜才珍.基于BP神经网络的建筑企业供应链风险评价模型研究[J].城市建设理论研究(电子版),2014,(17):509-510.
[13]刘志强,张方明.建筑供应链风险评价研究[J].物流科技, 2012,(1):18-21.
[14]王红春,郭立.价值管理在建筑供应链中的应用研究[J].建筑经济,2009,(3):88-90.
[15]黄衍,查伟雄.随机森林与支持向量机分类性能比较[J].软件,2012,(6):107-110.
Application of Stochastic Forest Algorithm in Risk Evaluation of Construction Supply Chain
Zhao Yaxing,Wang Hongchun
(School of Economics&Management Engineering,Beijing University of Civil Engineering&Architecture,Beijing 100044,China)
In this paper,we applied the stochastic forest algorithm in the risk evaluation of a construction supply chain to build the construction supply chain risk evaluation model and then through an empirical demonstration,proved the feasibility of this method in the risk evaluation of construction supply chains.
stochastic forest algorithm;construction supply chain;risk evaluation
F274;F407.9
A
1005-152X(2017)08-0136-04
2017-06-30
国家自然科学基金“基于大数据的供应链协同机制研究”(61472027)
赵亚星(1993-),女,河南濮阳人,硕士研究生,研究方向:物流与供应链管理、建筑供应链;王红春(1976-),女,湖北荆州人,北京建筑大学经济管理与工程学院教授,研究方向:物流与供应链管理。
doi∶10.3969/j.issn.1005-152X.2017.08.031