基于投影寻踪-随机森林的制造企业供应链稳定性评价
2022-04-13王雪原
王雪原, 李 姗
(哈尔滨理工大学 经济与管理学院,黑龙江 哈尔滨 150080)
0 引言
制造企业因涉及材料、设备、资金、市场等资源规模高于一般企业,所以更需利用外部供应链弥补自身资源数量、种类丰富性不足的问题,而日本对韩国半导体材料的断供事件、美国商务部对中兴通讯的出口限制事件等,向全世界展示了制造企业供应链稳定性对于企业有序、健康发展的重要性,因此维持制造企业供应链稳定成为企业管理的重要内容。
当前关于供应链稳定性研究主要集中在两个方面,一是将供应链作为整体,研究其稳定性的影响因素并据此设计评价指标体系与评价方法,合适于判定制造企业供应链宏观整体状态;二是将供应链进行解析,分析供应链内部节点联结特征、供应资源传送物流与路径等,判定供应链内部运行过程存在的问题,进行模型优化设计或仿真计算等,适合为单个制造企业供应链管理提供方法支持。鉴于本文期望为我国制造企业供应链稳定性评价提供宏观整体性决策支持,因此采用第一种方法。第一种方法研究的现有成果在指标体系设计时缺乏有效的理论论证,影响指标体系设计科学性;同时,评价研究过程不够全面,对“指标采集——指标筛选——指标重要性判定——稳定性评价——检验与分类”的全环节、系统性研究不足,无法为制造企业供应链稳定性评价与管理提供完整的方法支持与参考。
因此,本文将按照全流程、系统研究思路,对制造企业供应链稳定性评价的不同环节开展方法设计,为供应链稳定性管理提供支持。
1 文献回顾
基于供应链内部结构的稳定性研究,重点以供应链成本、供货能力和流通产品的数量为参考指标做出稳定性评价(刘慧等)[1],也有考虑节点响应时间,从供应链重构、供应链收益分配和供应链响应三方面设计供应链响应时间决策与监控模型,从而维持供应链稳定的(Jorn-Henrik)[2]。
在指标体系设计方面,贾鹏等对四维平衡记分卡进行拓展,设计五维稳定性评价指标体系,应用权值因子法对指标赋权[3]。也有学者设计模型判定指标体系合理性,杨瑾采用协同性、可靠性等潜变量反映供应链情况,利用验证性因子分析方法从匹配度和稳定性方面来验证评价模式合理性[4]。
在稳定性评价与预警方面,有学者从数据挖掘视角出发,采用关联规则和物联网技术,对整个供应链系统实行即时监控和自动预警(Jing等)[5]。也有学者借助计算软件,用BP神经网络建立预警系统,对系统状态进行评估(Liu等)[6]。也有学者基于设计的稳定性评价指标体系开展评价与预警研究,一部分对影响稳定性的核心因素进行识别,从而判定管理重点,如程铁军等从网络舆情预警视角,运用Fuzzy-DEMATEL法对风险因素开展实证研究[7]。Schoenherr等利用层次分析法,通过迭代和结构分析,识别出17种造成供应链风险的因素[8]。该类研究虽然能识别出稳定性管理重点,但却无法得到供应链稳定性整体状态。因此,另一部分学者则利用评价指标等,对供应链整体稳定性进行评价分析,如黄星等采用加速遗传算法对投影寻踪模型求解,实现风险预警[9]。还有学者基于评价结果进行后续分类研究,如李健等采用构建PSO-SVM供应链预警模型,对风险进行分类[10];宋宝娥等也界定了供应链安全预警警限和阈值[11]。柴国荣等则从时间维、空间维、关系维、逻辑维和要素维对风险预警识别、测评等进行系统设计[12]。这些为制造企业供应链稳定性研究提供了有效方法借鉴与参考,然而针对制造企业供应链的、涵盖整体环节的稳定性评价的系统性、综合性研究还有待完善。
2 制造企业供应链稳定性指标提取
本文采用扎根理论对制造企业供应链稳定性影响因素进行萃取,具体步骤如下:
(1)开放式编码。对获取的原始资料进行逐条分析并概括,将文本信息概念化,找出其关联性与相近性,从而提炼更加抽象的范畴。按照扎根理论编号规则,对获取范畴进行编码,共提炼出23个,具体结果如表1所示。
表1 制造企业供应链稳定性影响因素初始概念提取
(2)主轴式编码。在提取初始概念基础上,根据不同概念间相关关系,进行语义编码组合,经过反复归纳,将具有最强关联性的范畴整合在一起,最终获得3个主范畴和6个副范畴,如表2所示。
表2 主轴式编码形成的主范畴与副范畴
(3)选择式编码与饱和度检验。该阶段是在获取主副范畴的前提下,经过反复推敲,最终获得完整的影响因素框架体系。从华为、联想等企业选取从供应链管理的10位专家进行访谈,分析提取概念与范畴的完整性,最终确认表2中范畴、副范畴与主范畴形成的制造企业供应链稳定性影响因素扎根理论模型已达到饱和状态。
3 基于云模型的制造企业供应链稳定性评价指标筛选
基于扎根理论获得众多稳定性影响因素,为进一步凝练指标,本文采用云模型方法确定指标重要性,并基于重要性筛选指标,构建指标体系。
(1)云模型。设U={x}为定量论域,用精确数值表示,T是U上自然语言值。设CT(x)隶属度函数,反映T关于x所表达定性概念的“真实程度”,云模型即为T在U上的分布。∀x∈U,x→CT(x),x为(x1,x2,…,xn)每一个x为一个云滴,大量云滴聚集便形成云图。云模型数值特征分别为:期望(Ex)、熵(En)、超熵(He),是定性定量概念转换的基础。
(1)期望Ex表示云滴x在U上分布的期望,是定性概念的定量化。
(2)熵En代表一种模糊程度,在云图中反映云的“跨度”,En越大随机性就越大。
(3)超熵He代表熵的熵,反映熵的不确定性。He反映云的“厚度”,He越大,云厚度越大,云滴越离散,隶属度随机性越大。
正向云发生器(FCG)的映射过程实现了定性概念的定量化,体现从定性概念中获取定量数值的范围与分布规律。将云模型的三个数值特征(Ex,En,He)与想要输出的云滴数N输入正向云发生器中,通过N个云滴实现映射。
(1)将指标重要性划分为5个等级,每个等级对应一个得分区间。分别为自然语言中“非常重要”、“较重要”、“一般重要”、“次重要”、“不重要”。对应分值分别为:“[0.8,1]”、“[0.6,0.8)”、“[0.4,0.6)”、“[0.2,0.4)”、“[0,0.2)”。每一个分数区间表示为(xi-1,xi),其中i=1,2,…,5;等级范围及定性语言描述见表3。
表3 等级范围及定性语言描述
(2)按照上述方法确定各得分区间(Ex,En,He),第i个得分区间数字特征记为(Exi,Eni,Hei),其中具有双边约束的评语如“次重要、一般重要、较重要”,对应取值同时具有上下限。期望值Ex和熵值En计算公式为:Ex(Cmax+Cmin)/2及En=(Cmax-Cmin)/6。超熵He=k可依据评语本身模糊度来调整,在此取k=0.005。对于评语不重要、非常重要等,因只有上限或下限,可将0和1作为期望值,其熵值可设定为各对称云模型熵值的二分之一,自然语言所对应云数字特征如表4所示。
表4 云数字特征
(3)设共有m个影响供应链稳定性的指标,咨询N个专家对第j个指标自然语言意见,j=1,2,…,m,统计第j个指标各得分区间的专家人数,设第j个指标不同得分区间的专家人数为(Nj1,Nj2,Nj3,Nj4,Nj5)。
表5 指标专家评价结果
根据指标得分进行排序,筛选出得分高于0.6的9个指标——战略管理互惠合作、开放合作、协同关系、通畅性、全过程管理、事后管理、多元性、充足性,从而构建出制造企业供应链稳定性综合评估指标体系。
4 基于投影寻踪的制造企业供应链稳定性评价
投影寻踪模型常用来评价受多个因素影响的复杂问题,基本思想是将高维数据提供一定的组合投影到低维子空间上,寻找使投影指标函数达到最优的投影值,根据投影值确定高维数据结构特征。研究中通常采用粒子群与萤火虫算法对投影指标函数进行优化,但这些算法在实际操作过程中容易出现局部最优,寻优性能大大减弱,而且运算速度较慢,因此本文选用较为成熟的加速遗传算法进行求解,该方法解决了遗传算法编码较为繁琐、计算量大且计算十分缓慢的问题,寻优性能大大增强[27]。
(1)指标数据来源与指标指数构建。本文以华为、联想、中兴等企业不同部门相关人员为调查对象开展问卷调查,最终收回191份问卷,有效问卷为172份;其次,向在职工程硕士班发放,通过其工作单位内滚雪球方式,收回有效问卷294份。样本总数466份,将基于云模型所确定的9个指标数据作为分析数据。
(2)指标归一化处理。xij为第i个样本第j个指标值,由于各指标量纲不同或数值范围相差较大,因此在建模之前需要对指标进行归一化处理并消除量纲。正指标采用yij=[xij-minxj]/[maxxj-minxj]归一化,逆指标采用yij=[maxxj-xj]/[maxxj-minxj]。式中:Yij——归一化的指标序列;xij——为第i个样本第j个指标的评价值;minxj与maxxj分别为第j个指标的最小和最大值。
Sz为投影值zi的标准差,Dz为zi的局部密度,R为局部密度的窗口半径,其取值与样本的特性有关;rij为样本之间距离;ut为一单位阶跃函数。当t≧0时,t=1;t<0时,t=0。
本文基于加速遗传算法对投影指标函数开展优化,使用matlab R2016b软件对模型编程求解,令种群规模初始值为400,交叉概率Pc为0.8,变异概率Pm为0.2,经过7次迭代计算,最终得到的最佳投影方向向量为a=(0.2586,0.2629,0.3045,0.3412,0.3230,0.4626,0.4159,0.2993,0.2719),即互惠合作B5>战略管理C1>协同关系B2>开放合作B3>通畅性A6>全过程管理C4>事后管理C9>充足性A4>多元性A1。a值代表相应各指标的权重。将所得的最佳投影方向带入公式,可计算出466家制造企业的投影值,进而确定其综合评价值。受篇幅影响,给出其中部分问卷综合评价值见表6。
表6 部分问卷的综合评价值
5 基于随机森林的制造企业供应链稳定性评价检验与分类
(1)随机森林方法。随机森林方法。随机森林常用于分类和预测研究,其核心思想是随机选择训练样本和特征参数用于分类。随机森林通过有放回的对样本进行抽取构建决策树,建立过程随机选择M个特征参数输入决策节点以控制其生长。对N棵分类树的分类结果进行整合,以投票方式确定最终结果。在随机森林中,任意一棵树的产生都具有随机性,相互独立且可完全生长,决策树中所有节点均能保证利用随机选择的特征参数进行最佳分裂[28],其计算过程如下:
(1)采用Bagging抽样方法,有放回地对训练集进行抽取,得到N个样本数据;进一步有放回的随机抽取M个特征变量得到自助样本集,由此产生T棵分类回归树,在此过程中均未被抽到的样本则构成T个袋外样本(out-of-bag,OOB)。
(2)自助样本数据对应的存储于分类回归树根节点处,按照最小不纯度原则从根节点开始选择某特征变量,分裂形成各个子节点。
(3)每棵树以最大限度递归形式,进行节点与分裂节点选择,当节点到达最大分解深度时,进行剪枝处理。为减少过拟合现象,可对节点的样本数目进行约束,若节点样本个数小于等于某个设定值时,节点不再进行分裂。
(4)将形成的T棵分类树组成随机森林,对样本进行测试,每棵分类回归树都对测试样例进行一次投票,样本从属于得票最多类别。
(2)基于随机森林稳定性评价检验与分类。根据投影寻踪计算得出的综合评价值,利用k-means聚类将466家制造企业分成4个预警等级,分别为低风险(1)、安全(2)、中等风险(3)、高风险(4)。
基于466家制造企业的供应链的相关数据与提取的9个特征指标,对指标进行重新编号分别为:供应链结构,包含多元性U11、充足性U12、通畅性U13;供应链关系,包含开放合作U21、互惠合作U22、协同关系U23;供应链管理,包含战略管理U31、全过程管理U32、事后管理U33。
随机森林模型训练样本的分类标准通过企业综合评价值k-means聚类获得,经过特征性实验发现,当决策树的个数大于等于2000时,各分类误差处于稳定状态,不会产生过拟合现象。因此,将决策树的棵树设置为2000,每棵树停止生长采用的特征维度为7[29]。将样本分为两部分,70%用于样本训练,共计326组;剩余30%用于验证,共计140组。利用matlab2016b进行计算,最终获得训练集预测结果、测试集预测结果如图2和图3所示。其中,训练集预测结果对比准确率为1,测试集预测结果对比准确率为0.94286,证明模型分类结果比较准确。
根据实验得出分类结果可知,在466份问卷中,安全等级的仅有8份;处于低风险共有51份,占比10.94%;处于中等风险的共有184份,占比39.48%;处于高风险的共有223份,占比47.85%。计算结果表明对制造企业供应链稳定性的调查展示了处于高风险的占比很高,我国制造企业供应链存在较大风险,应采取相应措施开展有针对性管理与改进。
6 实证分析
A企业是哈尔滨市一家医药制造企业,原采用成员协作能力、信息共享程度、利益分配等指标衡量供应链稳定性,采用简单赋权与专家打分结合法简单确定供应链稳定程度,企业基于原有评价方式得出供应链处于低风险状态,而利用本文设计的基于投影寻踪-随机森林的供应链稳定性评价方法重新计算时,结果表明其处于中等风险状态,指标具体得分见表7,结合上文确定的最优投影方向可获得稳定性综合评价值为1.28(中等风险)。
表7 企业供应链稳定性指标数据
两种方法得出企业供应链风险等级不同,原因如下:首先,原评价指标选取不够全面,仅侧重对供应链成员关系的考量,本文采用扎根理论方法提取的影响因素更全面,为企业供应链风险识别与评价提供了更多视角与更完整的参考。其次,企业采用简单赋权确定指标重要性较为主观、具有一定局限,影响权重准确性。本文通过问卷调查,广泛获取多个专家意见,样本数充足,并采用投影寻踪方法将获取样本数据投影到低维空间,用求取的最优投影方向反映权重,减少主观判断对结果造成的影响,赋权更加科学、客观。最后,分类方法也存在差异,企业原有风险等级划分主要依据企业自身运营经验,无法根据数据特征有效识别与归纳,采用随机森林方式进行分类可提高结果准确性,同时利于提升供应链管理指导的针对性。根据本文计算结果,A企业需将战略管理、互惠合作等纳入供应链稳定性评价考虑范畴,并给予充分重视;需提升稳定性管理精准性,根据当前结果可知,A企业供应链成员急需增加开放力度、寻找互惠点并培养互惠关系,应从预警、协同、创新等方面优化供应链战略管理,同时加强各种处理经验的分享与学习等。
7 结论
本文采用扎根理论基于现有文献提取了制造企业供应链稳定性影响因素,基于云模型筛选并确定评价指标体系。利用基于加速遗传算法的投影寻踪模型确定指标权重,并进一步采用随机森林方法对评价结果进行检测与稳定性分类,为制造企业供应链稳定性评价提供了系统、完整的方法支持,促进了质化与量化分析的结合,实现了理论论证、方法设计与实践检验整体逻辑链的有效融合。结果表明:
(1)基于扎根理论、云模型,确定制造企业供应链稳定性,可利用供应链结构(多元性、充足性、通畅性)、供应链关系(开放合作、互惠合作、协同关系)、供应链管理(战略管理、全过程管理、事后管理)有效反映。
(2)利用随机森林方法,确定多数供应链处于中高等风险状态,表明我国制造企业供应链在结构、关系与管理方面存在较多问题,应根据稳定性评价内容采取针对性改进措施。 (3)根据投影寻踪计算结果可知,供应链结构中节点通畅重要性高于节点资源充足性、高于多元性,因此为提升制造企业供应链稳定性应首先确保节点间能通畅联结,进一步要确保节点提供资源的充足性——能满足制造企业当前资源需求,最后需考虑选择节点提供资源是否具有多元性、丰富性,为供应链未来发展及应对可能变动提供更多资源选择。
供应链关系中互惠合作重要性高于协同关系高于开放合作,因此为确保制造企业供应链稳定,应首先选择能产生互惠作用的节点,保障各方在合作过程中同时实现能力提升、获得更高竞争优势,终止合作将给双方同时带来巨大损失,由于互惠从而保持双方高度合作热情与意愿,提升供应链稳定性。其次,节点伙伴需在供应链整体发展规划、活动与行为安排、文化与理念等方面保持协同一致,避免或减少矛盾冲突的产生;最后,节点需具有开放合作的理念,对显隐知识的共享、交流持有积极态度,能有效吸纳供应链外部信息、拓展供应链合作渠道与空间等,保持节点与节点以及供应链与外部合作的开放性、兼容性,有效吸纳信息、知识与技术,促进供应链稳定发展。
供应链管理中战略性管理重要性高于全过程管理高于事后管理,为保证制造企业供应链稳定发展,首先需对供应链发展进行战略性前瞻介入,提前预判供应链发展趋势及时预警,对供应链进行科学规划,促进节点协调与创新,确保其适应外部环境变动要求;其次,对供应链进行全过程管理,通过有效监控、应急处理等实现常规与紧急事件的有序管理;最后,应对供应链突发事件发生后的处理经验、方法等进行知识加工,为后续供应链稳定性管理提供有效决策与方法支持。