APP下载

基于小样本贝叶斯网络结构学习的质量绩效评价模型研究

2017-02-03鲁守东

关键词:网络结构贝叶斯绩效评价

鲁守东,林 仁



基于小样本贝叶斯网络结构学习的质量绩效评价模型研究

鲁守东1,林 仁2

(1. 安徽信息工程学院,安徽 芜湖 241000;2. 湖南城市学院,湖南 益阳 413000)

采用一种多元回归加PC算法的改良BN结构学习方法,有效地克服了小样本训练数据下的结构学习可靠性问题﹒从铁路建筑施工现场收集到研究数据后进行探索性因子分析,并萃取出11个质量绩效动因要素;以多元回归分析方法找出5个直接影响因子,并以此为先验知识构建BN初始网络结构,再应用PC算法进行结构学习,一套理想的质量绩效测度模型被最终获得﹒以3个企业的实际样本数据为依据,进行贝叶斯网络推理和检验,检验结果表明模型具有较好的适切性和科学性﹒

建筑施工系统;质量绩效评价;小样本BN结构学习;多元回归分析

质量和绩效分别是两个具有丰富内涵的概念,由这2个抽象的概念组合而成的新概念——质量绩效,则具有更加丰富的理论内涵﹒事实上,到目前为止还没有人对质量绩效概念作出严格的定义,但有关质量绩效评价方面的研究文献却从质量管理实践中源源不断地产生﹒

Jim(2003)以波音公司的20条最佳实践结合MBNQA的19个2级要素构建实践——绩效关系矩阵,以质量功能展开的方法构建质量屋,并给出实现各种绩效战略的手段[1]﹒于本海等(2011)以软件企业为例,应用模糊神经网络方法,定义了若干级输入指标和输出指标并构建出6个层次的FNN项目绩效评价模型[2]﹒Florence(2004)应用神经网络方法构建了一套包含11个输出指标和65个输入指标的3层ANN模型,以新加坡的33个建筑项目为样本,对项目绩效模型进行了有效性验证[3]﹒还有文献以ISO9004标准和质量竞争力指数为依据的绩效评价模型等﹒

总结国内外相关研究文献,主要有以下一些特点及不足的地方:(1)评价指标体系不完备或过于宽泛;(2)评价方法定性的居多,定量评价方法较少;(3)定量评价方法出现过如QFD、BP、ANN、FNN和DEA等不少好方法[1-3],但还不曾发现用BN方法进行质量绩效定量评价的文献﹒

BN方法作为数据挖掘和人工智能领域的一种新型工具,在系统变量的因果关系挖掘及网络结构建立方面具有很好的应用前景﹒本文的目标就是尝试以贝叶斯网络为工具,以铁路建筑施工系统的质量绩效为评价对象,构建一套适合推理诊断和可预测决策的绩效评价模型﹒

1 BN结构学习方法

BN(Bayesian Network)最早是由Judea Pearl提出的[4]﹒贝叶斯网络理论认为BN由2部分构成:其一是有向无环图DAG(Directed Acyclic Graph),又称作贝叶斯网络结构,通常是由若干节点和一些连接边所组成的;其二是条件概率表CPT(Conditional Probability Table),它是变量之间联系规律的表达﹒

贝叶斯网络学习包括参数学习和结构学习﹒结构学习的目标是获得DAG结构图,参数学习通常是在结构学习的基础之上,通过特定的方法获得CPT参数的过程﹒

为了保证BN结构学习的准确性和可靠性,一般需要海量的训练样本数据﹒而基于条件独立性测试(简称CIS)的PC算法相对来说比较适合于系统变量不多、网络结构稀疏和小样本训练数据的学习条件[5]﹒

文献[6]曾经将SEM结构方程模型方法和BN方法相结合,先用SEM方法构建模型网络结构,再应用BN推理方法进行诊断研究,从而避开了小样本数据下的BN结构学习难题[6]﹒文献[4]认为BN结构学习的样本量较少时,可人为增加一些客观的先验信息和扩大样本数据量具有同样的效果﹒正是在这2篇文献的启发之下,本文将多元回归方法和PC算法相结合,直接面对小样本数据下的BN结构学习问题﹒

2 质量绩效评价模型构建

2.1 质量绩效影响因素定性分析

国内的文献在确定质量绩效影响因素时,几乎都是按照国外的“质量管理实践QMP——质量绩效QP”的实证研究范式来进行的[6,7],至于国外的量表是否适合中国的文化情境以及不同行业的特点,学者们并没有深入研究﹒本文则是采用理论分析加文献分析,结合铁路建筑行业的特点,以探索性因子分析方法来确定铁路建筑施工系统质量绩效的动因要素或影响因素﹒

质量绩效评价虽然也涉及到结果质量,但主要是以组织系统及其过程为评价对象﹒根据建筑施工系统的特点,资源类要素一般包括4M1E(人、机、料、法、环)及信息资源6个方面内容;而流程类要素则包括业主沟通、地勘设计、施组计划、工艺设计、采购供应、施工过程和质量检验7个过程;管理活动要素通常包括质量领导、质量计划、质量保证和质量改进4个方面﹒这3类不同性质的要素跟质量绩效以及最终工程质量之间的具体关系,定性的推断只能是一种假设,必须要拿到实践中检验,甚至是多次检验,才能得到相对可靠的结论﹒

本文结合QMP-QP实证研究文献中的量表题项内容,同时参考了建筑施工管理领域相关的研究文献[3,7-9],从流程、资源和管理3个视角出发,设计出一套调查问卷如表1所示﹒

文献[8]曾经对铁路建设的质量风险因素进行过识别,发现共有34项常见的质量风险因素,本文对此进行一一验证,发现有31项能从本文的问卷中找到准确的对应﹒而通过与其它类似的量表[2,3,7]对照后发现:本文以流程、资源和管理3个视角设计的问卷题项具有一定的代表性,能够发现施工系统中影响质量绩效的主要因素﹒

为了进一步保证问卷质量,本文第一作者还通过电话、电子邮件及个别访谈的方式接受了铁路建设施工现场的专家建议,通过对题项的增加、删减和合并等多轮互动与修改,最后得到1份包括53个题项的质量绩效调查问卷如表1所示﹒

表1 质量绩效及其影响因素指标测度

注:由于篇幅限制,凡是标有“**”的地方均表示省略的部分

2.2 质量绩效影响因素的探索性因子分析

最终的调查问卷在南广铁路、云桂铁路和京沪铁路的建设施工单位中发放,它们分别是中国铁建、中国建筑和中国中铁股份有限公司﹒调查对象主要是各标段的项目经理、项目监理和项目质量安全负责人,总共收集到有效问卷945份﹒

本文利用收集到的数据,对建筑施工系统中质量绩效影响要素进行一次探索性因子分析,从53个指标项目中共萃取出包括:信息管理、过程控制、质量领导、质量检验、人力资源、改进创新、施组工艺、地勘设计、资质标准、资源保证和材料供应11个因子﹒11个主成分累计解释总方差变异数为67.108%,各维度因子所涵盖的测度题项及其信度和效度检验结果如表2所示﹒

Cronbach´s α信度检验结果显示:除因子9和因子11的信度系数略低于0.7(标准)外,其它维度的因子基本达到或超过标准值﹒

表2 探索性因子分析及信度效度检验

效度检验结果显示:因子6的WBS52及TD44、因子7的TD14和因子9的WBS13题项的CITC指标远低于0.5(标准)而予以删除,确保各维度指标的收敛效度达到标准﹒删除4个题项后,最终的49个题项的11个因子维度及其测度题项数均未改变,且第1主元方差提取指标均大于0.5(标准),符合单维度标准﹒另外除了因子1和因子3的AVE平方根指标略低于最大相关系数指标外,其它维度因子均显示出具有较好的区分效度﹒在内容效度方面,因子1(信息管理)、2(过程控制)、3(质量领导)、5(人力资源)、6(改进创新)和11(材料供应)是国内外文献中常见的绩效影响因子;其余5个因子可以理解为行业特有的影响因素,其内容效度均解释良好﹒最终的探索性因子分析结果显示:施工系统中影响质量绩效的11个因子具有一定的代表性和稳定性﹒

2.3 质量绩效影响因素的多元回归分析

接下来本文采用多元线性回归方法来验证11个绩效动因要素和质量绩效变量之间的直接因果效应是否真实存在﹒

首先采用SPSS15.0将11个解释变量用强行进入法纳入回归模型,拟合结果如表3所示﹒

表3 具有11个解释变量的强行进入法回归分析

预测变量:(常量),1,2,3,4,5,6,7,8,9,10,11;因变量:质量绩效

回归结果表明:达到统计显著性水平,说明各变量回归系数整体来说显著不为零;调整后R方达到0.467,表明11个解释变量对被解释变量质量绩效的变异具有一定的解释力;D-W在1.5和2.5之间,表明自变量之间不存在自相关可能性﹒

考虑到变量11、10、9、6、3和1的回归系数的T检验不具有显著性,运用逐步后退法再次进行回归分析,最后得到表4的回归结果﹒

表4 应用逐步后退法的回归分析

预测变量:(常量),8,4,5,7,2;因变量:质量绩效

最终的回归分析结果显示地勘设计(8)、施组工艺(7)、人力资源(5)、质量检验(4)及过程控制(2)这5个变量与质量绩效之间的回归系数显著不为零,表明它们之间具有直接因果效应,同时5个变量之间的VIF膨胀系数都小于10,表明它们之间不存在共线性,是影响质量绩效的相对独立的因子,它们共同解释因变量(质量绩效)约45.5%的变异﹒

2.4 基于PC算法的质量绩效模型结构学习

在BN应用领域,有大量文献直接通过定性分析构建网络拓扑,多数是以简单的“鱼骨图”来建立模型结构,这对于其后的BN推理和诊断会带来较大误差[8,10]﹒真正意义上的BN网络结构是需要通过数据学习才能获得的,笔者从中国知网中仅搜索到1篇医学方面类似的研究案例[11]﹒

本文通过2.3节的多元回归分析获得了一些实证结论,为构建初始的BN网络拓扑结构提供了客观的先验信息,接下来再利用PC算法进行结构学习,试图解决小样本前提下的BN结构学习效果问题﹒

PC算法的核心思想和算法步骤如下:

步骤1:将节点集中节点进行两两连接,得到完全无向图;

步骤4:所有的结构找到后,为确定剩余的无向边方向,PC算法反复运用下面2条规则﹒

GeNIe是一款建立图决策模型的应用软件,由美国匹兹堡大学决策系统实验室开发﹒本文选择GeNIe2.0作为结构学习平台,在BN结构学习之前,先构建如下的初始BN网络拓扑结构:

(1)地勘设计8为质量绩效的父节点;

(2)施组工艺7为质量绩效的父节点;

(3)人力资源5为质量绩效的父节点;

(4)过程控制变量2为质量绩效变量父节点;

(5)质量检验4为质量绩效的父节点﹒

在GeNIe软件平台上进行样本数据学习,学习方法选PC算法,显著性水平选择0.05,最大父节点数选择11,得到11个QP动因要素和质量绩效间的贝叶斯网络结构模型如图1所示﹒

图1 质量绩效BN网络结构

从图1的模型内容来看,影响质量绩效的直接动因要素是人力资源、质量检验、过程控制、地勘设计和施组工艺,而质量领导、质量信息、资源保证、改进创新、材料供应和资质标准6个变量是通过前5个变量的中介间接作用于最终的质量绩效﹒整个模型没有出现违背常理或明显逻辑悖论问题,初步预示模型学习效果良好﹒但是,BN结构学习效果的最终验证还是要看模型在实际应用中的解释力﹒

3 模型的推理检验

获得了结构模型之后,还需要进一步进行CPT参数学习,获得节点之间的条件概率关系表,才算是获得一个完整的BN网络﹒BN参数学习方法主要有极大似然估计、贝叶斯估计、EM算法和MCMC算法等[4]﹒

以BN方法建立的质量绩效评价模型的特点是:它不仅能充分体现出动因要素绩效指标和结果绩效指标之间的内在因果联系,以DAG来反映这种因果关联的方向,以CPT反映因果关联强度;并且还可以推理和诊断,对于管理决策具有很强的现实意义﹒BN推理可以实现从左到右的因果推理、从右到左的诊断推理、相互关联性推理和敏感性分析等﹒

为了检验图1中的质量绩效路径结构模型的适切性,本文从945个样本中挑选出1个样本项目A(属于优秀项目公司)的数据进行检验﹒应用熵权法[12]计算11个动因要素的分值,再按照分值为3.7~5.0定义为优等、分值为2.4~3.7定义为中等和分值为1.0~2.4定义为劣等的标准进行等级划分,得到每个动因要素的得分等级,结果如表5(第2行)所示﹒

应用GeNIe2.0软件的推理工具进行推理,推理结果:项目A质量绩效为劣等级的概率为0.07;中等级概率为0.07;优等级概率为0.85,具体结果如表5所示(注:表5的最后1列为GeNIe2.0的BN推理得到的结果,前11列为调查统计的结果,下同)﹒

为了验证本次研究获得的绩效模型是否具有可推广性,重新挑选了2家公司(简称项目公司B和项目公司C)进行验证研究,它们的质量绩效水平有着显著差异,每家分别发放并回收问卷35份,问卷主要由公司的中高层管理人员及技术人员填写,仅有少量优秀员工代表参与,最终获得1组评价统计数据见表5﹒

对项目公司B所收集到的数据再次进行CPT参数学习,将11个QP动因要素变量的概率值分别带入模型,应用GeNIe2.0软件,选择贝叶斯估计方法,运行软件得到QP节点的后验概率值﹒其中质量绩效为劣等级的概率为0.11;中等级概率为0.24;优等级概率为0.65﹒这就说明了当前的施工水平下,项目公司B的工程结构质量达到优等级的概率为0.65,且达到优等水平的概率最大,推理结果符合选择样本时的初始预期﹒

表5 3个测试项目的调查及推理

进行类似推理可获得项目C的QP后验概率结果分别为0.61、0.20和0.19﹒后验概率的数值表明项目公司C的工程结构质量达到优等级的概率仅为0.19,而符合劣等级水平的概率值最大(0.61)﹒这和现实情况也是完全相符的,也说明了本次研究所建立的模型是科学合理的﹒

4 结论

(1)本文采用1种多元回归加PC算法的改良BN结构学习方法有效地克服了小样本训练数据条件下结构学习的准确性与可靠性问题;

(2)在参考同行文献基础上,根据铁路建筑施工行业的特点,从资源、流程和管理3个视角探索质量绩效的影响因素,应用探索性因子分析方法得到影响质量绩效的11个因子,并在此基础上应用改良BN结构学习方法获得了一套比较理想的质量绩效评价与测度模型;

(3)本次研究不足之处在于以探索性因子分析方法萃取出11个绩效动因要素只能解释质量绩效变量46.7%的变异,表明本文的质量绩效影响因素调查问卷中的53个指标测度项还有待进一步扩充﹒如何发展出更加完善的质量绩效量表和质量绩效评价模型,是今后同类研究中需要重点关注的内容﹒

[1]WALDEN J. Performance excellence: A QFD approach[J]. International Journal of Quality & Reliability Management, 2003, 20(1): 123-133.

[2]于本海, 张金隆, 吴恒亮, 等. 基于FNN的软件项目绩效评价模型研究[J]. 管理学报, 2011, 8(10): 1517-1523.

[3]Ling F Y Y, Liu M. Using neural network to predict performance of design-build projects in Singapore[J]. Building & Environment, 2004, 39(10): 1263-1274.

[4]SPIRTES P, GLYMOUR C, SCHEINES R. Causation, prediction, and search[M]. Seconded, Cambridge: The MIT Press, 2000.

[5]SPIRTES P, GLYMOUR C, SCHEINES R. Causality from prob- ability[M]. London: Piman Evolving Knowledge in Natural Science and Artificial Intelligence, 1990.

[6]宋永涛, 苏秦. 基于贝叶斯网络的质量管理实践对绩效的影响评价[J]. 系统工程理论与实践, 2011, 31(8): 1440-1446.

[7]李军锋, 曾德智, 龙勇. 我国制造业背景下质量管理活动的量表开发研究[J]. 数理统计与管理, 2011, 30(1): 1-11.

[8]周国华, 彭波. 基于贝叶斯网络的建设项目质量管理风险因素分析——以京沪高速铁路建设项目为例[J]. 中国软科学, 2009(9): 99-106.

[9]CHAN A P C, CHAN A P L. Key performance indicators for measuring construction success[J]. Benchmarking: An International Journal, 2004, 11(2): 203-221.

[10]陆静, 唐小我. 基于贝叶斯网络的操作风险预警机制研究[J].管理工程学报, 2008, 22(4): 56-61.

[11]朱文锋, 晏峻峰, 黄碧群. 贝叶斯网络在中医证素辨证体系中的应用研究[J]. 中西医结合学报, 2006, 4(6): 567-571.

[12]邱菀华. 管理决策与应用熵学[M]. 北京: 机械工业出版社, 2002.

(责任编校:龚伦峰)

Research on Quality Performance Evaluation Model Based on Small Sample Bayesian Network Structure Learning

LU Shoudong1, LIN Ren2

(1. Anhui Information Engineering Technology Institute, Wuhu, Anhui 241000, China; 2. Hunan City University, Yiyang, Hunan 413000, China)

The reliability of structure learning in small sample training data is the bottleneck of the application of Bayesian Network method. This paper uses a new improved method based on multiple regression and PC algorithm to overcome this shortcoming. The collecting data from the railway construction site, an Exploration Factors Analysis is conducted to extract 11 quality performance factors. The multiple regression analysis is used to find out 5 factors that directly affect the quality performance, and the initial network topology of the Bayesian Network is constructed. the PC algorithm is used to construct the final Bayesian Network structure, an ideal quality performance evaluation & measure model is obtained. Through the sample data of 3 typical enterprises, The Bayesian Network inference and model test were conducted, the result shows that the model is scientific and good applicableness.

building construction system; quality performance evaluation; small sample BN structure learning; multiple regression analysis

F273.2

A

10.3969/j.issn.1672-7304.2017.06.0013

1672–7304(2017)06–0061–06

2017-09-19

鲁守东(1971- ),男,安徽芜湖人,讲师,博士,主要从事项目质量管理研究﹒E-mail: donaldlsd@163.com

猜你喜欢

网络结构贝叶斯绩效评价
贝叶斯公式及其应用
基于贝叶斯估计的轨道占用识别方法
基于BSC的KPI绩效评价体系探析
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用
沪港通下A+ H股票网络结构演化的实证分析
非营利组织绩效评价体系的构建
一种基于贝叶斯压缩感知的说话人识别方法
复杂网络结构比对算法研究进展
气象部门财政支出绩效评价初探