基于复杂网络理论的危险品事故原因实证分析
2020-08-31蔡婷婷刘祥伟刘云霞
蔡婷婷,刘祥伟,刘云霞
(安徽理工大学 经济与管理学院,安徽 淮南 232001)
近年来,随着我国工业化进程的加快,化工产业的规模不断扩大[1].危险品产链的发展,与危险品相关的安全事故时有发生,不仅使国家和人民生命财产遭受了重大损失,也给相关安全监管部门带来了巨大压力.危险品的安全问题已经成为了全社会共同关注的大事,为了加强对危险品的安全管理,预防事故的发生,许多学者加入到危险品事故的研究当中.在危险品生产事故分析方面,徐琳娜[2]通过分析化工生产设备事故类型,阐述了化工设备的致因机理,并提出了相应化工事故的应对策略.在危险品运输事故分析方面,杜珺等[3]采用事故树分析法分析了危险品航空运输事故,得出了最容易引发危险品航空事故的两个因素,并提出了一些安全管理的改进建议;赵文辉[4]基于对危险品铁路运输事故报告的分析,对铁路运输常发事故原因进行了讨论,提出了提高铁路危险品运输安全的有效措施;韩银彩等[5-6]针对危险品公路运输事故频发的问题,分析了事故的特点、成因,提出了相应的事故预防措施和管理建议;陈振昌等[7-8]通过分析危险品船舶运输过程中可能引发事故的主要原因,提出了对内河危险品船舶运输安全管理的建议及对策;蒋雪枫等[9-10]基于对危险品海洋运输的研究,通过分析事故发生原因,提出了相应对策.在危险品仓储事故分析方面,王伟强[11]将危害分析与关键控制点方法的预防性管理思想用于危险品的仓储管理中,通过分析在危险品仓储过程中可能发生的危害,提出了具有可行性的危害控制方法;鲁征等[12]基于事故致因“2-4”模型对天津港“8·12”危险品仓库火灾爆炸事故的不安全动作等原因进行了分析,针对分析结果,提出了一些事故预防措施.
以上学者在危险品生产事故分析、危险品运输事故分析及危险品仓储事故分析方面都开展了深入的研究,但都只是在微观层面,并没有在宏观层面对危险品事故的产生原因分布进行定性定量分析.本文将基于复杂网络理论对危险品事故原因进行实证分析,通过对事故原因的选取、筛选来构建相应的网络模型,并对网络拓扑结构、网络的统计特征进行分析[13].
1 数据来源及研究方法
1.1 数据来源
以127起事故调查报告为样本数据,整理归纳总结事故发生原因,包括直接原因和间接原因,事故报告的分布情况见图1.
图1 2004~2019 年危险品事故统计
从图1可知,危险品事故发生率呈现先增后降的趋势,2018年是事故高发期,总共有21起危险品事故,不过近年来呈现下降趋势,说明我国对于危险品的安全管理起到了一定的效果.
1.2 研究方法
复杂网络理论将大多数的复杂系统抽象为网络,将复杂系统中的个体视为网络中的“节点”,将个体之间的联系或是相互作用关系视为网络中连接节点的“边”,由此建立起一个可抽象表征复杂系统的网络模型[14].以下几个统计指标常用来分析复杂网络特征:
1)度与度分布
度(degree)是描述单个节点属性的重要概念.在网络中,节点的度定义为与该节点相接的边的总数.
度分布(degree distribution)顾名思义就是指图中各个节点度的分布情况,常用分布函数P(k)来表示一个任意选择的节点度为的概率.
2)平均路径长度
网络中任意两点i和j间的距离dij被定义为:连接两点的最短路所包含的边的数目,它描述了网络中节点的分离程度[14].而任意两个节点之间的距离的平均值就是网络的平均路径长度L,即
全书内容丰富而翔实,分析细致而清晰,足见作者深厚的语言功底和文化积淀,体现了作者独到的观察力和分析力。
(1)
3)聚类系数
聚类系数C是用于衡量网络节点集聚情况的参数.在网络中,节点i的聚类系数等于该节点的所有邻节点之间连边的数目占可能的最大连边数目的比值[14].计算公式如下:
Ci=2Ei/ki(ki-1)
(2)
4)介数
节点i的介数是指网络中经过i的所有最短路径的数量.它反映了节点i对其他节点之间联络的控制作用.计算公式如下:
(3)
其中:Sij为(i,j)之间最短路径的集合.
2 基于复杂网络理论构建危险品事故原因共现网络
2.1 选取节点
首先使用Bicomb软件对127起危险品事故原因进行数据挖掘,合并 “安全教育培训不到位”、“教育培训不到位”,“非法组织生产”、“非法生产”,“违章指挥作业”、“违章指挥”等同义词,最后共得到468个事故原因,如图2所示.经校对,最后筛选出频数排名前50的事故原因定义为节点,如表1所示[13].
表1 高频事故原因统计表
图2 Bicomb软件事故原因统计界面
从高频事故原因的分布可以发现,主要分为两类:
1)直接原因:相关事故原因有违章作业、违规操作、操作不当、盲目施救、违章指挥、非法生产、严重超载、静电放电、违章驾驶、施救不当、疲劳驾驶、违法运输、违法违规生产、违规储存危险品、非法经营、非法建设、非法储存、违规建设、工艺设计存在缺陷、违规行驶、违规装载、冒险作业、生产设备出现故障、设备存在工艺缺陷.
2.2 边的确定
把事故原因之间的共现关系定义为边,把出现共现关系的频数定义为权值,以此构建一个50×50的邻接矩阵.若两个事故原因同时出现在一篇事故调查报告中,则记为1,代表它们之间有联系,否则记为0.因篇幅有限,图3截取了部分事故原因的邻接矩阵数据.
图3 部分邻接矩阵数据图
2.3 网络拓扑模型构建
首先对从Bicomb软件中导出的事故原因共现矩阵数据进行预处理,然后导入Pajek软件中.由于Pajek软件无法识别图的矩阵格式,会默认所有的矩阵格式都为有向图格式,所以需要创建一个新的网络,把有向图转换成无向图,通过依次点击Net→Transform→Arcs->Edges→All菜单命令,可以把有向弧转换成无向边.然后再依次点Info→Network→General菜单命令就可以得到网络的全部信息,网络信息如图4.最后利用Pajek的可视化功能,点击Draw绘图命令,就得到了一个包含50个节点、245条边的无向加权网络图,网络结构图如图5所示.
图4 事故原因共现网络信息图
图5 事故原因共现网络结构图
3 网络拓扑结构分析
3.1 度与度分布
通过依次点击Net→Partitions→Degree→All菜单命令,可以把节点按度值进行分类,统计情况如表2所示.
如表2所示,事故原因共现网络中节点度值最大的是29,最小的是2.点击编辑网络图标可以在显示窗口中看到度值排名前三名的节点分别是“安全管理混乱”、“安全教育培训不到位”和“违规操作”,可知这三个事故原因经常与其他事故原因共同出现在事故调查报告中.
表2 事故原因共现网络的节点度值分布表
把各节点的度值求和再取平均数就得到了该事故原因共现网络的平均度,经计算,事故原因共现网络的平均度是9.80,而从表2中可知,度值小于平均度的节点数有34个,占全部节点总数的68%,说明网络中度值较小的节点占绝大多数,网络的节点度分布不太均衡.
图6则显示了事故原因共现网络在普通坐标下的度分布情况,横坐标为度值k,纵坐标P(k)表示度值为k的概率.
图6 事故原因共现网络度分布图
从图6中可以看出,该网络中节点度值服从幂律分布,通过数值拟合得到度分布函数为P(k)=0.145k-0.547,其中R2=0.3411.对图6中各节点的横、纵坐标取对数,可以得到该网络在对数坐标系下的节点度分布,如图7所示.
从图7中可以看出,事故原因共现网络节点在对数坐标系下的度分布呈直线递减形式,具有显著的无标度网络特征[14].
图7 事故原因共现网络度分布图(对数坐标系)
3.2 平均路径长度与聚类系数
3.2.1 平均路径长度
通过依次点击Net→Paths between 2 vertices→Distribution of Distances→From All Vertices菜单命令,可以在报告窗口中看到网络的平均路径长度为1.938 78,说明任意两个事故原因之间平均有两条边相连,如图8所示.
图8 事故原因共现网络平均路径长度信息图
网络中任意两个节点之间的距离的最大值称为网络的直径(diameter),记为.通过依次点击Net→Paths between 2 vertices→Diameter菜单命令,可以求得网络中距离最大的两个节点的距离.在报告窗口中可以看到最长的一条边是从操作不当(8)到安全管理存在缺失(46),直径为3,如图9所示.
图9 事故原因共现网络直径图
3.2.2 聚类系数
在危险品事故原因共现网络中,网络的聚类系数可反映事故原因之间的联系紧密程度.
通过依次点击Net→Vector→Clustering Coefficients→CC1菜单命令,可得到事故原因共现网络中各个节点的聚类系数,为方便统计,数值统一只保留四位小数,结果如表3所示.
表3 事故原因共现网络各原因的聚类系数表
整个复杂网络的聚类系数CC1就是所有节点i的聚类系数的平均数,经计算,事故原因共现网络的聚类系数CC1为0.692 75,表现出很强的集聚性.
由于小世界网络最突出的特点是网络具有小的平均距离和大的聚类系数,所以由以上的计算结果可知:事故原因共现网络的平均路径长度约为1.938 8,而聚类系数约为0.692 8,具有小世界网络性质[14].
3.3 中心性分析
3.3.1 点度中心性
点度中心性(degree centrality)是刻画节点中心性的最直接的度量指标,它通过求出每个节点的度数来判断这些节点在整个网络中所处的位置.一般情况下,某节点的度值越大就意味着该节点在网络中越重要.由Pajek软件求得的网络节点的度值排名前十的关键词如表4所示.
表4 事故原因共现网络中度值排名前十的事故原因
从表4中可以看出,“安全管理混乱”、“安全教育培训不到位”和“违规操作”这三个事故原因的度值最大,说明这三个事故原因与其他事故原因的联系紧密,关联性程度高.除此之外,“安全监管不到位”、“违章作业”、“安全管理不到位”这三个事故原因的度值也较大,与其他事故原因的联系也较紧密.
3.3.2 中介中心性
中介中心性(betweenness centrality)是反映不同节点或边在整个网络中作为媒介的能力.由Pajek软件求得的网络节点的介数值排名前10的事故原因如表5所示.
从表5可以看出,“安全教育培训不到位”、“安全管理混乱”和“违章作业”这三个事故原因的介数值最大,说明这三个事故原因对其他事故原因之间联系的控制作用强,关联性最大.
表5 事故原因共现网络中介数值排名前十的事故原因
通过对比表4、5, 可以看出节点的度值、介数值和接近值之间有很强的相关性,排名前十的事故原因几乎都是一样的,只是排名顺序有所不同而已.
4 结 语
本文基于复杂网络理论构建了危险品事故原因共现网络模型,通过Pajek软件的可视化功能得到了危险品事故原因共现网络的全景图,并通过对共现网络的节点度分布、平均路径长度、聚类系数、介数值等统计指标进行分析,得出网络符合无标度网络特征和小世界网络特征[13],综合节点的频次、度值、介数值可知:“违章作业”、“安全生产主体责任不落实”、“违规操作”、“安全管理混乱”、“安全监管不到位”、“安全教育培训不到位”、“安全管理不到位”、“操作不当”、“安全意识淡薄”和“盲目施救”这十个事故原因是危险品事故的高发事故原因,这其中既包括人为因素也包括相关企业和部门的管理因素,希望通过这些挖掘出的高发事故原因给相关危险品的生产、运输、经营企业敲响警钟,避免危险品事故的发生,保证社会的安全.