APP下载

基于SPSS对全国各地区安全生产状况的聚类分析

2017-07-24李胜楠凌标灿

华北科技学院学报 2017年2期
关键词:火灾事故状况聚类

李胜楠,凌标灿,2

(1.华北科技学院 研究生院,北京 101601;2.中矿龙科能源科技(北京)股份有限公司,北京 101601)

基于SPSS对全国各地区安全生产状况的聚类分析

李胜楠1,凌标灿1,2

(1.华北科技学院 研究生院,北京 101601;2.中矿龙科能源科技(北京)股份有限公司,北京 101601)

为对全国各地区的安全生产状况有一个清晰直观的认识,了解不同地区安全管理水平的差异性,基于SPSS软件对2009~2016年我国各地区的安全生产统计数据进行系统聚类分析,将我国31个省、市、自治区的安全生产状况划分为4类,通过分析不同类别地区安全生产状况的特点及原因,为控制和预防生产安全事故提供依据。

安全生产状况;系统聚类分析;SPSS

0 引言

安全生产状况反映了一个地区的安全生产水平,分析不同地区安全生产状况的特点,有利于采取针对性措施,减少安全生产事故的发生,进而提高经济发展水平。

本文以2009~2016年我国各省、市、自治区的安全生产指标数据为基础,结合国家统计局《中国统计年鉴》中对各地区生产总值(GDP)、交通事故情况和火灾事故情况的统计数据,从亿元GDP生产安全事故死亡率X1、工矿商贸事故死亡人数X2、交通事故死亡人数X3、火灾事故死亡人数X4和特大事故起数X5五个指标数据出发[1],基于SPSS软件对我国31个省、市、自治区的安全生产状况进行聚类分析。分析数据选取为8年数据的均值。通过具体分类情况,有利于分析全国的安全生产形势,为政府、企业的下一步安全生产工作规划提供方向和依据。

1 系统聚类分析

1.1 基本概念

系统聚类法(层次聚类法)是聚类分析方法中最常用的一种方法,它根据样本的多指标(变量)、多个观察数据、定量的确定样品、指标之间存在的相似性或亲疏关系,并据此连接这些样品或指标,归成不同类群,构成树状图或冰状图。它的优点在于可以指出由粗到细的多种分类情况,结果可由一个聚类图展示出来。具体步骤如下:设Ω={w1,w2,…,wn}

(1) 计算n个样本两两之间的距离{dij},记为矩阵D=(dij)n×n;

(2) 首先构造n个类,每一个类中只包含一个样本,每一类的平台高度均为零;

(3) 合并距离最近的两类为新类,并且以这两类间的距离值作为聚类图中的平台高度;

(4) 计算新类与当前各类的距离,若类的个数已经等于1,转入步骤(5),否则回到步骤(3);

(5) 画聚类图;

(6) 决定类的个数和类。

1.2 聚类过程及结果

选取2009~2016年我国各省、市、自治区的安全生产事故统计数据5个指标的平均值[2],如表1所示:

表1 全国安全生产事故统计数据(2009~2016年平均值)

进入SPSS程序,选择分析→分类→系统聚类,进行系统聚类分析(Hierarchical Cluster Analysis),引入X1至X5为变量,对样本(个案)进行Q型聚类分析[3]。

(1) 数据标准化

由于五个指标中既有绝对指标又有相对指标,具有不同的量纲,为了使这些指标能放到一起加以比较,提高精度,故采用极差标准化方法对数据进行标准化处理。

(1)

(2)

(2) 计算类与类之间的距离

这里选择欧式距离的方法,进入SPSS18.0程序,选择分析→分类→系统聚类→方法,然后从度量标准对话框中的区间项选择欧式距离(Euclidean distance)。

(3) 应用SPSS对数据进行聚类分析

聚类方法采用离差平方法(Ward法)。从聚类方法框中选择离差平方和法(Ward’s method),该方法基于方差分析思想,若分类合理,则同类样品间离差平方和最小,类与类间离差平方和最大[4,5]。

表2 案例处理摘要

a. Euclidean 距离 已使用

表2表示在31个样本中,有效个案为31个,无效个案为0个,样本有效率100%,聚类分析结果可靠。

由于相似矩阵为31×31阶矩阵,本文中未表示,相似矩阵反映了各地区安全生产状况的相似程度,越接近于1,说明相似程度越高。

表3 案例聚类分析

表3所列各项的意义如下:阶——聚类步骤号;群集组合——在某步中合并的个案;系数——样本欧式距离。数值越大,二者越不相似;首次出现阶群集——新生成聚类;下一阶——对应步骤生成的新类将在第几步与其他个案或新类合并[6,7]。

由表中显示,在第1阶,由序号1北京市和序号2天津市先合并成一类,它们的系数为0.025。北京市亿元GDP生产安全事故死亡率为0.45、工矿商贸事故死亡人数35.5人、交通事故死亡人数940.83人、火灾事故死亡人数30.33人、特大事故0.17起。天津市亿元GDP生产安全事故死亡率为0.50、工矿商贸事故死亡人数20.17人、交通事故死亡人数904.33人、火灾事故死亡人数25.17人、特大事故0.17起。表明2者在各个指标数据上都非常相似,这个合并完的类将在第13阶中用到。在第13阶中,刚刚新生成的这个新类和序号21海南省又合成一类,它们的系数为1.230。直到经过30步后,所有的样本均聚成一大类。

为了能够准确的对我国31个省、市、自治区进行分类,并确定最精确分类数量。采用树形图加以判断。树形图能够直观的对所分析的数据进行分类,且提供比较合适的类数。本文根据亿元GDP生产安全事故死亡率为、工矿商贸事故死亡人数、交通事故死亡人数、火灾事故死亡人数、特大事故起数这五个指标,对31个省、市、自治区的安全生产状况进行分类,树状图如图1所示:

图1 聚类分析结果树状图

根据树状图可以清晰直观地看出整个样本的分类情况,把直尺竖着放在图上,图与直尺相交的线,即为一类。树状图上方的数字是按距离比例进行重新标定的结果,不影响对分类结果的观察与结论。从图中可以看出,把我国31个省、市、自治区划分为4类或者是5类都比较合理,类间距离较大,说明各类的特点比较突出,能够从不同类的角度分析事故的特点。若分成6类或者是更多类,类间距离较小,类与类之间的区别不明显,达不到准确的分析结果。

通过以上的分析,把指定样本聚成4类,聚类结果如表4所示。

2 聚类结果数据分析

为更加了解各类指标的特征,对所分四类中的均值、最大值及最小值进行计算比较,得到的结果如表5所示。

表4 聚类结果

表5 实例分析均值表

结合表4、表5可知,系统聚类分析结果将我国31个省、市、自治区的安全生产状况划分为4类,我国的安全生产状况具有明显的地域特征。

(1) 北京、天津、河北、内蒙古、吉林、上海、安徽、福建、江西、山东、广西、海南、陕西、甘肃和新疆15个省、市、自治区为第1类。北京、天津两市是华北地区相邻的直辖市,经济发展水平较高,矿山等高危行业拥有量较少,且地域条件、教育条件、安全监管等条件相似,故各类指标相似,分类结果与预想相符合,也验证了分类的准确性。该类地区工矿商贸、交通和火灾事故死亡人数均值总和为2009.91人,处于中等。安徽省工矿商贸事故死亡人数最多,为325.67人,这是由于该省是我国煤炭大省,2014年煤炭产量为1.33亿吨,关闭小煤矿后全省煤矿数量约有百处。山东省交通事故死亡人数最多,这是由于该省是人口大省和经济发展大省,二级以上公路里程3.95万公里,连续多年位居全国第一,并且在公布的全国10大交通事故高危路段中有两处位于山东省,该两处的事故起数和死亡人数均位于前列,这就导致了该省交通事故频发。该类地区要根据各个省市的特点,加强安全生产工作,以此促进经济的进一步发展。

(2) 山西、辽宁、黑龙江、河南、湖北、湖南、重庆、四川、贵州、云南10个省、市为第2类,安全生产状况较差。与第1类的事故死亡人数总和相似,为2246.13人,工矿商贸事故平均死亡人数最多,特大事故频发,平均每年发生特大事故3.83起,安全生产状况亟待解决。山西、河南两省矿山较多,辽宁、黑龙江两省是我国的东北老工业基地,湖北、湖南两省民营企业过多,生产效率和企业管理条件过于落后。山西省是我国煤炭大省,随着开采强度和深度的不断增大,地质条件日趋复杂,再加上整体规模偏小、开采方式和技术装备水平比较落后、缺乏先进的管理技术和高素质人才等原因,山西省的各个煤矿不同程度地显现出了许多问题与缺陷,各类事故时有发生,导致特大事故起数位居全国首位。重庆市交通事故死亡人数最少,这与当地实行的单行道息息相关,不仅缓解了堵车的情况还大大降低了交通事故的发生。四川省地貌复杂,以山地为主,具有山地、丘陵、平原和高原4种地貌类型,拥有已探明储量的矿产资源132种,占全国资源种数的70%,已探明天然气储量超过3.8万亿立方米,位居全国第一,是川气东送的起点,因而使得该省工矿商贸、交通事故死亡人数均居首位。但历年数据呈现逐年递减趋势,说明政府已重视该项工作,安全生产形势明显好转。2013年底,四川省开展道路交通安全综合整治工作,在高速公路货车“双超”治理、普通公路治超、农村道路交通安全管理等方面取得阶段性成效,使得道路交通安全形势持续好转,现已建成公路安保工程(路侧护栏)1.73万公里;2014年,全省共关闭(退出)金属非金属矿山863个;2015年工矿商贸10万从业人员事故死亡率、道路交通万车死亡率大幅下降,其降幅明显高于全国水平[8]。

(3) 江苏、浙江、广东3省为第3类。工矿商贸、交通和火灾事故死亡人数均值总和为5834.39人,死亡人数最多,是事故高发大省。根据《中国统计年鉴》中地区生产总值统计表显示,该三省位于全国前4名,是经济发展大省。亿元GDP生产安全事故死亡率均值为0.86,在4类中为最低,说明该类地区在发展经济的同时注重安全工作,安全意识较高。但交通、火灾事故死亡人数均为4类地区中最高,这可能是由于该类地区处于东南沿海地区,化工企业数量较多,并且随着电子商务的发展,该类地区成为电商大省,服装、纺织业、日用化妆品业逐渐增多,同时带动交通运输业,进而不免增加交通、火灾事故。相关部门要加强该类地区的相关检查,重点部位重点监察,将事故发生率降到最低[9-11]。

(4) 西藏、青海、宁夏3个地区为第4类。该类地区亿元GDP生产安全事故死亡率均值为2.57,在4类中为最高,其余四项指标均为最低。该类地区生产总值位于全国底端,所占比例较小,进而导致亿元GDP生产安全事故死亡率最高,这也说明了该类地区安全生产意识差,对安全工作的投入力度和重视程度明显不足。

3 结论

本文通过运用数理统计的聚类分析方法,以SPSS软件为分析工具,将我国31个省、市、自治区的安全生产状况分为4类,聚类方法为离差平方法,度量标准为欧式距离,分类结果与预想相符合,这说明本文采用的分析方法的正确性。分类的结果也揭示了安全生产状况具有明显的地域特征,受到诸多因素的影响,并具体分析了各类地区在各个指标上的安全生产状况,相关部门要根据地区存在的具体问题,采取针对性措施,从而有效改善安全生产状况,达到事半功倍的效果。

[1] 冯彧,康玉杰. 抓好企业安全生产应突出把握的几个问题[J]. 吉林劳动保护,2013(09):36-37.

[2] 李生才,笑蕾. 2014年7~8月国内生产安全事故统计分析[J]. 安全与环境学报,2014(05):350-352.

[3] 严先锋,杜强,贾丽艳. SPSS统计分析从入门到精通.2版[M]. 北京:人民邮电出版社,2008:95-103.

[4] 任智刚,周建新,张兴凯. 基于SPSS聚类分析的企业职业伤害风险分级标准研究[J]. 中国安全生产科学技术,2006(03):43-46.

[5] 张在旭,尚高龙. 基于SPSS聚类分析的黄河三角洲经济园区特色产业集聚发展研究[J]. 河南科学,2013(09):1502-1506.

[6] 凌标灿,魏洪霞. 各城市消费水平差异层次聚类及因子分析[J]. 华北科技学院学报,2017(01):110-116.

[7] 李杰,张靖岩,郭建中,等. 基于聚类分析的我国火灾空间分布研究[J]. 中国安全生产科学技术,2012(02):61-64.

[8] 李德忠. 四川:安全生产工作取得新突破[J]. 中国安全生产,2015(03):42-43.

[9] 王莎莎,倪晓阳,王洪,等. 基于MATLAB的系统聚类法在我国安全生产事故分析中的应用[J]. 工业安全与环保,2010(08):52-54.

[10] 黄盛初,周心权,赵爱国. 安全生产发展规律聚类分析[J]. 中国煤炭,2005(11):13-18+29+12.

[11] 崔柳. 煤矿安全生产水平分层聚类分析[J]. 辽宁工程技术大学学报(自然科学版),2015(12):1356-1360.

Hierarchical cluster analysis of safety production condition of various regions in China based on SPSS

LI Sheng-nan1, LING Biao-can1,2

(1.GraduateSchool,NorthChinaInstituteofScienceandTechnology,Beijing101601,China; 2.ZhongkuangLongkeEnergyTechnology(Beijing)Co.,Ltd.,Beijing101601,China)

In order to have a clear understanding of the safety production situation of each province in China, and understand the difference of the level of safety management in different places based on SPSS software, the hierarchical cluster analysis of production safety statistical data of China’s provinces in 2009~2016 is conducted. Production safety situation of China’s 31 provinces, municipalities and autonomous regions are divided into four categories. The analysis of safe production conditions of different types of areas provides the basis for the control and prevention of production safety accidents.

Safe production status; Hierarchical cluster analysis; SPSS

2017-04-13

中央高校基本科研业务费资助(3142017031)

李胜楠(1993-),女,河北承德人,华北科技学院在读硕士研究生,研究方向:工业卫生及职业危害防治、危险化学品安全技术。E-mail:18730601629@163.com

X928

A

1672-7169(2017)02-0084-06

猜你喜欢

火灾事故状况聚类
一起亡人火灾事故原因的认定
声敏感患者的焦虑抑郁状况调查
对烟头引发火灾事故的调查
2019年中国国际收支状况依然会保持稳健
莫名的火灾事故
高层建筑火灾事故引发的思考
基于DBSACN聚类算法的XML文档聚类
第五节 2015年法学专业就业状况
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究