基于文本挖掘的建筑工人不安全行为及其影响因素研究
2021-04-02薛楠楠张建荣赵挺生
薛楠楠,张建荣,张 伟,赵挺生
(华中科技大学土木与水利工程学院,湖北 武汉 430074)
建筑业安全生产事故发生较为频繁。据统计,2019年我国房屋市政工程共发生安全事故773起,导致904人死亡,也造成了严重的社会负面影响。已有研究表明,90%的建筑业安全生产事故与建筑工人的不安全行为密切相关。因此,探究建筑工人施工过程中的不安全行为及其影响因素,对于提高建筑施工安全管理水平、预防事故发生具有重要意义。
目前,关于建筑工人不安全行为的研究主要集中在影响因素、传播机理、预防措施等方面。在建筑工人不安全行为的影响因素研究中,叶贵等从组织管理、个体、生产作业和社会环境四个方面建立了建筑工人不安全行为影响因素的ISM模型;Choudhry等运用问卷调查法确定了安全意识、安全规程、工作保障、安全教育培训等11个对建筑工人不安全行为产生重要影响的因素。上述这些研究识别建筑工人不安全行为的影响因素多采用文献研究、专家访谈和问卷调查方法,具有一定的主观性。相比之下,文本挖掘方法可将事故调查报告、检验测试报告等作为数据源,从报告中获取特征值并进行统计分析,有利于揭示事故发生和安全管控的规律。基于这种思路,Esmaeili等运用文本挖掘技术,从1 771份建筑工程事故报告中提取了22个风险因素;李解等首次运用R语言和文本挖掘方法,从151份地铁施工事故报告中提取了6项关键因素和23项一般因素。但这些研究多关注某一类事故,对建筑工人不安全行为的表现及其影响因素的研究相对较少。
本文选取334份建筑施工安全事故报告作为数据样本,首次运用文本挖掘技术识别建筑工人不安全行为的具体表现及其影响因素,以为加强建筑施工安全管理、规范工人作业行为提供依据。
1 不安全行为综述
根据《企业职工伤亡事故分类标准》(GB 6441—86),不安全行为指能造成事故的人为错误。基于此,出现了多种不安全行为分类方式,如Chua等将不安全行为分为有意的不安全行为和无意的不安全行为;居婕等划分了内因导致的不安全行为和外因导致的不安全行为;韩豫等划分了习惯性不安全行为和偶发高危不安全行为。其中,有意与无意不安全行为的划分考虑了人的心理状态,符合认知行为理论。有意不安全行为是指工人因贪图便利或心存侥幸,基于内心意念驱使而实施的危险性或违规行为;无意不安全行为是指工人由于安全知识缺乏或作业经验不足,无意之中实施的危险性或违规的行为。
2 建筑工人不安全行为及其影响因素文本挖掘流程
文本挖掘(Text Mining),是指综合利用机器学习、自然语言处理等挖掘技术从文本数据中抽取有价值的信息和知识,可用于信息提取、主题追踪、文本分类、信息可视化等方面。文本挖掘及分析流程一般包括语料库构建、词库开发、文本分词、特征项选取和数据分析5个步骤,见图1。
图1 文本挖掘及分析流程Fig.1 Text mining and analysis process
2. 1 语料库构建
施工安全事故报告由政府安监部门牵头组建的专家调查组编写和发布,详细描述事故的发生经过和原因,从组织、技术和管理等方面分析各方单位的过失和管理缺陷。每一起事故都由人、机、环、管等多方因素综合作用而产生,而每一份事故调查报告都是内容全面、信息量大的安全教育素材。
依据《生产安全事故报告和调查处理条例》的事故划分标准(伤亡人数和经济损失),本文搜集了2005—2019年间我国334份较大及以上严重程度的建筑施工安全事故报告,涉及高处坠落、坍塌和起重伤害等12种不同事故类型。其中,较大事故的发生最多,占事故总数的95.21%;而不同事故类型中坍塌、中毒窒息等事故类型最多,见表1。为了降低文本挖掘的工作量、减少无关词组的干扰,本次筛选事故报告中 “发生经过”“原因分析”“责任划定”三部分内容为“.txt”文本集,形成待挖掘文本语料库。
表1 2005—2019年我国建筑施工安全事故统计表
2. 2 词库开发
R语言是一个开放免费的平台,在使用过程中可根据需要加载程序包,实现数据预处理、分类和结果可视化等功能。因此,本文选用R语言对建筑工人不安全行为及其影响因素进行文本挖掘分析。为了确保分词效果,避免遗漏专业词汇及虚词干扰,先建立了专业词词库、停用词词库和归并词群表。
考虑建筑施工安全相关的专业表述,去除常用停用词(如“单位”“然后”等),并考虑不同事故报告表述风格的差异以及对同一个影响因素的多种可能表述,分别挖掘、统计后再予以合并,从而建立了如表2所示的建筑工人不安全行为及其影响因素归并词群表。
表2 建筑工人不安全行为及其影响因素归并词群表(部分)
2. 3 文本分词
词库建立完成后,运用R软件对挖掘语料进行分词处理,获得一个高维稀疏的建筑施工安全事故报告的初始特征项集合,见表3。
初始特征项共有871个,包含大量无用信息,因此需要对初始特征项实施降维处理。本文选取具有较高召回率和查准率的χ
统计方法对初始特征项进行降维处理,其计算公式为(1)
式中:n
为整个文本的数量;a
为属于c
类且包含特征项t
的文本频率;b
为不属于c
类且包含特征项t
的文本频率;c
为属于c
类但不包含特征项t
的文本频率;d
为不属于c
类也不包含特征项t
的文本频率。则整个语料的χ
值为(2)
表3 建筑施工安全事故报告的初始特征项(部分)
以m
值作为降维阈值,移除大部分无价值的特征项,实现关键特征项的提取。在R语言中调用Boruta和Caret两个程序包,并用χ
统计功能实施特征项降维,其降维结果见图2。其中,纵坐标表示35个维度的关键特征项;横坐标表示词频。图2 建筑施工安全事故报告的初始特征项降维结果Fig.2 Dimension reduction results of initial feature items in construction safety accident reports
2. 4 特征项选取
对35个关键特征项分别按照有意的和无意的不安全行为、“人-物-环-管”4类影响因素进一步归纳整理,最终得到8项建筑工人的不安全行为及其27项影响因素,见表4。其中,由于工人心存侥幸而实施的不安全行为有违规操作、违反施工方案、违反作业程序等;由于工人经验不足而导致的不安全行为有经验施工和盲目施救。人的因素涉及工人自身生理状况和技能素质,如安全意识淡薄、个人无资格等;物的因素涉及机械设备状态和现场防护,如无现场安全防范措施、机械设备危险状态等;管理因素涉及安全管理制度和安全管理措施等,如监理失职、安全检查不到位等;环境因素涉及与安全相关的环境状态,如天气原因、作业环境未检测等。
表4 建筑工人不安全行为及其影响因素文本挖掘结果
为了使文本挖掘结果可视化,在R软件中加载Wordcloud程序包,得到建筑工人不安全行为及其影响因素词云图,见图3。其中,位置越靠近中央、字体越大、颜色越深的行为或因素,其重要程度越高。例如:“安全监管职责不到位”“安全教育培训缺失”处于词云图的中心位置,且字体较大、颜色较深,应对其高度重视和严格管控。
图3 建筑工人不安全行为及其影响因素词云图Fig.3 Word cloud of construction workers’ unsafe behaviors and influential factors
3 建筑工人不安全行为及其影响因素共现分析
3.1 建筑工人不安全行为及其影响因素共现网络构建
根据事故致因理论,事故发生是多种因素耦合作用的结果。建筑工人的不安全行为也是受到多种因素的影响或相互关联的。共现分析就是统计一组词语在大数据样本中共同出现的次数,进而分析其相互影响关系。将两组因素在一个事故中共现时计为“1”,不同时出现时计为“0”,再考虑全部的334起事故,将因素两两之间的共现次数进行累加,形成建筑工人不安全行为及其影响因素共现矩阵,见表5。例如:DB与HF在16起事故中同时出现。
表5 建筑工人不安全行为及其影响因素共现矩阵(部分)
基于共现矩阵,本文运用Ucinet软件绘制建筑工人不安全行为及其影响因素的共现网络图,见图4。其中,圆圈代表不安全行为;方块代表影响因素;它们之间的连线表示共现;方块(圆圈)的尺寸大小代表其在共现网络中的重要程度,反映了该因素或行为与其他因素或行为之间关系的紧密程度。例如:因素MF(安全监管职责不到位)的方块最大,表示它在整个网络中的重要程度最高,与其他的因素或行为的关系密切。
图4 建筑工人不安全行为及其影响因素共现网络图Fig.4 Co-occurrence network of construction workers’ unsafe behaviors and influential factors
3.2 建筑工人不安全行为的影响因素中心性分析
中心性反映网络中节点的重要性以及该节点与其他节点之间的紧密程度。中心度分为绝对中心度和相对中心度,前者表示节点i
与其他n
-1个节点的直接联系总数;后者指的是节点i
的绝对中心度与其他n
-1个节点最大可能的连接数之比,分别采用下面公式表示:(3)
(4)
根据上述表达式可计算出建筑工人不安全行为的27项影响因素的中心度值,并采用如下标准对建筑工人不安全行为的影响因素等级进行划分:中心度占比≥0.060的因素为关键因素;0.040≤中心度占比<0.060的因素为重要因素;0.020≤中心度占比<0.040的因素为次要因素;中心度占比<0.020的因素为一般因素,具体分级结果见表6。
表6 建筑工人不安全行为的影响因素中心性分级结果
3.3 建筑工人不安全行为的关键因素和重要因素分析
3.3.1 关键因素
(1) 安全监管职责不到位(MF)。行政主管部门对工程建设立项、招投标和安全生产等方面的工作监管不力,以及组织开展“打非治违”工作不深入、不彻底是引发事故的重要原因,尤其是对项目经理不到岗履职、建设单位随意压缩工期、施工单位出借资质等行为缺乏严厉的打击和整治。
(2) 安全教育培训缺失(MF)。建筑工人的流动性较高,部分企业为了节省费用而忽视安全培训,而文化素质低和安全培训不足导致作业人员凭经验和习惯施工、事故发生后盲目施救等违规现象屡禁不止。
(3) 隐患排查治理不彻底(MF)。部分施工单位存在隐患排查不彻底、整改不及时等问题,甚至在监理单位提出隐患整改单后仍无动于衷或敷衍了事,导致隐患持续积累或同类隐患反复出现。
(4) 安全检查不到位(MF)。部分施工单位并未严格落实施工安全检查制度,未能及时发现并制止施工人员的违规行为,未能发现施工现场安全防护设施缺失等隐患,进而导致各类事故的发生。
3.3.2 重要因素
在重要因素中,监理失职(MF)、施工单位无资质(MF)和违法发承包(EF)分别体现了监理单位、施工单位和建设单位等主要参与方的管理缺陷;专项施工方案编制审核不规范(MF)和未进行安全技术交底(MF)相互关联,施工方案编制审核不规范影响施工方案质量,进而影响交底有效性,而安全技术交底不充分,进一步降低了施工方案落实的效果;安全生产管理制度不健全(MF)反映了部分工程项目的制度建设滞后,不能满足安全管理需求;安全意识淡薄(HF)指部分建筑工人存在麻痹侥幸心理,无视安全责任制和操作规程,仅凭经验施工等;安全管理人员缺失或履职不力(MF)主要表现为管理人员缺乏责任心且能力不足,是各项安全管理工作开展不到位的主要原因。
4 典型事故案例分析
2019年5月16日11时10分左右,上海市长宁区昭化路148号厂房发生局部坍塌,造成12人死亡、13受伤,直接经济损失约3 430万元,该厂房坍塌重大事故发生的现场情况见图5。
图5 某厂房坍塌重大事故现场情况Fig.5 Site conditions of a major accident of a factory building collapse
4. 1 事故调查分析
经调查发现,昭化路148号厂房发生坍塌的直接原因是一层承重砖墙的承载力和稳定性不足,且未采取加固措施,在施工时承重砖墙(柱)瞬间失稳,从而引起部分厂房结构连锁坍塌。在该起事故发生过程中,主要参建单位(包括建设单位、施工单位、设计单位、厂房租赁单位和建设行业相关管理部门)均存在明显的管理过失或缺陷,具体如下:
(1) 建设单位未履行建设方主体责任。建设单位在项目未办理立项、报建等手续的情况下违规组织施工;将工程发包给不具备资质的单位和个人。
(2) 施工单位未履行承包方主体责任。施工单位主要负责人未履行安全生产职责;在缺乏施工组织设计、安全技术交底的情况下违规施工。
(3) 设计单位内部管理不严。设计人员在未经设计单位同意、未办理盖章手续的情况下,加盖了设计单位“工程施工图设计出图专用章”。
(4) 厂房租赁单位未履行对出租场地的管理责任。厂房租赁单位未对出租厂房的安全性进行检测;以租代管,对出租场所的安全检查不到位。
(5) 建设行业相关管理部门未履行管理责任。建设行业相关管理部门在发现项目未办理相关建设手续后,未依法对相关单位进行行政处罚;安全检查时,未能及时发现项目违法施工情况。
4. 2 事故致因识别
依据文本挖掘及因素分类结果,识别该厂房坍塌重大事故出现的事故致因即影响因素,得到该事故致因的等级和具体表现,见表7。
由表7可知,27项建筑工人不安全行为的影响因素中有13项在该重大事故中出现,其中关键因素3项、重要因素4项、次要因素6项和一般因素0项;
表7 案例事故建筑工人不安全行为的影响因素识别与具体表现
事故中出现的3项关键因素和4项重要因素都属于管理因素,说明管理上的缺陷如隐患排查不彻底、安全检查不到位等往往是建筑施工安全事故的根本原因,从而导致工人的不安全行为;此外,重要程度高的关键因素、重要因素和次要因素在事故中大部分出现,而一般因素无一出现,这说明文本挖掘识别出建筑工人不安全行为的影响因素及分类结果能较好地反映建筑施工安全管理的实际情况,具有合理性和实用性。
5 结论与建议
(1) 本文借助文本挖掘和R语言技术,通过词库建立、文本分词和特征项降维等流程,从我国334份较大及以上严重程度的建筑施工安全事故报告中识别出8项建筑工人的不安全行为及其27项影响因素,并用词云进行了可视化展示。
(2) 利用词共现网络图展现各行为及因素间的共现关系,并根据中心度将27项建筑工人不安全行为的影响因素划分为关键因素、重要因素、次要因素和一般因素4个级别。其中,政府安全监管职责不到位(MF)、安全教育培训缺失(MF)、隐患排查治理不彻底(MF)和安全检查不到位(MF)为关键因素,应对其高度重视和重点管控。
(3) 以上海市的某厂房坍塌重大事故为案例,对比分析了建筑工人不安全行为影响因素的文本挖掘分析结果与案例实际发生情况,发现两者具有较好的契合度,从而验证了文本挖掘和因素分级结果的实用性和可靠性。
(4) 本文运用文本挖掘技术识别了建筑工人不安全行为及其影响因素,后续研究可从认知心理角度进一步探索各种因素对建筑工人不安全行为的影响路径,并提出相应的预防措施,以规范建筑工人的行为。