企业职业健康安全数据分析的挑战与机遇研究
2023-12-16范韬
范韬
(中钢集团武汉安全环保研究院有限公司,湖北 武汉 430081)
0 引言
在职业健康安全领域,国外大数据分析为预测和预防作业伤害提供了帮助。例如,加拿大黄金公司Goldcorp金矿开采公司聘请了专业咨询公司检查其5 a 内职业健康安全数据,包括2 000 起安全事故和180 万d 的工作时间,以及人口统计、生产经营、天气数据等,并分析确定了薪酬与伤害、伤害率与年龄、伤害率与工作岗位等之间的关系。但是大规模数据收集和复杂数据分析方法的应用也面临诸多挑战,包括职业健康安全专业人员缺乏数据科学方面的知识和经验、员工隐私问题、缺乏集中数据库、缺乏对数据分析潜在益处的理解等。
1 安全数据分析定义
数据分析在职业健康安全领域的应用仍处于探索阶段,现有国内外文献在研究内容和研究范围上差异很大,比如研究内容取决于研究者关注的主要问题,研究范围既有企业内部层面的,也有扩展到跨企业、跨部门范围。例如,CHENG C W 等[1]进行的一项关于建筑行业职业伤害的跨部门研究,利用的是台湾地区主管部门收集的数据,调查的变量包括事故类型(如触电、交通事故等)、项目类型、公司规模、项目合同金额、伤害来源、工人性别及年龄、不安全状态(如未提供个人防护装备等)、不安全行为和安全管理体系(如提供安全培训、进行自检等)。该研究使用分类和回归树来识别与职业伤害相关的因素,其中发现,安措成本低于500 万新台币(约16.6万美元)的小型企业(少于10 人)的建筑项目更有可能发生跌倒伤害。但是此类分析缺乏代表企业内部运营的数据,难以识别出具体的可操作性干预措施。
与政府层面收集的职业伤害数据库相比,企业也可以利用更多的数据来源去捕获危险发生的背景。例如,LINGARD H 等[2]报告了一个分析项目,该项目利用某企业内部大型基础设施建设项目的数据,合并来自企业安全项目的数据(如班前会议、热负荷会议、安全观察、危险报告等)以及受伤的频率,通过整合指标识别出先行指标和滞后指标之间的循环模式。在这种模式中,受伤后通常会采取预防措施,例如增加工具箱会议,随着受伤时间的增加,预防措施的频率会降低。在另一项对新加坡某建筑承包公司收集的数据分析中,发现某些变量与建筑项目的特征(如项目类型、所有权、安措成本等)有关,某些变量与内部安全检查有关(如坠落危险、脚手架安全等)。利用这些数据,本文构建了5 种不同类型的机器学习模型来预测历史数据中无事故、小事故和重大事故的发生情况。该研究分析中的最佳拟合模型模拟随机森林的分类模型,在预测事故方面达到了78%的准确率。这项研究的结果表明企业层面的数据可以揭示更精确的相关关系。
如上所述,利用政府管理机构收集的数据进行分析,有些跨部门层面的研究问题得到了解决,但是由于信息数量有限,很多情境下分析结果并不完整。相比之下,在企业内部进行数据收集和分析,大大增加了可用数据的类型和来源,可以整合来自企业内部层面的具体信息,有效地进行职业健康安全预测和预防工作。表1 提供了按企业内部不同部门分类收集的内部变量示例。
表1 企业安全措施内部数据类别示例
安全指标可划分为先行指标和滞后指标,对通过分析预测和预防伤害尤为重要。先行指标是为了预防安全事故发生而采取的措施,包括安全管理系统的各个方面,观察、审计和班前讨论;滞后指标是传统的用于衡量结果的安全指标,如伤害频率、伤害严重程度和损失工作日。安全环境是衡量员工对工作场所安全态度的先行指标,通常通过自我报告的调查问卷进行评价。
2 安全数据分析前期准备
通过职业健康安全分析有利于降低职业环境中伤害的发生,但是为了得到可操作性的分析结果,必须做好相应前期准备。ARNOLD K E 等[3]描述了职业健康安全分析前期准备不可或缺的4 个因素如表2 所示,各要素之间的关系如图1 所示。
图1 职业健康安全分析前期准备要素关系
2.1 专业技术知识
专业技术知识是指拥有进行各阶段分析所需的各类权威知识。职业健康安全数据分析阶段包括数据收集、数据存储、数据解释和应用分析模型。除了描述性、诊断性、预测性和规范性分析的专业知识之外,还需要数据库管理、配置计算机软件和数据加密方面的技能。职业健康安全数据分析需要各类专家之间的协作,包括来自信息技术部门、人力资源部门以及职业健康安全部门的人员。数据技术专家关注开发大数据分析的基础设施,例如管理服务器平台或开发仪表板,专业人士关心的是通过数据分析和项目管理将数据分析结果转化为企业可操作的具体步骤。
2.2 IT 基础设施
IT基础设施是指拥有数据分析所需的硬件和软件组合。数据分析通常需要对硬件和软件基础设施进行大量投资,因此企业的高层领导必须愿意优先考虑投入资金购买必要的工具以进行分析。IT 基础设施因素与专业知识因素可以重叠,企业需要有适当的人员来开发、构建和执行IT 基础设施,进行分析并将结果有效地传达给最终用户。
2.3 数据
数据是分析的基础。致力于数据分析的企业可能拥有成熟的安全行为规划,每天收集大量数据,包括安全行为观察、危害分析和安全审计等,将这些数据与其他部门的数据综合分析,可以获取新的见解,当然也要注意确保数据满足适当的分析标准。描述数据质量的维度包括完整性、正确性、合理性、通用性和一致性。完整性是指表单内是否缺失了数据;正确性是指数据测量的对象符合要求;合理性与数据的“可信度”有关,数据与实际相符;通用性与数据的可用性和及时性有关;一致性是指数据以一致的方式输入并在不同时间范围内保持可靠。可以利用黄金标准对照、数据元素一致性和分布比较等方法评估收集数据的质量。通过不同维度数据质量的评估,可提示企业增加收集相关安全数据的频率,提高数据质量,改进其行为安全计划,并简化跨部门的数据聚合。
安全结果变量的限制是与职业健康安全数据质量相关的常见问题。例如,安全绩效通常根据记录的伤害频率或急救频率来评估。这些滞后指标变量的频率可能较低,特别是在伤害频率相对较低的行业或具有完备的安全计划的企业中。因此,仅包含伤害或其他低频事件的数据库可能无法进行具有洞察力的分析。例如,在一项讨论工人安全氛围与伤害之间关系的研究中,在讨论安全氛围和伤害频率变量之间的关系时,安全结果变量就受到限制,研究中增加了对人员流动意图、安全解决方法和危险程度变量的考察。
数据分析的目的是为预测伤害以及发现影响安全工作的变量并提供具有操作性的建议。企业可以选择整合多个部门或机构的数据以获得观测值。例如,澳大利亚耗资数十亿美元的某建筑基础设施项目中,研究人员汇总了众多承包企业的数据,对安全指标之间的关系进行时间序列分析。通过扩大项目数量,既包含伤害频率相对较高的建筑项目,也包含伤害频率相对较低的建筑项目,以获得可供分析的数值。
2.4 数据文化
数据文化因素与组织对待数据收集、处理的规范和实践有关。GUPTA M 等[4]对数据文化的定义是“组织全体成员根据数据分析的结果做出决策的程度”。这一定义需要企业所有员工参与数据流程,且数据分析中获得的结果可供有需要的员工使用。例如,行为安全计划通常依靠工人的参与来促进安全工作实践。此类计划可以作为职业健康安全分析的支柱,一线员工在收集即时数据(通常来自自愿的点对点安全观察)方面发挥着关键作用。事实证明,鼓励工人直接参与的计划可以有效改善安全氛围和文化。
同样,组织的数据文化可以通过由员工发起的安全实践来改善。例如,如果某企业的员工完成并提交了任何观察到的安全和危险行为或安全检查表,并且通过安全简报传达的信息导致了安全工作实践的改进,他们会更倾向于以更高的保真度和规律性收集信息。在强大的安全数据文化中,各级员工都积极参与,与安全专家和IT 部门合作,利用收集到的数据来改善工作场所安全。
ALHASSAN I 等[5]认为数据整理涉及建立分析目标、制定数据政策和程序、定义角色和职责等。尽管许多公司已经收集和跟踪安全相关数据,例如安全观察和伤害记录,但缺乏数据治理来描述将收集和存储哪些数据,那么进行安全分析时可能会面临困难。在由多个部门组成的大型企业,各部门管理安全数据的方式可能存在显著差异。每个部门可能收集不同的数据,以不同的方式命名相同的变量,并以不同且可能不连接的数据存储技术存储数据。为了避免这种情况,组织应该在不同的部门之间实施尽可能一致的数据治理政策,这些政策帮助描述要收集哪些数据以及如何构建所收集的数据(如变量名称、类型等)。建立集中式数据存储设施以实现整个企业的安全分析。
数据整理还可以解决对隐私和安全的担忧。员工可能会担心数据将如何使用,并且随着用于跟踪员工生理状态或环境条件的可穿戴传感器等技术的开发和实施,这些担忧不断加剧。企业可以制定与数据隐私和安全相关的协议,概述谁有权访问数据、如何使用数据以及如何保护数据。例如,应制定与数据安全和安全漏洞意外事件相关的策略,作为数据分析的先决条件。
3 职业健康安全数据分析发展趋势
职业健康安全领域尚有许多问题有待研究,表3总结了该领域值得关注的一些问题及未来发展方向。
3.1 前期准备情况
对数据分析的前期准备情况进行评估,将有利于企业后继的安全数据分析。例如,医疗行业开发的前期评估工具HAPRA 根据5 个因素对其准备程度进行自我评估:数字医疗技术、IT 基础设施、用户对技术的采用、技术的质量、可用数据和管理协调。该评估提供工具可将评估值与理想值进行对比,并指导如何提高前期准备程度。在职业健康安全领域,企业可以开发类似的测量工具来评估前期准备情况并揭示有关如何改进的路径。
3.2 分析方法
针对高阶分析方法的不同阶段(如描述性、诊断性、预测性和规范性)、建模技术(如分类、聚类、回归)和运用这些分析方法得出的分析结果进行验证,有助于拓展职业健康安全领域的知识成果。
根据“经验法则”来处理特定类型的数据或解决特定类型的问题,将帮助企业更有效地实施分析过程。为了获得经验信息,研究者可以进行调查研究,要求企业汇报采用的分析类型、具体的分析方法以及拟解决的问题。另外,了解实施分析失败的案例以及失败的原因也很重要,对该领域进行系统回顾也可以找到有价值的信息。
研究显示针对不同行业,从企业层面进行分析将有助于探究获得有价值的分析结果需要什么类型的数据和数据量。迄今为止发表的大多数职业健康安全研究都是基于大型政府数据库进行的,针对企业层面数据进行的研究较少。中小型企业进行职业健康安全分析可能会面临特殊的挑战,揭示职业健康安全分析为中小型企业可能带来的特殊好处是值得的,因为中小企业占据了绝大多数。
3.3 技术集成
技术的进步促进了传感器和其他智能设备的开发,这些设备可以纳入职业健康安全分析中,以进一步提高工作场所安全性。例如,可穿戴传感器可以监测工人的身体健康状况,包括他们的生命体征(如心率、体温、呼吸)、振动暴露和人体工效。工作场所中的传感器技术包括射频识别(RFID)传感器,已开发用于跟踪个人防护装备的使用情况并提醒工人是否靠近危险机械,还包括用于监测管道内腐蚀的超声波技术、用于识别土木和工业工程中的裂纹和微裂纹的声发射监测等。可穿戴环境传感器对员工和企业都有广泛的好处,因为传感器可以收集有关环境条件和潜在危险的实时数据;传感器可以向工人提供及时的反馈,以减轻危险并防止不良事件的发生;传感器收集的数据可以通过实时仪表板纳入职业健康安全分析,以改善员工的健康和安全状况。
3.4 数据文化
研究表明,组织安全文化的几个关键特征可以促进有效的安全绩效。将文化的概念扩展到组织围绕数据收集的态度、信念和规范、收集数据和使用信息进行决策、数据系统和基于数据的决策所涉及的个人行为似乎是合理的。更好地理解组织的数据文化需要一个评估工具——一种评估机构或企业的数据文化的工具,特别是围绕其安全数据的工具。例如,该工具的目标之一可能是评估一线员工和管理人员对收集安全数据的承诺以及对高层管理人员正确使用数据的信任。
与数据文化相关的另一个研究目标是研究组织数据文化如何与分析应用相关联。与此目标相关的一个研究问题可能是:具有强大行为观察计划的安全计划是否可以通过分析获得更多可操作的见解?研究这一假设可能涉及向机构和企业传播数据文化调查,并询问与其安全管理系统、数据收集过程和分析过程相关的问题。与这个潜在项目相关的一个假设是,具有强大数据文化的机构和企业正在进行更成熟的分析阶段。
3.5 分析影响
分析在职业健康安全中的应用是一个新兴领域,因此安全研究人员和专业人员将从看到许多成功和不成功应用的例子中受益。尽管有人呼吁将分析应用于职业健康安全,但缺乏研究证明其在减少工人伤害和疾病方面的有效性。其他成功实施分析的公开报道可能有助于职业健康安全专业人员获得管理层和工人的支持,并有助于改进和完善分析方法。对“暗”职业健康安全数据(即已收集但不用于得出见解或为决策提供信息的信息)的检查将有助于加深对导致事故的情况的了解及预防事故,例如,使用文本分析来检查事件或审计中包含的开放式文本信息。纳入目前传统上未纳入职业健康安全分析的数据源(如人力资源、运营、客户和销售信息等)也将提高职业健康安全预测模型的有效性。考虑到大多数组织可用的技术和自动化以及集中大部分运营数据的推动力,这种类型的数据聚合和分析应该是可能的,但还需要更多的研究来开发标准化协议,以提高跨行业数据集的通用性和聚合性。
4 结语
曾任美国安全工程师协会主席的ERRIE NORRIS 表示,“工人死亡人数统计上的稳定水平并不是一项成就,而是证明某个国家保护工人的努力陷入停滞的证据”,她呼吁采取新的范式来解决这一问题。在如今计算机软件和硬件技术进步的信息时代,企业可以实现实时收集大量与安全相关的信息,将大数据分析的概念和原则扩展到职业健康安全领域,并强调在企业层面进行分析的重要性。
本研究可帮助职业健康安全管理、技术研究人员接受数据分析带来的挑战和机遇,以打破安全绩效的稳定状态并进一步减少工伤和死亡。