基于数据挖掘的现场作业风险态势评估方法
2020-04-24欧郁强严永高赵晓宁
蒋 毅,欧郁强,梁 广,高 杨,严永高,林 捷,赵晓宁
(广东电网有限责任公司安全监管部,广东 广州 510699)
0 引 言
近年来,国家发展改革委、国家能源局印发多项电力行业安全相关的实施意见、行动计划等文件,提出建立电力行业安全生产信息大数据平台,深度挖掘大数据应用价值,推进大数据、“互联网+安全监管”、电力及外部环境综合态势感知等新技术在电力建设和设备改造中的安全应用,不断加强电力行业安全风险监管。同时,每年第三和第四季度是供电企业施工作业的黄金季节,现场作业项目数量多,现场风险因素复杂,依靠有限的人力资源开展风险准确评估及制定有针对性的防控措施的难度越来越大。随着日益加强的现场监管要求,应用成熟的大数据及安全态势感知技术,在大量作业数据整合与深度分析基础上,建立风险态势评估模型,进一步提升作业风险评估及防控的智能化,具有很强的实际意义。
电力大数据在生产领域主要在电力负荷预测、输电线路风险识别、电网设备状态监测、电网运行态势评估与自适应控制、继电保护设备评价和管理等设备运营管理方面有成熟的应用实践[1-3]。同时,部分供电企业开始从安全生产角度,在现场作业管控方面积极探索在大数据背景下作业风险预警的策略和方法,通过事故事件案例、违章数据、生产计划及“两票”等海量数据的多维深度剖析,按照人、机、物、法、环等诱发因素,建立作业风险关联模型,寻求安全生产风险管控的最优解[4-11]。
综上,针对某省级电网公司目前在作业风险评估中存在的依据经验判断与历史数据应用不足,风险因素辨识的全面性与系统功能有待提高,评估结果计算不精准等缺陷,本文通过现场作业过程数据梳理,结合事故事件、违章等历史数据,应用数据挖掘方法,开展风险因素识别、指标分析及风险态势感知及预测模型构建。同时,应用信息技术开发智能评估工具,以提升现场作业风险评估的准确性、科学性,为开展现场作业风险动态管理、降低事故发生率奠定基础。
1 作业全过程数据特点
数据的获取是作业风险智慧化管控的重要基础。从数据来源、结构化程度和实时性等维度进行数据调研,现场作业全过程业务数据不仅涉及内部安全生产子系统和作业现场智慧安全监管系统等7个模块的数据、图片、文档等电子文档,还涉及气候、交通等外部数据,如表1所示。
表1 数据来源及特点
如表1所示,总共可以采集到60多万条计划数据、20多万条勘查记录数据、2万多条违章数据、860多起事故事件案例等海量数据,作为作业风险态势模型研究的数据基础。
2 作业风险态势评估指标体系建设
2.1 作业风险态势评估指标体系框架
根据事故事件、违章及作业人员数据分析,在识别出的人、机、料、法和环境等风险影响因素基础上,通过从人员、设备(机械)、材料工器具、作业方法、作业环境、时间管理等6个维度设计现场作业风险评估指标体系框架[12-16],具体步骤如下:
1)事故事件因素分析。
本文通过对全网2003-2019年39起人身事故及839起电力安全事故事件原因描述的数据分析,提取出事故事件致因因素特征,并对人身风险、电网安全风险的后果等级、发生频率及原因因素发生频率进行分析。其中,人身事故以1~2人死亡的比例最高,占到64%,电网安全事故事件造成人员轻微伤害(小的割伤、擦伤、撞伤)或设备、财产损失在1000元以下及造成设备、电力安全四级、五级事件的比例最高,占到67%。
应用帕雷托分析法(二八原则)对事故事件影响因素进行分析,其中,人员因素以人的违章行为、操作失误及监护不到位为主,设备(机械)因素以设备质量缺陷为主,材料工器具主要存在安全工器具和个人防护用品质量缺陷或配置不足问题,作业方法主要以临近带电设备、高空作业、交叉作业存在作业指导文件缺失、安全措施不符等问题,环境因素主要以气象因素影响最大。
2)违章影响因素分析。
根据2016-2019年的违章数据,本文通过统计平均每年本单位以及外单位的违章问题分布情况,开展人员、设备、方法、工具、环境等维度的因素分析,发现主要存在人员违章行为、作业监护、作业文件执行不到位及个人防护用品缺陷等问题,且各专业外单位作业均有习惯性违章作业人员,主要与施工单位管理有关。
3)作业人员分析。
本文根据省公司内部与外包单位人员数据,通过统计各专业的人员年龄分布、工龄分布、人员资质、工作负责人分布及经验等情况,开展人员维度的因素分析。以外单位变电专业为例,超60%的人员年龄在26~40岁之间、工作年限不足10年的超过60%、超40%的工作负责人作业管理每年少于4次。
综上,根据事故事件、违章及人员识别的18个风险因素,本文设计了作业风险态势评估指标体系框架,如图1所示。
图1 作业风险态势评估指标体系框架
图1中,人员因素包括同类作业熟悉程度、工作负责人过往违章扣分情况、作业资格、主要工作班成员年龄4个子因素;设备因素包括设备类型、设备质量缺陷、施工机械检查缺陷3个子因素;作业方法包括作业方式、停电、交叉作业、作业性质、作业指导依据5个子因素;工器具包括安全工器具检查缺陷、个人防护用品检查缺陷2个子因素;环境因素包括作业天气、作业地段2个子因素;管理因素包括承载状态评价和违章单位排名2个子因素[8-11]。
2.2 作业风险态势评估指标赋值方法
本文依据现场作业风险指标体系框架,根据历史数据分析指标因素与风险关联因素,并对发生概率及影响程度进行分级赋值,具体计算步骤如下:
1)因素指标关联分析。
本文根据指标框架,主要对指标与事故风险的关联关系进行分析。SPSS Modeler对因素应用自动分类模型推荐逻辑(Logistic)回归、贝叶斯网络及判别分析法这3种较高预测准确率方法,如图2所示,对因素与事故风险关联性分析模型进行筛选,综合考虑最终选用贝叶斯网络分析方法[12-13,17-20],如表2所示。
图2 因素与风险关联性分析筛选模型
表2 因素与风险关联性分析模型对比结果
应用SPSS Modeler,通过贝叶斯网络分析法分析出强关联和中度关联性指标,如图3和表3所示,例如通过分析人身安全事故的触电风险的强关联指标有违章扣分、作业地段、作业方式及作业监护。
图3 贝叶斯分析网络模型
表3 因素关联性分析结果
2)因素指标重要性分析。
应用SPSS Modeler对人身事故(事件)、设备及电网安全事故(事件)通过类神经网络算法预测各因素影响程度大小,作业监护为0.15,排在第一位即为重要影响因素;作业类型、作业方式、人员配置等预测大于0.1的即为主要影响因素,具体模型如图4所示,模型分析结果如表4所示。
图4 因素指标重要性分析模型
表4 因素指标重要性分析结果
3)因素指标赋值。
根据作业风险因素指标的关联性、重要性分析,按重要因素、主要因素及次要因素3类,制定指标分级评分标准如下:
①重要因素指标分级标准:最低级为1,其他级别逐级增加2。
②主要因素指标分级标准:最低级为1、其他级别逐级增加1。
③次要因素指标分级标准:最低级为1、其他级别逐级增加0.5。
以人员维度指标为例,指标分级标准如表5所示。
表5 人员维度指标分级标准
3 作业风险态势评估模型
根据作业计划,一项计划可能是单项作业也可能包含多项作业,为此分为以下2种计算方式:
3.1 单项作业项目风险值计算方法
根据因素的发生概率、影响程度,结合历史数据和企业标准,计算风险发生概率、对风险后果进行分级赋值,具体计算公式如下:
(1)
其中,N=6(6个维度),R为风险值,wk为第k个维度权重,pki为第k个维度因素i影响发生概率,S为产生的风险后果大小值。其中:
1)风险后果严重等级标准如表6所示。
表6 风险后果严重等级
2)维度因素权重计算。
根据因素关系分析,对变电、输电、配电、基建等专业,利用层次分析法(AHP)确定各因素维度权重,具体方法如下:
①确定标度值,建立判断矩阵。
通过问卷调查得出指标的重要性赋值均数,利用分值的高低确定相对重要性标度,构造出指标判断矩阵。
②计算权重系数。
采用方根法即几何均数法确定权重向量W以及相应的最大特征值λmax。
权重W计算方法为:
(2)
λmax的计算方法为:
(3)
③层次排序及其一致性检验。
用评价矩阵的阶数n查平均随机一致性指标RI表,计算一致性比例:
CR=CI/RI
(4)
CI=(λmax-n)/(n-1)
(5)
当CR<0.1时,则认为评价矩阵合理。
根据层次分析法,测算出6个维度权重,如表7所示。
表7 维度权重表
3.2 多项作业项目风险值计算方法
针对在一天内,工作计划中有一项以上作业时,在单项作业风险计算的基础上,该计划的多项作业项目总体风险值为:
Rm=max(R1,R2,…,Rn)
(6)
其中,R1,R2,…,Rn为各单项作业的风险评估值,其总值为:
R总=Rm×k1×k2×…×kn-1
(7)
其中,k1为最高风险单项作业外的第1项作业风险系数,k2为最高风险单项作业外的第2项作业风险系数,kn-1为最高风险单项作业外的第n-1项作业风险系数,其计算公式为:
(8)
3.3 安全态势指数模型
为显示地市局整体风险态势概况,在作业风险评估模型基础上,借鉴网络安全态势常用的指数构建方法对作业风险评估值进行归一化处理。对指数计算过程中的每一个细分的作业类型,按照下面公式计算作业安全指数。
1)归一化算法为:
(9)
2)地市局i安全指数模型为:
(10)
权重计算公式为:
(11)
其中,nij为该地市局i第j个作业类型的作业项目数量,k为该地市局作业类型总数。
3)态势指数分级标准。
将安全态势指数分为4级,指数及分级标准如表8所示。
表8 安全态势指数分级标准
以某供电局7月份的作业风险态势评估为例,操作类作业数量为6、风险平均值为56.50,检修类作业风险数量为4、风险平均值为56.75,基建类作业数量为5、风险平均值为40.8;全省操作类作业数量为17、风险平均值为96.59,检修类作业数量为13、风险平均值为90.49,基建类作业为16、风险平均值为80.38。该地市局安全指数为85.84,为A级,总体风险受控,风险因素动态波动幅度在可控范围内。
4 作业风险态势智能评估工具设计
4.1 数据整合技术框架
1)数据整合思路。
考虑到异构数据的独特性,通过对异构数据的抽取、转换、关联等方法,形成中间库,再对中间库数据进行检查、加载等操作,最终将数据更新到作业风险管控数据库,实现作业风险异构数据的整合,为作业风险态势评估离线工具提供数据支撑[16],具体整合思路如图5所示。
图5 数据整合思路
2)数据整合技术架构设计。
数据整合技术是开展数据分析、可视化的基础。根据作业全过程数据存储特点,数据获取、处理及存储采用以下2种形式:①未上业务系统或不能开放数据接口的系统数据,直接将业务数据、文档数据及电子档案等通过复制或者抽取到本项目构建的数据库中;②开放业务系统数据接口的数据,通过数据交换系统进入项目构建的数据库中,技术框架如图6所示。
图6 数据整合技术框架
其中,针对可开放数据接口的外接业务系统数据,项目采用开发数据服务Web Services接口,实现集合访问数据的功能,拟定将业务系统的开发数据通过WMS、WFS、WCS等组合方式推送到本项目拟开发离线工具上,针对纸质文档、图片、PDF等电子文档数据,首先采用OCR技术进行数据自动识别,并保存为Excel文件格式,再应用ETL技术导入数据库[21]。
4.2 作业风险态势智能评估工具功能规划
为实现作业风险态势智能化评估及管控,开发作业风险评估态势系统,系统主要功能范围包括“作业风险态势评估”“风险管控策略匹配”“统计分析”及“风险知识库”4大主题应用功能模块[11,17-19,21-24],如图7所示。
图7 系统功能图
作业风险态势评估系统主要模块功能如下:
1)作业风险态势评估模块功能。
现场作业风险态势评估分为2个部分:①对该公司现场作业进行风险评估,得出每个现场作业的风险值及风险等级、存在的具体危害因素,并根据天气预测、安全通报等电网环境数据,应用风险评估指标模型对作业风险状态进行动态评估调整,提出风险预警;②基于历史数据、作业风险状态数据,应用安全态势评估模型,开展风险态势评估。
2)风险管控策略匹配模块功能。
该模块主要根据作业风险值及风险等级、存在的具体危害因素及风险具体分布、作业风险预警与管控措施等实现自动匹配。选中某一项具体作业,自动弹出风险管控措施等功能。
3)统计分析模块功能。
对历史的和新增的现场作业进行风险等级统计及风险等级分布统计。以作业风险量化、综合作业风险态势量化、风险态势等为主题进行统计分析,从不同侧面直观地反应现场作业的风险情况,为管理决策层提供依据。界面实现以图形与列表结合的方式展示出作业风险量化、综合作业风险态势量化的功能。
4)风险知识库模块功能。
风险知识库包括制度文件、本地化管理要求、基准风险库及风险案例等内容的维护管理。
5 结束语
本文以实现电网作业风险智慧化管控为目标,从人员、设备、作业方法、工器具、环境及管理6个维度构建作业风险评估指标,结合数据挖掘算法构建态势评估模型,然后利用多源异构数据整合、数据分析及数据可视化技术开发作业风险态势评估系统来实现现场作业风险态势感知及智慧化防控。在不改变现有业务系统的基础上,可以有效开展综合指标计算、可视化展示和风险管控措施推荐,是行之有效的基于指标体系的风险态势感知,能够提升安全监管人员对现场作业风险的防控能力。