APP下载

基于数据挖掘的施工危险识别注意投入与分配研究*

2023-02-24裴中玉张泾杰张梦月

中国安全生产科学技术 2023年1期
关键词:注视点轨迹当事人

张 帅,韩 豫,裴中玉,张泾杰,吴 晗,张梦月

(1.江苏大学土木工程与力学学院,江苏 镇江 212013;2.江苏大学城市环境与工程安全行为系统研究中心,江苏 镇江 212013;3.江苏大学管理学院,江苏 镇江 212013)

0 引言

建筑业是事故频发的高危行业,建筑施工现场复杂、动态特性,加重危险识别难度,导致安全事故发生。事故分析表明,当事人没有对危险目标投入足够的注意资源,未能准确识别危险是产生事故的重要原因[1],此外,工人在施工活动中首要任务是施工作业,而不是危险识别[2]。多重任务和干扰的不利作业环境,导致工人未关注到危险目标,进一步加剧对危险目标不合理的注意资源分配问题,并且传统施工安全研究主要集中在外显因素层面,对内隐问题关注较少。因此,迫切需要进一步采用多学科交叉的先进手段揭示危险识别内隐特性,了解施工情境中危险识别注意资源动态分配规律,掌握工人对不同危险目标的注意投入偏好,协助工人更及时、有效地识别危险,从根本上减少事故数量。

危险识别在预防和减少事故发生中发挥基础和先导作用,是行为安全研究中的重要主题,也是安全行为与认知心理学交叉领域研究重点。现有研究从认知负荷[3]、注意分心[4]、注意盲视[2]等角度分析危险识别等深层问题以及认知结果的差异[5]、特性、成因[6]和失误识别[7],并证明提高对危险目标的注意有助于控制和调节施工失误和不当操作[4]。目前,采用动态指标分析危险识别注意资源分配与投入变化研究较少,部分文献从注视轨迹分析危险识别的视觉搜索策略[8]和不同年龄的视觉搜索差异[9]。但现有研究主要以危险识别静态表征为主,未能揭示工人危险识别主动搜索行为中注意资源对目标的投入动态过程,缺乏从前期到后期注意投入目标倾向特征和时空分配变化规律研究,研究结果缺乏针对性,无法及时有效进行危险识别前摄引导。

因此,本文拟通过眼动试验和数据挖掘相融合的新视角,以重心平均动态时间规整(DTW Barycenter Averaging,DBA)算法挖掘施工情境中注视轨迹序列,表征注意资源动态分配,利用k-means聚类和注视熵分析注意资源在施工情境中时空分配变化规律,并采用Needleman-Wunsch 全局序列对齐算法和统计方法分析工人注意资源对危险目标投入倾向差异。研究结果可为改善施工安全培训、提高工人危险识别绩效、优化注意资源分配、减少建筑事故等提供科学建议。

1 研究设计

注意资源分配蕴含在当事人对危险目标的主动识别搜索过程中,是对危险目标偏好和注意投入的体现,具有不易观察的内隐特征。眼动追踪试验可以获取当事人危险识别注视轨迹等眼动数据,反映危险识别注意资源投入变化规律、时空分布特征等信息。

1.1 眼动试验方案

通过工地调查走访,利用照相机广泛采集588 张包含住建部通报的高处坠落、物体打击、土方、基坑坍塌、机械伤害等典型事故原始状态施工的照片,作者团队经过初步筛选,剔除质量较差和不含危险目标的照片,得到有效照片297 张,经专家、施工现场安全人员和作者团队讨论,最终筛选确定20 张施工照片作为眼动试验素材,包含脚手架踏空坠落、钢筋机械加工和电焊作业等场景,以体现不同事故特征及施工阶段。试验采取非侵入方式追踪眼球运动,能够较大程度满足被试在试验中的自由度,设备频率60 Hz,可在17 ms内自动测定被试对危险目标的刺激,获取被试在施工情境中危险识别任务的注视轨迹序列。

为避免采用具有施工经验、不同工种工人产生的认知惯性及思维定势等带来的危险目标偏好[10],研究选取55 名裸眼或矫正视力正常,无色盲、色弱等眼部疾病的土木工程、工程管理专业本科生和研究生作为被试,所有被试均要求专注于施工情境中的危险识别任务,以获取完整的注视轨迹序列。

本文研究旨在探索当事人在危险识别过程中对不同危险目标特征的注意资源投入与分配时空变化规律。为方便后续注视点编码和对比,以注视轨迹的完整性、危险目标的易识别性等条件筛选试验数据,初步选取既包括机械伤害、高处坠落、触电、坍塌等高危、频发的典型施工场景,又满足注视轨迹数据完整性等要求的3 张施工情境试验素材数据。

根据情境中潜在危险目标数量、情境开放性等标准将其划分为3 类复杂程度情境。例如在情境a中,危险目标主要包括机械切割伤害、材料堆放和工人等;在情境b 中,危险目标主要有脚手架踏空坠落、木板掉落失稳和工人等;在情境c中,危险目标由配电箱、混乱的电线、工人、堆放木板、工具等组成,危险目标数量多,情境复杂;考虑到情境a,b 危险数量相似,但情境b 为开放情境,干扰因素较多,比情境a复杂,因此,将3 张施工情境根据专家、施工经验丰富的工人和作者团队讨论的危险目标数量、情境开放性等标准,按照复杂程度递增顺序划分为施工情境a,b,c。研究以最终确定的3 张试验素材的165 组序列数据为支撑,分析危险识别过程的注意投入和分配规律,如图1所示。

图1 眼动试验素材Fig.1 Eye movement test mater ial

1.2 数据挖掘方法

眼动追踪注视轨迹是当事人在危险刺激下,按时间先后顺序产生的注视点连线,包含注意资源在时间和空间分配变化等信息,是表征危险识别注意资源动态投入变化的重要眼动心理指标。但集合中的每条序列长度不等,且其在时间轴上的特征可能是错位的。针对时间序列集合,数据挖掘领域提出动态时间规整(Dynamic Time Warping,DTW)算法[11],用于比较长度分别为m,n的时间序列,即X=(x1,x2,…,xi,…,xm)和Y=(y1,y2,…,yj,…,yn)。DTW 算法主要包括以下2 个步骤:

1)根据2 个序列,构造m×n 的距离矩阵D,如式(1)所示:

式中:dij表示xi和yj之间的欧式距离;m,n 分别表示序列X,Y的长度;D为2 序列的距离矩阵。

2)利用动态规划思想在D中寻找最优规整序列。为找到最优规整序列,定义规整序列W=(w1,w2,…,wk,…,wK),其中,序列中第k个元素wk=(i,j)k。为确保序列为全局最优、累计距离最小,如式(2)所示:

式中:d(wk)=d(xi,yj),表示在序列k处对应的i、j;K满足max(m,n)≤K≤m+n-1;DTW(X,Y)即序列X,Y的DTW距离。

式(2)需要满足边界性、连续性和单调性3 个约束条件,即DTW 算法必须从d(1,1)到d(m,n)且不允许跨越匹配和交叉匹配,利用动态规划方法求解DTW 距离如式(3)所示:

式中:i∈{1,2,…,m};j∈{1,2,…,n};D(0,0)=0,D(i,0)=D(0,j)=∞。

动态时间规整算法主要分为局部平均策略和全局平均策略,局部平均策略导致每次迭代获取的平均序列长度变长,不利于后续分析,因此Petitjean 等[12]提出重心平均动态时间规整(DBA)算法,以全局平均策略计算时间序列集合的平均序列。该算法是期望最大化迭代算法,其目的是最小化平均序列到序列集T={T1,T2,…,Tn}的DTW距离平方和,即采用该序列作为该情境中危险识别注意序列,计算平均序列如式(4)所示:

式中:X为从序列集合中随机选择的初始化序列;Ti为序列集合除X外,从集合中随机选择的其他比对序列,由2 者计算更新生成新的X序列。

更新生成新的X序列主要包含2 个阶段:1)随机选取1 条时间序列X作为初始序列,计算每个单独序列和该初始序列的DTW 距离,以便找到初始序列坐标和序列集坐标之间的关联;2)将初始序列上的每个序列坐标与其关联的序列坐标分为1 组,计算平均值,将该序列更新为初始序列。

2 数据处理与分析

2.1 注视轨迹序列聚类和注视熵分析

首先,将注视点跳出施工情境等不完整的注视轨迹剔除,构建完整的注视轨迹序列数据集。注视屏幕分辨率为1 680 ×1 050,眼动追踪设备可以记录被试群体的注视轨迹,以像素点的形式保存为坐标,通过Tobii Studio3.2.2 软件导出。最终试验施工情境分别导出51,49,47 条有效完整的危险识别注视轨迹,长度范围为18~153。将序列数据采用DBA算法挖掘,获取相应平均序列,经计算较低、中等和较高复杂程度施工情境中的注视轨迹序列长度分别为102,131,122,即该情境中注意资源动态投入和分配变化序列。

将数据挖掘得到的序列进行k-means聚类,分析注意资源在施工情境中空间分布特征,采用轮廓系数法(Silhouette Coefficient)确定最佳聚类值。对于任意样本点xi,其轮廓系数定义如式(5)所示:

式中:a(i)为样本点与同簇中其他样本点的平均距离,称为凝聚度;b(i)为样本点到与它相邻最近簇中所有样本点平均距离的最小值,称为分离度;S(i)为该点的轮廓系数,聚类效果总轮廓系数是所有样本点轮廓系数的平均值,该系数介于0~1,数值越大,表示聚类效果越好。

轮廓系数对注视轨迹序列聚类评估情况如图2所示,试验选用较低、中等和较高复杂程度施工情境中最佳聚类值分别为3,3,9。不同复杂施工情境中,序列长度和最佳聚类个数呈现较大差异,如图3所示。如中等复杂程度施工情境序列相对较高,复杂程度施工情境较长,但聚类个数较少,这表明当事人对不同聚类区域中的注意投入不均匀。采用最佳聚类值分别对注视轨迹序列进行聚类,以上三角符号标记为起点,下三角符号为终点,聚类中心以黑色原点为标记,如图4所示。

图2 聚类效果轮廓系数变化Fig.2 Change of contour coefficient of clustering effect

图3 序列长度和最佳聚类个数Fig.3 Sequence length and optimal clustering

图4 注视轨迹序列聚类Fig.4 Cluster map of gaze track sequence

为讨论注意资源在不同区域的分配变化特性,引入“注视熵”的概念[9],注视熵是衡量注意资源在不同聚类区域转移过程无序化的重要指标,能够为分析当事人注意资源在施工情境空间分布变化的随机性提供支撑。注视熵越高,相应注意分布空间范围更广、转移变化随机性更高。随施工情境杂乱程度、危险目标数量等复杂性递增,注视熵出现明显上升,如图5所示。这意味着在较复杂的施工情境中,当事人需要处理的危险目标较多,注视点在不同区域转移变化,此时注意资源在不同区域之间转移分配变化更加频繁。注视熵计算如式(6)所示:

图5 注视轨迹序列注视熵值Fig.5 Gaze entropy values of gaze track sequence

式中:X为总长度为n 的注视轨迹序列;(x,y)为其中某个注视点坐标;p(x,y)为该注视点所属聚类区域的注视概率。

2.2 注视轨迹序列全局对比和统计分析

为比较分析当事人在不同施工情境中危险识别注意资源投入的目标倾向变化特征,根据施工情境中危险搜索结果,例如注视停留在墙面、木板过路等目标,即判定识别错误,编码为W;停留在工人等低危险目标,编码为L;停留在切割设备、电线或外凸钢筋等高危目标,编码为H,以此对挖掘到的注视轨迹序列逐一编码。采用Needleman-Wunsch 算法对编码序列进行全局对比[13],并按照时间顺序将其等分为3 段,如图6所示。根据编码序列建立相似度矩阵,计算注视轨迹的相似性得分,计分规则为:匹配得1 分,不匹配和间隔空位时减1 分。得到相似度矩阵每个单元得分,利用回溯算法找出最佳共有编码序列,从上到下分别为低中、低高、中高施工情境注视轨迹序列对比情况,相似度得分分别为58,45,81分。由图6可知,不同复杂程度施工情境中,危险识别注视轨迹序列具有较高相似性,尤其是进入危险识别稳定阶段,注视序列集中在施工情境中具有较高系数的危险目标和区域;结合时间序列观察,在危险识别进入后期时,当事人注视点分布区域进一步扩大,对整个视野进行复查,注意资源重新分布在施工情境各区域中。

图6 注视轨迹序列编码对比Fig.6 Coding comparison of gaze track sequence

根据编码后的序列,采用统计方法分析危险识别开始到结束动态过程中,当事人注意资源在不同危险目标上的投入倾向。相关眼动追踪研究表明[14],大约10 次注视点后,会形成稳定的任务驱动注视轨迹。以前10个注视点为前期注意投入,最后15%的注视点作为后期注意投入,剩余中间部分为中期稳定注意投入,分别对试验选取的较低、中等和较高复杂程度施工情境中注意资源投入到墙面等错误目标(W)、工人等低危险目标(L)和切割设备、电线等高危险目标(H)进行统计,结果如图7所示。由图7可知,在前期注意投入,当事人倾向将注意资源投入到施工情境中的显著位置和目标;进入稳定识别阶段后,注意资源倾向集中在施工情境中高危目标,例如在较高复杂程度情境中,中期稳定识别阶段占比95%,而识别错误率仅为1%;在后期注意投入,注意资源倾向在不同区域进行切换,识别错误注视点较少,但后期识别错误率均超过20%,高于前期和中期识别错误。

图7 注视轨迹序列过程变化Fig.7 Process change of gaze tr ack sequence

3 施工危险识别的注意资源投入与分配

3.1 危险识别中的注意资源在目标上的投入倾向

危险识别活动通常包括目标搜索和判断过程。通过对危险识别注视轨迹序列编码分析,危险识别准确率较高,这是因为在形成注视点之前,当事人会对施工情境进行扫视,继而集中注意资源形成注视点,完成对危险目标的判断和确认。注视点是危险目标辨识判断的结果,视觉搜索主要通过扫视完成,不易形成注视点。由此可知,当事人在危险识别时,首先投入较少的注意资源进行扫视,完成对施工情境中较为直观、危险系数较大的危险目标和区域的快速筛选,无法形成高注意资源消耗的注视点,具有自动化行为特征[15]。

此外,当事人在危险识别时,首先由自下而上的注意资源加工启动,随后被自上而下的注意机制驱动完成任务。经过对注视轨迹序列编码并结合聚类图分析,发现当事人首先将注意资源投入到显著位置,即首次注视点主要位于施工情境中心位置,这表明危险识别任务启动后,当事人易受施工情境中自下而上视觉显著因素的无意识引导。经过大约10 个注视点进入危险识别稳定中期阶段,当事人将注意资源投入到施工情境中切割设备、外凸钢筋等高危目标,并形成较高危险目标的集中识别序列,相关研究也验证在复杂施工情境中,注意资源受自上而下的注意控制更强[16]。进入危险识别后期,当事人注视点在不同聚类区域间出现较为频繁的注意切换,重新检查施工情境危险目标,导致危险错误率提高,例如在中等复杂情境中,后期错误率达40%,随后结束危险识别任务。因此,在施工安全教育培训中,应考虑当事人危险识别注意投入倾向特征对改善安全培训的积极影响,规范施工现场生产秩序,减少来自现场杂乱物体的干扰,引导和强化2 种视觉注意加工机制融合识别,有助于提高当事人危险识别行为绩效。

3.2 危险识别中注意资源空间分配变化

首先,当事人危险识别过程的注意资源随施工情境复杂性增加呈均匀分配的空间特征。危险识别注视轨迹序列最佳聚类个数随施工情境复杂性增加而增多,但最佳聚类值和序列长度之间存在非线性关系,如图3所示。危险识别注意资源分配与情境危险数量、杂乱等复杂危险目标区域密切相关,并直接表现为最佳聚类个数。在危险目标较多、区域分散的复杂施工情境中,危险目标聚类区域更多,但每个区域注视点较少,这可能与复杂施工情境中带来的认知负荷有关[3],每个区域只能分配较少的注意资源,导致无法产生更多的注视点,注意资源更加均匀的分布在施工情境中,不利于重点识别施工情境中的危险目标。

此外,随施工情境复杂增加,当事人危险识别注意资源在不同聚类区域之间分配变化更加频繁无序。结合注视熵发现,在危险更多、秩序更为混乱的复杂情境中,注视熵更高,当事人的注意资源需要在不同聚类区域频繁转移变化识别更多的危险目标。这意味着注意资源分布更加分散,当事人环境意识更强,该情况与驾驶情境中危险识别特征较为相似[9],当事人需要不断调整注意,扩大关注区域,以便在各区域进行切换,获取更多危险信息;而在复杂性较低的情境中注视熵较低,当事人往往投入更多的注意资源在确定的区域检查,注意资源分布较为集中。因此,在施工现场安全管理中,相对复杂的施工情境中应分配更多的注意资源,以提高危险识别绩效。

4 结论

1)当事人危险识别各阶段注意资源投入具有明显的目标倾向差异,在自下而上的注意机制引导危险识别前期,当事人倾向于情境中显著的位置和目标,进入稳定识别阶段,由自上而下的注意驱动倾向集中在危险系数较高的目标。

2)当事人危险识别注意资源空间分配区域和情境危险目标、杂乱程度等复杂特征密切相关。随施工危险目标、区域增多,注意资源在情境中分配更加零散、均匀,转移变化更加频繁,这不利于有效重点识别危险目标。

3)后续将借助虚拟现实、脑电试验等开展更具情境化的危险识别研究,进一步探索注意资源在多重任务和干扰复杂情境下的投入和分配特征。

猜你喜欢

注视点轨迹当事人
眼动仪技术在里院建筑特色分析中的应用
我不喜欢你
基于超复数小波和图像空域的卷积网络融合注视点预测算法
轨迹
轨迹
什么是当事人质证?
轨迹
什么是赞扬激励法?
射击运动员的反向眼跳研究
进化的轨迹(一)——进化,无尽的适应