煤炭安全管理时序数据可视化方式研究
2021-06-23谭章禄
谭章禄,刘 洁,吴 琦
(中国矿业大学(北京)管理学院,北京100083)
煤炭企业安全管理过程中存在着海量的时序数据,当管理人员面对这些实时更新的数据时,难以从中快速高效地获取有效信息并及时做出决策。近年来,有不少学者将可视化技术应用到展示时序数据的过程中,可视化能够以更加直观的形态展示图形,并帮助用户实现信息的交互。因此通过探究煤炭安全管理时序数据的最优可视化展示方式,从而更为清晰直观地呈现企业安全管理过程中的问题,帮助企业管理人员准确把握煤炭实时动态。
1 时序数据可视化研究现状
时序数据是众多应用领域的决策基础,可视化方式的正确选择,能够为用户展示更为直观的时序数据的规律和趋势,方便用户根据统计结果做出科学决策。煤炭作为我国的主体能源,在国民经济发展发挥着重要的作用。近年来,国内外研究学者已将时序数据分析应用到煤炭领域中,通过计量经济学[1]、数据挖掘[2-3]等方法对相关时序数据进行分析预测。然而,目前学者针对时序数据最优可视化展示方式的研究较少,因此通过对煤炭安全管理时序数据进行可视化展示方式的研究,基于时序数据不同数据维度和管理任务类型层面下开展眼动实验,选择最为有效的可视化展示方式,从而帮助管理者及时有效地做出管理决策,全面提高煤炭安全管理水平。
2 时序数据可视化的管理任务及展示方式
时序数据代表了数据的某一个维度随时间发生变化[4],所以不同数据维度下选择的可视化展示方式是有区别的。对于管理人员来讲,时序数据可视化的管理任务是通过观察整体数据值的走向以及数据值之间的关系,从中发现时间序列存在的规律,即整体走势、其中包含的周期和循环等,并对其中的关键点,例如:离群点、异常值、拐点等进行观察,从而分析其出现的原因。
2.1 趋势任务
趋势变动反映了客观事物的主要变化趋势[5]。常用的展示多维时序数据趋势任务的可视化展示方式有:折线图、平行坐标图和主题河流图。一般来说,折线图主要用于反映事物发展变化的规律和趋势。平行坐标图能很好地处理多维时序数据信息,帮助用户识别多元数据时间变化总体趋势以及每个数据点对应的数据曲线所属的时间范围。主题河流图是一种常用的展示时间序列数据的可视化形式,能够有效展示多个主题的整体趋势。
2.2 循环与周期任务
时间序列分析之前需要对时间序列进行分解,其中分解中包括周期性波动和循环波动。目前的研究一般运用雷达图、螺旋图来表示二维时序数据循环与周期任务变化的规律。雷达图可以用来表现一个周期数值的变化,也可以用来表现对象主要参数的相对关系。螺旋图在展示周期性特征数据时具有很好地展示效果。
2.3 数值点识别任务
数值点识别包括对于离群点、峰谷值和拐点的识别。离群点是指在一系列时间序列数据中,远离序列一般平均水平的极端值,也称为异常值。峰谷值是指在所考虑的时间间隔内出现的最大和最小瞬间值。从数据图中寻找的另一个特征值就是拐点,例如从上升趋势突然转变为下降趋势的点[6]。目前,散点图和折线图是展示二维数值点常用的方法。散点图可以直观地表示观测数据的分布情况以及变化趋势[7];折线图能够分析事物变化的规律。
3 时序数据可视化方式的眼动实验设计
3.1 实验目的
实验旨在探究煤炭安全管理时序数据在不同数据维度和管理任务类型层面下,哪种可视化展示方式效果最好。以期帮助煤炭管理人员对煤炭安全管理时序数据可视化展示方式进行最优选择,从而及时发现煤炭企业安全隐患,进行科学有效的决策。
3.2 实验对象
实验研究对象选取了35名具有相关矿业知识背景的煤炭企业管理人员,由于煤炭企业的特殊性质,被试均为男性,视力或校正视力均正常,无色盲色弱现象。在35名被试中,剔除了3名坐姿不标准、数据偏差较大的样本数据,最终对32个样本进行分析。
3.3 实验设备
实验采用Tobii Pro Nano 60眼动仪,采样率60 Hz,准确度0.3°理想环境下,精确度0.10°RMS理想环境下,头动范围35 cm×30 cm。设备可以自动记录被试者在观察刺激材料时注视、眼跳、眨眼等指标的相关数据。
3.4 实验材料
为了实现不同数据维度和管理任务类型层面下煤炭安全管理时序数据可视化方式的综合分析比较。针对趋势任务和数值点识别任务,以我国2009—2015年煤矿安全管理各隐患主题数据的发生次数为依据,分别用可视化图形进行展示;而循环与周期任务展示的数据需要较大的数据量,因此以国家安全生产监督管理总局网站的事故统计为依据,对我国2011—2019年各月煤矿安全事故死亡人数进行可视化方式展示。
实验中的实验材料共涉及7幅可视化图形,其中展示多维数据的趋势任务,选择折线图、平行坐标图和主题河流图3种可视化展示方式;展示二维数据的循环与周期任务,选择雷达图和螺旋图2种可视化展示方式;展示二维数据的数值点识别任务,选择折线图和散点图2种可视化展示方式。
3.5 实验设计
实验开始前,为提高实验采样率,被试者在开始眼动实验之前均需进行校准。校准完成后,先让被试者阅读实验指导语,随后屏幕将根据煤炭安全管理时序数据的不同数据维度和管理任务类型依次呈现7幅图片,且在每幅图片前均设置了问题,被试带着问题去观看实验材料,浏览完图片之后屏幕将呈现该问题的答案供被试者进行选择。为了进一步测试被试者的认知效应,眼动仪也在实验过程中记录了被试者的平均瞳孔直径、眨眼频率和平均注视时间3种眼动指标,以便对实验结果进行统计分析。
4 实验数据分析
实验结束后,用Tobii pro眼动仪自带的Ergo-LAB软件将实验数据导出,用EXCEL表格对导出的实验数据进行分析整理,处理完成后借助SPSS19.0软件进行数据的统计分析。
4.1 不同影响因素下眼动指标的差异性分析
选取了对认知负荷有显著性影响的3种眼动指标,分别为平均瞳孔直径、眨眼频率、平均注视时间。其中,平均瞳孔直径和平均注视时间与认知负荷成正比,当认知负荷增大时,这2种眼动指标也会随之增大[8-9];而眨眼频率与认知负荷成反比,当认知任务较为困难时,眨眼频率会降低[10]。
4.1.1 管理任务类型的差异性分析
分别探究不同管理任务类型层面的眼动指标差异性分析。运用SPSS19.0软件进行独立样本t检验,不同管理任务类型的差异性分析见表1。
表1 不同管理任务类型的差异性分析Table 1 Difference analysis of differentmanagement task types
分别得到不同管理任务类型层面的眼动指标,其中平均瞳孔直径F(2,221)=21.233,P=0<0.05;眨眼频率F(2,221)=13.717,P=0<0.05;平均注视时间F(2,221)=4.588,P=0.011<0.050,3种眼动指标的显著性P值均小于0.05,说明3种眼动指标在不同管理任务类型下均有显著性差异。
4.1.2 数据维度的差异性分析
进一步从不同数据维度层面,探究多维和二维数据的眼动指标差异性分析,不同数据维度的差异性分析见表2。
表2 不同数据维度的差异性分析Table 2 Difference analysis of different data dimensions
可以分别得到不同数据维度层面的眼动指标,其中平均瞳孔直径F(1,222)=1.241,P=0.267>0.05;眨眼频率F(1,222)=3.352,P=0.068>0.050;平均注视时间F(1,222)=4.195,P=0.042<0.050,3种眼动指标中只有平均注视时间的显著性P值小于0.05,说明平均注视时间在不同数据维度层面存在显著差异。
4.1.3 可视化展示方式的差异性分析
分别探究不同可视化展示方式下眼动指标的差异性,不同可视化展示方式的差异性分析见表3。分别得到3种管理任务类型层面下可视化展示方式的眼动指标,其中平均瞳孔直径在趋势任务层面,可视化展示方式F(2,93)=7.365,P=0.001<0.050;在循环与周期任务层面,可视化展示方式F(1,62)=7.920,P=0.007<0.050;在数值点识别任务层面,可视化展示方式F(1,62)=13.891,P=0<0.05,平均瞳孔直径的显著性P值均小于0.05,说明平均瞳孔直径在3种管理任务类型层面下的可视化展示方式均有显著性差异。同理,通过比较眨眼频率和平均注视时间2种眼动指标,在3种管理任务类型层面下可视化展示方式的F值和显著性水平,可以得到这2种眼动指标在不同管理任务类型层面下也存在显著性差异。综上说明,3种眼动指标在不同管理任务类型层面下可视化展示方式均有显著性差异。
表3 不同可视化展示方式的差异性分析Table 3 Difference analysis of different visual disp lay methods
4.2 可视化展示方式的综合评价分析
针对眼动实验设置的每道问题均设置了一项标准答案,根据被试者回答问题正确与否分别计算得分,其中回答正确计1分,不正确计0分,随后运用SPSS19.0软件针对不同可视化展示方式进行单样本统计量的检验,可视化展示方式的综合分析见表4。
表4 可视化展示方式的综合分析Table 4 Comprehensive analysis of visual display mode
从表4可以看出,不同可视化展示方式层面的sig.(双侧)均为0,说明不同数据维度和管理任务类型层面下,可视化展示方式的效果均有显著性差异。在展示多维数据的趋势任务时,折线图、平行坐标图和主题河流图的均值分别为0.94、0.66和0.72,其中,折线图的均值最高,说明展示多维数据的趋势任务时,折线图展示效果最好,主题河流图的展示效果次之,平行坐标图的展示效果欠佳。在展示二维数据的循环与周期任务时,可以得到雷达图和螺旋图的均值分别为0.59和0.91,说明螺旋图的展示效果相较于雷达图更好。在展示二维数据的数值点识别任务时,可以得到折线图和散点图的均值,分别为0.91和0.94,说明这2种可视化展示方式的效果较好,且散点图的均值比折线图较高,说明展示二维数据的数值点识别任务,散点图展示效果比折线图更好。
5 结 语
为探究煤炭安全管理时序数据的最优可视化展示方式,开展眼动实验,并对实验结果进行统计分析,可以得到以下结论:平均瞳孔直径、眨眼频率和平均注视时间3种眼动指标在不同管理任务类型、不同数据维度和可视化展示方式层面均有显著性差异。通过比较7幅可视化展示图形的展示方式,可以得到:展示多维数据的趋势任务时,折线图展示效果最好;展示二维数据的循环与周期任务时,螺旋图展示效果最好;展示二维数据的数值点识别任务时,散点图展示效果最好。研究结果为煤炭安全管理可视化界面设计提供一定的指导,从而帮助煤炭管理人员更为清晰直观地呈现煤炭企业安全管理过程中的问题,及时发现企业安全隐患,进行科学有效的决策,降低煤炭安全管理事故的发生率。