基于三维交互效应的公共安全事件知识可视化研究
2021-01-22刘天键周科平
■ 刘天键 周科平
中南大学资源与安全工程学院 长沙 410083
0 引言
自2011年我国进入以城镇为主体的社会发展阶段以来[1],截至2018年我国城镇人口占总人口比重已经达到59.58%。随着现代化城镇的不断扩张,安全管理问题与矛盾日益凸显,我国近5年因公共安全事件造成的非正常死亡人数平均每年超过30 万,伤残人数超过250万,经济损失高达7000亿元。社会的进步发展对城市的公共安全管理提出了更高要求,国家“十三五”规划提出应用大数据视角与技术为公共安全管理提供创新性的理念与方法。随着公共安全管理向整体战略的转变实践[2],社会多方参与共同推进公共安全管理协同治理与整体化治理,进一步优化资源配置,达到最大限度维护和增进公共利益的目的[3-4]成为公共安全管理模式的必然趋势。
我国在公共安全管理方面已有的研究主要集中在体系建设与定性分析,近年来数值分析随着大数据时代的到来也逐渐被推广应用,2012年陈秋玲等[5]首次应用偏最小二乘回归于安全经济学领域分析安全生产事故死亡率与经济社会领域若干自变量的影响关系。在可视化研究领域,国外设计研发出VOS viewer[6]、Cite Space[7]、Pajek[8]等软件进行知识图谱的构建,国内有高利军[9]通过可视化进行专利创新与资本化能力的相关分析,李谦升[10]详细阐述了城市信息可视化设计的相关理念与方法,周(Y.Zhou)等[11]研究了4D 可视化技术在地铁建设安全管理中的应用。交互分析目前多应用于心理学、金融等领域,在安全管理方向少有应用。如何在物联网及大数据背景下高效稳定地利用公共安全管理的信息资源,既要保证政府企业组织开源数据的权威性与功能性,又能兼顾群众个体的接受门槛与传播效率,是今后公共安全协同管理模式革新的重要环节。
本文在数值分析与知识可视化的基础上以公共安全事件为研究对象,为了克服列联表缺乏关联分析统计控制与无法准确定量描述交互效应的缺点,对相关维度进行交互效应分析并结合知识可视化将事件的发生规律与安全知识具体具象化,为公共安全管理工作提供更加直观科学的参考依据。从更深层次的角度出发,此类知识可视化的构建与分析有利于构建更全面完善的公共安全管理知识智库。
1 交互分析模型
公共安全事件的发生往往是由于诸多影响因素的安全状态失稳,偏离了公共安全正常运作所允许的波动范围,并交互影响从而最终引发,即存在多个维度的交互效应作用,具有其潜在的内在规律与分布特征。但事件发生维度的交互效应往往隐含于经验性知识中,难以简明直接地应用和传递于各项管理工作中,也难以被安全宣传的群体受众所理解认知,不利于各项安全工作的稳步推进。因此需要通过数值分析手段将定性的交互效应量化为直观的定量数据,挖掘事件维度之间的抑制或者增强作用,优化交互效应相关的安全知识的逻辑功能与认知效果从而进一步指导安全管理的决策和宣传受众的认知。
1.1 模型选取
交互分析的常用方法有列联表、逻辑回归、对数线性模型等,由于公共安全事件的发生服从随机离散的概率分布,列联表的χ2检验对于高维度交互作用的解释有一定局限性且无法量化维度间的交互效应作用幅度,且列联表本身也很难拓展至高维统计,逻辑回归方法中较多的名义变量又会导致交互效应的分析研究变的繁琐复杂,因此选取广义线性模型中的对数线性模型综合运用方差分析和逻辑回归的优势进行多元统计,通过泊松分布进行对数线性模型的回归建模,将期望频数与多维度变量之间的交互效应有效量化[12],同时又能弥补多项分布对数线性模型不能解释分类随机变量的缺陷。
1.2 模型构建
根据事件维度及维度内的变量,以三维泊松对数线性模型为例,假设维度集合D={X,Y,Z}中包含3 个属性变量,Xi、Yj、Zk(i=1,2,…;j=1,2,…;k=1,2,…)表示各属性变量的类别,期望频数nijl,代入泊松概率密度函数得到三维饱和对数线性模型如式(1)所示:
通过极大似然估计得到常数项(λ)、主效应、二维以及三维交互效应参数定义公式如(2)~(5)所示:
在三维饱和对数线性模型基础上,通过统计检验对饱和模型进行高阶交互项选取,将饱和模型中显著性sig.<0.05 的交互项剔除形成更高拟合优度的非饱和模型。本研究应用K-way 高阶效应检验,通过似然比卡方检验进行单项及分层效应检验,参数估计与拟合优度通过双尾Pearson-χ2方法进行检验,公式如(6)、(7)所示:
2 知识可视化
可视化的核心内容是寻求更优化的映射方式将数据中的隐含知识按照设计者和用户的需求通过映射关系转化为视觉的优势清晰地传递给用户。可视化不仅能够提升数据的利用价值与操作的灵活性,更可以有效降低受众的接收与传递门槛[13]。公共安全事件的知识可视化设计应从4 个方面展开:① DIKW 金字塔模型的知识内容整合;② AIDMA 组织模式的知识结构优化;③文本向视觉的知识转译;④视觉效果的审美体验。通过可视化能够使公共安全事件的隐含知识更加直观有效地传达,视觉的引导作用强化了从数据到智慧的递进提炼,并产生持续有效的形象记忆,进而促进安全管理者达成安全目的,培养受众的安全行为习惯和安全意识。
如图1所示,公共安全事件知识可视化是将公共安全事件的有关知识通过信息及视觉设计优化知识内容,凭借图像的认知引导功能从信息源头、传播途径以及受众的角度增强安全意识与安全责任的感知接受和知识提炼过程,并通过知识获取的结果不断形成正反馈,在设计方法探索中不断改进改良,以优化原有的可视化模式[14]。本研究中知识可视化主要作用在于安全管理者的迅速识别与安全宣传受众的优化认知两个方面。
3 实例分析
图1 知识可视化设计流程图
表1 交互分析样本集
根据针对数据结构转换的六合分析法(5W1H)中的基本内容,选取时间(When)、区域(Where)和性质(What)维度作为交互效应研究对象,其中时间维度划分为4 个季度;区域维度划分为6 个管辖区;性质维度方面,目前我国安全科学界将公共安全事件划分为自然灾害、事故灾难、公共卫生事件以及社会安全事件4 类[15]。通过对某市统计年鉴及公开数据中的公共安全事件在时间、区域和性质维度下进行调研统计,数据经过数据编码以及预处理最终构成了用于交互分析的样本集如表1所示,主维度频数柱状图如图2所示:
3.1 交互分析
样本集的交互效应分析处理通过IBM SPSS Statis‐tics 22.0 的对数线性模型功能进行实现,采用后向剔除法由高到低对饱和模型进行单项及分层效应的显著性检验,由K-way 高阶效果的计算结果可知,主效应(Sig.=0)、二维交互效应(Sig.=0),三维交互效应在95%置信水平下似然比显著性(Sig.=0.044)与皮尔逊卡方显著性(Sig.= 0.023)均为显著,即时间、区域、性质3 个维度存在交互效应,即三维交互作用下的各个水平中的频数对数的平均值存在显著差异,维度之间的交互作用对公共安全事件的分布起到了显著的抑制或者增强效果,泊松对数线性模型中的主效应项与二维项、三维交互效应项均不予以剔除,形成泊松对数线性的饱和模型用于描述交互效应的分布情况。检验结果如表2所示:
通过似然比卡方检验和双尾Pearson-χ2检验结果表明观测值和期望值在99%置信水平下的相关性非常显著且判定系数R2≈1,说明三维饱和模型能够合理解释公共安全事件在时间、区域、性质维度高阶交互影响下的频数分布且拟合效果理想,能够进一步分析研究。三维交互效应的参数估计结果如表3所示:
图2 主维度频数柱状图
根据表3参数估计结果可知,主效应参数最大值:第1 季度(0.0678),事故灾难(0.4061),C 区(0.2863),其中对比图2可以发现时间维度的交互效应更多集中在第1季度(0.0678)而非同维度频数占比最高的第2 季度(27.77%),这是由于第1 季度在同一水平的时间维度属性变量中与其他维度交互效应更加显著导致与列联表分析产生了统计结果上的差异,在公共安全管理工作中这些隐含信息的安全知识非常容易忽视从而影响安全工作的效率和效果;二维交互效应参数最大值:第4 季度-公共卫生事件(0.6309)、C 区-自然灾害(0.7224)、第4季度-D 区(0.3993)。三维交互效应参数最大值:第4 季度-公共卫生事件-B 区(0.7892)。根据这一结果可以初步推断出该城市公共安全事件的预防治理工作由于交互效应高于其他属性变量,需要重点分析、关注和预防第一季度、事故灾难与C 区的相关情况,在二维交互方面需要重视第4 季度的公共卫生事件、C 区的自然灾害、第四季度的D 区,三维交互方面则是第4 季度B 区的公共卫生事件。
表2 K-way高阶效果检验
表3 三维交互效应参数估计
图3 二维交互效应极区图
以第1 季度为例,对某市公共安全事件的时间、区域、性质维度交互效应的管理意义可以初步得到:在第1季度(1)A区需重视自然灾害、事故灾难和公共卫生事件的发生,交互效应参数分别为0.0997、0.3457 和0.1751;(2)B区需重视事故灾难和社会安全事件的发生,交互效应参数分别为0.3048 和0.0150;(3)C 区需重视自然灾害、公共卫生事件和社会安全事件的发生,交互效应参数分别为0.1031、0.0950 和0.2946;其他管辖区和其他季度的知识发现以此类推。根据以上内容,公共安全管理的各方参与者能够科学有效地从安全管理决策和安全知识认知的角度,在不同季度针对不同地区的实际情况加强不同性质公共安全事件的隐患排查工作以及优化应急治理措施。
3.2 知识可视化
通过知识可视化更加直观地突出泊松对数线性模型的交互效应大小,应用二维与三维的交互效应极区图进行交互效应参数基础上的安全知识发现。极区图结合了直方图与扇形图的优点,能有效避免以圆心为原点的值域限制,通过夹角反应事件频数占比的同时,外弧半径又能表示交互效应的正负及大小,即倾向性的大小与正负,离圆心越近则倾向性越小,反之越大。不同维度的属性变量通过不同颜色区分,半径越大扇环面积越大则说明同一水平下的交互效应与频数占比越大,从视觉上相比表3明显能够通过激发读者的注意机制(atten‐tion)、产生更强的阅读兴趣(interest)、促进阅读欲望(de‐sire)的产生并形成长期的形象记忆(memory),进而增强安全管理的迅速决策和安全宣传的普遍认知(action),形成良好的AIDMA模式视觉效果。
3.2.1 二维交互效应可视化
对三组二维交互分析极区图进行观察分析可初步得到以下信息:
(1)时间与性质交互分析极区图表示某市4 个季度对应4 类公共安全事件性质的交互效应强度。第1 季度更倾向于发生自然灾害(0.5400),第2 季度更倾向于发生事故灾难(0.1839),第3 季度更倾向于发生事故灾难(0.5125),第4 季度更倾向于发生公共卫生事件(0.6309);以此类推,能够从二维交互的角度为公共安全管理提供参考依据。
(2) 以时间与性质交互分析极区图为例,可以通过纵向对比同一事件性质在4个季度的交互强度差异而获得不同于横向对比产生的安全知识;事故灾难需要在第2、3季度加强预防;公共卫生事件在第4季度的发生频数与时间-性质交互效应均达到最高;社会安全事件从主效应或者二维交互的角度来看全年不显著且波动不大。
(3)极区图能够反映传统直方图不能涵盖的信息内容,以时间与性质交互分析极区图为例:虽然第2季度社会安全事件的发生频数占第2季度事件总频数的比例在4 类事件性质中最低(共21 起,占同季度总频数15.44%),但时间-性质二维交互效应(0.0718)仅次于占比最高的事故灾难(0.1829),这是时间-性质交互效应对同水平下的此类事件产生了增强效应,而非片面地通过频数统计解释事件的倾向性。由此可见,交互效应分析综合考量多个维度挖掘隐性安全知识的优越性是传统列联表分析方法所不能比拟的。
3.2.2 三维交互效应可视化
根据时间-区域-性质三维交互效应极区图我们可以初步发现:
(1)对比同1 季度和地区条件下发生不同性质的公共安全事件的倾向性有明显差异,以第1 季度的A 区为例,交互效应由高到低顺序为:事故灾难(0.3457)>公共卫生事件(0.0997)>自然灾害(0.1751)>社会安全事件(-0.6205),说明第一季度A 区发生社会安全事件可能性低的同时,管理者与群众应警惕和防范各类事故灾难的发生,充分做好相关预防和治理工作。同样的方法能够通过图3进行二维交互效应的拆解,从不同的角度进行不同目标的二维交互效应的分析进而科学地指导公共安全管理各项工作开展。
(2)针对具有正交互效应的外圈极区图可以对比同一季度条件下不同区域对应发生各类性质事件的趋向性。以上半年为例,通过观测可以直观地发现第2 季度的B、C 两区发生事故灾害的倾向性、以及第1季度E区、第2季度D区发生公共卫生事件的倾向性、和1、2季度A区发生社会安全事件的倾向性相较同区域同时段其他事件在视觉乃至数据上都更加突出,进一步意味着该类事件的管理优先级与其他事件差别较大,需要公共安全管理的各方参与人足够重视这些事件以及发生的区域,提前做好隐患排查工作以及制定应急预案。通过视觉上的差异刺激能够更深层次地激发信息传播受众的阅读欲望以及主观感知,相比表3的参数估计结果,图4在叙事内容与传达功能不变的前提下,通过知识可视化改变表述形式加强了信息的直观性和生动性的特征,产生AIDMA 视觉设计的正反馈,能够更有效的提高公共安全管理的信息资源利用效率,引导社会群体积极参与公共安全协调管理。
图4 三维交互效应极区图
4 结论
公共安全事件一直以来危害着社会群众、企业组织乃至城市整体的切身利益与生命健康,对该类事件的分析研究方法我国尚在起步阶段,本文在单一维度频数统计的基础上,提出应用对数线性模型的方法分析公共安全事件时间、区域、性质的相关性大小以及多个变量之间的高阶交互效应,该模型是具有科学依据以及研究价值的统计学方法之一。
模型拟合与参数估计结果表明,三维泊松对数线性模型能够应用于公共安全事件相关维度的交互分析研究,且可以有效量化各维度不同变量间的交互作用,具有充分的可行性与可操作性;对观测值与期望值的双尾Pearson-χ2检验证明该模型对于公共安全事件的三维分布特征有较强的解释力,能够指导安全管理的预防、统计以及决策等各项工作,知识可视化设计通过优化信息的知识内容与表述方式为相关预防、应急、治理等措施工作以及民众安全知识普及提供了科学可靠的依据。另一方面,泊松对数线性模型的应用也有局限性,即对数据量和分布特征有一定要求,当数据量不足或分布特征不明显时,K-way 高阶效果检验无法拒绝原假设而导致后向剔除法删除了高阶交互效应,从而影响模型的拟合优度以及交互作用的量化。
综上所述,本研究提出的交互知识可视化为公共安全管理以及社会群众普及工作提供了新的手段方法,通过数值分析的手段挖掘并量化隐含的定性安全知识从而促进公共安全预防与治理等相关工作稳步推进,同时利用知识可视化的优势提高了信息的传播与接收效率,有效帮助受众理解思考并消化吸收安全知识,积极参与公共安全协同管理工作,响应安全政策号召。另一方面我们应不断完善公共安全管理体制与相关法律法规,提高市民群众与企业的防范意识,从根本上解决公共安全问题。