基于文本分析的应急辅助决策方法
2024-05-30李佑文褚红健
刘 琴,李佑文,褚红健
(1.国电南京自动化股份有限公司,江苏 南京 210032;2.南京国电南自轨道交通工程有限公司,江苏 南京 210032)
0 引言
城市轨道交通行业复杂的城市轨道交通网、庞大的客流量、设施设备的复杂多样性等逐渐成为造成应急事件的主要因素,为各轨道交通运营公司的安全运营与管理工作带来了巨大的压力。由于城市轨道交通在人们的日常出行中起着至关重要的作用,在运营阶段,任何应急事件的发生都可能对运营造成严重的后果,轻则增加运营成本和耽误乘客出行,严重的甚至会威胁到乘客的生命和财产安全。而现状是城市轨道交通系统在应急事件方面还没有系统化的体系结构,无法做到真正的区域资源共享,往往造成问题解决不及时、效率低下等问题。因此,为了能在应急事件发生时尽快解决问题,系统将根据可能的应急事件类型,事先设计好应急预案,存储到预案库中;将系统运营过程中,实际发生过的应急事件及其采用的应急预案,存储在案例库中。然而,城市轨道交通应急事件类型较多,而且存在很多的不确定性,案例库、预案库的信息会很多,当应急事件发生时,如何获得最佳的应急预案,实现自适应预案和智能流程,仍然是一个难题[1]。
基于上述问题,本文提出了一种基于文本分析的应急事件辅助决策方法,基于实时数据和机器学习,结合当前应急事件与历史数据分析结果,快速适应场景,为站务人员推送最佳应急预案,实现自适应预案和智能流程,提高应对复杂情况的效率与准确性,解决快速响应与灵活流程之间的矛盾,保证轨道交通安全运营[2]。
1 应急事件及其处理过程
应急事件发生后,工作人员将应急事件信息汇总,形成一个文档,根据匹配模型,在应急预案库中匹配度较高的应急预案。若有匹配度较高的预案,则采用此预案,在执行过程中对重要环节进行人工考证,确保预案的可行性以及发现存在的问题并及时改正。应急事件处理结束后,对其整个应急处理流程进行梳理、分析、总结,对此次应急事件对应的应急预案进行修正,进一步完善预案库。若没有匹配度高的预案,工作人员则根据现场实际情况给出一份符合实况的应急预案。
应急事件突发性强,短时间内难以获得可靠的事件信息,给工作人员留的反应时间短,为了尽可能地减少损失,要尽快地启动应急预案。因此,如何提高预案匹配的准确度成为研究的重点。预案匹配在整个应急辅助决策流程中发挥着重要的作用,本文将文本分析应用到应急辅助决策中,提出基于文本分析的应急辅助决策方法,具体流程如图1所示。该方法在预案匹配中更加合理,从而帮助工作人员快速地找出最优的应急预案[3]。
图1 应急辅助决策流程
2 LDA模型和TF-IDF方法
对语料库中的每个文档建立基于Gibbs Sampling的LDA模型,获得每个文档对应应急预案的分布以及每个文档中词的分布,进一步获得每个文档中对应于不同应急预案的关键词。
利用TF-IDF方法,挑选出区分度较高的关键词,获得当前应急文档d的关键词wi的计算公式为:
3 基于文本分析的应急辅助决策
3.1 语料库构建
从应急事件案例库、预案库中获得应急事件的文档数据,所有的文档数据使用NLPIR汉语分词系统进行分词处理,对分词后的数据进行数据清洗,将清洗后的数据整合成文档,构成一个大的语料库D。
3.2 语料库处理
首先,语料库中的每篇文档d中的每个词随机赋予一个主题z,其中n表示文档d中的第n个词,z表示主题,Z表示主题数。统计每个主题z中词的数量以及每个文档下出现主题z中词的数量,每轮使用Dirichlet分布的期望公式,计算P(zn|z-n,d,w),即排除当前词的主题分布,根据其他所有词的主题分布估计当前词分配到各个主题的概率Wdn;得到当前词属于所有主题的概率分布后,根据此概率分布为当前词选定一个主题;重复上述步骤,直到Gibbs Sampling收敛,即每个文档下主题分布θd和每个主题下词的分布βz收敛。统计语料库的主题-词的共现频率矩阵,根据这个主题-词的频率矩阵,获得所有词的主题概率分布。
3.3 关键词隶属度
针对一个特定文档d中的第i关键词wi,令该关键词对应的应急预案为j,其对应的公式为:pj(wi|d)=p(wi|j)×p(j|d)。
枚举所有的应急预案,其中j表示应急方案,pj(wi|d)表示文档d中第i关键词对应某个应急预案j的概率;p(wi|j)表示应急预案j中出现关键词wi的概率;p(j|d) 表示文档d对应应急预案为j的概率。
根据文档中实际采用的应急预案,获得不同应急预案的关键词,构建不同应急预案关键词集合T={t1,t2,…,tZ},ti表示对应第i个应急预案的关键词集合。每个关键词归属不同应急预案的比重不同。
按照LDA获得的文档A对应每个应急预案的概率不同,而真实情况下,文档A对应的应急预案是确定的,则将PAi(A实际对用的应急预案i)修正为1,则将文档对应每个应急预案的概率作为对应关键词集合的隶属度。
3.4 关键词提取
采集当前应急事件的数据,整合成一个文档,利用TF-IDF方法,获得该文档的关键词条,即此应急事件的关键词。
3.5 预案关联度
将关键词条与案例库、预案库数据处理获得的不同应急预案关键词集合进行匹配,通过求和方式获得与每个预案的关联度。
基于3.3节中获得某个应急事件文档d中关键词wi对应某个应急预案j的概率pj(wi|d),从而获得文档d中所有关键词对应某个应急预案j的概率;进一步地获得所有文档中所有关键词对应每个应急预案的概率。
将当前应急事件的一个关键词wi与某个应急预案j中包含的关键词集合进行匹配,如果应急预案j中存在匹配的关键词y,则认为关键词wiv归属于此应急预案j的概率等于关键词y归属于应急预案j的概率即pj(wi)=pj(y),因此当前应急事件与某个应急预案j的关联度如下公式所示:
Cj=∑wk∈Spj(wk)
其中,wk表示当前应急事件的某些关键词,S表示当前应急事件关键词中与应急预案j的关键词集合相匹配的关键词集合。
3.6 预案关联度
基于3.5节中获得当前应急事件与所有应急预案的关联度,认为与某应急预案关联度越高,采取该应急预案的可能性越强,选择关联度最高的应急预案作为最佳的预案;而当应急事件与所有应急预案的关联度都偏低时,则认为此应急事件未发生过,没有相关的应急预案可以采用,需要现场工作人员根据实际情况,制定一份符合实况的应急预案。
3.7 预案推送全流程
基于3.1节至3.6节所阐述的基于文本分析的应急辅助决策方法,预案推送全流程如下:当系统监听到信号产生应急事件时,执行应急辅助决策,匹配出最优的应急预案,实现预案推送,具体流程如图2所示。
图2 应急预案推送流程
4 优缺点
本文设计基于主题摘要的应急事件与预案相似度评估方法,建立融合用户偏好的预案优先级评价机制,开发基于相似度评估和优先级评价的预案推荐决策,支持按事件影响等级智能化推荐最佳预案,有效支撑应急事件的精准处置,以期最大程度降低应急事件对运营单位和乘客可能造成的损失。
然而,本文所提出的一种基于文本分析的应急辅助决策方法对预案数据量的要求较高,语料库中的预案种类越多,应急事件的覆盖面越广,匹配到的应急预案精确度越高。因此,本文提出的方法还需进一步优化,实现预案的组合和重组,减少人工参与,提高智能匹配的精确度。
5 结语
随着城市轨道交通地铁智能化的发展,地铁公司对地铁运营安全性的要求越高。地铁作为一种大型的公共交通工具,一旦发生应急事件,将直接威胁乘客生命安全和社会正常运行。本文提出的一种基于文本分析的应急辅助决策方法,能够获取应急管理的参考信息,有效提升应急辅助决策能力,帮助地铁运营及时做好应急处置,降低应急事件的影响力度,减少人员损伤。此外,随着事后的应急总结和事件分析学习,可以进一步完善预案库、案例库,进一步优化辅助决策方法。