APP下载

城市轨道交通运营安全事故多圈层匹配创新研究*

2023-02-24张久鹏

中国安全生产科学技术 2023年1期
关键词:案例库城轨圈层

许 慧,张久鹏

(1.重庆邮电大学经济管理学院,重庆 400065;2.重庆工业大数据创新中心有限公司工业大数据应用技术国家工程实验室,重庆 400707)

0 引言

截至2022年4月,我国国内(不含港澳台)共计51个城市开通运营城市轨道交通(以下简称城轨)线路275 条,运行总里程8 904 km[1]。城轨具有空间特殊性、结构紧凑性、电器密集性、人流聚集性等特点,使得城轨运营安全事故不仅具有一般安全事故的不确定性、紧急性等特征,还具有专业交叉、疏散困难、影响广泛等特点[2]。城轨运营安全事故管理需要决策者在复杂动态的环境下快速做出应对决策,其中管理经验至关重要。目前管理经验应用流程化的研究尚少,运营管理通常依赖主观判断,对以往积累的城轨运营管理经验利用不足。已有学者开展相关研究,Yu 等[2]基于案例推理和专家规则构建并探讨系统结构和关键技术的实现方法;陆莹等[3]利用前兆信息作为案例索引;Lu 等[4]利用前体语义网络实现案例的自动检索;Wu 等[5]通过CBR技术和自然语言处理技术,提取120 起城轨事故案例用于案例检索;Feng等[6]利用本体模型表达领域知识进行灾害情景匹配;郭素[7]设计了基于聚类分析的2 级检索策略;Xiao等[8]使用改进相似度算法优化案例推理过程。现有研究仍有以下不足:一是国内城轨运营安全事故案例推理方面的研究较少;二是事故知识的表示较多依赖专业领域知识,缺少对数据自身特点的关注;三是对案例表示、特征属性选择等关键环节描述尚有优化空间;四是案例检索策略较为单一,对城轨事故适应性一般;五是已有事故案例库内案例数量较少,不能保证检索精确性。

因此,本文以城轨运营安全事故为研究对象,以案例推理为研究技术,在事故案例收集、特征属性选取、特征属性分层结构化表示的基础上,构建城轨运营安全事故案例库。通过拓宽案例库的规模,降低小规模案例库对检索质量的影响。提出多圈层相似案例匹配策略,并通过实例验证该方法的有效性,增强案例管理经验的可用性。本文研究为城轨运营安全领域管理经验的重用提出了1 条可行路径,可为城轨运营单位、相关政府部门制定安全管理决策方法和制度流程等提供借鉴。

1 研究方法与案例库构建

1.1 案例推理技术

案例推理技术是人工智能领域内1 种基于知识的问题解决方法。常用案例推理过程为案例检索-案例复用-案例修正-案例保存,形成检索、匹配、加工使用和存储的循环过程[9]。

1.2 主题网络爬虫技术

主题网络爬虫技术是快捷准确抓取互联网中相关主题信息并储存的方法[10]。运用文献资料法,在有关城轨运营事故原因分析的文献中收集事故原因,根据不同层级应急预案总结事故类型。爬取关键词格式为事故类型+事故原因,爬取内容为事故新闻标题、正文内容、发布时间、网址链接。加载获得原始文本数据7 238条。爬虫搜索流程如图1所示。

图1 爬虫搜索流程Fig.1 Crawler search process

1.3 人工筛选

城轨事故文本数据内容杂乱,依靠软件识别、筛选得到的数据可用性较低,因此开展人工筛选工作。选择2002—2021年的事故样本,根据新闻标题,删除重复内容、无关数据、国外事故数据等;再依据正文内容,删去事故关键属性缺失案例。整个爬取和筛选流程历时3个月,最终将7 238 条原始案例数据处理为507 条事故案例文本,将筛选出的案例以结构化形式存储。

1.4 城轨运营安全事故案例库

Access是微软发布的图形用户界面形式的关系数据库管理系统。“表”是Access数据库中最重要的对象,定义表和表之间的关系,完成事故案例库的建立。表间关系如图2所示。

图2 表间关系Fig.2 Relationship between tables

2 城轨运营安全事故多圈层匹配模型构建

2.1 城轨运营安全事故表示框架研究

2.1.1 特征属性选取

根据辨识度,从3 个层面选取城轨运营安全事故特征属性,包括关键圈层属性、重要圈层属性和一般圈层属性。圈层属性分类如图3所示。

图3 圈层属性分类Fig.3 Classification of attr ibutes in circles

1)关键圈层属性是高共性、高完整性、高区分度、高影响力的特征属性。

①高共性是指不同事故的某一属性的主要属性值具有高集中度。本文所选3 个关键属性的各属性值均具有较高集中度,其中事故部位属性中的属性值“车站空间”占比最低,为25%,因此设定主要属性值占比不小于25%的属性为高共性属性。

②高完整性是指某一属性的属性值在所有文本中均无缺失,属性值完整度为100%。

③高区分度受高共性影响,是指能够快速分割、聚类案例库中的不同事故,如利用事故类型可将事故快速划分为自然灾害类事故、事故灾难类事故等。

④高影响力是指某一属性直接影响其他属性,如事故原因会对后续事故应急措施产生直接影响。

2)重要圈层属性是指在事故文本中存在信息缺失,完整性低于100%,属性的共性值低于25%,属性区分度和影响力低于关键圈层事故,用于进一步扩充事故检索信息的属性。

3)一般圈层属性是用以补充案例事故细节及背景信息的一般属性。

2.1.2 特征属性细分

文本型特征属性之间存在着部分匹配的情况。例如,“6·19”深圳城轨1 号线列车突发故障停驶事件中,事故影响为列车延误40 min,但是如果将“列车”“延误”“40 min”合为一体进行事故影响匹配,完全匹配的事故数量会非常少,一些潜在匹配案例会被过滤掉,降低最终匹配结果质量。因此,考虑将“事故影响”细分为“影响对象”(列车)、“影响结果”(延误)、“影响时长”(40 min)。特征属性细分主要针对概括性比较高的特征属性,本文主要针对重要圈层的4 个属性展开,如图4所示。此外,部分特征属性的语义描述模糊,如乘客跳轨和乘客坠轨同为社会安全事件,但行为主体主观性不同,事件影响和安全管理措施也不同,实际情况中二者差异较大。因此,需要对特征属性进行规范化、结构化表达,消除文本语义模糊和部分信息匹配对案例相似度的影响。

图4 特征属性细分Fig.4 Feature attributes subdivision

2.1.3 城轨运营安全事故的表示框架

框架表示法是将结构性知识以框架形式储存起来。1 个框架包括多个槽,槽由槽名及侧面组成,侧面包含侧面名称、侧面值和侧面值类型。圈层特征属性框架如表1所示。

表1 特征属性框架Table 1 Feature attributes fr amework

2.2 城轨运营安全事故多圈层检索与匹配

2.2.1 城轨多圈层检索策略

由于传统案例检索策略计算范围遍及整个案例库及案例的所有特征属性,检索时间较长。因此,本文改进案例检索策略,即在案例检索时,将城轨事故案例库作为初始案例库,计算案例关键圈层相似度,按相似度高低筛选一定数量案例,形成重要圈层案例子库;再依次计算重要圈层、一般圈层相似度;最后综合圈层权重和各圈层相似度得出目标案例与源案例之间的相似度,输出全局相似度高的案例作为决策案例。相比传统案例检索策略,改进策略单轮检索的案例个数大幅度减少。经过关键圈层案例检索,初步相似结果集中的案例数减少,降低后续检索的复杂度,缩短检索时间。改进案例检索策略流程如图5所示。

图5 改进案例检索策略流程Fig.5 Process of improved case retrieval strategy

2.2.2 城轨运营安全事故属性特征权重计算

权重计算主要分为主观评价法和客观评价法,但2种权重计算方法都有使用上的局限性。本文结合研究内容特征,使用主客观综合赋权法[11]。在运营安全评价时,需要借助专家主观判断,本文使用较为成熟的模糊层次分析法(fuzzy analytic hierarchy process,FAHP),模糊层次分析法结合模糊理论和层次分析法,改善层次分析法中存在主观性强和科学性弱等问题[12]。此外,为了综合分析城轨运营评价指标体系,需要依据客观数据间的关系,运用熵值法确定各指标的权重。熵权法能够深刻反映指标信息熵值的效用价值,因此,本文采用FAHP和熵值法综合赋权的方法来评价影响城轨运营安全的各项指标,既能改善熵权法无法体现属性重要性差异的问题,又能避免FAHP法依赖专家经验引起的属性偏好。

1)模糊层次分析法

①构造模糊判断矩阵。设某层特征属性集为A={A1,A2,A3,…,An},通过专家对A1,A2,…,An相互之间的重要度进行比较,可得特征属性集A的模糊判断矩阵R,如式(1)所示:

式中:rij为元素ri与元素rj的重要性比较结果;i=1,2,3,…,n;j=1,2,3,…,n。

②计算特征属性权重。结合排序向量的最小二乘法,可求得特征属性权重Wi如式(2)所示:

式中:a=2(n-1)/5。

2)熵权法

①构建评价多项特征属性集合的特征属性评价矩阵Xij,如式(3)所示:

式中:Xij为第i个案例的第j个信息特征属性值,i=1,2,3,…,m;j=1,2,3,…,n。

各信息特征属性值标准化计算公式如式(4)所示:

式中:Yij为各Xij数据标准化处理后的值;max Xij和min Xij为特征属性极值。

②对标准化处理后的各特征属性进行比重变换,计算特征属性j的比重Pij,如式(5)所示:

计算各特征属性对应的熵值Ej如式(6)所示:

③计算各特征属性权重。依据式(6),得出各个特征属性的信息熵为E1,E2,E3,…,Ej,而后第j个特征属性值所占权重Wj,如式(7)所示:

3)主客观综合赋权法

计算主客观综合权重值λi,如式(8)所示[13]:

式中:λi为第i个指标的综合权重;ωs为FAHP法计算的主观权重;ωo为熵权法计算的客观权重。

使用综合权重法计算特征属性权重后,使用AHP法计算圈层权重,圈层各特征属性权重及圈层权重如表2所示。

表2 综合权重值Table 2 Comprehensive weight values

2.2.3 城轨运营安全事故相似度计算

最近邻法是通过计算目标案例和源案例之间的加权相似度,筛选输出相似度值最高的案例[14]。基于最近邻法的相似度计算主要包含属性相似度计算和全局相似度计算2 个部分,其中属性相似度计算包括单个属性相似度计算和属性综合相似度计算。

1)单个属性相似度计算

针对符号型数据的计算公式如式(9)所示:

针对数值型数据采用基于海明距离公式计算相似度,如式(10)所示:

式中:xj,yij分别表示目标案例X与源案例Yi关于属性j对应的数据。

2)属性综合相似度计算

属性综合相似度计算公式如式(11)所示[15]:

3)全局相似度计算

全局相似度计算公式如式(12)所示:

式中:ωi表示圈层权重。

3 案例应用

3.1 全局案例相似度计算

事故灾难类事故在案例库中的占比最大,为61.1%,选择此类事故检验本文所构建的事故多圈层匹配模型实用性。选择案例“6·19”深圳城轨1 号线列车突发故障停驶事件进行验证。限于篇幅,应用过程仅展示排名前3 的案例,事故名称以日期替代表示。

1)计算案例库中关键圈层属性相似度,结合属性权重计算关键圈层综合相似度,验证结果如表3所示。

表3 关键圈层综合相似度计算验证Table 3 Calculation and verification of comprehensive similarity of core circles

2)筛选关键圈层综合相似度符合阈值的案例作为下一阶段匹配的案例子库,计算重要圈层综合相似度,验证结果如表4所示。

表4 重要圈层综合相似度计算验证Table 4 Calculation and verification of comprehensive similarity of important circles

3)确定重要圈层综合相似度后,计算一般圈层属性及圈层综合相似度,验证结果如表5所示。

表5 一般圈层综合相似度计算验证Table 5 Calculation and verification of compr ehensive similarity of general circles

4)结合各圈层权重和圈层综合相似度,计算案例全局相似度,相似度排序前3 的案例如图6所示。

图6 排序前3 的案例相似度对比Fig.6 Top 3 case similar ity compar isons

3.2 应用研究延伸

继续选取其他类型的2 起案例作为补充验证,案例为“6·25”深圳城轨4 号线男子跳入路轨事件和“7·31”上海暴雨致城轨3 号线供电故障事故。验证结果中,“事故灾难类”、“社会安全事件”、“自然灾害类”验证案例的最高相似度值分别为0.892 2,0.784 1,0.721 5;案例库中,3 类事故占比分别为61.1%,35%,3.6%,证明案例数量对案例相似度值存在影响。

4 结论

1)基于人工智能技术开展管理经验的流程化提取和总结,可提高以往管理经验的可用性,进而满足城轨运营管理对相似案例应用精度、速度的要求。

2)依据文本数据特点,结合领域知识进行分层结构化表示,可避免案例的结构表达较多依赖专业知识的问题,并对案例表示、检索等关键环节进行详细的阐述。

3)针对传统检索策略的不足,提出多圈层检索策略,通过3 种类型事故的案例匹配验证,验证多圈层检索策略的实际应用有效性,所检索出的相似案例可为现实事件提供管理依据。

猜你喜欢

案例库城轨圈层
心血管外科教学案例库的建设及应用研究
国内首个海事司法案例库正式上线
基于实践应用的基坑工程设计案例库建设研究
No.4 圈层用户不断拓展,圈层经济价值释放
B站冲破圈层
年轻人“圈层化”的背后到底是什么
让圈内新闻飞出圈层——“振兴杯”宣传的一点思考
漫谈城轨
城轨春节 敬业福
城轨的“敬业福”万家的“团圆福”