APP下载

基于朴素贝叶斯数据挖掘的社区应急监测体系构建

2023-03-08周星汉

绿色科技 2023年1期
关键词:朴素贝叶斯科普

周 啸,韩 怡,应 桦,周星汉

(1. 乐山职业技术学院 旅游系,四川 乐山 614000;2.乐山师范学院 应急管理知识普及基地,四川 乐山 614000;3. 乐山职业技术学院 药学系,四川 乐山 614000)

1 引言

社区作为城市治理的“最后一公里”,是城市社会的最基本构成单元,也是构建社会主义和谐社会的基础。社区虽小,但却是人口高度集中的生活区域,人员结构复杂,居民素质层次不齐,应急科普和应急管理的难度极高,主要体现在以下3个方面:①出现突发紧急情况时,社区居民对突发情况的警惕性和对科学应急的认知度低,造成应急管理难以平稳、有序进行;②部分社区居民欠缺应急基本知识,自我保护意识淡薄,不懂科学应急,造成极大安全隐患;③社区应急科普与应急管理难以做到精准分类,管理手段原始单一,没有与人工智能、数据挖掘等信息化技术融合的高效便捷管理方式。因此,如何针对社区管辖范围内不同认知水平的居民进行点对点应急科普,动态监测社区应急能力,提高社区应急管理的信息化、智能化水平,是当前社区应急管理工作的重要研究课题。

2 研究现状与问题

金蓉等[1]通过对社区老年人应急准备教育指标体系、应急准备及灾难素养的现状进行调查,分析了三者的相关性,得出了目前社区老年人在应急准备教育、应急准备和灾难素养方面处于中等水平的结论,指出了社区开展老年人应急教育的必要性。李雪等[2]利用多个潜变量构建了社区应急管理模型,证明了潜变量对提高社区应急管理能力具有积极作用,并为社区应急管理提供了建议和意见,得出了社区应当完善应急决策制度、完善信息推广和发布机制,拓宽渠道,及时总结应急事件处理经验的结论。陈梦真等[3]利用韧性理论对社区应急管理机制进行了融合研究,从完善社区应急动员、应急信息管理等方面提出了针对性措施。该研究完善了韧性理论和机制在社区应急管理中的理论研究和应用研究,对拓展韧性理论的应用领域具有重要意义。崔凯凯等[4]利用SWOT分析方法研究了城市社区应急协同治理优化路径,提出多元主体参与社区应急的重要性,并从优化应急措施、应急信息平台建设、加强应急人才培养等方面提出了建议。研究创新性地提出了多元主体之间相互协作的应急管理机制,社区应急信息化平台建设需要融合多元主体协同作用的结论。柏毓彤等[5]利用软件CiteSpace对社区应急管理进行了关键词聚类分析,绘制了社区应急管理知识图谱,基于社区应急管理知识图谱,提出了社区应急管理未来的发展路径。研究发现“社区模式”“应急管理”和“管理重点”是应急研究的高频关键词,提出社区未来的应急管理研究重点是管理过渡到治理、重视智能技术与应急管理结合、建设韧性社区和跨学科领域的交叉应用与融合。刘杰等[6]利用多种研究方法对云南省典型社区应急能力建设情况进行了调查研究,并基于调查研究结果提出了提高云南各类社区应急能力的措施。研究得出了云南典型社区应急管理存在的问题,包括居民安全意识淡薄、应急救援队伍力量不足等,得出了应加大社区应急物资和经费投入的结论。王玉等[7]对社区应急管理体系建设存在的问题进行了分析,并构建了新型社区应急管理体系的理论框架。研究针对社区应急问题提出了改进建议,包括“智能应急小屋+远程帮办坐席”的创新模式,搭建“一键呼叫”应急小程序以及开展社区应急演练等。

通过对已有研究的分析可知,目前对社区应急科普的研究侧重对社区应急存在的问题进行探讨并提出改进意见和改进措施,这种研究方式重在理论论述,对如何实现应急知识精准科普、应急能力监测等问题缺乏具体方法研究。应急知识普及与应急管理仍然采用原始单一的方法,如网格化治理、线上线下联动、专业机构入社区等方式,这种应急科普与应急管理的方式具有模糊性和不确定性,难以监测社区居民的应急认知度和应急水平,缺少对社区居民的精准分类管理和针对性应急科普管理。同时,应急科普与应急能力监测的智能化、信息化水平不高,仍然采用纸质化统计、上门登记、敦促居民积极参与等效率低下的方式。在突发紧急情况时,难以快速采集社区居民信息、精准掌握居民对突发情况的认知度和应急能力,导致点对点精准应急、提升居民应急能力的难度较大。针对目前社区应急科普和应急能力监测存在的问题,本文构建了一种基于朴素贝叶斯数据挖据方法的社区应急监测体系,分别建立了社区居民应急认知能力精准分类模型和社区居民应急科普与应急决策模型,实现社区应急科普和应急监测与人工智能、数据挖据等技术的有效融合。

3 基于朴素贝叶斯数据挖掘的社区应急监测体系构建

社区居民存在属性上的差异,包括年龄、性别、学历等,且居民对应急知识的认知水平和发生紧急情况时具有的应急能力均不同。因此对社区居民进行精准分类管理、针对不同分类实现精准应急决策,是目前社区应急工作需要重点关注和研究的问题[8~12]。数据分析与挖掘技术中,分类算法能够实现不同属性数据的分类,其中朴素贝叶斯方法最具有代表性,是一种具有良好性能的分类方法[13~15]。根据社区居民的属性特征,构建了基于朴素贝叶斯数据挖据方法的社区应急监测体系。

3.1 基于朴素贝叶斯数据挖掘算法的社区居民应急认知能力精准分类模型

首先对社区居民的属性特征进行标签化。以社区全体居民为研究对象构建居民应急认知标签集模型。构建应急认知元标签作为采集每个居民属性的基础标签。基于应急监测结果分类标签对采集的待分类居民的应急认知元标签进行分类,分类过程基于朴素贝叶斯数据挖掘算法。根据社区应急特点,将应急监测结果分类标签精准划分为第Ⅰ类、第Ⅱ类、第Ⅲ类和第Ⅳ类监测对象,对应的应急科普与应急能力监测等级如表1。

表1 基于朴素贝叶斯挖掘算法的应急科普与应急能力监测等级

3.1.1 社区居民应急认知标签集模型构建

构建朴素贝叶斯数据挖掘模型的前提是建立社区居民应急认知标签集模型[16~18]。标签集模型的基本结构如图1所示。标签L(i)的标识分别为B(1):年龄;B(2):学历结构;B(3):身体健康水平;B(4):应急知识水平;B(5):是否经历过突发紧急情况;B(6):对社区应急工作认可度。每个社区居民P(i)对应一个认知标签L(i),居民通过社区发起的微信统计小程序填写标签内容B(1)~B(6),其中“B(3):身体健康水平”的度量以常见基础性疾病为标记,评价居民的健康指数;“B(4):应急知识水平”通过应急知识客观问答获得评分,其度量方式为分数区段,设计为B(4)-a:低于30(含)分(认知极低);B(4)-b:30~60(含)分(认知低);B(4)-c:60~90(含)分(认知合格);B(4)-d:高于90分(认知高);“B(6):对社区应急工作认可度”设计量化评分表,对社区应急科普、应急处置、应急措施等进行评价打分。将量化后的社区居民应急认知标签存入数据库(数据集)备用。在构建社区居民应急认知标签集模型时由社区统一标准设计应急认知元标签,确定不同标签组合下的应急监测等级(表1),用于构建朴素贝叶斯数据挖掘模型。

图1 构建的标签集模型基本结构

3.1.2 社区居民应急认知能力精准分类模型构建

基于朴素贝叶斯分类器原理,将采集的认知标签集分为训练集和测试集。利用训练集构建朴素贝叶斯分类器,对分类器进行训练并确定参数指标。以应急认知元标签集为依据,利用测试数据集对构建的分类器进行测试,并反复调整参数指标。经过多次模型测试与参数调试,最终构建能够用于社区居民应急科普与应急能力监测等级精准分类的朴素贝叶斯数据挖掘模型。图2为构建的朴素贝叶斯分类器的基本结构。

图2 构建的朴素贝叶斯分类器的基本结构

3.2 社区居民应急认知能力分类与动态监测

对社区居民应急认知标签进行多次k交叉重采样,基于应急认知元标签和社区居民应急认知能力精准分类模型,对多次k交叉重采样后的标签数据进行精准测试、分类,确定每位居民的精准监测等级,定义方式为多次交叉重采样后居民P(i)出现频数最高的监测等级。图3为经过多次k交叉重采样和分类测试后居民P(i)在各监测等级中出现的频数统计示意图。基于图3模型,可以在一定周期内进行社区居民多次k交叉重采样和分类测试,从而动态监测居民的应急科普和应急能力等级。社区工作人员根据精准监测等级分类结果对不同监测等级的居民采取针对性应急科普和应急管理措施[19~21]。

图3 多次交叉重采样和分类测试后居民P(i)在各监测等级中出现的频数统计示意

3.3 基于动态监测等级的社区居民应急科普与应急决策模型

根据朴素贝叶斯数据挖掘模型构建的社区居民应急认知能力精准分类模型,可以得到社区居民应急认知能力分类,并综合分析获得整个社区的应急能力等级和人员分布。根据社区居民应急能力等级和人员分布,从应急科普、知识宣讲、应急演练、精准监控、对口帮扶等多个方面,构建针对不同监测等级分类的应急科普与应急决策模型,并设计具体方案计划。决策模型的有效期根据突发紧急情况的事态和社区应急决策情况设定,超出有效期后需重新采集数据并建立模型,进行多次交叉重采样确定社区居民监测等级,制定针对性的应急科普与应急决策。图4为社区居民应急科普与应急决策模型基本结构。

图4 社区居民应急科普与应急决策模型基本结构

4 基于监测模型的社区应急决策与建议

社区应急科普与管理应围绕社区居民属性分类进行,利用基于朴素贝叶斯数据挖掘的社区应急监测体系对社区居民属性数据进行广泛采集,获取社区居民应急认知标签集。将标签集作为基本数据源,从中挖掘社区居民的应急认知分类,获取不同风险级别的居民群体,针对不同分类群体采取不同应急科普和管理措施。根据构建的社区应急监测体系,从模型的构建与使用周期性、数据采集与管理、社区应急决策与管理3个维度提出基于监测模型的社区应急决策与建议。

4.1 模型的构建与使用应遵循周期性原则

本文构建的基于朴素贝叶斯数据挖据方法的社区应急监测模型具有严格的周期性。因突发紧急情况具有不稳定性、难预测性和周期性特点,监测模型的使用必须严格遵循周期性原则[22,23]。首先,构建朴素贝叶斯分类器模型所进行的数据采集必须以突发紧急情况发生重大变化的周期性为标准,确定采集社区居民认知标签数据的时间、总量和选取原则,以保证模型构建使用的数据符合当前社区应急状况和居民的认知情况。其次,对朴素贝叶斯分类器模型的训练、构建、验证等也必须基于周期性原则,模型的有效期根据紧急情况的整体态势和社区应急状况确定,超出有效期后需重新采集数据和建立模型,并进行多次交叉重采样确定社区居民监测等级。最后,社区居民应急科普与应急决策模型也应当随着数据采集、分类器模型的周期性调整而重新构建,设计符合当前应急态势的决策模型。

4.2 重视数据采集标准的设计和数据采集的精准管理

数据采集是构建朴素贝叶斯分类器的关键,数据的准确度决定模型训练的精准度和最终分类结果的准确度[24,25]。应当严格按照当地应急政策和紧急事件发展态势构建社区居民认知元标签,通过纸质问卷、电子问卷等多种方式对社区全体居民进行发放、填写、回收和统计。认知元标签的设计应当符合易读性、全覆盖、不冲突的原则。易读性原则指的是所有标签的设计应当简易、可读性强,各个年龄段的居民均可读懂并作出正确判断。全覆盖原则要求所设计的标签覆盖社区居民的所有认知属性,且每项认知属性均能够作为构建朴素贝叶斯分类器模型和引导分类器模型进行交叉训练的标准化数据。独立性原则要求每一条认知标签的属性均为独立不相关个体,不能出现模棱两可、含义交叉的情况,以避免社区居民产生判断失误,影响分类结果和应急决策措施。对采集到的数据应当进行数据清洗并做好精准管理,作为该批次应急决策与管理的备案数据。

4.3 社区应急决策与管理应以决策模型为依据

根据构建的基于动态监测等级的社区居民应急科普与应急决策模型,对已经分类的社区居民进行精准管理,分为应急科普、知识宣讲、应急演练、精准监控和对口帮扶等环节[26]。针对不同监测等级(居民分类),社区应设计难易度和认知水平不同的应急科普手册或公众号科普知识问答,并根据社区居民的实际情况进行科普活动。针对不同监测等级(居民分类),社区可以针对各等级实际情况设计不同批次的应急知识宣讲活动,组织不同监测等级的居民参与宣讲,提高其对应急法规、应急知识、应急政策、应急措施等的认知水平。有条件的社区还可以根据不同居民分类展开不同情境下的应急演练,提高社区居民的应急处置能力。日常生活中,社区应针对不同监测等级的居民进行精准监控和对口帮扶,确定每户居民存在的问题和遇到的困难,并动态进行调研、监管和帮扶,确保应急科普和应急管理不落一户、落实到人。

5 结论与讨论

根据当前社区应急科普和管理存在的问题,本文构建了一种基于朴素贝叶斯数据挖掘的社区应急监测体系。通过对社区居民应急认知标签采集获取居民基本属性数据,作为构建朴素贝叶斯分类器的训练数据源。利用采集的数据构建了社区居民应急认知标签集模型,将数据按照一定的标准进行预处理并采用结构化形式存储。通过朴素贝叶斯分类器建立了社区居民应急认知能力精准分类模型,将社区居民分为动态监测的四类,并依据监测等级和居民分类构建了社区居民应急科普与应急决策模型,对不同监测等级和分类的居民进行不同方式的应急管理。在构建监测模型的基础上,从“模型的构建与使用应遵循周期性原则”“重视数据采集标准的设计和数据采集的精准管理”“社区应急决策与管理应以决策模型为依据”3个维度提出了基于监测模型的社区应急决策与建议。

本文构建的方法可为社区应急科普和应急管理工作提供理论支撑和技术参考。创新性地将基于朴素贝叶斯分类的数据挖据算法引入社区管理,特别是针对社区应急管理问题,利用朴素贝叶斯分类算法的特性将社区居民进行精准分类,能够有效帮助社区工作者获得每户家庭、每位居民的应急认知和科普情况,并针对具体情况采取针对性措施。在分类模型的使用上,本文研究方法考虑到应急管理具有的动态性、周期性规律,针对社区特点提出将模型应用纳入周期性管理的思想,使居民应急科普和应急管理遵循社区管理规定和社区人口发展规律。同时,本文构建的方法模型以数据采集为基础,对数据采集的准确性、完整性和区分度进行了严格界定,提出了重视数据采集精准化管理的思想,对社区应急科普与管理提出了严格要求,保证社区应急工作稳步推进。今后的研究工作将进一步拓宽基于朴素贝叶斯分类的数据挖掘算法的应用领域,将本文研究思想应用于社区健康管理、社区养老、社区团购、社区文化建设等各个方面,全面提升社区服务水平和服务质量,为建设社会主义和谐社会贡献力量。

猜你喜欢

朴素贝叶斯科普
隔离朴素
基于贝叶斯解释回应被告人讲述的故事
科普达人养成记
朴素的安慰(组诗)
他是那样“笨拙”和朴素——30多年后,我们为什么还需要读路遥?
最神奇最朴素的两本书
科普漫画
科普连连看
科普连连看
基于贝叶斯估计的轨道占用识别方法