APP下载

大数据背景下常态化疫情精准防控机制研究

2020-10-27王靖亚张玉龙

关键词:防控社区人员

王靖亚, 朱 赫, 吴 艺, 张玉龙

(1.中国人民公安大学信息网络安全学院, 北京 100038; 2.日照市公安局, 山东日照 276800;3.日照市交通运输局, 山东日照 276800; 4.日照市卫健委, 山东日照 276800)

0 引言

2020年初,一场突如其来的新型冠状病毒席卷世界,短短一个多月时间,我国国内8万余人确诊、3千余名患者死亡,以“居家隔离”为主要举措的疫情防控大战迅速在全国范围内展开,往日车水马龙的车站码头和热火朝天的工厂仿佛按下了“暂停键”,国民经济和正常的社会秩序受到前所未有的挑战。在党中央的领导和全国人民奋力拼搏下,国内新冠肺炎的传播已经得到有效地控制。但是,国内疫情的有效遏制,并不意味着疫情防控的彻底胜利,随着海外疫情的爆发和各地逐渐复工返学,人员流动性增强,防控形势变得更加复杂。

据中国通信院发起的人工智能产业联盟发布《人工智能助力新冠疫情防控调研报告》(简称《报告》)显示,大数据分析在疫情态势感知、疫情重点人追踪、人员轨迹溯源、网络舆情分析等方面表现突出[1]。

1 疫情大数据分析及疫情专题库组织

大数据技术使得过去不可计量、存储、分析和共享的信息都被数据化了[2],标志着人们在认识世界和管理世界的道路上迈进了一大步。大数据管理系统也从以软件为中心开始向以数据为中心的计算平台的迁移[3]。

本次国内疫情防控效果显著,疫情大数据分析研判功不可没。疫情大数据来源丰富、结构复杂,具有多源异构的特点,多源包括来自纵向的各层级、横向的各行业信息;异构包括结构化关系型数据库信息、非结构化声音图像等信息以及半结构化的网页信息等。

1.1 疫情大数据来源分析

各地的疫情大数据根据当地的特点,有些由卫健部门主导;有些由公安机关主导;有些由地方大数据中心主导。疫情大数据包含了来自公安机关、卫健部门、企事业单位等多部门和网上、网下等多渠道的多源异构数据,来源多样、结构复杂[4],归纳起来包括以下几类:

(1)公安业务数据。这类数据主要是指公安机关在执法过程中产生和积累的数据,比如标准地址、实有人口、实有单位、实有房屋等“一标三实”数据,还有户籍信息、车辆信息等。这类数据是公安业务的基础类数据,可以关联到公民的真实身份,数据的价值密度大、真实可靠、数据的完整性和一致性好,可用于人员社会关系挖掘、落脚点查询、人/车核验等。

(2)轨迹类数据。这类数据来自网吧登记信息、铁路/民航旅客登记信息、运营商基站信息等。由于此类信息采用实名登记制度,不仅可以关联人员身份,还可以分析人员位置、运动轨迹等。这类数据价值密度大、实时性好、可信度强,可用于人员运动轨迹分析、同时空人员分析、团伙挖掘等。

(3)健康类数据。这类数据一部分来源于卫健部门公布的疫情数据,如新增确诊、新增疑似、新增死亡、境外输入等。这部分数据直接关联公民身份、可靠性强、价值密度大,可用于疫情态势预测、密切接触者分析等。另一部分来自公民自行申报的个人健康信息,这部分数据的真实性很大程度取决于公民自身的主观意志,可能存在谎报和瞒报的现象。

(4)视频数据。这类数据是基于云计算的分布式大数据视频平台获得的监控数据,如卡口车辆数据、智慧社区警务的视频监控数据等。这类数据的特点是直观生动、数据量大、价值密度低。可用于人/车关联、团伙发现、轨迹跟踪、密切接触者发现等。

(5)互联网数据。这类数据是直接表达公民衣食住行消的数据以及互联网公众数据,比如微信公众号、贴吧论坛、博客、物流数据等。这类数据结构复杂、数据量大、价值密度低,可用于人物画像、社会关系研判等。

(6)其他社会类数据。这类数据是和公民生活相关的企事业单位数据及社区物业等信息。如婚姻登记数、人脸数据、异常体温数据、车辆数据,以及水、电、煤气等消费数据,这类信息实时性强,属于感知类信息,大部分数据客观真实,也有些是人工采集的数据,其零散存储、时效性差。这类数据可用于同行同住、异常聚集、人车关联等分析,用于对疫情重点人口精准管控、智能发现潜在的密切接触者等。

1.2 疫情大数据专题库

多源异构的大数据必须按照不同的应用场景需求进行不同视角的汇聚融合和重新组织。大数据组织分为原始库、资源库、主题库等组织方式。原始库是汇聚分门别类反映原始业务场景的数据,其中的数据按照原始的数据格式进行存储,其特点是能够真实反映原始场景;资源库是在原始库基础上,按照行为、内容、轨迹、关联关系、时空分布等方式重新分类组织后所形成的轻度汇总数据,如:公民身份号码、车牌号、手机号、MAC等要素以及要素之间关联关系;主题库是从原始库和资源库中抽取的,围绕人、地、案、事件、物、组织等主题对象所形成的多维度的反映对象全貌的公共数据集合[4,5]。图1为疫情大数据原始库和主题库的示意。

图1 疫情大数据原始库和主题库示意

2 涉疫人员发现模型

基于大数据的涉疫重点人群发现,是根据规则在海量的数据中自动发现和锁定疫情重点人。其核心是以确诊人群、疑似人群等为线索,从多维度进行信息的碰撞及分析研判,找出所有涉疫重点人群的密切接触者。

2.1 多维信息碰撞锁定涉疫人群

在疫情大数据基础上,通过人际关系、时间和空间等3个维度进行廓线,建立数据模型,快速锁定可能的涉疫人员,及时准确地发出预警信号,阻断可能的传播途径,数据模型的3个维度如图2所示。

图2 三维数据模型

以上3个维度中,以确诊人群、疑似确诊人群等为线索,与其有社会关系交集(主要是同住)为密切接触者;与其轨迹信息有同时空交集的,为潜在的密切接触者。根据三维分析,可以得到若干疫情大数据模型[6]。如可以围绕省际卡口、高速公路、铁路、民航、客运站等数据资源,按照预定的规则,实时提取出入本地的车辆信息、火车到站人员信息、民航到达人员信息等,从高风险地区人员往来、高概率返程、复工返学等信息,构建相应计算模型,分析研判当地的疫情态势,预测下阶段人员流入趋势;根据运营商数据和出行方式数据,分析和识别重点关注人群的迁徙轨迹,通过对轨迹的挖掘,进一步寻找密切接触人群。

2.2 数据模型让疫情线索“水落石出”

按照上一节介绍的疫情大数据模型的构建思路,通过同住、同时空等信息碰撞[7],各地结合自身特点,推出了丰富多彩的疫情防疫数据模型,助力疫情及时发现、迅速阻断及危险隐患的消除,下面介绍几种典型的疫情大数据模型。

(1)疫情态势监测模型:该模型通过各级卫健部门公布的确诊、疑似、死亡、出院等数据,建立本地与全国疫情趋势对比模型,评测本地的疫情态势。

(2)高危区域人员流动特征模型:该模型基于铁路、民航、旅店业、运营商基站等实名制轨迹数据,筛查出高风险地区返回本地的人员名单,及时下发各地并予以关注,有效防范外部输入。

(3)密切接触人员分析模型:该模型依托疫情大数据,按照社会关系、同时空等条件,筛选出密切接触人员,关联补齐身份及落地地址信息后,及时发往社区进行精准防控。

(4)涉疫重点人员临控模型:该模型整合全国疫情重点人员、密切接触人员、高风险地区人员在本地申请健康码情况、本地滞留高风险地区人员、运营商数据中显示的高风险地区进入本地人员等数据,形成涉疫重点临控人员库,推送对应的疾控中心,并下发社区进行预警布控。

(5)涉疫重点车辆临控模型:该模型融合滞留高风险地区车辆、高风险籍人员在本地登记车辆、涉疫重点人员的车辆等数据,研判出涉疫重点车辆库,依托视频云平台进行布控。

(6)涉疫重点国家入境人员分析模型:基于全国口岸入境人员信息,关联常驻人口、暂住人口、临时居住的外国人、火车、民航、运营商等数据,研判出入境人员落脚点,推送给相应的社区进行落地精准管控。

(7)入境人员预测模型:该模型根据入境订票数据、入境申报数据等与全省常驻人口、暂住人口等数据进行关联分析,预测出近3日内可能进入本地的人员,全面防控境外输入。

3 常态化模式下的疫情防控实践探索

随着国内疫情逐渐好转,人们的生活逐渐恢复常态,人员跨地区流动加剧,同时,海外疫情爆发使得防输入任务仍旧艰巨。常态化疫情防控应该具有两个重要特征,一是保证非涉疫人群的快速无感流动;二是尽量将疫情防控的代价减小到最低程度。

3.1 常态化模式下公共场所人员快速分流

疫情防控可以抽象为人流、物流、商流及信息流的多个输入和输出的大系统。系统从无序向有序的演变受到外部因素与内部因素的推动,外部因素是系统与外界的流协同,内部因素是系统内部的流协同[8]。疫情防控大系统中的各部门之间、部门内部各单元之间必须消除壁垒、协同一致。

目前,境内人员流动的通行证是健康码,健康码是人流与信息流相互转换和信息流支撑人流的应用。健康码依托于“国家政务服务平台”,汇聚融合多项实名制数据,每个人申请健康码时,系统都需要从海量的公共数据库中,精准获取其公共信息,通过高性能算法加工得到其健康码[9]。由于各地的疫情等级、响应级别及防控要求标准不一等原因,国内的健康码信息库基本是以省为单位建立的,尚未实现全国范围内的互联互通,健康码是互通互认的[10],当人员跨省流动时,就需要重新申报前往地的健康码。

为了在疫情防控不放松的前提下,让省内非涉疫人群快速无阻通过公共场所,减少人员的聚集,日照市交通运输局、日照市卫健委和日照市公安局等单位共同研制了山东省内第一款基于身份证和本省二维码的人员快速分流系统,该系统对接了省卫健委的健康码专题库数据,融合居民近期行程信息,实现了通过身份验证和本地二维码快速核验通行、将本地非涉疫人员、本地涉疫人员以及外地未申报本省健康码的人员快速分流,在此基础上,实现了外来人员自动入库、落脚地实时预警、核酸检测信息共享等功能。该系统在铁路、民航、港口等入口处,以及公园、医院等人流密集地均有非常重要的应用价值,最大程度的保护了执勤人员及乘客的健康出行。图3所示为闸机口及人员分流示意。

图3 疫情防控人员快速分流

图3中,提供核验身份证及本地健康码两种验证模式通过闸机,当人员持有本地健康码并且为非涉疫人员时,可以快速通过闸机;当系统检测出涉疫人群或者没有申报本省健康码人员时,系统会自动报警。

3.2 入境人员全流程无缝转接措施优化

我国疫情防控工作的下半程是以外防输入为重点,对此,各机场口岸都设计了严密的流程,力争在第一时间发现感染者并阻断传染源。目前普遍的做法是,旅客从预约登机开始到进入社区,经历了航班管控、通关管控、医学隔离、社区管控4个阶段[11]。对于入境人员身份,可以通过公安机关提供的请求服务进行核验,但是对于其落脚点并没有有效的验证机制,因此,给谎报瞒报信息者造成了可乘之机,并且现行信息流滞后于人流,本文给出了入境人员的流动机制的优化方案,如图4所示。

图4 入境流程中的人流和信息流协同

其中虚线部分为在现有入境人员流动模式的基础上增加的信息流,其目的为:一方面在于尽可能早地让信息流提前于人流,为政府疫情态势预测提供支撑;另一方面,增加人员落脚点的真实性验证,第一时间发现和杜绝谎报瞒报现象。

3.3 社区层面的疫情智慧精准防控

居民社区是公民的最终落脚点,也是疫情聚集性传播的重要场所,因此,社区是实现精准化疫情防控的最重要的环节。近年来,各地公安机关,围绕社会综合治理和打击新型犯罪的需求,运用大数据、云计算、人工智能、物联网等技术,探索共建、共治、共享的现代社区警务模式,实现社区数据的“全感知”。智慧社区管理模式有助于提高社区疫情的预测预警能力、精准锁定涉疫人群,加强对疫情重点人群的动态管理[12]。

基于三维场景的智慧小区管理,借助于直观形象的三维场景,以及移动终端便利的拍照和定位功能,可以将“一标三实”数据有机关联,实现小区人防、物防、技防相结合的治安管控模式,向小区安防智能化全覆盖转变,实现对小区人、车、物的全维感知、智能识别、全程跟踪,达到“人过留影、车过留牌、机过留号、卡过留痕”,通过科技手段实现对社区的围合[13]。图5所示为智慧社区警务科技围合示意。

图5 三维可视化小区科技围合

通过对散乱的社区视频数据、图像数据、多媒体感知数据进行结构化,并经过去重、特征比对和聚类分析后,对确认的同一人员和车辆,形成该区域唯一视频身份,并通过公安内网进行核录,再通过数据模型,智能发现疫情预警信息。

围绕疫情防控需要,在原有的智慧社区数据的基础上,对接公安大数据的疫情专项数据,对小区常住人口进行疫情分级标识,同时监控疫情重点人群的出入,从海量数据中挖掘潜在的规律和线索,提供人、车、房、事件等多要素关系分析应用,在原有的”一人一档”“一车一档”以及“一屋一档”数据关联模型的基础上,通过同时空对比、轨迹伴随分析、人车关联等创建潜在密切接触者发现模型、疫情重点人员排查模型,快速发现本小区疫情风险,并精准到户予以防控[14-15],图6为智慧社区精准防疫示意图。

4 结语

目前,我国疫情防控取得了阶段性的胜利,但是只要世界范围内的疫情没有消失,疫情防控就不能停止,目前,疫情防控存在诸多亟待解决的问题。

首先是健康码的问题。健康码是常态化模式下人员流动的通行证,但是目前全国范围内的健康码尚未做到互联互通,由于各地的疫情等级、响应级别及防控要求标准不一,本地健康码正常的人,不一定符合跨省后的健康标准,可能会造成一人多码的现象。对此,应该尽快统一健康码生成标准,进而实现全国范围内健康码的互通互认;二是健康码不够精准,由于个人轨迹信息(基站信息、航班/铁路信息)一般区分到地市,没有做到精准化、差异化的区域分级,不符合疫情错综复杂的现状。

其次是各部门在疫情防控中的相互配合问题。疫情防控是全社会的大事,横向来说涉及卫健、交通、公安等部门的数据融合,纵向包括从管理部门到社区落脚点,为此,各部门应该打破部门之间的信息壁垒,实现真正意义上的疫情大数据共建、共享、共治机制,同时将疫情防控重心下沉至社区,实现信息的闭环流动。在各部门密切配合进行疫情防控方面,日照市的作法值得借鉴,日照市在市委、市政府的领导下,交通运输局、卫健委、公安局针对疫情防控中的公共场所人员快速分流问题,专门成立了“日照公共健康动态管控实验室”,推出的公共场所人员快速分流系统,为保证疫情防控前提下,最大限度地恢复常态化的生活模式,降低防控代价起到了非常好的示范作用。

再有是疫情防控的同时加强公民隐私的保护问题。大数据技术在带给人们极大便利的同时,也会引起公民隐私的暴露。疫情防控初期,许多不良商家以疫情防控为由,骗取公民个人隐私信息,近阶段各地已经加大了整治力度。由政府部门、卫健部门或者公安部门推出的健康码,在数据采集过程中必须符合信息系统等级保护三级的要求,信息的采集必须遵守最小化原则,敏感信息的“知情权”必须在满足工作需要的前提下严格限制[16],健康码只允许采集公民身份证号和人脸信息,并且必须在24小时内进行所有数据的删除和重置。同时,应该加大对虚假健康码小程序的识别打击力度,加强社区宣传,让广大群众能够正确识别真假健康码。

猜你喜欢

防控社区人员
配合防控 人人有责
猪常见腹泻病症状及防控
社区大作战
守牢防控一线 静待春暖花开
3D打印社区
在社区推行“互助式”治理
夏季羊中暑的防控
让刑满释放人员找到家的感觉
影像社区
再来一次,这太有趣了!