APP下载

重大疫情数据治理的问题与对策

2021-04-28邓子云

昆明理工大学学报·社科版 2021年2期
关键词:抗疫管控疫情

邓子云

(长沙商贸旅游职业技术学院 湘商学院,湖南 长沙 410116)

面对2020年初新型冠状病毒肺炎肆虐这一重大疫情(以下简称新冠肺炎疫情),大数据技术在疫情管控中发挥了重要作用[1],然而也暴露出诸多的问题,如数据资源整合不够、解决方案不足等[2]。为此,应当从单纯的大数据技术应用,上升到数据治理的高度去看待如何对重大疫情做出有预备的、系统的应急处理,从而实现应急领域治理体系与治理能力的现代化。所谓数据治理指使用数据的一整套管理行为,这套行为能系统地发挥出数据的作用,在组织中促进工作、解决问题、提升效能。重大疫情数据治理的问题与对策研究思路如图1所示。

图1 研究思路

一、数据治理研究现状

对于数据治理的研究已有不少,技术与治理框架日趋成熟,但仍是当前的研究热点[3]。在掌握大量的数据后,人工智能、区块链等前沿技术被逐渐广泛运用在各种场景,如政府决策、企业管理、行业分析等[4]。有学者提出了多种数据治理的框架,如将PDCA(Plan-Do-Check-Act,计划-执行-检查-处理)管理思想引入大数据治理框架[5]14-20;又如从政务大数据角度提出政务大数据治理框架[6]67-72等。这些框架对重大疫情的数据治理有一定的指导意义,并且在一些观点上具有共识,如数据治理要通过技术和管理相结合形成框架、专用领域应当有专门的数据治理框架等[5]14-20,[6]67-72。

应用大数据、人工智能等前沿信息技术在应急数据共享[7]、物资配置[8]等方面已有一些先行案例。有学者提出应用大数据决策支持模型来支持指挥中心调度[9];提出建立大数据中心、建立数据模型来支持应急领域的各种应用需求[10-11]。有学者指出大数据、人工智能可以运用在指挥调度[12]、物资管理[13]等方面。而专门针对重大疫情应急处理的大数据管理研究还不多见,仅有针对疫情管控需要而提出或研发的各种信息系统、实验平台[14-15]。目前,在CNKI(China National Knowledge Infrastructure,中国知网)中有学者提出大数据治理的通用方法论框架[16]、城市治理现代化框架[17]和针对重大公共卫生事件的“5WHR”数据治理概念框架[18]有一定借鉴作用。

综上所述,有必要建立重大疫情数据治理框架,从数据治理的理念和视角来看待重大疫情需要解决的问题并提出对策。

二、新冠肺炎疫情的大数据应用

2020年初发生的新冠肺炎疫情,在1月和2月上旬,由于数据治理的理念、前沿信息技术没有得到发挥,疫情一度十分紧急,公共管理问题也时有发生。在2月下旬及之后,大数据、人工智能技术在疫情管控中的作用开始显现,通过统一指挥及疫情数据平台的应用等取得了显著的数据治理成效[19]。

目前,大数据技术在疫情管控上主要应用在应急指挥调度、物资管理与调拨、疫情分析与预测、疫区人员流动管理等方面,已涌现出大数据技术支持抗疫的一些典型案例,如三大通信运营商(中国电信、中国移动、中国联通)通力合作,研发出人员动向管理查询软件[20];铁路系统提供有病例的车次查询接口及软件[21]。一些大型互联网、移动互联网平台企业(如网易、360等)发挥APP、互联网平台用户群体巨大的影响效力,利用部分人工智能技术收集数据并形成应用后提供很多功能给广大民众使用,如疫情日报、确诊小区查询、同程查询、辟谣等[22-23]。华为公司为武汉的方舱医院提供了先进的5G技术支持[24]。京东集团发挥物流平台的信息化及运营效率高的优势,帮助转运和调度救援物资[25]。阿里云利用人工智能技术帮助医生快速诊断病情[26]。

三、新冠肺炎疫情暴露的数据治理问题

有媒体报道指出此次新冠肺炎疫情暴露出我国应急领域数据治理上的不少问题。例如,数据分散、各自为阵,救援物流调度效率低下,信息技术支持能力较差等[27-28]。

(一)数据资源整合度低

重大疫情管控需要的数据来源渠道很多,而且数据之间有较强的关联性,需要整合才能发挥效用。从此次新冠肺炎疫情已有的报道和大数据服务案例来看,对部分数据资源已作了一些整合,但由于数据平台和应用系统是由临时组建的合作研发团队建立的,所以用信息化手段整合的数据只涉及少数几个政府部门、企业、医疗机构,虽已形成一些应用,但明显数据资源的整合力度与应急管理、数据治理的要求相去甚远。

1.核心的医疗及病人数据、政务数据之间缺乏集成。当这些数据用于根据亲属关系排查确诊病例、疑似病例的密切接触者时有重要的参考价值。指挥调度决策和提供救治服务时也需要掌握医疗及病人的数据。例如,为临时的新冠肺炎病人收治医院准备足够数量的后勤物资储备,预测医院的建设规模及医务、工勤人员的配备数量。

2.社会公共服务的数据缺乏集成。此次新冠肺炎疫情的管控上,采取了一些紧急措施。由提供公共服务的企业(如铁路公司、民航公司等)开放数据接口并直接提供应用[20-21],一些大型互联网、移动互联网平台企业再借助与公共服务企业的数据接口研发新的功能供广大民众使用[22-23],如广大民众在APP中可查询是否与确诊病例坐过同一趟公共交通工具、是否在同时间段去过同一个公共场所等。但这些都需要广大民众主动查询,发现有接触史后再进行自我隔离并上报,存在遗漏的可能。应当做到数据集成后由指挥平台直接获知,并安排工作人员配合软件系统作位置跟踪及排查处理。

3.大数据平台型企业发挥的作用不够。重大疫情不同于普通商业应用,应当在一定可控和安全范围内允许获取大数据平台型企业的可用于重大疫情管控的数据。以人工智能、数据挖掘、海量数据快速存取等技术作为支撑,大型互联网、移动互联网平台企业的社交数据、位置信息、通讯记录等数据均可用于重大疫情管控。

(二)应对方案不足

重大疫情防控要应对的是临时的社会公共突发事件,事先很难预估,因此必不可少的会需要快速产生临时应对的数据技术方案。这种临时应对的数据技术方案分为两种:一种是事先数据技术预案,即这种预案事先已准备好,可根据临时发生的情况来选用;另一种事先没有准备,需要临时制定。

1.事先数据技术预案准备不充分导致临时数据技术方案出台不及时。在重大疫情数据的集成及软件应用上,尽管在软件工程中有快速原型法、迭代式开发等方法可用来快速开发软件,但由于研发需要有一定的周期,很难在数天的时间里快速形成。因此,重大疫情的数据治理需要针对各种可预料的情形准备若干套应对的数据技术预案,紧急事件一旦发生就马上可用于实施;其次,由形成数据技术解决方案的各个组织机构共同组成应对小组,针对紧急事件制定出台数据技术解决方案。

2.缺乏对重大疫情下各种数据治理场景的应急演练。不能只作医疗单位配合下的简单场景演练,应当让各政府部门、企事业单位、部分民众共同参与演练。

3.缺乏对数据治理的研究及成果利用。疫情发生后,国家科技部及各省份的科技部门临时启动了有关疫情的科研专项。这些项目中也有一些大数据、人工智能的应用研发,研发成果给予疫情管控工作一定的支持。各级社科研究机构、各种智库、政协、民主党派也开展了疫情的社科理论和应用研究,并及时向各级党委、政府献计献策,为新冠肺炎疫情后的企业复工复产、大数据技术应用、物资调度等工作提出了许多真知灼见。然而,研究工作有一定的时间周期,绝大多数无法立即取得成果并投入应用,数据治理则更是一套体系的运作,不是简单的技术应用。

(三)政府管理部门数据治理能力弱

1.应急管理部门对重大疫情的数据资源统筹能力弱。重大疫情涉及的政府管理部门有应急管理部门、卫生健康部门等,还有许多公共事业单位(如疾控中心、医院等)。由于各级政府的应急管理部门成立时间较短,对数据资源的掌控能力有限,用于重大疫情应急管理的信息系统尚处在建设中或起步阶段,致使没有平台能对重大疫情具备数据资源统筹的能力,也没有信息平台作为支撑进行统一指挥调度。

2.数据资源管理水平低。有了数据的积累和应用软件系统后,还要辅以管理体制机制的配合,才能拥有擅用软件系统的能力。例如,建立人员流动管控系统,通过该系统了解疫区所有人员的流动情况,一旦有人离开疫区就自动报警。运用这样的系统需要合适的体制机制来管理和协调三大通信运营商、互联网和移动互联网平台型企业、地理信息系统供应商、系统集成商,促使各方紧密合作,共同抗疫。

3.数据治理的法律法规不健全。应在立法上授权重大疫情期间在必要范围内可集成各种数据资源以服务于疫情管控,同时又能保证隐私数据安全,这些数据包括但不限于个人位置数据、社交关系等。

四、重大疫情的数据治理体系框架

下面提出一种重大疫情下的数据治理体系框架(见图2)。

(一)接口层

1.医疗及病人数据的来源。有的数据(如X光片、心电图等)带有很强的专业性,普通的结构化ER(Entity-Relationship,实体关系)关系并不能描述,且由于医学图像尺寸过大,互联网传输会有所延迟。病人涉及的医疗保险数据来源于人力资源与社会保障部门。目前,绝大多数城市的医疗保险定点医院已经与医疗保险中心建立了数据网。

图2 重大疫情下的数据治理体系框架

2.人员流动管控用到的人口和家庭关系数据的来源。人口数据来源于公安部门,这些数据主要是家庭的户籍数据。人口的婚姻关系登记数据来源于民政部门。随着各级政府的机构改革和电子政务工作的推进,有不少地方政府成立了数据资源局或专门的电子政务机构,对分散在各政府部门中的数据作了资源整合,可以较为方便地进行数据交换。

3.位置和公共出行数据的来源。在提供公共服务的国有企业中,掌握着许多重大疫情管控需要的数据。三大通信运营商掌握有移动通信用户的信息,包括客户的基本数据、通讯记录、位置信息等。铁路、民航、海运等企业掌握有交通出行数据。城市的公共交通部门掌握有市民的公交、地铁出行数据。

4.互联网、移动互联网平台企业掌握的数据。互联网、移动互联网平台企业掌握的用户数据可以为重大疫情的管控所用。例如,用户的位置信息、用户的社交关系、用户上报的健康情况数据等。社交软件QQ、微信既可记录位置又能即时通讯,还可加挂许多功能应用。

(二)数据层

1.重大疫情数据集成平台。通过这种平台可集成来自各种数据接口、数据源的数据。平台应建立在重大疫情大数据中心,并为大数据中心的其它软件系统提供统一的数据使用接口。但并非所有的数据都要集成到数据中心,如医学的影像数据尺寸特别大,都集中存储到重大疫情大数据中心并不现实,只要有接口可以在需要时能调用到即可。

2.重大疫情大数据中心。应面向各种应用主题建立数据集市或主题数据库,如面向医疗卫生用户建立医疗卫生数据集市,用于查询各种病例数据、分析用药及药效数据、辅助新药作大数据分析等。通过从通信运营商、公安、移动互联网平台、公共交通部门(公交、地铁、民航、铁路、航运等)等集成来的数据,建立位置通信数据集市,便于管控确诊病人和疑似病人的出行,广大民众也能够查询与病人和疑似病人的同行情况。通过集成公安部门的户籍数据和各种社交平台的社交数据,可得到公民的社会关系数据、所在位置的精确定位,用于分析、排查确诊病人和疑似病人的密切接触人群,还可用于作传染病学的传染关系分析。

(三)应用层

应用层的各种应用软件系统为不同的用户提供特定的应用功能。疫情上传系统可用于各单位上报疫情并传递各种疫情管控的内部公文、通知、公告等。疫情发布系统可用于统一发布疫情信息,并提供给其它系统获取重大疫情数据的Web服务接口。物资调度系统可用于交换、统计各种防疫物资的缺口,并与各大物流平台建立物流数据接口,支持招投标、直接委托物流等业务的线上操作。流动管控系统可在GIS(Geographic Information System,地理信息系统)系统的基础上,建立可视化的病例和疑似病例分布图,利用电子围栏、主动推送信息等技术手段监控人员的流动。交通协调系统可根据在各种公共交通系统中获得的出行数据得到病人和疑似病人的出行轨迹,及时公告甚至是主动提醒同行人员注意疫情;必要时,可紧急通过该系统及时对接各方,临时承担公共事业运输任务。舆情管控系统可用于获取互联网的软文、评论等数据,然后运用人工智能技术分析公众的情感偏向、参与人数等。疫情预测系统可利用机器学习、深度学习等人工智能技术,对重大疫情发展的趋势进行预测。

(四)治理层

在更高的层面对重大疫情进行管控,组织进行重大疫情的指挥调度、应急演练,并吸收部分民众的共同参与,以达到良好的治理成效。

(五)框架中的辅助部分

1.数据技术规范和前沿信息技术的应用。在接口层和数据层建立重大疫情的数据技术规范,包括用于数据交换的各种数据集成接口数据规范和重大疫情大数据中心数据规范。为便于知识管理及数据推理,还可以建立语义规范。在积累了大量的数据后,大数据、人工智能等前沿信息技术就能发挥作用,建立多维数据模型、机器学习模型、拟合数据规律公式等。

2.重大疫情法律法规体系。各种软件系统、应急指挥调度和演练等疫情防控工作的顺利推广实施离不开疫情管控的法律法规。例如,重大疫情下对隐私数据保护的等级规定,在不同的疫情防控等级下对人员流动管控的规定等。

3.先进的治理模式。使用众包模式,可将“举报确诊病例私自出行”一事放入APP中,由广大民众实名举报,一经核实即可奖励举报人;如果没有得到核实,也可以给民众以答复;如果举报人是恶意举报,还可以进行惩戒。使用竞赛模式,可将要解决的重大疫情管控问题抛给市场,由企业、团队以竞赛方式提出解决方案并予以实施,根据问题解决的绩效给予奖励。

五、重大疫情的数据治理对策建议

(一)明确职责分工,成立协同抗疫工作机构

1.成立抗疫领导机构。由于抗疫工作涉及的政府部门、事业单位、公共服务机构、企业数量众多,因此,应当相对明确各自的职责分工,以便统一调度。在党的领导下,坚持专业人士调度专业事务,行政人员调度行政工作的原则,由前述单位共同组建抗疫领导机构,平时分散合作,抗疫期间集中办公。

2.在抗疫领导机构下设立数据治理工作组。工作组由计算机、医药信息、人工智能、政府治理、舆情管控、通信技术等跨学科的专家组成,即数据治理专家顾问团,提供数据治理的专业建议,编制数据治理科技攻关项目指南,制定重大疫情数据规范。吸收应急管理、数据资源(或电子政务)、公安、科技、卫生健康、大型公立医院、通信管理、通信运营商、公共交通(民航、铁路、交通等)、大型互联网公司、大型移动互联网公司的专业人士参与,各自承担数据接口研发、数据集成,应急行政工作、医疗卫生处置工作、联系专家顾问团、统筹电子政务及数据资源工作,依托已有的电子政务中心运维重大疫情大数据中心的基础软件、硬件和网络系统。

(二)集成各方数据资源,建立多维数据模型

1.在重大疫情大数据中心建立多维数据模型。参照数据仓库的建设模式,建立多个支持多维数据、历史数据、海量存储的数据集市,包括但不限于医疗卫生数据集市、位置通信数据集市、户籍社交数据集市等。此外,在重大疫情大数据中心还应建立数据技术规范,在数据集成平台建立与各方数据交换的技术规范。

2.坚持集成数据的3条原则。一是实用性原则。应按数据应用的需求来设计数据接口集成数据,不必抽取各数据来源方的全部数据。二是建章立制原则。应出台数据隐私保护及数据通信的法律法规,对涉及个人隐私的数据(如位置、社交数据等),在没有疫情时确保数据通道畅通、可交换测试即可;在重大疫情期间,应有法律法规允许并在对公众屏蔽了敏感数据的前提下使用该数据。三是数据等级保护原则。可分为“公共-受保护的-机密-核心机密”等多级数据,将不同等级的数据开放给不同使用范围的人员使用。

(三)研发应用系统,形成疫情管控平台

1.加快软件系统的研发。应组织研发的应用软件系统包括但不限于疫情上报系统、疫情发布系统、舆情管控系统、抗疫物资调度系统、医疗管理系统、交通协查与调度系统、疫情大数据分析系统、抗疫指挥系统等,同时建立呼叫系统、视频会议系统、短信系统等,集成以上应用系统形成全国统一的疫情管控平台。

2.开展数据治理的科学研究。在科技计划、社科基金等项目中设立疫情管控信息技术、数据治理研发专项或指南条目,支持科研人员开展研究;支持软件企业研发软件产品;支持开展医学、软件工程、大数据、人工智能、政府治理等学科作交叉研究;支持先进信息技术(大数据、云计算、物联网、5G、人工智能等)在抗疫医疗、政府决策参考等方面的应用型研究。对公共交通企业、通信运营商、大型互联网和移动互联网平台等与抗疫紧密相关的企事业单位优先支持其开展重大疫情数据治理的专项研究,并迅速将其研发成果投入应用;允许在应用的过程中用快速原型法、迭代法等软件工程开发方法不断完善数据接口和应用功能,逐步提升软件质量。

(四)加大演练力度,构建群防群控体系

1.对数据治理体系进行演练。重大疫情的数据治理系统必须要进行演练,以测试其建设成效及存在的问题。演练不应只针对医疗体系,而应对整个体系中的各要素、各环节进行全面演练。

2.演练应定期进行并遵循一定流程。在建成重大疫情大数据中心后,至少每隔一年进行一次重大疫情演练,模拟疫情发生的各个环节进行应急处置。遵循发现疫情→紧急上报→启动疫情级别响应模式→启用应急平台各大应用系统→指挥调度→发布疫情→交通管控→人流管控→物资调度→舆情分析与管控→解除各种管控的演练流程,由抗疫领导机构及各工作组各司其职进行操作。

3.演练时应一并测试群防群控系统。可让部分民众通过APP、互联网平台、电话等在线渠道参与到重大疫情防控演练中来,测试基层的各种业务流程,发现并预防出现过度防控、滥用职权等问题。

(五)创新治理场景,应用先进治理模式

1.补齐法律法规短板。建议补充出台《重大疫情防治条例》《重大疫情下公民信息数据隐私保护与征用规定》《重大疫情下抗疫物资调度规定》等条例或部门规章。

2.应用先进的治理模式。重大疫情发生后可应用的先进治理模式有很多种,这里列出其中的3种及其应用场景示例供参考。一是众包模式:将疫情管控的部分工作通过APP在可控范围内(如某街道的共产党员群体)进行传播并外包。二是竞赛模式:将疫情管控的紧急科研任务通过移动互联网征集研发单位,规定在指定时间内快速研发成型,对参与研发的组织、团队按研发成效给以奖励或回报。三是随手拍模式:由疫情管控监督人员随手对问题用手机拍照后上报疫情防控系统,再协调整改疫情防控工作。

六、结论

本文梳理了我国在此次抗击新冠肺炎疫情中出现的数据资源整合度低、应对方案不足、管理漏洞多的问题,提出了一种重大疫情下的数据治理体系框架。该框架包括接口层、数据层、应用层、治理层及辅助部分。由此,解决我国重大疫情下数据治理问题的5点对策分别是:成立抗疫领导机构并设置数据治理工作组;在重大疫情大数据中心建立多维数据模型,坚持实用性、建章立制、数据等级保护3条原则;加快应用系统的研发,开展数据治理的科学研究;对数据治理体系进行定期演练,同时测试群防群控系统;补齐法律法规短板,应用众包、竞赛、随手拍等先进的治理模式。

猜你喜欢

抗疫管控疫情
抗疫路上 不屈前行
EyeCGas OGI在泄漏管控工作中的应用
“画”说抗疫
抗疫之歌
战疫情
团结抗疫
多端联动、全时管控的高速路产保通管控平台
BIM技术在土建工程管控中的运用
抗疫情 显担当
疫情中的我