APP下载

时空集成
——论大数据技术在疫情防控中的“集成效应”

2021-12-04

关键词:不确定性防控疫情

杨 子 飞

(杭州电子科技大学 马克思主义学院, 浙江 杭州 310018)

一、引言:“抗疫战争”中的大数据技术

当前,新冠肺炎疫情还在全世界蔓延,而我国在党和政府的正确领导和全国人民的齐心协力之下,已经取得了疫情防控战役的重大战略成果。值得注意的是,在这场全民参与的“抗疫战争”中,大数据技术频繁亮相,各地政府采用了形式多样的“大数据武器”,成为中国式抗疫和中国式社会治理的一大特色。比如,厦门市采用了基于交通大数据的疫情防控分析平台,该平台通过采集分析公交车、出租车、网约车、长途和旅游客运巴士、轮船以及路口、居民小区等地方的人、车(船)数据,面向政府提供基于交通工具、交通枢纽、保障物资、体温异常人员的快速监测预警、分流跟踪、对比查询等服务,面向公众提供病者同行、实名查询、乘坐预警及出行引导服务。北京市海淀区推出了“城市大脑”疫情防控平台,返京人员的来源地、是否经由疫区、是否与确诊病例同过车、在某地的驻留时长等关键信息都可以在城市服务管理指挥中心大厅的电子屏幕上集中显示。

与此同时,很多互联网企业也在疫情防控中提供了宝贵的大数据技术支撑。比如,“百度地图”面向社会提供了名为“人口迁徙热力图”的城市大数据,“京东数科”协助政府搭建了“高危人群疫情态势感知系统”,“阿里巴巴”协助浙江省政府开发了功能强大的疫情防控APP,等等,类似的案例不胜枚举。

值得深思的是,与2003年的非典疫情相比,新冠肺炎疫情在传播规模和死亡人数上情况更为严峻,但防控成效却更为显著。这其中当然有很多因素在起作用,但是大数据技术的运用无疑是一个非常重要的原因。当前的实践充分证明,大数据技术在提升疫情防控的有效性和精准性、降低疫情防控成本等方面,发挥了越来越重要的作用。然而,我们在理论层面却还未对此现象作出深入分析,还不能在学理上清楚且深刻地揭示大数据技术在疫情防控及社会治理中的运作机制。理论难免具有一定的滞后性,及时对实践经验进行归纳总结,建构与实际相吻合的理论体系,才能够反过来促进实践的发展。

祸福相依,危中有机。为了在灾难中吸取经验教训,让大数据技术更好地服务于疫情的防控和国家的发展,我们有必要深刻认识疫情防控的本质,深入分析大数据技术的基本特性,归纳大数据技术在疫情防控中的作用机理,总结大数据技术在社会治理方面的有益经验,并对其可能存在的风险进行评估。

二、疫情防控的本质及难点:对双重不确定性的风险防控

人类的历史常与灾难并行,疫情也在人类灾难史上频繁出现。此次由新冠病毒引发的疫情是一次极其典型的突发性公共卫生事件,起因是自然界中一种人类未知的病毒侵袭了人类,进而导致了疾病的产生,可以说在事件源头上它类似于一场自然灾害。但是,与地震、海啸等典型的自然灾害不同,由病毒引发的疫情不是一次性生成的,而是递增式生成的;不是完全由自然原因导致的,而是会随着人类行为的变化而发生巨大变化的。因为当病毒侵入人体之后,人类本身就成了病毒扩散、灾难加剧的最重要因素,而且其扩散和加剧是呈指数式增长的,这正是疫情引起社会恐慌的原因。因此,病毒及其导致的疾病虽然是一个自然现象,但疫情及其扩散却是一个社会现象。

相应地,疫情防控也必然是一个社会性工程。如果说消灭病毒、治疗病患是一个医学研究问题,那么疫情防控则是一个社会治理问题。医学研究的对象是病毒,而社会治理的对象则是人,人永远比病毒复杂千万倍。尤其是在“流动的”①现代社会,人口的大规模流动(新冠肺炎疫情发生在中国人口流动最频繁的春节期间),以及人口在城市的大规模聚集,导致各种不确定性因素激增。现代社会的诸多制度安排,比如保险制度,就是为了应对这些不确定性因素的挑战而设立的,对确定性的追求是现代社会的最深层渴望。通过对不确定性范围的删减、对事件发生概率的控制,可以实现一种单一的、稳定的、可预见的秩序②,传染病防控体系就是其中一个代表。未知的病毒带来的不确定性是自然的不确定性,随着科学技术的进步,这种自然导致的不确定性正在逐渐减少,但从根本上来说,它是不可能被彻底消除的,因为人类对自然的认知是远远不足的。而流动的人所带来的不确定性是社会的不确定性,在流动的现代社会里,这种社会的不确定性正与日俱增。不确定性无法被完全消除,只能被控制,因此不确定性的存在即意味着风险的存在,对不确定性的管控就是对风险的管控。因此,疫情爆发就是自然不确定性和社会不确定性导致的风险双重叠加,而疫情防控就是对这种双重不确定性的风险管控。

作为一个风险管控工程,最重要也最大的难点在于风险识别,因为只有对风险进行有效识别,才能对风险进行有效管控,正如在疫情防控中,最重要也最难的就在于找出确诊患者的密切接触者,进而锁定潜在的被感染者。但是,风险不同于危险,危险是具体的、实存的、容易辨别的,就像一个具体的病毒是比较容易借助现代手段把它识别出来的,而风险是一个概率性存在的危险,可能发生也可能不发生,可在此处也可在彼处,难以识别。风险之所以难以识别,主要原因在于信息的匮乏以及信息整合能力的不足。在前大数据时代,人类所拥有的信息都是“小”的、局部的、相互孤立的,而且人类对这些信息只能采取样本统计的方式来处理。“因为我们不能控制我们生活在其中的世界,唯一减少不确定性的方式就是发现真理,并试图避免不确定性造成的不良结果。”③真理也许并不易被发现,但是完整的信息和强大的信息整合能力能够给人类带来知识的力量,进而实现对不确定性因素的掌控。知识即是掌控,这是风险社会里的保险逻辑(insurance logics),也是大数据技术的隐秘逻辑,即认为安全可以通过情报数据的收集、鉴定和追踪而获得④。突发的疫情将人类社会对不确定性的恐惧极端化,也将现代社会对秩序与安全的渴望极端化,而现代社会应对不确定性的保险逻辑又将疫情防控引向高科技、智能化方向。

因此,在这种现代逻辑指引之下,要将疫情风险高效、精准地识别出来,并同样高效、精准地纳入管控系统,就需要构建一个能够有效应对上述困境的现代技术体系,并创新一种用此现代技术体系武装起来的现代治理方式,大数据技术本身具有的高度“集成特性”很好地回应了这种需求。

三、大数据技术的“集成特性”:集聚性与生成性

近十几年来,大数据技术在世界范围内蓬勃发展,成为世界各国争相争夺的战略要点,同时也引起了学界的广泛讨论。一般而言,我们所说的大数据技术是指一种“搜索、分析、整合、交叉处理海量数据的能力”⑤,这个定义实际上暗含了大数据技术的另一个层面,即监控技术。早在20世纪80年代,监控问题就进入了学术界的视野⑥(尽管监控现象是古已有之的)。人们过去常常把监控技术与大数据技术当成两个关联不大的事物来看待,但实际上这两者是高度相关且相辅相成的,大数据技术必然要借助监控设备才有可能获取海量数据,而监控设备则必须借助大数据技术才有可能对海量数据进行有效处理,并服务于监控的特殊目的。

只有将大数据技术与监控技术结合在一起,才能看清大数据技术的本质特征。从数据处理的角度看,大数据技术所具备的“搜索、分析、整合、交叉处理海量数据的能力”是人类之前所无法企及的;从社会治理的角度看,大数据技术最突出的特性可以被概括为“集成特性”,这与前人的认识并不矛盾。“集成特性”主要包括以下两个方面的特点:

第一,集聚性。大数据技术具有快速、便捷获取数据的能力,这种快速便捷几乎是实时产生的,而且数据的收集一直在持续进行中,持续不间断地汇聚实时数据几乎可以等同于全时间覆盖,这意味着时间的特殊意义在大数据技术条件下被削弱了。而且,大数据技术所获取的数据覆盖全面,因为它试图获取的是全场域最大限度的细节信息,这种空间上的全覆盖意味着空间的特殊意义在大数据技术条件下也被削弱了。以快捷的方式收集全方位信息,从而汇聚出体量巨大的数据海洋,这也是大数据之所以得名的直接原因。值得注意的是,大数据的“大”不仅仅指的是与“小”相对而言的“巨大”,更是指“全”,亦即信息覆盖的全时空性。全时空数据即所谓的“全样本数据”,正是因为大数据技术可以借助信息技术搜集“全样本数据”,所以它可以不再关心现象之间的因果关系(对因果关系的关注只是在信息处理能力低下的“抽样数据”时代的无奈之举),而只需要关心数据之间的相关性,从中就可以获得“产生于数据的洞见”⑦。

第二,生成性。大数据技术收集的数据是多元化、异质性的,既有结构化数据,也有非结构化数据,如何从这种近乎混沌的数据海洋中获得所需要的特定信息,就需要有高超的数据处理、整合能力。大数据技术的数据处理能力是高度智能化的,它可以借助复杂的算法程序从看似不相关的数据中“生成”人类所需要的特定信息⑧。

正因为大数据技术具有“生成性”,所以它既能对过去进行回溯,也能对未来进行预测。所谓回溯,是指大数据技术可以借助现有的数据资源追踪回溯过去发生的行为轨迹,这种功能在刑侦领域已经被广泛运用。在新冠肺炎疫情防控过程中,很多管理部门也都在使用大数据技术来追踪确诊病例的过往行动轨迹,以此来锁定密切接触者的可能范围。比如,中国三大电信运营商根据疫情防控的需要,在得到用户授权的情况下,基于电信大数据分析,向用户提供14~30天内到访地查询服务,甚至可以精准测算用户在某地的具体逗留时间。该服务可以帮助有关部门提高对流动人员行程查验的效率,对重点人群进行排查,实施精准防控。所谓预测,是指大数据技术可以借助以往的数据信息预测未来可能发生的行为或现象,实现监控方式从原来的后发制人式监控转变为先发制人式监控(pre-emptive surveillance)⑨,这是只有大数据技术才有可能实现的功能。比如,早在2008年,谷歌就推出了“谷歌流感趋势”(Google Flu Trends,GFT)即时网络服务,通过分析人们在网上的搜索记录来预测冬季流感的传播。它可以对咳嗽、发烧等与流感有关的关键词进行监测,并通过地图将这些被检索的关键词显示在其所对应的地区。关键词密度越高、越频繁,则该地区爆发流感的可能性越大。分析结果表明,谷歌的预测与官方医疗统计数据的吻合度高达97%⑩。同样地,在此次新冠肺炎疫情防控中,也有很多部门和专家都试图借助大数据技术对疫情的发展趋势作出预测。

大数据技术的“集成特性”正是对风险管控工程中的难点问题的有效回应。一方面,大数据技术的“集聚性”可以解决信息匮乏的难题,体量巨大而且是近乎全时空覆盖的数据能够为疫情防控提供必要的数据支撑。另一方面,大数据技术的“生成性”能够解决信息整合能力不足的难题,可以根据防疫部门的特定需求提供相应的大数据支撑服务。在疫情防控过程中,我国三大电信运营商借助用户手机信令和漫游数据,为政府部门提供大数据平台,用来支撑疫情防控工作,该平台具有疫区人群流动监测、返程复工人群流动监测等功能。三大电信运营商提供的大数据比互联网企业提供的数据更及时、更全面,因为中国移动、中国联通和中国电信所拥有的手机用户分别达到9.47亿、3.21亿和3.34亿,基本实现了空间与人口的全覆盖,这一点是互联网平台无可比拟的。

四、大数据技术的集成效应:从“数据集成”到“治理集成”

如前所述,疫情防控是一个涉及面极广、各种因素错综复杂的风险管控系统工程,这就决定了任何一个地区、任何一个部门都不可能凭借一己之力来完成。而要实现各个地区、各个部门之间的协同作战、联防联控,首先要改变的就是各地区、各部门之间的“数据割据”甚至“数据孤岛”状态。

大数据技术首先带来的就是“数据集成效应”,这其实是大数据技术的题中应有之义,因为只有将各个地区、各个部门的数据汇聚打通,才有可能达到大数据所要求的数据量级。比如,济南市就将“城市大脑”长期汇聚的医疗、交通、公安等不同部门的城市动态管理信息和实时监控数据加以整合汇聚,为疫情防控中的人员追踪、疫情态势分析、应急资源调度等方面提供数据支撑、决策支持和联动指挥依据。

大数据技术的“数据集成效应”同时也会带来“时空集成效应”。归属于不同地区、不同部门的数据是产生于不同时空背景下的多元、异质性数据,在没有大数据技术支撑的条件下,特定时空中所产生的特定数据只能用来说明特定时空中的特定现象,这正是前大数据时代数据处理的基本特征。但是大数据技术的运用,将多元异质的数据集聚起来,当数量达到大数据量级时,数据的多元性和异质性就会消失,至少是被大大削弱,此时多元、异质性数据被大数据技术转变成同质性数据,因为只有同质性数据才可以被算法程序无差别对待。这就是说,大数据技术消除了时空差异,在海量数据面前,时空被敉平了。只有这样,风险才能够被计算,才能“生成”具有强大效用的“相关性知识”;也只有这样,疫情防控中的高风险人群或者高风险地区才能被锁定,这就叫大数据技术的“时空集成效应”,也是大数据技术能够大大提升疫情防控有效性的关键所在。

当时空被敉平化、集成化处理之后,时空中的人也是被敉平化、集成化了的。在疫情防控中要锁定感染源及密切接触人群,仅靠人员的职业、民族、姓名等社会属性是不可能完成的,即使勉强完成也必然是代价高昂的。大数据技术忽略掉人员的社会属性,只是从人员的流动信息、手机信令、网络数据等基础数据中计算生成人员关键信息。与社会属性相关的数据是异质性很高的数据,而手机信令、网络数据等基础数据则是同质性很高的数据。至少在大数据技术面前,人不再是一个传统意义上的社会人,而是一个“集成人”,我们把这种现象称为“社会集成效应”。“集成人”是没有身份甚至没有脸的,但它最容易被程序识别,这是大数据技术能够大大提升疫情防控精准性的关键所在。

大数据技术除了把时空和社会集成化了,还把权力也集成化了。以往政府部门存在一定程度的各自为政,实际上是因为权力的分散,而权力的分散是与数据的孤立分不开的。大数据技术不但促成了数据的汇聚集成,也促成了权力的汇聚集成,即“权力集成效应”。在疫情防控过程中,大数据技术已经成了“权力之眼”,借助大数据技术提供的统一防控平台,各地方政府之间以及地方政府内部不同部门之间相互合作,真正实现了联防联控、统一调度,构筑起一个不留死角的疫情防控闭环,这是有效管控风险并取得当前疫情防控阶段性成果的关键所在。因此,有着“集成特性”的大数据技术在疫情防控过程中创造了“集成效应”,“数据集成”是基础,“时空集成”是根本,“社会集成”和“权力集成”是关键。在这些“集成效应”共同作用之下,就形成了一种“治理集成”效应。与原有的治理模式相比,“治理集成”效应至少具有三个方面的优势:

首先,在大数据技术的驱动下,“集成式治理”不再被地方主义所困扰。比如,现有的网格化治理的最大优势是精细化,最大弊端是容易导致“割据式管理”。“集成式治理”并非与现有的网格化治理相矛盾,恰恰相反,“集成式治理”一方面能够高效吸收网格化治理带来的益处,比如数据获取更加高效便捷,另一方面也能够很好地避免“割据式管理”的弊端,真正实现全国一盘棋。

其次,在大数据技术驱动下,“集成式治理”不再是滞后式治理,而是一种前瞻式治理,或者叫“先发制人式”治理。传统的治理方式因为信息的滞后性,必然是在危机或灾难已经发生的情况下,才能够采取应对治理措施。而大数据技术凭借其强大的数据分析和挖掘能力,能够产生预测性效应。比如,在此次疫情防控过程中,可以根据人口迁移大数据,预测疫情的扩散方向和扩散趋势,进而为疫情防控赢得宝贵的时间。防患于未然,这正是现代社会治理体系所迫切需要的。

再次,在大数据技术驱动下,“集成式治理”不再是模糊式治理,而是精准式治理。所谓模糊式治理,是在信息处理能力不足的情况下的无奈之举,它不仅效率低下而且成本高昂。与之相反,在疫情防控过程中,大数据技术能够精准识别流动人群中的密切接触者,精准定位追踪确诊患者的行动轨迹。比如,温州市曾是新冠肺炎疫情较为严重的城市之一,在一场关乎10万人生命健康的疫情保卫战中,温州市疫情防控部门借助大数据技术锁定了在疫情爆发地附近停留15分钟以上的流动人员和周边小区住户,最终从10万人中精准筛查出28例确诊患者。让可疑人员得到精准控制,让非可疑人员自由流动,大数据技术为精准防控、精准施策提供了强有力的技术保障。正是因为有了这样精准、高效的防控策略,才使得温州市在短短一个月时间内从一个疫情高风险地区快速转变为一个疫情低风险地区。从实践检验来看,“集成式治理”可以说是科学治理的典范。

五、一个可能的未来:集成式社会治理

虽然新冠肺炎疫情是一个突发事件,疫情防控中所采用的很多措施也都是应急措施,但是某些应急措施的出台绝非偶然,它们持续存在并最终得以常态化也并非不可能。只要这种应急措施能够有效回应社会的需求,符合历史发展的需要,那么它们就一定会继续存在下去。事实上,人类社会现有的很多常态性制度安排都是在应急措施的基础上逐步确定下来的。因此,我们有理由相信,大数据技术在疫情防控中发挥的“集成效应”预示着一个可能的未来,即集成式社会治理的到来,这个可能的未来令我们喜忧参半。

一方面,大数据技术驱动下的“集成式治理”极有可能成为未来社会治理的发展方向。尽管它现在还只是初具雏形,但我们已经可以看到它的强大功能,它能够有效识别风险因素,有效回应现代社会对不确定性的深切恐惧和对风险管控的热切追求,这意味着技术将以更深、更广的方式形塑现代社会,将以更直接、更强有力的方式改变人类的生活,这是不可改变的历史潮流。

另一方面,大数据技术不仅将时空集成化、权力集成化了,同时也将人集成化了。一个“集成人”虽然借助技术的手段可以避免(至少是减弱)对不确定性的恐惧,但它必然又会因此而产生对“权力-技术综合体”的恐惧。换句话说,“权力-技术综合体”是以创造一种新的不确定性来控制原有的不确定性的,创造确定性的过程实际上也是一个创造不确定性的过程,“权力-技术综合体”源于恐惧,同时它也创造恐惧。在这个意义上,人类对技术的依赖其实本质上是一种交换:用一种人造的不确定性来换取自然的不确定性。我们当然不能简单地认定这种交换是不值得的,但是我们的确有必要对这种带来了新的不确定性的“权力-技术综合体”保持一定的警惕,至少我们应该对其边界进行清楚地划定,以免它对个人的权利与自由构成侵犯。

更重要的是,不确定性并非完全一无是处,因为自由与不确定性可以看成是同一个事物的两面。当我们借助技术手段消除不确定性、获取安全与保障的同时,自由也在一定程度上受到了侵害。比如在此次新冠肺炎疫情防控过程中,我们也遗憾地看到,一些单位或个人在未征得当事人同意的情况下就将确诊患者或者疑似患者的个人信息公之于众,对当事人的正常生活造成了伤害。所幸,我们看到中央网信办已针对上述现象发布了《关于做好个人信息保护利用大数据支撑联防联控工作的通知》。只有为大数据技术的使用划定清晰的边界,才能为个人的自由与权利留出空间。也许我们还应该清醒地认识到,不确定性终究无法被完全消除,甚至不确定性也不应该被完全消除,但安全与确定性也是值得追求的,这意味着我们注定要生活在不确定性与确定性的双重变奏中。

注释:

①参见齐格蒙特·鲍曼:《流动的现代性》(上海三联书店,2002年版)。

②参见齐格蒙特·鲍曼:《作为实践的文化》(北京大学出版社,2009年版)。

③参见丹尼斯·史密斯:《齐格蒙特·鲍曼:后现代性的预言家》(凤凰出版传媒集团,江苏人民出版社,2007年版)。

④参见Lyon D:Surveillancestudies:Anoverview(Polity Press,2007)。

⑤参见Boyd D,Crawford K:Critical questions for big data:Provocationsfora cultural,technologicaland scholarlyphenomenon(Information,CommunicationandSociety,2012,Vol.15,No.5)。

⑥参见Marx G T:The surveillance society:The threat of 1984-style techniques(TheFuturist,1985,No.6)。

⑦参见Kitchin R:Big data,new epistemologies and paradigm shifts(BigData&Society,2014,Vol.1,No.1)。

⑧参见Kitchin R:Big data and human geography:Opportunities,challenges and risks(DialoguesinHumanGeography,2013,Vol.3,No.3)。

⑨参见Elmer G,Opel A:Surviving the inevitable future(CulturalStudies,2006,Vol.20,No.4-5)。

⑩参见Ginsberg J, Mohebbi M H, Patel R S,et al:Detecting influenza epidemics using search engine query data(http://www.nature.com/nature/journal/v457/n7232/full/nature07634.html)。

猜你喜欢

不确定性防控疫情
法律的两种不确定性
战疫情
配合防控 人人有责
猪常见腹泻病症状及防控
抗疫情 显担当
疫情中的我
守牢防控一线 静待春暖花开
疫情期在家带娃日常……
夏季羊中暑的防控
英镑或继续面临不确定性风险