APP下载

大数据预测传染病,神吗?

2016-07-25云贺

财经国家周刊 2016年14期
关键词:流感公共卫生预测

云贺

大数据在疾病监测领域依然大有可为,但仅靠在线数据进行疾病识别和预测存在一定风险。

2008年,谷歌推出了一款名为“谷歌流感趋势”(Google Flu Trends)的产品。工程师们假定:一旦人们患上流感,就可能会在搜索引擎上输入特定的检索词条以获得与流感相关的信息。通过汇总和分析这些检索词条,谷歌就能预测流感将在何时何地爆发。2009年,这款产品在甲型H1N1流感爆发几周前成功预测了其在全美范围的传播。一时间,有关大数据开启公共卫生变革的观点接踵而来。然而,2013年英国《自然》杂志刊文称,在最近一次预测流感爆发趋势时,谷歌所预测的流感病例数目几乎是美国疾病控制与预防中心统计数据的两倍。这是否意味着大数据在疾病监测领域失去了价值?

近日,查塔姆学会全球卫生安全中心两位研究员迈克尔·埃德尔斯坦(Michael Edelstein)和大卫·哈珀(David Harper),发表题为《在线数据助力高效应对国际公共卫生突发事件》的文章,通过探讨数字疾病监测在追踪和预测疾病方面的应用,提出了大数据在疾病监测领域的发展机遇和目前面临的问题。他们认为:大数据在疾病监测领域依然大有可为,但仅靠在线数据进行疾病识别和预测是存在风险的。

“数字疾病监测”

数字疾病监测(digital disease detection,简称“DDD”)是指通过收集和分析网络在线数据,在早期确认和追踪疾病或公共卫生事件的爆发。具体来说,DDD采用的方法包括:由个人自愿上报疾病症状,扫描媒体对于疾病的报道,分析人们发布在社交媒体上的信息,通过手机数据绘制出人口流动路线图,总结一段时间以来人们在搜索引擎中键入关键词的模式等。

尽管DDD早在1990年代中期就开始投入应用,但直到谷歌流感趋势推出,这一技术的影响力才有了切实的提升。目前,DDD已被广泛应用于传染病暴发(如禽流感、埃博拉和寨卡病毒)以及一些慢性疾病(如失眠和肥胖问题)的识别和调查过程中。同时,DDD还被应用于为出现疫情的热点地区建立模型,以及收集其他公共卫生事件的相关信息,如枪支暴力和卫生保健质量等。

查塔姆学会的文章认为,随着DDD这一新兴技术开始走向成熟,无论是其识别和预测疾病的准确性,还是对于数据价值的挖掘都有了一些改善。目前,这一技术正在为越来越多的公共卫生机构所用。例如,当埃博拉病毒在西非地区爆发时,手机数据被用于追踪人口流动路线,以便能预测出哪些地区可能会产生新病例;再比如,通过人们发布在推特上的内容,来识别和联系那些可能会被食源性疾病爆发所影响的人员。

谷歌流感趋势遇挫

虽然DDD的出现引发了公共卫生领域的极大热情,但在2012-2013年,它对疾病的实际预测能力却遭到强烈质疑。因为就在这一时期,谷歌流感趋势被指出其预测的禽流感病例数目是实际数目的两倍。2015年,谷歌流感趋势不再对公众开放。

然而,迈克尔·埃德尔斯坦和大卫·哈珀却认为,谷歌所遭遇的挫折并不能完全否定大数据对疾病监测领域的价值。毕竟,谷歌流感趋势曾不止一次准确地提供了有关流感爆发的消息。这只能说明:仅仅依靠大数据技术来监测公共卫生事件是存在风险的。

这种风险在一定程度上来源于大数据应用的核心,即通过捕捉事物间的相关关系——而非因果关系来预测未来。《金融时报》专栏作家、英国经济学家提姆·哈福德(Tim Harford)认为,如果不知道相关关系形成背后的原因,也就不知道造成相关关系破裂的原因。

实际上,对于谷歌预测失灵的一种解释就是:2012年12月,网络上充斥着有关流感爆发的恐怖消息,这使得那些健康的网民也会上网搜索有关流感的信息。而谷歌只是简单地将“键入流感关键词”与“患上流感”视为关联关系,却没有深究人们搜索流感信息的真正动机是什么。

在《大数据时代》一书中,维克托·迈尔-舍恩伯格(Viktor Mayer-Sch?nberger)和肯尼思·库克耶(Kenneth Cukier)也曾提出:大数据不可能也不必要实现精确性。因此,要想实现在疾病监测领域的真正价值,大数据应该与那些以常规监测为基础的、传统的疾病监测系统形成互补关系,同时与其他那些可以提供疾病追踪记录的统计工具相结合。

难题待解

查塔姆学会的文章认为,大数据在疾病监测领域依然大有可为,随着相关技术的发展,DDD的应用机会将不断增加。不过,目前DDD在公共卫生监测领域的应用中,还亟须解决两个方面的难题。

一是,DDD怎样才可以与官方的疾病监测体系及应急反应机制相结合?目前,很少有政府卫生部门对DDD数据进行常规应用,而大多数能够产生这些数据的组织都处于政府的疾病监测和反应机制之外,如学术、私营和非营利机构等。这可能会导致这样一种情况发生:某一公共卫生事件的爆发虽然被监测到了,但是对这一信息做出应急反应的责任机制却没有到位。

例如,在2015年11月,一个致力于通过分析网络内容以监测传染病爆发的小组注意到:巴西有关皮疹的报道数量呈现出显著的上升趋势。然而,由于没有官方沟通渠道,这个小组没能将此情况反馈给巴西卫生部门或者世界卫生组织。几个星期之后,巴西寨卡病毒爆发的消息传遍了全世界。而皮疹正是感染寨卡病毒最常见的症状之一。

二是,有关使用网络数据的道德和法律问题。例如,如何去看待和处理那些属于私人信息的数据?如何去平衡个人隐私权与公共利益之间的关系?目前上述问题还没有得到充分解答。而公众如何看待他们的在线数据被应用于疾病监测领域,现在业内对此的了解和认识也十分匮乏。

两位研究员在文章中表示:无论是DDD在公共卫生领域中的定位,还是与此相关的道德与法律问题,现在都务必要得到解决,只有这样才能确保DDD的潜力得到充分发挥。其中,各国政府和公共卫生机构的参与,将为可持续的数字疾病监测系统提供重要推动力。如果不这样做,大数据的应用弱点将会重现,最终将削弱整个疾病监测系统对下一次类似埃博拉或寨卡疫情的预测和反应能力。

猜你喜欢

流感公共卫生预测
流感大作战
公共卫生管理在传染病预防工作中的作用分析
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
小心,流感来了
中国首个P4实验室:服务全球公共卫生安全
小心!流感来了
《福彩3D中奖公式》:提前一月预测号码的惊人技巧!
公共卫生
医药资讯