食品安全风险预警:小变量撬动大数据
2018-07-26自述:陈娟
自述:陈娟
在国外基于跟新闻传播或者跟传播学的合作所展开的舆情监测已经成为一种常态。但国内做舆情监测,更多地仅在本专业内完成,只监测专业数字或者是专业术语,对受众的心理就没有很好地预测和感知。
大家都知道应该去抓取大数据,而问题是一定要注意小变量,也就是在抓取的时候需要使用的高频词。
自述:陈娟
华南理工大学新闻与传播学院副院长
整理:南方周末记者 崔慧莹
专家与民众的认知落差
近些年来,我们的农副产品农药残留量逐年下降,食品检验的合格率也在上升,但为什么公众都觉得食品越来越不安全?
这是风险知识落差模式造成的。
在专家眼中,风险是统计风险概率和死亡率估算出来的,比如今天食品安全率从95%提高到了98%,风险更低了。但在民众心中,风险更多是来自心灵上的感受,与个人的生活息息相关,他们的评估标准包括对风险的熟悉程度、恐惧、是否自愿、个人的可控制性、公平、道德等诸多心理因素。
2016年,我在医院做了两个月调查,给20位志愿者每人发了一台智能手机,让他拍下自己对医院的不满,或者说会影响到与医院沟通的问题。
结果发现,就诊者的不满和医生所认为的不满完全不同。医生认为:“病人对我的医术、治疗方案或使用的药物不满。”但患者的不满在于:“我今天停车特别不方便。电梯等很久,排队时有人加塞儿。”
这个例子说明,专家眼中的风险认知和民众眼中的风险认知是有极大差异的。而我们要监测的风险,并不是技术导向的专家眼中的风险,而是公众认知上的落差和错误。
无论是媒体、监管部门还是公众,最需要的就是将认知水平从参差不齐到相互融合。大数据监控的目的,就是为了弥合目前公众的认知和科学家的认知与监管部门认知之间的落差。
健康教育任重道远
我们时常看到,某个突发事件在网上一曝光,即迅速引爆全国舆论,把地区性、局部性和带有某种偶然性的问题,变成全民围观的公共话题。
比如有很多媒体质疑“速生鸡”投喂激素,但其实白羽鸡的生长周期就是45天,是完全没有问题的。
与其说今天要解决食品安全问题,还不如说我们要通过日常的健康教育,解决受众对今天中国食品不信任的问题。
一些中国人接受到的健康教育一直是自上而下的传统模式,就是我不断地向你传播信息,但至于有没有击中你、说服你,根本没人在乎。
甚至可以说,就算人们在认知上发生了改变,想要他们改变行为也是非常艰巨的,更不要说我怎样才能把内容传播出去,让他们获得这种认知了。这是一条非常漫长的道路。
国民健康教育不可能一蹴而就,但在这之前,我们可以通过大数据做一些食品安全的预警和研判,以控制可能会发生的心理不安全感。
监测预警:降低80%舆情处理成本
这里要强调一下,我所认为的食品安全预警,更多强调的是沟通的风险和认知的风险。
以前总有政府部门请我去上课,要讲舆情应对,我就说这课上不了。现在我们早进入了互联网和自媒体的时代,根本没法阻拦网民的议论。
而今天我们要讨论的——基于大数据的网络舆情在食品安全监测预警中的应用,不是危机爆发后的舆情应对,而是监测并预警。意思是,在事情没有爆发之前先警示。美国有一系列的研究结果表明,相比事情出现之后再收拾烂摊子,预警可将舆情处理的成本降低80%。
国内也是一样,一个地方哪怕出现一个很小的问题,但是这个问题特别尖锐,它就不能只在这个地区处理,而是会成一个全国性的公共舆论事件,我们希望做的就是通过预警,尽量降低这种舆情对整个社会产生的巨大影响。
说白了,我们有那么多食品安全事件,但是它的恐怖性或者严重性真的要到全国整治的地步吗,每次全国整治我们要花多少钱?
在欧美等发达国家,健康教育已经做得非常成熟了,民众并不会因为今天发生一起马肉替代牛肉的事件,就觉得牛肉完全不能吃了,不会发生这种恐慌性的事件。在国内,虽然加强风险沟通已经成为监管部门的基本认知,但是由于信息公开的缺失,也常常出现越沟通问题越多、民众越不满意的局面。
怎样提高应对舆情风险的能力并及时有效地进行信息公开呢?
我们认为,通过多数据源的网络舆情分析,可以更全面、更准确地监测食品安全事件的形成和发展。
在舆情分析的基础上,结合重要的相关现实数据,可以帮助早期预测、发现和评估食品安全事故发生的几率和发展趋势,为政府部门制定和调整公共卫生事件的防控政策提供重要参考。
“小变量”是 大数据分析关键
早在20世纪90年代,世卫组织为了加强全球流行性疾病的监测,就开发了一套软件系统——“全球公共健康情报网”(以下简称GPHIN),它综合利用了网络搜索、数据挖掘、自动翻译、自动化过滤等多项技术,发现和跟踪重大公共卫生事件,实现基于国际互联网的实时、早期预警。
它的二代系统在2004年发布,每天自动扫描网络上超过10000个网站的20000多条信息,能够识别包括简、繁体中文在内的7种文字,已多次成功地预报了一些国家和地区的流行疾病。目前,联合国和世界卫生组织获得的大约75%的传染性疾病情报都来自GPHIN。
这种早期预警是非常成功的,可以让那些老弱病残者提前打疫苗,不到人多或可能导致传染的地方去。
国内也有类似的用于公共卫生的监测平台,以广东省公共卫生舆情监测平台为例,它就可以对南方网等550个中英文传统网页、论坛、博客的内容以及搜索引擎的数据进行自动抓取,再由人工辅助进行预判。
当初做这个案例研判的时候,地方政府认为自己能够发现热点,通过趋势分析图和传播链接分析图解决事情的来龙去脉。结果2011-2012年,总共监测到传染病疫情91起,食物中毒事件68起,其中仅有7起是由舆情平台首先监测到的。
为什么国内平台的监测效果远远不如国外系统?
首先,国外的传统媒体报道比较科学严谨,对他们来说,信息的抓取更多来自社交媒体;而国内这些突发性公共事件问题的发生,大多来自社交媒体,只监测主流媒体是不够的。
其次,在国外基于跟新闻传播或者跟传播学的合作所展开的舆情监测已经成为一种常态。但国内做舆情监测,更多地仅在本专业内完成,只监测专业数字或者是专业术语,对受众的心理就没有很好的预测和感知。
现在大家都知道应该去抓取大数据,而问题是一定要注意小变量,也就是在抓取时需使用的高频词。
对高频词的专业判断,也成为新闻专业与计算机专业合作的基础。计算机学院可以设计监测系统模型,而新闻学院更清楚地知道受众心中的风险是什么,在不同的情况下,哪些词汇是应该受到关注的。
在现在这样一个信息爆炸的时代,无论是疾病防控还是食品安全,对相关舆情进行预警和研判,以控制可能会发生的公众心理不安全,非常重要。