全球数据新闻奖对我国调查性数据新闻的启示
——以2014—2019年度调查奖入围作品为例
2019-12-16□邓力
□ 邓 力
数据新闻发展至今,其意义不言而喻。但在国内数据新闻热潮过后,数据新闻正需要更多的思考和对实践的理解。2012年,国际上出现了第一个为表彰优秀数据新闻工作而设立的奖项——全球数据新闻奖(Data Journalism Awards)。该奖项由全球编辑网(GEN)发起和组织,谷歌新闻实验室和奈特基金会等赞助,每年面向全球范围的数据新闻作品和数据新闻创作者进行评选。自2012年创立起,该奖受到了全球新闻工作者的广泛关注,经过数年权威评审,已成为全球数据新闻业界的权威。2019年的全球数据新闻奖共收到来自全球26 个国家、73 个组织的607 个参赛项目,最终入围的作品有103 项。全球数据新闻奖不仅鼓励了数据新闻实践,也同时见证着新闻事业的转型和发展。
2012年至2019年,全球数据新闻奖的奖项设置一直在根据实际情况进行调整,但数据可视化奖、年度数据调查奖、突发新闻奖、数据应用奖、数据开放奖这五大重点奖项一直存在。近三年,国内一些学者开始针对全球数据新闻奖的某些奖项进行研究,其中数据可视化奖和突发性新闻奖受到更多关注,但还尚未对“年度调查奖”有过深入分析。年度调查奖重在表彰以数据驱动为基础的、揭露权力滥用或维护公众利益的优秀数据调查报道。而调查新闻作为新闻报道的重要类别,其内容深度性预示着其与数据新闻在未来的发展空间中有重大重合,对全球数据新闻奖的“年度调查奖”的分析有很大意义。
本文选取2014—2019年入围数据新闻奖“年度调查奖”的129 件作品与6 件获奖作品展开研究,从DJA 官方网站、各媒体官方网站、组织机构官方网站等多渠道获得关于获奖者机构、个人、国家、获奖作品等信息,对作品的数据来源、选题内容、制作团队、数据呈现形式以及技术使用进行分析,探究现如今数据新闻发展的状况,了解国际前沿动态,展望数据新闻的发展趋势。
一、数据来源分析
关于报道的数据来源,可以分为“公共公开数据”“突发性事件或意外获取数据”和“自主搜集数据”三类。通过对6 篇“年度调查奖”获奖报道的分析可知,此三类数据来源方式的占比较为接近。
“公共公开数据”即公共机构、司法机构、公益组织、互联网公开 API(Application Programming Interface)等公开数据资料,如2014年获奖报道、华盛顿邮报的《Homes for the Taking》。为了进行报道,华盛顿邮报整理了来自全国800多个城市、县、地区和其他地方司法管辖区的行业数据,研究了数以百计的法庭案件、契约、抵押贷款文件以及公司和土地记录。因此,好的数据报道不一定来自于难得的数据,善于发现和挖掘公共数据也能做出好的调查新闻。
“突发性事件或意外数据获取”即因为特殊情况获取到的一般人无法接触到的相对保密的数据资料。例如,2015年获奖报道 ICIJ(International Consortium of Investigative Journalists,即国际调查记者联合会)的《Swiss Leaks》与2016年获奖报道 ICIJ 的《The PANAMA Paper》,其数据分别来源于“瑞士泄露”和“巴拿马文件泄露”两项突发性数据泄露事件,而这些数据如果没有发生偶发性事件,便只会永远躺在某些私人企业或市场组织的抽屉里,不为人所知。而影响力较大的突发性事件,往往也能吸引到更多的受众,新闻价值也更大。
“自主搜集数据”即需要媒体组织主动搜集的数据,这些数据可能是不予公开的,也可能是之前根本不存在的。例如,2017年获奖报道、加拿大环球邮报的《Will police believe you?》,其数据就来源于加拿大环球邮报发给全国873 个警察管辖区的调查请求。而2016年的获奖报道《The PANAMA Paper》中也有一些这样的数据。ICIJ 联系了所有报道中涉及的人物,通过邮件寻求他们对自己被泄露的数据和报道内容的回应。这种主动搜集而来的内容,不仅使报道更加丰富可看,也增加了新闻的公正性和全面性。
通过深入分析近6年的获奖报道数据来源和处理方式,我们看出:第一,对于公共公开数据来说,工作团队需要有很强的数据挖掘能力。毕竟数据获取阶段难度很小,就要通过多种渠道和方法手段将数据进行整理、牵连和分析。例如,2017年获奖报道、加拿大环球邮报的《Will police believe you?》,数据记者就在繁杂的性侵案件数据中,捕捉到了“警察管辖区女性军官数”与“该管辖区性侵案无理率”(即性侵犯控告不成立概率)之间的相关性。而这种数据中的隐藏信息,需要很强的关联思维和新闻敏感性。第二,对于难度较大的突发性数据,要善于寻求合作,共同开发数据内容。例如《Swiss Leaks》背后的团队就不止ICIJ,还有法国《世界报》和全球性记者团队加盟。而《The PANAMA Paper》也联合了德国《南德意志报》和全球其他100 多家媒体和机构。
二、选题分析
(一)选题内容
我们将2014年至2019年所有入围及获得调查性数据新闻奖项的135 个项目选题内容分为了六大类,以下是其中的发现。
1.最受关注的内容是“法律犯罪类”和“社会民生类”,在所有选题中的占比分别为27%及26%。这说明,在调查性新闻进入数据分析阶段时,新闻从业人员仍然最关注与普通大众联系更紧密的社会生活问题,也致力于发挥新闻的社会功能以影响和改善大众生存状况。
法律犯罪类事件具有天然新闻性和重大性,利于推动法律完善和起到社会警示作用。此外,法律条文、犯罪文件和案件数据比较容易收集和调取,也是这一类题材的优点。
就社会民生类新闻来看,民生类内容与受众生活关系最紧密,往往能关注到社会弱势群体,帮助解决社会问题,维护社会公正和谐。例如,英国汤森路透报道的《生活在难民营》与以上提到过的华盛顿邮报的《Homes for the Taking》都对生活困难的弱势群体予以了关注。
2.“政治军事类”新闻也受到较多关注,占比16%。政治性新闻往往有监督政府和各党派以及维护公民权利的作用。而随着各国媒体全球化发展的趋势,调查性数据新闻不仅监督本国政府机构和党派,还关注外国政府以及国际关系问题。例如,中国“上海观察员”的报道《川普在访问中赞美中国》,就通过对比川普在访问中国期间的讲话内容与其在社交网站Twitter 与中国有关的发言,得出川普实际并不像其访问中国期间所表现的那么赞赏中国。
3.环境问题和健康问题格外受关注,达到了14%。此类题材甚至比“经济金融类”新闻还高出2 个百分点。社会生活条件的变化、环保意识的深入,使健康和环境等问题更加受到重视。特别是在发展中国家,其媒体对国内环境和健康问题十分关注,如印度IndiaSpend 的《印度癌症危机三部曲系列》、尼日利亚每日信托的《有毒城镇》以及肯尼亚公民电视的《护理孕妇危机》。发展中国家的媒体逐渐意识到,在经济发展之外,环境和健康问题对民众生活的巨大影响,因而利用数据来帮助调查、呈现和解决这些问题是一条有效路径。这种关注不仅可以引导管理部门和普通民众对环境和健康问题的关注,同时也是媒体责任心的一种体现。
4.财经内容一直是调查性新闻的重要内容。然而统计显示,“经济金融类”内容仅占比12%。但需要注意的是,经济类内容其实远比这里数据展示的更受到重视。其原因在于很多报道中都含有不少经济问题和经济现象,只是我们在最终的选题划分中,对一篇报道只能有一种选题定义。这就使报道常常呈现一些复合题材情况。
(1)“经济金融”+“犯罪法律”
在35 个有关“犯罪法律”提交项目中,许多犯罪行为都涉及经济问题或经济现象,这种高频率模式尤其多出现在获奖报道中。例如,2015年ICIJ 的《Swiss Leaks》就利用“瑞士泄露事件”中流出的瑞士银行用户数据和内部文件,勾勒出了一幅“经济犯罪”的数据群像。
(2)“经济金融”+“政治军事”
在西方国家,资本运作和政治总是脱不了干系。因而,很多报道在调查政治人物或事件时,总是有些经济行为牵扯之中。例如,2016年ICIJ 的获奖报道《The PANAMA Paper》从全球最大的离岸服务提供商——巴拿马的莫萨克·丰塞卡泄露的1150 万份文件着手分析,以人物作为线索进行呈现。其中就包含12 位现任或前任国家领导人以及30 多名与该事件有直接联系的政界人士和政府官员。
(3)“经济金融”+“文化体育”
《谁被授予印度大学荣誉博士学位》是印度快报通过分析印度大学所有荣誉博士获得者的数据而揭示了荣誉博士授位背后交易的报道,即该模式的一个典型。
此外,我们单独对2014年至2019年的年度调查获奖报道进行了分析,以得出了一些获奖报道的选题特点。
第一,获奖报道的选题重心与所有提交项目的选题趋势一致,即“法律犯罪类”最受青睐。第二,获奖作品中,“社会民生类”和“政治军事类”涉及相对较少。一方面,社会民生方面的报道在传统调查性新闻中已经有很多,并且数据性往往不强,难以让人眼前一亮。另一方面,政治军事方面内容调查难度较大,小事件没有亮点,重大事件容易涉及国家利益,数据收集困难。第三,“文化体育类”和“环境健康类”无获奖。这一方面是因为严肃题材更容易受到评委会关注;另一方面,这两类调查性数据报道的经验仍不丰富,社会影响力往往不足。
通过对所有入围项目的选题分析,我们得出调查性数据新闻选题的一些特点。选题方面,总体选题广泛,且数据性报道与传统调查性新闻报道一致,多为严肃题材,注重题材的重大性和影响力,因此文化娱乐内容很少见。不过文化现象也是社会生活的一个重要侧面,期待着文化类数据能帮助做出一些有价值和影响力的报道。其次,一篇数据报道的内容往往不仅只有一个方向,而是经常包含经济、民生、法律、犯罪等多方面内容,说明了调查性数据新闻综合性、多内容融合的特点。这可能也与数据内容本身的中立性有关,因而往往能与多方面内容结合,得出多种分析结果。而一个新闻事件或一个调查,其影响是多方面的,如果能将事件和调查涉及的方面与影响更全面地呈现出来,就能向受众展现更全面的图景,其调查越能发挥其新闻功能。
(二)选题范围
我们将选题范围分为两大类,即“区域型”和“跨区域型”。区域型报道即表示该报道关注的事件或现象发生在某一特定区域或国家范围内,涉及范围不广,影响范围也有限。而跨区域型报道则表示该报道关注的事件或现象涉及范围超越某一区域或某一国家,涉及范围广泛,影响范围较大。
通过对所有提交及获得该奖项的135 篇报道的选题范围进行分析,可知“跨区域型”报道共19 篇,占比14%;“区域型”报道共116 篇,占比86%。
为什么区域型报道会更多呢?
首先,从数量上来说,新闻调查多以突发性事件或某一社会现象为对象,而一般涉及范围大甚至全球性的新闻事件远没有区域新闻事件数量那么多。其次,就工作范围而言,如今真正具有全球性报道能力的媒体组织仍然是少数,大多数媒体的工作范围和能力范围依然局限于某一地区和国家内,所以更加容易捕捉区域性的新闻事件和内容。最后,在资料收集和处理上,跨国新闻调查不仅在收集数据阶段就耗时费力,即使是整理和分析到手的现成海量数据也需要很大的工作量和技术支持。相对于区域型报道来说,跨区域型报道难度大大增加。跨区域型政治军事类报道《民粹主义如何重塑欧洲》(美国彭博新闻社)和《展示的力量》(英国汤森路透),也都来自具有全球性报道能力的媒体机构。
表1 跨区域型报道和区域型报道对比表
而在2014年至2019年的6 个获奖报道之中,跨区域型报道共有3 个,比重50%;区域型报道共有3 个,占比50%,如表1。对比“所有提交项目选题范围分析”来看,跨区域型报道好像更容易受到评审会的关注。
三、数据呈现形式
通过对6年来该奖项获奖作品的数据呈现形式的分析,我们发现游戏、视频等形式的应用更加娴熟,数据可视化手段也随着计算机技术和数据人才的发展而更加准确和丰富。但需要注意的是,近年获奖作品的数据呈现形式并不算多,获奖报道整体更加平实。例如,数据形式在2016年达到最多,之后便弱化了,特别是2018年的获奖报道《Easy Money》就只有文字、图形表格和关联对比三种数据的表现形式。报道用讲故事的方式,将数据融入到新闻事件的讲述中平实地展开故事,没有使用过多处理。这也说明数据新闻“技术热”在受到一段时间的追捧后趋于冷静,回归了调查性新闻严肃、注重新闻价值以及功能发挥的本质。在充分挖掘数据内容、了解到数据特点的基础上,越简单贴切的数据呈现形式越能成就优秀的内容。
四、制作团队分析
2014年至2019年,全球共有至少88 个组织入围了年度调查奖项,其中包含35 个国家及一些跨国的新闻调查组织(例如ICIJ)。其中,美英作为传统传媒大国,仍是该奖项参与程度最高的两个国家。此外,“金砖四国”参与程度也较高,至少分别有3 个组织参与,提交报道4 篇,而超过一半的参与国只有1 个媒介组织代表。特别是印度和中国,作品内容丰富,多以地区性的民生、健康为主。而以古巴Postdata club 为代表的一些非传统媒体组织,不仅作品丰富,还标志着年轻化、小型的数据新闻组织的良好发展势头。从获奖情况来看,加拿大和美国是获奖次数最多的国家,平均获奖2 次。中国并无获奖。不过凭借对数据新闻和数据可视化的长期研究和实践,数据新闻奖评审团将2018年的“最佳大数据新闻团队”颁给了中国财新Vis-Lab。这是对财新数据团队过去表现的肯定,同时也是中国数据新闻一个好的开始。
五、使用技术
通过对该奖项2014年至2019年所有入围作品的统计,得出以下技术和软件在表2 中的项目中使用频率较高。需要说明的是,高速更新迭代的计算机技术和数据工作者的不断创新,使得我们能有越来越多的选择和方式去进行数据收集和处理,以下相关技术和软件也是如此,有的软件同时具备多项数据处理能力,而同一个数据结果也可以用不同的技术得出。
表2 全球数据新闻奖常用技术和软件
越来越多的专业技术人才成为新闻团队中不可或缺的一部分,而新闻工作者需要加强对数据处理的了解也是必然趋势。好的调查性数据报道需要同时具有新闻敏感性和一定数据分析能力的新闻工作者。
在被过度关注之后,我国的数据新闻生产开始了冷静和下沉阶段。国内真正有志于数据新闻的媒体和实验室正在做许多有益的探索,在业态发展方面与全球保持着密切的联系。财新VisLab 获评2018年“最佳大数据新闻团队”已经充分说明了这一点。随着互联网技术的完善与我国信息公开机制的健全,基于大数据的新闻报道,特别是调查性数据新闻报道还大有可为。