数据“深加工”:疫情下的数据新闻报道透视
2020-08-12□
□
内容提要 与传统的文字报道相比,数据新闻在突发公共卫生事件中具有独特价值。本研究选取新华网《数据新闻》、网易《数读》、搜狐《数字之道》、澎湃新闻《美数课》、财新网《数字说》等五个知名数据新闻栏目共176篇报道进行文本分析,并对比分析了外文媒体的数据新闻报道。研究发现,此次疫情中五家媒体在数据分析、数据呈现、用户参与和共享上进行了“深”尝试,但在数据来源、动态信息图和交互设计的使用以及选题内容上仍缺乏“深”内涵,由此提出数据新闻报道“深加工”的途径。
在突如其来的新冠肺炎疫情中,数据新闻因可以讲述文字无法述说的故事而彰显出独特价值。数据新闻是用数据处理的新闻,它是把传统新闻具有敏感性和说服力的叙事能力,与海量的数据信息相结合而形成的一种全新的新闻报道方式[1]。数据新闻通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合并成新闻故事[2]。
疫情之下,国内媒体的数据新闻报道有何创新与不足?外文媒体的数据新闻报道有哪些值得借鉴?本文以国内五个知名数据新闻栏目为例,选取2020年1月20日疫情爆发至5月26日国内疫情基本得到控制这一时间段内,与疫情相关的数据新闻报道共计176篇(其中新华网《数据新闻》64篇、网易《数读》24篇、搜狐《数字之道》21篇、澎湃新闻《美数课》34篇、财新网《数字说》33篇)进行文本分析;对比起步较早的英国BBC、《卫报》《今日美国》及香港《南华早报》等媒体疫情报道,剖析国内媒体数据新闻报道的突破和不足。
□ 表1 五个数据新闻栏目数据来源分析(本研究整理)
一、疫情数据新闻报道的创新
首先,数据分析方法多样。数据新闻的分析方法一般包括“统计、关联、对比、换算、量化、溯源、发散、综评”等方法[3]。此次疫情报道中,除常见的对比方法之外,还采用统计、换算、关联等方法,并将这几种方法叠加使用,形成对数据的“深加工”。
澎湃新闻《美数课》的报道《多国疫情进入剧烈增长期,全球“封锁”步步加深》,对比不同国家采取相同措施的时间先后,直观显示了全球对疫情的防控情况,较之传统文字报道,数据分析更能将复杂事实清晰地展示出来。《和病毒相比人类在地球上究竟几斤几两?》(搜狐《数字之道》)用简单的换算解释一个复杂的知识,换算也是数据新闻的长项。
其次,数据呈现——可视化图表+可听化+短视频。各数据新闻栏目创新图表形式,不仅有传统的平面柱状图、折线图、饼图、表图,还将其立体化、3D化,并采用了词云、热力图、社会关系网络图和一系列自行创作的图表。新华网《数据新闻》的交互报道《致敬每一个闪亮的名字》,首页将援鄂医疗队员的名字通过弹幕形式呈现,内页则用名字拼成省份简称,生动形象地体现了抗疫中“一方有难,八方支援”的精神,表达了对医护人员的敬意(图1);澎湃新闻《美数课》在关于新冠病毒肺炎的逝者报道中,将每一位逝者比作一朵花,将其自身患病情况、性别通过花瓣、花心表示。在文字难以传达的情况下,可视化通过颜色差异、字体大小,将抽象的信息转换为直观、具体的报道,并对重要信息加以突出强调。
□ 表2 五个数据新闻栏目的数据新闻可视化呈现方式分析(本研究整理)
图像与声音结合,眼睛和耳朵并用能够帮助人们轻松地接受信息,这是信息图、交互图表都难以达到的效果。此次财新网《数字说》的报道设置了语音播报功能,读者可以播放音频获取信息。但《数字说》是机器对照文稿播报,效果不太理想。数据新闻的可听化并不普遍,原因在于可听化需要更高的成本。
短视频兼具图像和声音的功能,已成功运用到数据新闻上。搜狐《数字之道》、澎湃新闻《美数课》在疫情报道中都采用了短视频的形式。澎湃新闻《“钻石公主”号上新冠肺炎感染比例已高达14.6%》通过数据走势、重点数值、邮轮平面图、地图和视频解说,将钻石公主号上的新冠病毒感染情况、感染原因、病例情况、事件发展、邮轮路径等信息在短短2分26秒内展示出来,这是文字报道和图解都需要花费一番功夫才能解释的。
再次,用户参与和共享。此次疫情报道主要通过客户端、微信公众号的回复来实现受众参与,但受限于下载量,涉及的范围相对较窄。澎湃新闻《美数课》尝试采用线上问卷的形式,通过Credamo平台发放,对近千名学生、家长和老师进行调研,推出《“停课不停学”,目前大规模线上教学反响如何?》的报道,此举还能收集用户数据,对数据进行科学管理,是一次创新。此外,在《新冠肺炎病例实时地图》底端设置了疫情信息明细数据共享的链接,用户可以通过石墨文档、GitHub等渠道了解、使用病例数据。由于数据共享链接放在新闻的最底端,实时地图的图表过长,读者若不阅读到底部,将无法看到共享数据,这就大大减少了公众参与数据共享的机会。
二、疫情数据新闻报道的难点与不足
□ 图1
□ 图2 澎湃新闻《美数课》2020 年2 月1 日报道截图。
疫情之下数据新闻报道的难点表现为:一是数据采集难度大。统计的失误、权威机构发布不及时等原因,都会令数据新闻报道者面临“巧妇难为无米之炊”的难题。英国《卫报》数据新闻记者帕梅拉·邓肯(PamelaDuncan)撰文称,自从疫病大流行开始以来,获取数据一直是记者在专业上面临的最大挑战之一,“对于像我这样的数据记者来说,过去两个月中的大部分时间都花在了追踪数据上。”[4]二是受众对于数据更新的及时性、准确性要求更高,而数据分析和可视化制作,如复杂的动态信息图和交互设计等,需要较长的生产周期,故而形成矛盾;三是由于数据采集和时效的原因,数据新闻选题难度大,做有深度的数据挖掘和分析更难。鉴于上述难点,纵观此次疫情下五家媒体的数据新闻报道,仍存在以下不足:
首先,数据来源模糊不清、渠道单一。新闻来源作为数据新闻专业规范中的一个指标,却常常遭到“偷工减料”,这与数据新闻领域倡导的开放理念背道而驰[5]。对比境外媒体在一条数据新闻中常常出现超过20个数据来源,国内数据来源还比较单一。此次疫情报道,在统计的176篇数据新闻中,有17篇没有来源说明(表1),并有7篇数据来源模糊不清,仅标出“根据公开资料整理”。在数据来源的数量上,仍有50篇报道仅有1个数据来源。
目前国内媒体的数据来源一般包括政府公开网站、第三方机构数据和报告、学术论文、抓取数据等。澎湃新闻在疫情期间用爬虫扒取了美国约翰霍普金斯大学网站上公布的海外疫情的相关数据,再把数据导入到所制作的项目中。除了公开的政府数据、开源数据等,商业数据也可以成为媒体数据来源。网易《数读》的《火锅奶茶还有你,都给我等着》《在家待久了,中国人重新爱上方便面》,财新网《数字说》的《7000条热搜词条分析疫情中大家都关注啥?》,这些报道的数据抓取自社交平台、购物平台,使得数据新闻更加贴近读者,更具有趣味性。此外,为了保证数据的准确性,搜狐《数字之道》、网易《数读》引入专业人士审核,进一步规范数据的应用,确保信息的准确。数据科学性的审核,能够避免错误信息的传递,但是这种审核还只是个别媒体的行为,并未成为普遍的做法。
其次,缺少动态信息图和交互设计。可视化呈现一般包括静态信息图表、动态信息图表和交互式信息图表等,而此次五个数据新闻栏目的报道均以静态信息图表为主(表2)。
疫情报道中仍缺少动态信息图和交互设计作品。例如,同样是用图形数量表示人数,《今日美国》2020年1月29日报道采用了交互设计,当用户点击某个颜色的方块时,被点击的方块会出现文字的解释,同时其他颜色的方块会变为灰色,这种设计不仅仅调动了视觉,还带动触觉的体验(图3)。而澎湃新闻《美数课》则采用静态图,在图片上将所有的信息铺开,虽然直观但是缺乏互动感(图2)。
除了交互设计的可视化呈现,还缺少动态图表。此次疫情新闻中,英国BBC网站的报道在呈现一段时间内的感染人数变化上,使用了可自行调节的动态图表,读者可以选择暂停、播放图标,并且拉动时间轴上的按钮,查看具体日期的感染人数数量。而国内媒体的动态图表是一种自行跳动的图表,速度和时间都不能选择。
再次,选题内容缺乏深度。常规型数据新闻只需简单的数据处理技能,可以在较短时间内迅速完成制作,因而较为常见;而调查型数据新闻需要使用复杂的数据处理技能,制作者需要较长时间做深入分析,内容上强调问题导向,旨在深入挖掘数字背后的故事,并做深度解释。纵观此次疫情报道,常规型数据新闻报道多,调查型数据新闻报道较少,对于内容的深度挖掘明显不足。
□ 图3 《今日美国》2020 年1 月29 日报道截图(上图为报道未点击方块时的样式;下图为同一报道点击方块时的样式)
此次疫情报道中,五个数据新闻栏目均注重选题的多样性,选题以实用、解惑为主,兼具趣味性。相比之下,《卫报》、《南华早报》等在选题方面更注重新闻性,关注内容的深度解读和分析。《南华早报》2020年3月30日A12版推出的整版报道《解码Covid-19》,运用图表和图形,以文字贯穿始终,向读者详细解释了新冠病毒,有一定的权威性;另一篇报道《新冠病毒如何破坏了食品供应链》(2020年4月21日),则综合运用了漫画、新闻图片、视频和文字等,对全球食品供应链的变化进行了深度解读。
三、结语
与传统的文字报道相比,在突发公共卫生事件中数据新闻将数据转化成可看懂的图像内容,能帮助读者更好地理解一个复杂的问题,及时释疑解惑;数据新闻可以直观地揭示事件的严重性,提高公众对疫情的关注度,可视化效果更易引起读者的情感共鸣;数据新闻能够在迅速发展的危机中通过数据分析做出预测,为公共政策的制定提供可靠依据等,彰显了数据新闻的独特价值。
此次疫情中,国内五家媒体在数据分析、数据呈现、用户参与和共享上进行了“深”尝试,但是在数据来源、动态信息图和交互设计的使用,以及选题内容上,仍缺乏“深”内涵。数据新闻作为一种全新的报道样式,已成为媒体融合的利器。借鉴境外媒体的做法,数据新闻报道“深加工”,一是要开放数据共享,增强受众与媒体的互动,满足受众个性化需求;二是要合理运用动态信息图和交互设计等数据可视化手段,降低受众获取信息的难度;三是拓宽数据新闻报道视角,增加报道内容的深度,多元化地讲述文字无法述说的故事。
【注释】
[1]Gray J,Bounegru L,Chambers L:《The Data Journalism Handbook》[M],O’Reilly Media,Inc,2012年版,第2页
[2]喻国明 李彪 杨雅 李慧娟:《新闻传播的大数据时代》[M],中国人民大学出版社,2004年版,第25~26页
[3]段晓敏:《大数据时代传统纸媒“数据新闻”的实践与价值——以《南方都市报》“数据”栏目为例》[J],《新闻世界》,2014年第11期
[4]The Guardian:《Counting the human cost of Covid-19:'Numbers tell a story words can't'》[EB/OL],https://www.theguardian.com/membership/datablog/2020/may/09/datacovid-19-numbers-story-pandemic-guardian-statistics,2020年5月9日
[5]方洁 高璐:《数据新闻:一个亟待确立专业规范的领域——基于国内五个数据新闻栏目的定量研究》[J],《国际新闻界》,2015年第12期