数据新闻发展新趋势:实用化、本地化、智能化和实体化
2019-12-24方诚
方诚
【摘要】作为大数据背景下的一种新兴的新闻形式,数据新闻近年来发展迅速。英国作为数据新闻发展比较成熟的国家,研究其数据新闻发展的新趋势对于我国有一定的借鉴意义。在对三届英国数据新闻大会重要议题的分析基础上,结合我国的具体情况,阐述了数据新闻发展由个性到实用,由中央到地方,由人工到机器,由虚拟到实体的转向,从而梳理出数据新闻发展的实用化、本地化、智能化和实体化的趋势。
【关键词】数据新闻;实用化;本地化;智能化;实体化
在数据新闻已经发展比较成熟的英国,从2016年至2019年,几乎每年都举办了全国性的数据新闻大会(Data Journalism UK Conference)。大会主持人是网络新闻博客①的创始人、伯明翰城市大学数据新闻研究生课程的负责人保罗·布拉德肖(Paul Bradshaw),大会参与者则来自英国各数据新闻媒体。本文在对这三届大会重要议题的分析基础上,关照我国的具体情况,梳理出数据新闻发展的新趋势。
一、由个性到实用:视觉设计的理性回归
2016年11月,第一届英国数据新闻大会召开,这次大会的重要议题是:如何用数据新闻吸引读者,让数据更贴近读者的实际生活。三一镜报集团(Trinity Mirror)的高级数据专家克莱尔·米勒(Claire Miller)强调了实现数据个人化定制的重要性。“做好数据新闻,很重要的一点是做到让日常人的普通生活更有意思。”米勒也对那些热爱图表展示的记者提出了警示:“有时候,用文字讲述故事反而更有效。”在三一镜报集团,米勒就遇到过图表无法在手机客户端查看的问题,因为手机屏幕较小,有些图表内容会非常难以看清,如果用手去放大,绝对会影响用户体验。另一个被演讲者不断提到的主题,就是在保证数据新闻私人化的同时,也要注意其实用性,而实用往往不一定跟花哨有关。在报道一些贫困地区的新闻时,一张用不同颜色标记贫穷的不同层次的交互式地图看上去或许不错,但更个性化的报道方法,是写一个小程序,让读者可以在输入自己所在的地区邮编后,找到具体的数据。[1]
数据新闻经过近几年的蓬勃发展,业界的发展趋于成熟。数据新闻出现之初对炫酷的可视化形式、复杂的交互水平的追求,亟须回归到个人生活的关注和实用性的思考。过度追求视觉上的丰富呈现,甚至将一些不适合的题材制作为数据新闻,反而会在传播中增加“噪声”。交叉使用多种呈现形式的数据新闻一定程度上提高了读者的沉浸与卷入程度,使读者的“临场感”更为强烈,但呈现形式的繁复也可能造成“选择困难”和“视觉压迫”。[2]
近年来,我国数据新闻界也逐渐重视设计上的实用性,并涌现出了优秀的数据新闻作品。正如财新传媒数据新闻中心主任黄晨所说:可视化只是结果,酷炫的技术并不是要把问题复杂化,而是为了用最简单的技术去把故事讲好。[3]
二、由中央到地方:数据新闻的全面扩展
数据新闻选题的本地化,是2017年英国数据新闻大会的重要议题之一。目前,英国主要有两个项目致力于数据新闻选题的本地化,一个是英国非营利性组织“新闻调查局”(The Bureau of Investigative)主导下的“地方局”(Bureau Local)项目,另一个是BBC的“共享数据部门”(Shared Data Unit)。
“地方局”项目由《泰晤士报》《星期日泰晤士报》的前数据新闻记者梅根·卢塞罗(Megan Lucero)主管,以一种从下到上的方式运行。该项目以一款协同工作软件(Slack)的线上小组为基础,邀请地方媒体的记者们进入线上小组,并与之分享数据。梅根·卢塞罗认为:“当你认为没有人在报道你的问题时,你就和媒体失去了联系。我们需要更多地方层面的关于公共利益的报道,所以我们专注于建立一个地方层面的社区和网络系统来实现这一目标。”[4]“地方局”项目孵化了一些优秀的数据新闻作品,如英国社区新闻网站“布里斯托电讯”②对于英国人接受移民抽查的数据新闻报道。在“新闻调查局”的帮助下,“布里斯托电讯”利用《信息自由法案》向英国内政部申请到了足够多的数据,揭示出大约有五分之一的英国人在过去五年中遭移民突击检查。[5]英国其他的地方媒体也随之跟进了移民突击检查的报道,但是用的是当地数据。
BBC的共享数据部门(Shared Data Unit)由彼得·夏洛克(Pete Sherlock)主管,则是采用自上而下的策略:每3个月从地方报纸和网站借调3名新闻记者到该部门,接受数据新闻有关技能的训练。当这些记者回到地方新闻机构中去的时候,将把这些新理念和新技能与自己的同事分享。[6]
“地方局”项目的优势是需要不同角色的共同协作,其中许多(或许大部分)并非来自传统新闻机构,这让该项目能够利用开发人员、设计师和记者的专业知识和才能。这是一种更加开放的路径,但也依赖于已经对数据项目感兴趣并有开发动机的个人。相比之下,“共享数据部门”利用的是地方新闻机构更为传统的网络。通过编辑和记者的电子邮件和电话的指导,能够激发那些可能不会参加“地方局”项目的人的数据素养。
目前已有的优秀数据新闻作品一般为全球性或全国性的内容。这种大型数据新闻涉及巨大的数据量和工作量,而且通常需要跨洲、跨洋、跨地区合作。从生产成本上看,地方媒体难以负担。[7]我国优秀的数据新闻作品虽然也集中于财新、人民网等国家级媒体,但近年来,地方媒体对于数据新闻的重视也与日俱增。针对具有鲜明的本地特色的议题进行的数据新闻生产,已經成为地方媒体创新的手段之一。
《四川日报》的More大数据工作室,聚焦于四川本地的数据进行数据新闻制作,选题包括《数读四川清洁来源》《四川省88个贫困县2017年电商全景》等。该机构以数据可视化为切入点,从数据新闻、数据榜单、数据报告三个层面对数据进行多层次开发,成立一年以来生产发布作品50余件。
三、由人工到机器:人工智能的深度开发
2017年第二届和2019年第三届英国数据新闻大会上对雷达(记者、数据和机器人)项目[The RADAR(Reporters And Data And Robots) project]均进行过介绍。由英国新闻协会(UK Press Association)和Urbs Media公司合作推出的雷达项目,它的团队只有五名数据记者和两名编辑,但是每月平均可撰写大约8000篇英国地方新闻。雷达项目利用了由政府公开的免费的基于地理区域的数据集,数据记者首先确定数据中哪些角度、趋势或异常值(outliers)具有新闻价值,将其放置在一个具有基本结构的数据模板中,并为不同版本的文章构建模板。然后,使用人工智能从本地化的角度润色报道。如果需要,本地新闻记者可以自行编辑内容以提高本地相关性。在该过程中,人工智能起到了新闻生产助理的作用,提高了新闻生产效率,使模板中的文字信息更加本地化。[8]
人工智能在数据新闻中的应用贯穿于数据挖掘的整个过程,一是体现在数据的筛选之中,二是体现在数据的处理之中。
新闻媒体在筛选第一系统的数据时,如果能配合智能算法,也可以淘汰掉不符合新闻生产标准的低价值数据,并依据新闻生产的要求,筛选敏感信息和关键部分。最理想的情况是还能做到根据具体的应用场景和需求合理配置数据,提高数据资源的利用效率。[9]目前受到技术条件的限制,中国媒体使用机器学习进行数据收集的情形较少,但中国不乏媒体与持有数据的企业合作进行的数据收集。如2014年春节期间中央电视台《晚间新闻》节目与百度进行合作,依托于数以亿计的百度地图定位数据,以动态迁徙地图的形式呈现中国春节人口迁徙情况。
人工智能技术的突破,使机器对各类型信息的处理能力大幅提升,可分析数据对象从人们习以为常的数字,扩展为广义的文本、图片、语音甚至视频。[10]机器新闻写作具有的生产速度快、数据分析客观公正等优势,使得新闻记者能够摆脱繁琐的数据处理过程,专注于内容的深度创作。中国和英国一样,早已将人工智能运用于新闻写作实践。腾讯的Dreamwriter、新华社的“快笔小新”等新闻写作机器人相继出现,并运用于财经、体育、气象、地质等领域的新闻报道中。中国庞大的人口基数及伴随产生的庞大数据集,来自国家层面的政策扶持和互联网巨头在各自垂直领域的多年耕耘,都为中国在人工智能领域的发展打下了坚实的基础。伴随着人工智能在新闻领域的广泛运用,人机协同式的新闻写作将成为中国数据新闻发展的新趋势之一。
四、由虚拟到实体:数据新闻的另类突破
对数据新闻作品进行实体化开发,也是新的数据呈现方式之一。2019年第三届英国数据新闻大会上,Batjo项目负责人爱丽丝·科罗娜(Alice Corona) 提出了数据新闻实体化的趋势,将数据新闻以实体装置的形式展现。Batjo项目是一个致力于让记者学习数字制造技能以制作实体的和数据驱动的新闻装置的机构,受到Google公司资助。Batjo项目的案例包括“数据漫步”(Data Walk)、3D数据地图和“绘制它”灯光条(Light Data Bars),参与者给出某些数值来点亮这些灯光条。科罗娜认为,这种“数字制造”有可能比基于屏幕的数据新闻更具参与感。“年轻人更有可能(以数据)参与”,她说,而那些有感官障碍的人可以使用非视觉感官来探索数据。[11]以数据漫步(Data Walk)为例,该项目包括一个或多个3D形式的木条,参与者可以在木条上通过行走的方式感受随着年份改变带来的数值变化。
“绘制它”灯光条则是一个由多个LED灯组成的灯光条。每个LED灯光条都有一个开关,可以设置两种模式。如果开关在位置一,LED灯光条亮起来的高度由具体的数据决定。如果在位置二,参与者通过在传感器上施加一定的力度来猜测正确的数据值。在人与装置的互动中,参与者对传感器施加的力度越大,代表参与者猜测的数据值越高。
实体形式的数据呈现不需要在浏览器中打开,而是以某种方式“始终存在”,这意味着它可以提供非正式和随意的体验,这对(数据新闻的)新手和非专业用户更具吸引力。新闻编辑室可以与公共空间(如公园、图书馆或博物馆)合作举办相关活动和制作新闻装置,选择与当地相关的议题。这样的装置将在规定的时间内留在这个地方,当人们经过它时,呈现出一个持续的视觉标识。人们可能会自发地参与,并与社区的其他成员讨论装置提供的信息。[12]除此以外,实体形式的数据新闻的优势在于:在互联网基础设施不够发达的地方,实体形式的数据新闻可以作为网络新闻的一种有效补充;实体形式的数据新闻可能通过触摸、听、闻等多种方式与用户进行交互,对有视觉障碍的用户比较友好;实体形式的数据新闻多以游戏的形式出现,具有一定的趣味性,能够提高大众的数据素养,促进公众参与。目前,中国的媒体还少有数据新闻的实体装置。而对数据新闻的实体化开发,可能会给数据新闻带来新的盈利模式。
五、结语
数据新闻从新生到成熟的过程,是数据新闻理念从英国、美国等发达国家扩展到中国等发展中国家的过程,是数据新闻实践从国家级媒体扩展到地方媒体的过程,是数据新闻生产者从媒体机构到丰富多样的数据新闻生产者团队的过程。当数据新闻生态趋于完善,业界发展趋于成熟,数据新闻也逐渐回归到对新闻本真的关注中。当炫酷的数据可视化不再是首要追求,数据新闻的发展反而蕴藏着更多创新的可能。
[本文为2017年重庆教育委员会人文社会科学研究规划项目“中英数据新闻实践与发展路径对比研究”(项目编号:17SKG086)、2017年重庆市社会科学规划项目“大数据时代基于移动端的数据新闻设計研究”(项目编号:2017PY17)、教育部人文社会科学研究青年基金项目“大数据技术使用对新闻从业者角色认知的影响及其职业困境研究”(项目编号:17YJC860034)的成果]
注 释:
①网络新闻博客(Online Journalism Blog)是由英国著名记者Paul Bradshaw创办的博客,内容包括网络新闻、数据新闻、公民新闻等。
②布里斯托电讯(The Bristol Cable),网站地址为https://thebristolcable.org,根据其网站上的介绍,该网站致力于布里斯托(英格兰西南部的海滨城市)本地新闻的报道,资金来源为2000多名会员的支持。
参考文献:
[1]英国数据新闻大会.个性+实用,数据新闻要接地气[EB/OL].http://dy.163.com/v2/article/detail/C77CC98805118VJ5.html.2016年12月2日.
[2]陆朦朦.数据新闻互动叙事策略研究:基于2014—2018年全球数据新闻奖获奖作品的分析[J].出版科学,2019,27(01):92-98.
[3]财新黄晨:Step by Step 教你如何提升数据素养|媒体人说[EB/OL].https://www.sohu.com/a/226857853_649502.2018年3月31日.
[4]In the UK, data journalism and investigations are getting more local[EB/OL].https://www.journalism.co.uk/news/in-the-uk-data-journalism-and-investigations-are-getting-more-local-than-ever/s2/a714339/. 2017年12月7日.
[5]Thousands of British Citizens Swept Up In Immigration Spot Check[EB/OL]https://www.thebureauinvestigates.com/stories/2017-10-09/review-homeoffice-immigration-checks.2017年10月9日.
[6]Local journalism is getting more data-driven — and other thoughts on Data Journalism UK 2017[EB/OL].https://onlinejournalismblog.com/2017/12/13/local-data-journalism-uk-2017-automation/.2017年12月13日.
[7]涂伊默.數据新闻产品趋于多样化[J].新闻战线,2018(15):72-75.
[8]Local journalism is getting more data-driven — and other thoughts on Data Journalism UK 2017[EB/OL]https://onlinejournalismblog.com/2017/12/13/local-data-journalism-uk-2017-automation/.2017年12月13日.
[9]喻国明,刘界儒,李阳.数据新闻现存的问题与解决之道:兼论人工智能的应用价值[J].新闻爱好者,2017(6):4-7.
[10]许向东.趋势、规范与本土化:移动传播时代数据新闻的生产实践研究[J].新闻爱好者,2017(12):20-23.
[11]From making data physical to giving journalists confidence (and a few other things too): Data Journalism UK 2019[EB/OL].https://onlinejournalismblog.com/2019/05/09/making-data-physical-data-journalism-jobs/.2019年5月9日.
[12]Alice Corona.Lets get physical: how to represent data through touch[EB/OL].https://datajournalism.com/read/longreads/lets-get-physical-how-to-represent-data-through-touch.2019年 7月16日.
(作者为重庆交通大学人文学院讲师)
编校:王 谦