APP下载

大数据时代信息图表新闻的生存之道

2014-03-24周咏缗

新闻界 2014年1期
关键词:数据数据库大数据

周咏缗

摘要 数据新闻的可视化呈现形式——信息图表(也称图表新闻)随着“大数据”的发展也日益受到媒体人的重视。如何有效利用数据,让数据“说”的“话”更具可信性、客观性和可读性是信息图表新闻赖以生存的关键,也是其未来持续发展的基础。本文提出可以通过搭建信息图表的宏观数据库和微观数据库,来提高图表在数据新闻报道上的时效性和准确性,并建议将数据库作为信息图表业务的重要基础性建设不断“扩容”。

关键词 大数据;数据;信息图表;数据库

中图分类号G203 文献标识码A

2013年,被业界称为大数据(Big Data)元年。“大数据”是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,其主要特点是海量、非结构化和半结构化、实时处理,业界将其归纳为4个“V”:Volume(数据量大),Variety(数据类型多样),Velocity(处理速度快),Value(价值密度低)。作为大数据时代的核心资源,数据也日益受到媒体人的重视。如果说20年前记者对数据的处理还仅限于罗列数字或将数字集合于一张表格之中,那么现在我们生活在用0和1描述的各类数据世界中,而统计学意义上的数字也仅仅是数据中的一种,媒体人现在和未来都必须面对包含各种文件,文字、数字、图形、符号、视频和音频等的海量数据。根据维基百科对数据的解释,数据是指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。数据可指计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。

面对丰富多彩的数据世界,如何借“大数据”发展这个契机,顺势而为开拓新闻报道的新疆域是近年业界讨论的热点话题。一种以数据驱动为特点的跨学科、跨领域的新闻“新秀”——数据新闻学(Data Journalism)应运而生,并逐渐受到媒体青睐。数据新闻的核心是数据,从数据采集到分析再到展示,各项报道环节和技术无不围绕数据展开,通过数据背后的关联与模式来讲述一个复杂的故事。具体而言,数据新闻在形式上以图表、数据为主,辅之以必要的少量文字;在实际操作中,记者主要通过数据统计、数据分析、数据挖掘等技术手段或是从海量数据中发现新闻线索,或是抓取大量数据拓展既有新闻主题的广度与深度,最后依靠可视化技术将经过过滤后的数据进行融合,以形象化、艺术化的方式加以呈现,致力于为读者提供客观、系统的报道以及良好的阅读体验。

在有市场需求的大环境下,作为数据新闻的可视化呈现形式——信息图表(也称图表新闻),以其数据分析和数据阐释见长的特点成为媒体应用数据进行报道时的“宠儿”。信息图表中的每一个数据都在为新闻服务,为新闻“说话”,编辑通过对数据的搜集、整理、分析和挖掘等定量分析来提升报道的可信度和客观性,使读者在轻松的“数读”过程中,多角度和多层面地了解新闻事实,接受信息,洞悉新闻事件的内在联系乃至本质,这也是信息图表在国内外媒体中扮演着越来越重要的角色的原因所在,也成为大众传媒在面对自媒体挑战时,实现自我救赎的一种方式。新闻报道中不论文字、图片,还是图表和音视频等都属于数据范畴,既是数据的内容,也是数据的呈现方式。相比其他类型,信息图表可以集文、图、符号、音视频于一体的特点本身就是对各类数据的集成,这也正是数据新闻选择信息图表作为报道载体的原因。国内“嗅觉”灵敏的各大门户网站早已开设数据新闻专栏,如搜狐的“数字之道”、网易的“数读”、新浪的“图解天下”和腾讯的“新闻百科”等,国外以《卫报》、《纽约时报》、《华盛顿邮报》、《金融时报》、BBC等为代表的传统媒体也纷纷通过信息图表这种形式展示数据新闻。

一、在信息图表中运用数据的三个注意事项

应该说,大数据时代为数据新闻提供了丰盛的“食材”,信息图表的报道任务就是将这些食材烹饪出适合受众口味的色香味俱全的大餐,为保证“美味”,在制作过程中需要特别留意以下三点:

(一)数据的权威性

要保证数据的权威性,首先要确保数据的来源可靠,有据可查。一般来说,政府部门和权威机构发布的数据可信度较高,而民间组织、调查公司等发布的数据说服力相对弱一些,记者随机采访的数据仅供参考。作为可信度较高的大量数据拥有者,政府和权威机构历来是记者的采访“重地”,以往需要记者提前联系、深入采访才能拿到的官方数据,随着近些年政务公开和信息透明化力度的不断加大,一下变得唾手可得,大量公共数据被“释放”出来,不但为媒体及时发布数据新闻提供了有力保证,更为信息图表的发展提供了巨大机遇。

其次,在制作信息图表的过程中,我们认为通过数据对比可以有效增强数据的权威性,加深受众对新闻主题的理解。数据对比通常采用纵向比或横向比,纵向比是指对同一类别的历史数据进行比较,比如,报道国内生产总值连续5年增长,就要有这5年每年的数据作为背景来说明这个新闻事实;横向比是指将同一时段的不同类别进行比较,比如,报道中国城乡收入比10年来最低,就要将10年来城镇和农村居民两组收入数据进行对比来验证新闻的真实性。

(二)数据的准确性

“准确”是贯穿数据新闻采编发始终的生命线。数据新闻中大至政治立场、舆论导向,小到具体数字、单位和译名,都要做到准确无误,这是对一名新闻工作者的基本要求。信息图表制作过程中经常要接触到各种图形和统计数据等,对准确性的要求尤为突出。例如在使用地图时应注意在涉及领土、国界线和国名标示等一系列重大敏感问题时,编辑必须慎之又慎,要与我国正式出版的地图册反复核对,有时甚至需要手工描摹。在制作财经类、调查类信息图表时,应倍加关注数字的准确性,一个小数点的前移或后移、一个“0”的多或少,都能造成严重的新闻失实。此外,国际报道中的数据经常会从外电、外刊和外国网站上取材,这就存在译名和“单位”准确的问题。

信息图表的特点之一就是数据量大,编辑要从茫茫数据洪流中摘出精华,表述完整而无歧义,色彩图形标识符合题材属性,字体格式构图规范统一,这些都对信息图表的准确性提出了严峻的挑战。面对挑战,应在采编稿件的头一个环节。即数据采集时就人手解决,不可留下隐患。例如在进行重大工程类报道时,新闻的采访不能仅仅停留在表面上,必须深入彻底,不但要掌握权威的数据和准确的科学术语,更要能看明白、听得懂、记得准,能把复杂的工程图和内部结构搬到稿件上,变深奥的专家术语为老百姓看得懂的图解图示,而又不造成误导或误解,这才是信息图表的数据生存之道。如果连自己都搞不清楚,又如何下手制作,更别提如何向受众交代?数据的准确性也就更无从谈起。此外,要保证信息图表的数据准确还可以借助校对工作来加以巩固。校对环节听似轻巧,实则至关重要。标题、文字、地图、数字、单位,甚至色彩选择是否恰当都在校对的范围之内,比如在报道天灾人祸等新闻时用红黄等暖色作为背景色就不太合适。因此,无论在思想环节还是采编环节上都必须多加小心,力求稿件内容精确,在准确无误的基础上再去追求形式上的更加完美,唯有如此才能在信息图表报道中实现零差错。

(三)数据的简洁性

数据的简洁性要求是基于对受众时间的尊重。一幅好的信息图表作品应该是直观易读、重点突出、层次分明的稿件,在制作上需要懂得数据的取舍之道。这就相当于罗丹的石料去除术,图表编辑应该明白哪些数据是有意义的应该保留,就像雕像,哪些数据是没有意义的应该舍弃,就像石料。即从大量的数据中只摘选出最重要、最核心、受众最关心的信息。正如耶鲁大学的教授及统计图表设计师爱德华·塔夫(Edward Tuff)认为,设计应该为信息而存在。一份高质量的信息图表必须具备以下性质:

1)包含重要的交流信息。

2)以清晰、准确、有效的方法传递信息。

3)从来不要小视读者的智商。

4)总是告诉事实。

根据塔夫的建议,编辑在制作图表的过程中应尽量避免花里胡哨、充满装饰的设计,因为过多的点缀和修饰往往会使重要信息淹没其中,分散读者对有用信息的注意力,进而降低读者的阅读速度,延长其阅读时间,增加了理解的难度。

相比自媒体,大众媒体的“官方”身份更要求对数据的使用不应是散落的、随机的和任意堆砌的,而需要在占有大量数据的基础上,通过对数据去粗取精、去伪存真的科学筛选、分析和提炼,清除“病毒数据”(失实的、陈旧的、冗余的数据)和人为误差(如不恰当的视觉设计等),将过滤后的关键数据而不是原始数据,以更客观、明晰地方式呈现给受众。

虽然数据新闻靠数据说话,但不应是简单地堆砌和拼凑,而应是通过突出关键数据来印证报道主题,表现形式上紧密围绕一个视觉中心点展开,切莫为盲目追求稿件的信息量而是个数据就照单全收,致使核心数据被淹没,进而令受众眼花缭乱并产生抵触情绪。此外,稿件制作过程中尽量避免使用专业性太强、太深奥的术语,若回避不掉,也要在稿件中注明并解释清楚,使专业数据变得通俗易懂旨在为受众提供轻松的阅读体验。

二、搭建信息图表数据库,提高报道时效性和准确性

俗话说:巧妇难为无米之炊。信息图表报道是围绕数据展开的,数据就是这个“米”,那么应如何多快好省地获取所需数据,让“米”及时下锅呢?结合多年工作实践,笔者认为,可以通过搭建信息图表的宏观数据库和微观数据库,来提高图表在数据新闻报道上的时效性和准确性。数据库可以作为信息图表业务的重要基础性建设,是一项需要不断积累、修正、完善的长期性工作。建库与实用是一种栽树与乘凉的关系,有一劳永逸之功效,还可以利用媒体自身或合作机构的数据库,来及时发现重要的新闻线索。

宏观数据库可主要包括五大子数据库:地图数据库、新闻背景数据库、标识数据库、各国政要名人数据库和资料来源网址数据库(表1)。微观数据库可分成两大块:一块是图形素材库(包含矢量图、创意图、各种按钮、图形符号等),另一块是指常识库(各类专有名词、术语等)。宏观数据库的建设是个系统工程,既需要依托媒体决策层和技术研发部门提供政策和技术支持,也需要媒体在认真分析信息图表业务需求的前提下,与媒体内外相关机构展开积极的合作,实现数据共享,以期对数据库进行实时更新、扩容和完善;微观数据库的建设相对简单,更具个人风格,可根据编辑个人的实际需求和工作重点平日随时积累。

建库的好处主要体现在遇有新闻发生,可将所储存的相应数据即需即取,数倍地节省了因描绘地图、制作图形、查阅标识等必须的工作所耗掉的时间。例如,2008年汶川地震消息刚一发布,新华社图表新闻编辑便从数据库中提取了全国和四川省地图,仅用30分钟便准确快速播发了汶川地震的示意图,媒体采用达到238家。

三、信息图表中数据采编的主要难点

机遇与挑战并存,应该看到,大数据时代下信息图表的数据采编也面临着诸多难题,主要有以下三点:

第一,数据采集障碍。一方面由于我国部分被采访机构和个人对数据新闻这种信息图表形式并不了解,不知道提供什么样的数据可供信息图表编辑使用,增加了数据新闻记者采访难度和沟通成本,既挫伤了数据新闻记者采访的积极性,又影响了报道质量。另一方面是深度报道所需数据不易获取,如科技工程类报道由于专业性太强,数据新闻记者的采访质量与自身对该项目的了解程度密切相关,如果核心数据涉及保密范围,则对新闻的“数读”就只能浅尝辄止。

第二,数据处理障碍。随着信息碎片化的加剧,从扑面而来的海量数据中挑选出适宜信息图表表现的数据难度越来越大,在“意图迷误”和“感受迷误”弥漫其中的数据流中,如何识别垃圾数据,清除数据“噪音”,都是制作信息图表需要攻克的难题。

第三,数据分析障碍。大数据时代对新闻从业者提出了更高的要求,信息图表编辑不仅要有新闻敏感性,还要有文字缩编能力,既需要具备数据采集、统计和分析能力,又要懂美术设计,并会操作多个计算机软件等,可以说合格的信息图表编辑必须有多种能力支撑,而目前我国开设信息图表课程的大学并不多,以此为专业进行培养的更是少见,大多数的信息图表编辑都是摸着石头过河,毕业于“实践大学”,而在制作信息图表之前对数据进行深层挖掘的专业数据分析师更是紧缺,专业人才的匮乏势必成为我国未来数据新闻发展的掣肘,特别是在深度报道领域凸显了数据挖掘力度的孱弱,亟待新闻教育界引起重视。

参考文献

[1]陈昌凤.“大数据”时代如何做新闻[J].新闻与写作,2013(1).

[2]文卫华,李冰.大数据时代的数据新闻报道——以英国《卫报》为例[J].现代传播,2013(5).

[3]保罗M.莱斯特.视觉传播——形象载动信息[M].中国传媒大学出版社,2003:219.

猜你喜欢

数据数据库大数据
数据库
公路工程试验检测存在的问题及措施
一种借助数据处理构建的智能食堂管理系统
浅谈计量自动化系统实现预购电管理应用
基于大数据背景下的智慧城市建设研究
数据库
数据库
数据库