浅析央视《“两会”大数据》的数据新闻报道
2014-06-19文/张楠
文/张 楠
2014年“两会”期间,中央电视台的 《“两会”大数据》特别栏目共播出了9期节目。主持人在演播室中使用全新的立体成像技术和人机互动技术,生动、直观、易懂地向观众播报基于大数据对“两会”热点的分析,可以说,这是中国官方媒体第一次大规模进行的电视数据新闻生产,其新闻报道可圈可点,当然,亦有可提升的空间。
获取海量数据是数据新闻生产的前提。从国外的新闻业界实践来看,海量数据获取的有效渠道主要是从政府、研究机构、大型企业等公开的数据库中抓取的二手数据和由媒体自己调查获取的一手采访数据。例如,《卫报》关于2012年美国总统选举报道的数据新闻,除了从政府的公开数据库中抓取有效的二手数据之外,还主动策划利用官方网站进行有效用户调查以便获得第一手的真实数据。但是,在我国,由于媒体自身搜集数据能力还有待提高,多是将数据获取和分析交给大数据公司去做。
借助数据公司完成数据加工
拥有海量数据对于数据新闻仅仅是第一步,零散的、隐匿的数据没有价值,对数据的加工和处理,将零散的数据有效分类整合,从庞杂数据中分析提炼有用信息,才能为观众提供有价值的新闻内容,以及鲜活并具有可读性的新闻故事。
《“两会”大数据》的第一集《“两会”脉搏全球跳动》中,“中国召开‘两会’,哪个国家最关注?”对于这个问题,我们过去可能无法明确解答,只能以“全球高度关注中国‘两会’”类似的模糊文字给观众一个描述。通过抓取全球89个国家的网民对中国“两会”浏览、关注、评价的数据,对最关注中国“两会”的国家进行排名,结果出人意料:印度尼西亚高居第一,美国列第四。仔细分析就会明白和理解,排行榜上的国家,大多位于亚太地区,如今他们与中国各行各业有着密切的经贸往来关系。让世界对中国“两会”的关注由过去的模糊变成精确,关注的内容和视角更加客观。这一切,如果没有对巨量数据的挖掘和分析,根本无法实现。
春节期间,“百度迁徙图”对于春运回家的流入和流出的实时呈现,“丈母娘的礼物”等热搜词,让不少观众大开眼界。百度的优势就在于搜索信息的抓取和分析,做“两会”热点调查是个好方法。百度新闻热搜榜、百度热词榜自然成为央视《“两会”大数据》栏目与其合作的一种。依托于百度指数,《“两会”大数据》栏目又对相关的搜索词汇进行了深度分析与扩展,比如针对一个热词,网民搜索的其他相关词汇的需求图谱和短期趋势,百度数据就为搜索网民迅速提供群像描述。
腾讯微博和新浪微博一样,国内覆盖人群也在数亿人以上,微博的话题活跃度高,能够提供对网民话题的深度了解。亿赞普是一家全流量数据分析的公司,通过构建不同的抓取和分析维度,就可以让“两会”新闻内容有深度,有细节。比如,《政府工作报告:谁在看?看什么?》这一期节目中,围绕政府工作报告的问题,同时亮出了三张榜单,腾讯微博的话题榜、亿赞普的热度榜、百度新闻的热搜榜,从中很容易寻找出重合的关键词,这样梳理出来的关键词,自然就是网民对政府工作报告最关注、最真实的热议话题。
多元创新呈现数据
数据挖掘、分析的结果,需要借助可视化技术加以呈现。“数据可视化”是要将大量的数据组合构成数据图像,同时还要将数据的各个属性值以多维数据的方式呈现,使观众能够以更直观的方式从多个不同维度观察数据及其结构关系,清晰发现和理解数据中隐含的信息。
海量数据组合构成的数据图像,主要是通过图表、图解、图形、表格、地图、动画、视频等,将某些单靠数据或文本很难表达和解释的信息之间的关联表现出来,化繁为简,兼具形象化与趣味性。主要体现在以下三个方面。
一是逻辑关系可视化。央视的《“两会”大数据》栏目,作为电视数据新闻,充分发挥电视媒体视听兼备的媒介属性,注重音频的解读元素和动画、视频等视觉工具的使用。与平面媒体和网络媒体上的静态图表相比,电视数据新闻可视化特征表现出连续的、动态的逻辑连接性。电视音视频的逻辑连接功能,通过非线性编辑技术用各种元素在“时间轴”的概念上将文本内容形象化、信息秩序化、时空层次化,并最终通过动态的视频形式表现出来。
二是利用虚拟演播技术,将指标和指标值可视化。指标图形化就是用形象化的图表来显示数据所描述的事物。其中最常见的形式就是仿影图形,顾名思义,就是仿照投影的造型所创造的图形,再经过省略、归纳的处理,最终以条理化和几何化的造型轮廓呈现。虚拟演播室内,留守儿童与流动儿童可爱的男女生卡通图形,贴合了新闻的主题。虚拟的动画司机驾车呼啸而来,向主持人挥手示意,点头微笑,这是《“互联网金融”成网络讨论热词》这一期的场景;《环境与食品安全最受百姓关注》中,主持人手指一点头顶旋转的视频片段,便切换到“舌尖上的安全”中虚拟动画人物热烈讨论的视频,主持人很自然地坐下来,端上一盘虚拟的“菜”,与他们讨论起来,就势引出关于这一话题的数据分析。
三是凸显电视媒介特性,使用交互式动态信息图表。《“互联网金融”成网络讨论热词》这一期,充分运用了动态信息图表(Motion Graphic)。红蓝绿三条曲线分别代表在网民和微博对政府工作报告最关心的三个问题,即:互联网金融、舌尖上的安全、黑名单制度。下方用时间轴标示“两会”期间的每一天。主持人手指移到某一条曲线所在的位置时,图上就会立刻出现当天这一话题的微博发帖量,从而可以看出“两会”时期这三大话题的关注数量对比,非常直观清晰。交互式动态信息图表和静态图表相比,交互式图表能够通过一个简洁界面向观众传递大量有用信息。这种呈现方式更具参与性和个性化,可以由观众自行点选所关心的内容进行了解,而不仅仅是简单地推送信息。
2014年央视的《“两会”大数据》深刻地说明:大数据正在改变着电视媒体固有的新闻报道方式,但是,这一改变只能是渐进而缓慢的。在我国电视节目的数据新闻报道中,观众的参与缺位显得十分明显。观众仅仅作为被动的数据产生者,观众在“两会”期间对“两会”的关注与搜索行为数据被百度、腾讯、亿赞普等大数据公司挖掘、分析。而观众利用政府公开数据库分析、理解“两会”中提到的社会现象,制作数据新闻的意识还很欠缺。这固然与我国信息公开制度尚未健全完善有关,也与我国受众数据意识不强,数据分析、制作能力相对欠缺有很大关系。如何利用社会化媒体赋予受众与专业新闻媒体平分秋色的新闻生产模式,开拓数据新闻生产的新流程,尚有待探索。