浅谈数据新闻的报道策划与实施
2016-04-16陈知春饶立文
■陈知春 饶立文
浅谈数据新闻的报道策划与实施
■陈知春 饶立文
数据新闻是在大数据时代兴起的一种跨学科、跨领域的新闻生产方式,它需要新的思维方式与多种能力的支撑。区别于一般的新闻报道,数据新闻以数据为中心,带领读者将目光延伸,投射到新闻背后的数据上,通过对数据梳理分析,发现其中的新信息、新内容,再配以可视化图表、动图、动新闻、H5页面等新的产品形态,让数据变得生动,讲出新闻背后的故事。
围绕数据新闻的报道策划,在操作上往往通过从新闻热点出发,从主动设置议题出发和从海量数据出发几个方面进行组织实施,在数据处理上既需要样本丰富、维度多元等多重因素具备,又需要对海量信息有全面梳理和深度加工的能力。新华社新媒体中心自创立以来一直对数据新闻进行不断的探索,在这里结合一些相关报道案例,供大家批评探讨。
从新闻热点出发,解析数据提供多角度思考
2013年在新华社新媒体专线创立之初,恰逢全国两会召开,两会的重中之重便是政府工作报告。编辑部与清华大学自然语言处理实验室合作,以词频分析为手段,对当年1.5万字政府工作报告中出现的词语进行分词、筛选、统计后,按出现频次高低排列展示, 《“发展”十年居榜首——“词云”解读政府工作报告》等稿件,在当时引领了数据新闻的浪潮。
在此后的报道中,编辑部立足追踪新闻热点,关注网民关注度高的新闻事件,以数据为依托,挖掘出了更多有意思的新闻。
2013年底,12306网站改版上线,12306手机客户端也正式开放下载。时值春运,通过网络和手机购票给大家带来方便的同时, “抢票难”也遭到了广大网民的吐槽。一时间 “黄牛用插件 ‘秒刷’千余张票” “车票卖给了名为樱桃小丸子和东方不败的用户”等新闻引起了全国网民的极大关注,12306无疑成了这一年春运的大热点。
在12306买票到底有多难?买一张春运回家的火车票要花多少时间?在12306买到回家过年的火车票概率有多大?全国网民的问题该如何解答?2014年初,编辑部在策划这组报道时首先想到了要采访中国铁路总公司和12306网站的负责人,但是官方的表态似乎并不能完全解开网民心中的疑问,让12306的后台数据说话,成为编辑部的共识。
通过对12306网站后台数据的梳理,新媒体专线推出的 《火车票去哪了?——带你走进 “12306”网站火车票购票后台》 《网民N问 “12306”》 《150多个 “码农”怎样保证2.58亿人次的购票需求》等一组揭秘12306后台数据的稿件。通过报道,让读者了解到 “2014年平均每张车票需访问 ‘12306’近千次才订上, ‘秒杀’到的火车票有43%无人支付流回票池”等新闻背后有意义的数据,这组稿件成为了当年春运有趣又实用的一组报道,通过客观详实的数据,让网民对12306多了些理解少了些吐槽。
从设定主题出发,梳理归纳发掘数据背后的新闻
作为新华社以生产新媒体内容为主要工作职责的部门,新媒体中心的报道策划更多时候需要围绕设定主题,宣传报道好国家大政方针、反腐倡廉、服务民生等重点工作,加强舆论引导。
这种方式的难点在于,首先要根据设定主题在海量数据种类中发掘出能够反映议题核心的数据领域,之后还要对所有能够获得的数据进行筛选和分析。
在以 “2015年中国经济发展成就”为主题的年终报道策划中,用什么样的数据来反映中国经济的发展,一度成为编辑部策划的难点。记者在随后的调研中开创性地发现,借助大数据和物联网技术,我国重点企业三一重工,以科技创新推动转型升级,他们的挖掘机 “挖”的不仅是土,还有最值钱的数据。
“跳动的字节记录着挖掘机运行的好坏,也从一个特殊的维度揭示着中国经济运行的 ‘凉热’。”在 《“挖掘机指数”告诉你不一样的中国经济》一稿中,记者通过对数据的比较和对照建立起了 “挖掘机指数”和中国经济的对应关系。通过对三一重工的数据进行详细的筛选和分析,发现 “挖掘机指数”能够反映路桥建设回暖、核电和风电等新能源引擎启动、房地产施工下降、 “一带一路”发力等多个新闻点。报道生动客观地对中国经济形势给予分析和肯定,有网友评价, “这是少有的能让人读懂的经济报道。”
在落实中央八项规定精神的系列报道策划中,要求反腐报道做出新意,编辑部拿出了数据新闻的策划方案。数据源就利用中央纪委监察部网站公开通报的反腐案例,记者分别对于每月、每季度、每年甚至一定阶段的反腐公开数据进行逐条整理,从而提高准确性与可靠性。包括清除不必要的干扰数据、清理数据中的人为误差、将数据转化为统一的格式,以及对数据进行计算和完备性测试等等。最后再运用可视化技术将经过过滤、整理后的数据根据 “老虎” “苍蝇”的年龄、性别、职务、工作地点、工作领域、犯罪类型等不同维度进行统计计算,再对计算结果进行说明和解读。
在这一阶段策划推出的 《“打虎拍蝇”在提速,摸准 “窝案”一锅端——数读中纪委国企 “反腐”之 “最”》 《落马 “一把手”曾是 “一霸手”?——透视166名 “一把手”腐败案》 《大数据揭秘:哪些 “老虎苍蝇”上过中纪委官网的头条?》等稿件,通过对多个中纪委公开的反腐个案进行数据统计分析,可以直观感受到中纪委对于反腐工作正在不断提速,更能看出中央对于打击腐败的力度与决心,这批数据新闻成为反腐报道的精品力作。
从海量数据出发,让数据自己发声
在移动互联网飞速发展的浪潮下,以手机APP为代表的各类应用得到了空前的发展壮大,不同类型的APP也积累了海量手机用户,由此产生的几何级数的应用数据,对于这些数据的处理、分析、挖掘,也让新闻报道的触角进入到了全新的领域。
《大数据揭秘:高温天部委加班大比拼》一稿,就是新华社新媒体中心联合滴滴媒体研究院,基于实时生成的移动出行大数据进行分析,将气温和新闻数据叠加,通过统计分析来自公安部、监察部、民政部、司法部、财政部、人力资源和社会保障部、国土资源部等17个部委基于手机应用滴滴出行的出租车、快车、专车使用数据进行分析,勾勒出 “国土资源部加班最狠” “公安部24小时无休”等多个图景。
《美味也在 “漂流”——大数据告诉你2015“舌尖上的迁徙”》一稿,是新媒体中心依托百度糯米和百度搜索等应用,对线上饮食消费进行全网数据挖掘、分析,用覆盖全国40余个主要城市、近百万家门店、上亿用户的2015年全年的大数据,为读者呈现数据版 “舌尖上的中国”。 《民航何时才能 “非常准”?——数说2015年那些迟到的 “空中约会”》一稿,是对航空数据服务商飞常准的数据进行分析挖掘,得出 “七八月份的航班正点率为全年最低,仅为65%左右”等关键信息。
在 《00后日常表达数据大揭秘: “宝宝”来自哪个星球?》一稿的创作中,利用百度输入法后台获取的海量数据,完成了输入法和00后表达方式之间的数据关联,得出 “00后新生代拥有不同的表达方式”这一主题,从中总结出了00后 “无表情不会聊天” “追星追漫更爱萌” “讨厌单调爱分享”这三大特点。
数据新闻的全维度呈现:可视化图表、动图、H5、动新闻
由于数据新闻来源于数据,并且由数据组成,所以它与新媒体化呈现之间有着天生的契合。数据的可视化历史久远,但数据新闻对其提出了更高的要求。不仅要把枯燥难懂的数据变为多彩易读的可视化产品,而且要让这些产品的表现形式符合数据的基本内容。在上文提到的案例中,大部分数据新闻产品都采用了文字稿配可视化图表的形式,这也是目前最常见的形式之一。
在数据新闻的实际操作中,记者扮演了多重角色,他是数据统计员,主要通过数据统计、数据分析、数据挖掘等技术手段或是从海量数据中发现新闻线索;他也是数据分析员,在抓取大量数据后,分析各新闻要素之间的必然联系,拓展既有新闻主题的广度与深度;他还是半个美编,要撰写可视化图表或视频脚本,依靠可视化技术将经过过滤后的数据进行融合,以形象化、艺术化的方式加以呈现,为读者提供客观、系统的报道以及良好的阅读体验。
随着技术手段的日新月异,读者对于数据新闻的呈现方式也有了越来越高的要求。由于GIF动图的流行,动态图表也逐渐代替普通图表成为了数据新闻的 “标配”之一。在数据新闻 《2015年 “象牙塔”反腐:平均每周一名校领导被通报》中,用循环动态图表来展现关键的数据内容,将有趣的动态效果与严肃的主题相结合,打破了原本相对无趣的话题,创造出一种全新的报道效果。
《滴滴大数据揭秘:高温天部委加班大比拼》一稿,则在使用数据图表的同时又配发了动新闻,用动画的形式展现了报道内容,仿佛让文字拥有了全新的生命。这种形式优势很明显,让读者在轻松幽默的动画中获取新闻内容,非常利于传播。但缺点也凸显,那就是生产成本较高,制作周期较长,短时间内很难创作出优秀的作品。
由于HTML5语言逐步代替FLASH动画,越来越多的交互式H5展现形式也进入了人们的视野。在 《00后日常表达数据大揭秘: “宝宝”来自哪个星球?》中,记者和百度合作,共同推出调查小测验H5《蛋蛋后日常大揭秘——测测你比蛋蛋后大几岁?》。一时间,朋友圈中的70、80、90后们都跃跃欲试,测试结果更是刷屏朋友圈,可见H5的魅力之大。
数据新闻是更适合通过网络、客户端展示的新媒体报道,它抽离于新闻现场,又与报道主题有着千丝万缕的联系,它丰富多元的呈现形态,是传统媒体很难做到的。随着科学技术的发展与渗透,机器人写作、人工智能等新的技术会更多地应用在新闻报道中,科技会令新闻更加精彩。
(作者分别系新华社新媒体中心总编室副主任,编辑)