数据,让新闻精彩呈现
——DT财经在数据新闻领域的探索与实践
2016-11-10王小乔
文/王小乔
数据,让新闻精彩呈现
——DT财经在数据新闻领域的探索与实践
文/王小乔
近几年来,随着大数据行业的发展,国内外数据新闻发展迅速,被专家学者认为是未来新闻业发展的新方向,互联网之父蒂姆·伯纳斯·李说:“新闻的未来,是分析数据。”
数据是这个时代的土壤,如何让新闻业在上面自由生长,是一个关乎新闻业发展与传统媒体转型的重要问题。北卡罗来纳大学菲利普·梅耶教授认为,对于这个时代的记者,重要的不仅仅是寻找和获取信息,还要有处理信息数据、发现问题的能力。
在国外,已有《纽约时报》《卫报》等较为系统地推行数据新闻的报道,走在行业的前列;国内多家门户网站和传统媒体也纷纷试水,开设专栏或频道推出数据新闻和可视化新闻。与国内其他尝试数据新闻报道的机构不同的是,DT财经是2015年刚刚成立的专攻数据的新媒体,数据融入其所有新闻实践的操作流程当中,并体现在每一件新闻作品当中。
作为第一财经和阿里巴巴的混血结晶,DT财经兼具财经新闻生产能力和商业数据挖掘能力,这样的新媒体产品,产出的内容有什么特点?与传统新闻操作有什么不同之处?
把数据当作新闻的核心资源
用数据做新闻,最重要的一个环节,就是获取大量客观有用的数据。这一步有两点很重要,一是客观,二是有足够称之为“大数据”的数据。任何一点的差错都可能导致整个新闻报道的导向性错误。DT财经在生产每一篇内容的时候,都会花大量精力来保证不在以上两点犯错误。DT财经获取数据的手段主要有两种:一是提取机构和公司的数据,二是自行挖掘数据。
DT财经拥有阿里系公司背后的大数据优势,通过提取这些公司的数据发现新闻事件。2015年10月29日,党的十八届五中全会公报刚发布了“全面二孩”政策,“备孕”这个平时沉寂的搜索词在淘宝上突然爆发(图1)。
图1 淘宝数据:“备孕”这个平时沉寂的搜索词在淘宝上突然爆发
DT财经对“备孕”热搜一族进行了详细的分析,包括年龄、教育、地域、工作等,通过数据可视化的形式展现出来。在数据分析的过程中,也发现了很多有趣的现象,比如,有钱的男人比一些女人更积极“备孕”。这些现象如果没有进行数据分析是很难发现的。当然,要准确划分政策对备孕族的影响,还需要全面科学地调查与分析,仅靠电商大数据是绝对不够的,而且电商大数据本身,包含了许多需要剔除的“杂质”。所以提取机构数据进行报道只是真正的大数据新闻的一个必经的初始阶段。
除了电商大数据,DT财经目前通过提取其数据用来做新闻的,几乎涵盖了已经开始留存大数据的各行业领头公司,包括滴滴出行、优酷等,也在充分使用国家气象局、国家统计局等政府公开数据来记录时代变迁。
让数据挖掘成为重要的新闻生产方式
为了弥补单个或多个机构数据的局限性,自行挖掘数据是一个很有必要的动作。数据产业发展迅速的同时,很多数据挖掘与分析工具也涌现出来,DT财经使用各种挖掘工具提取目标网站的数据。经过必要的清理、去重和筛选,建立数据库,将数据的价值储存下来。
2015年9月,DT财经用了一个多月,整理了中国重量级的153位财经官员的教育背景,做出一份培养财经官员的“大学排行榜”。这个系列报道的衍生产品,形成了一个中国财经高官资料库,每一次重要人事变动,均可以调取,并挖掘其新闻价值(图2)。
图2 153位中国财经官员的教育背景数据
数据分析的第一步并不是挖掘数据,而是定义问题,需要明确进行挖掘的目的,报道的主要目的是想弄清楚中国哪个大学的财经官员更多。然而在数据整理的过程中往往能够发现意料之外的现象,这也是做数据新闻的一大乐趣。以清华大学为例,10位中央财经官员中9位并不是经管专业出身,这在一定意义上表明对于年轻大学生,专业不对口从来不是达到梦想的阻碍。
经过半年多在数据挖掘分析方面的广泛试错,2016年4月,DT财经开始使用Python、R语言等数据分析语言、八爪鱼等数据挖掘工具,介入重要新闻专题报道。比如,提取了多家大型房源中介机构的数据,跨度两个月,做了一个涵盖上海楼市多个维度、用多种形态展现的系列大数据报道,其维度包含了地铁沿线房价、租房价,以及所有公立小学学区房等,尝试从包括价格在内的多个维度,勾画出上海楼市的真实运行轨迹(图3)。
图3 上海地铁沿线出租房源数量
计算机语言能力、数据分析技能正在成为大数据时代新闻媒体记者必不可少的一项技能,DT财经也正在努力培养既有新闻敏感性、又能熟练挖掘数据分析数据的全能小编,甚至是集编辑、码农、设计师于一体的全方位人才。当然,能分析数据只是掌握了工具,更重要的是方法论和价值观,掌握用数据的思维方式做新闻,方能够判断怎么样的数据有怎样的新闻价值。
内容与内容的展现形式同样重要
专注财经新闻领域、以数据表达为方法、以可视化为工具,这三点是DT财经的三大特色,从DT财经的内容来看,其对新闻的展现形式非常看重,无论是可视化图表还是标题的拟定,都需要经过严格的制作与挑选。可视化的根本目的是有效地传达和沟通信息,一张图可能比得过成百上千行数据。同时,可视化排斥那些华而不实的图表,复杂的图表会加大受众的理解难度,所以设计师需要在视觉和功能之间达到较好的平衡。
DT财经在日常的新闻报道中大量使用我们所熟知的那些柱状图、饼状图、散点图等,作为最基础的可视化呈现形式。而对于较大型的专题性报道,会使用更加富有表现力的呈现形式。在实践当中,主要有两种类型的数据呈现方式,一种是数据图,一种是交互型作品。
2016年6月,上海迪士尼开园,DT财经推出迪士尼系列专题报道,对于“吃喝玩乐买”进行了详细的总结,通过搜集整理相关数据,制作了多种信息图表。2016年6月13日,专题文章《这份上海迪士尼乐园攻略,专攻周边吃喝玩乐》介绍了迪士尼周边商圈的情况。通过前期商家数据爬取,再结合地图,制作出动态的GIF图,清楚地让受众了解商圈信息。这样的表现形式相对于纯粹的文字叙述或者表格展现具有更加直观易懂的特点,把复杂的信息聚集在一张数据图中(图4)。
2015年11月22日,中国和东盟10国政府,正式签署中国—东盟自贸区(CAFTA)升级谈判成果文件,推动了《区域全面经济伙伴关系协定》(RCEP)和亚太自由贸易区(FTAAP)的谈判。亚太地区有这么多贸易协定要谈,彼此都是啥关系?DT财经通过这张关系网清晰地展现出了各个国家、各个协定的关系网(图5)。
图5 亚太地区自贸协定关系网
交互性作品可能要经历包括数据采集、数据挖掘、数据分析在内的一系列复杂数据处理,然后由设计师设计一种特殊的表现形式,这种形式不同于静态的数据图,而是动态的、实时的,以及允许交互的。这种数据新闻需要内容产品经理、设计师、程序技术员等协同工作,受众通过这种特殊的形式更好地了解其他形式难以表现的含义。
《我获得一份生活体验账单,你也来试试》是用北京和上海的生活各项成本做的一份H5作品,用户可以看到两个城市的平均工资和白领工资,以及房租、餐费、交通费等各项支出,最后判断出自己处在一个什么生活水平。以上实践比较好地做到了内容和形式的紧密结合,打造出良好的用户体验。
尽管国内的交互制作水平还不及国外一些优秀的新闻机构,但是我们已经看到了这种形式未来的发展前景,加上中国现在大数据的迅速发展,数据可视化的应用价值、多样性和表现力,促使更多新闻从业者不断创新,结合不同的专业背景,创造出更多更好的作品满足大众。
众包思维,与其他领域数据团队协同进化
无论是工业制造领域还是消费文化领域,中国都具有较好的数据条件,而在商业环境和传播环境变得日益复杂的现在,如何利用不同领域的大数据来处理问题将会非常必要。这个时候就需要不同领域的专业人员协同合作,打破行业与技术的壁垒,让数据的价值流动起来。DT财经不仅想自己做数据新闻,还想让更多人参与进来,DT财经提供一个平台,通过这种以众包思维为主要特点的理念来进行数据新闻的操作。
2016年6月,DT财经举办了“寻找数据侠”的线下活动,邀请各行业对数据有研究、有兴趣、有独特见解的人,让他们自由表达对数据的各种观点与看法,DT财经在自有APP、微信公众号等渠道开通了“数据侠”专栏,为“数据侠”的优质内容提供传播渠道。通过持续提供不同领域的数据化内容,让数据有温度,更加人性化,为用户提供一个有价值有温度的数据内容入口。
《一条数据狗的上海买房攻略》展示了2015年以来上海房价的增长趋势,作者为一位阿里云数据可视化工程师,这篇数据新闻利用大数据解释了上海高房价背后的一些故事。图6中的红色代表2015—2016年房价增长20%以上的区域,蓝色代表增长20%以下的地段。文章通过数据分析向受众介绍了哪里的房子好卖、哪里的房子涨得快、高房价背后的建设量、租房的分布、政策对房价的影响等问题。
图6 2015—2016年上海房价增长数据
为了让用户获得更好的阅读与交互体验,DT财经有专门的编辑人员对“数据侠”创作的内容进行再编辑,让其更加符合数据新闻的要求。除了与个人“数据侠”合作,DT财经还与第三方数据机构合作,利用其提供的大数据资源进行新闻内容生产。2016年5月,DT财经与地理大数据服务商GeoHey合作推出了《铁路大调图》系列专题报道,利用32万条12306的数据进行分析。铁路运行图调整这种新闻,往常基本就是便民信息和一些新闻通稿,但是通过大量数据的整理与分析之后,发现了一系列铁路运行调整背后所反映的区域经济和人口变化情况,这是传统新闻报道难以挖掘到的新闻点(图7)。
图7 京沪高铁小站车次统计
把这些新闻点整理出来之后,DT财经做出了三篇系列文章《12306数据告诉你:“铁路新势力榜”中,北上广深居然要重新排序!》《32万条数据揭示:高铁争夺战尘埃落定,哪些小城是真正的赢家?》《32万条铁路数据揭示:那些地域鸿沟和偏见,十年来未曾改变》,结合地方城市历史与现状分析了当下中国经济和人口流动的密码。
响应碎片化时代,打造独特的阅读体验
移动互联网的发展已经把人们带入碎片化时代,传播技术的发展决定了传播方式的变革,在新的技术环境下,落后的传播方式和传播理念早晚会衰弱的。用户的碎片化阅读方式呼唤新的移动端产品。DT财经无论从媒体产品形态还是其内核特征上,都具有鲜明的创新性,是典型的新媒体,是一个基于数据新闻价值挖掘并形成新闻信息产品的平台。
DT财经对时代回应的特点就是APP的“卡片式”模式,每一篇文章有不同段落,用户可以对每一段落点赞、分享。考虑到大量读者对图片的印象比对文字更加深刻,DT财经的客户端为每一张图片都增加了分享按钮,这样图片可以摆脱文本,独立完成“病毒式”传播。不仅如此,还为用户提供了多种不同的图片修改模板,每一个用户都可以自行输入文字评价图片内容,使这些图片的分享效果更加个性化。这样基于每一段文字、每一张图片的自定义分享功能具有很强的独创性。
DT财经的进化方向
大数据时代是一个令人兴奋的时代,数据新闻想象空间巨大,技术的力量、科学的思维、艺术的表达方式将有可能在这里实现高度融合。
传统新闻报道写故事讲道理,用的是有代表性的个案,偶尔用一些小样本的定量分析。信息与通信技术的发展,为记录社会的各种行为提供了新的技术条件,而新技术呼唤新闻操作层面的全新方法论。数据新闻的广泛发展可能将是新闻进化史上一个重要的转折点。
数据新闻来源于调查新闻,具有调查新闻独立、深入、细致、全面的特点。DT财经作为一个数据新媒体,本质上是力图成长为一个将数据进行可视化、新闻化、产品化解读和呈现,最终实现其商业价值和社会价值,为IT时代到DT时代的商业逻辑设计创新奠定基础的创新性产品。
未来,DT财经将担任起数据时代新媒体探索的先头兵,使用更多的技术手段与呈现方式,在数据新闻领域做更多深入摸索,做一个忠于历史的记录者。DT今后不仅会专注于数据分析与可视化,更会重视培养如何讲好中国故事的能力,提供一个有价值的数据内容入口,还会聚集数据人、数据报告、数据公司,成为大数据产业链上连接各方的新媒体平台。
作者系DT财经主编