从数据来源看财新网与西方媒体数据新闻差异
2019-12-05申金鑫
申金鑫
【摘要】近年来,国内数据新闻取得了飞快发展。其中,财新数据新闻中心自成立以来发布数百件优秀作品,在国内外屡获殊荣。作为国内媒体在数据新闻领域的优秀代表,财新网出品的数据新闻与西方媒体在数据来源、可视化方式、技术手段等方面存在着诸多差异。本文将主要从数据来源角度分析财新网与西方媒体数据新闻的差异。
【关键词】财新 数据新闻 数据来源
数据新闻作为“舶来品”,在中国的发展时间只有短短不到十年。许多人对于数据新闻最初的印象或许还来自于《新闻联播》里的“数字两会”,主持人一改往日的严肃表达,而是用颇为生活化的语气将一个又一个两会相关的数据向观众们娓娓道来。如今,经过近十年的发展与技术的快速更迭,数据新闻已经落地生根于中国的纸质媒体、电视广播、网络门户甚至还有各新媒体平台的自媒体大V。
目前,国内的数据新闻领域涌现了诸多优秀的数据新闻案例。如四大门户腾讯、新浪、网易和搜狐的数据新闻专门栏目——《数据控》《图解天下》《数读》和《数字之道》;传统媒体新京报的“图个明白”和“有理数”;新华网“新华炫闻”客户端的“数据新闻”……其中,财新数据新闻中心自成立以来发布数百件优秀作品,在国内外屡获殊荣。财经数据新闻的融合创新曾入选 2017中国应用新闻传播十大创新案例。《星空彩绘诺贝尔》入围英国 Information Is Beautiful Awards(数据视觉化大奖),开创中国程序员获得新闻类奖项之先。2018年 6月 1日,财新数据新闻中心凭借《高铁 6小时能到的地方,你想去哪个?》在全球编辑网络主办的 2018年数据新闻奖中获得最佳数据新闻团队、年度可视化作品奖和微软公共选择奖三项提名,并最终荣获“2018年度全球最佳数据新闻团队奖”,这也是中国媒体首度获得这一重磅奖项。
一、财新网数据新闻数据来源研究
此次研究中,为了便于后续的分析和研究,在总结前人研究方法的基础上,将财新网数据新闻的数据来源分为政府网站、数据公司、行业网站、公开资料、公开报道以及财新报道六大类。其中,来自教育部、科技部、央行等政府单位的数据,统一划入政府网站类别中;来自同花顺、知微数据等数据提供商的数据,统一划入数据公司类;将易居研究院、豆瓣电影等专注于行业信息发布的网站提供的数据,划入行业网站类;将来自维基百科、上市公司年报、科研学术机构报告等渠道的数据,划入公开资料类;将财新网引用的其他媒体报道划入公开报道类;财新网自身的报道资料和数据,以及财新网联合其他企业、机构进行收集、统计、分析的数据,统一划入财新报道类。
在对 2017年 3月 1日—2019年 2月 28日,财新网“数字说”频道的新闻进行逐条梳理,并去除了其中的转载新闻以及非数据新闻的条目后,共收集到 344条数据新闻。经过统计分析,发现在这344篇新闻中,有 59篇报道中采用了财新报道数据,占比 17.15%;采用政府网站数据的有 120篇,占比 34.88%;采用行业网站数据的有 52条,占比 15.12%;采用公开报道和公开资料数据的有 157条,占比 45.64%;采用数据公司数据的有 63条,占比 18.32%。(一些报道会同时选用不同类别的数据来源,只要所统计的数据来源在报道中被使用,便计入篇章数中。)
可以看出,在数据来源上,财新网数据新闻以政府和非政府机构网站、公开资料、既有报道为主。其发布的时效性数据新闻多为对政府或非政府机构发布的数据的可视化呈现;另有部分数据新闻是财新网与其他企业或机构合作,进行数据收集后,制作而成,但这类新闻制作周期较长,且数量极少。在进行数据新闻制作的时候,财新网很大程度上依赖二手数据,而未能充分进行一手数据的采集,使用大数据的技术对数据进行挖掘的案例也比较少。
例如,在 2019年世界湿地日这一时间节点,财新网推出了可视化数据新闻作品《来自“地球之肾”的警报》。这篇作品中,所有数据均来自于拉姆萨尔公约(ramsar.org)、湿地中国、联合国环境署世界保护监测中心、第二次全国湿地资源调查报告和《中国国际重要湿地生态状况白皮书》等公开渠道。虽然画面制作精细,且呈现方式非常清新独特,但是在数据获取方面仍处于比较初级的阶段。又如,2018年财新网数字说栏目推出的可视化互动新闻作品《高校师生关系调查》,以发放调查问卷的方式对高校师生关系进行调查,在一个月的時间里,收回了 384份问卷。这是财新网在数据收集上的一次主动尝试,但是问卷的体量相对较小,且问卷调查这种方式的效率也不是很高。这与新闻作品的制作周期和技术团队的整体实力也有一定的关系。相信随着财新网数据新闻团队的成熟和壮大,在数据获取方面也会有更进一步的提升。
二、西方媒体数据新闻数据来源研究
相对而言,西方媒体在制作数据新闻时的数据来源更为多元。虽然他们自己采集的数据仍然是新闻中的极少数,但是在引用数据方面,除了政府网站、公开资料/报道外,还大量选用社交媒体的用户数据。相比而言,国内媒体的数据
新闻作品中,对于社交媒体用户数据的挖掘还非常不够。《纽约时报》的数据新闻团队就多次通过统计社交媒体用户的数据,创作出令人眼前一亮的数据新闻作品。反映球队粉丝在美国各州分布情况的《棒球民族地图》,以及反映 NBA球迷在北美分布的《NBA北美粉丝地图》等都是《纽约时报》数据新闻的经典之作。值得一提的是,他们在分析处理数据的时候,还通过一定的算法对社交媒体数据可能存在的误差进行了排除,而且,经过算法处理过的数据与大型民调结果有着高度的一致性。
在 2019年全球数据新闻奖的提名作品中,被提名为年度创新奖的德国数据新闻作品《Radmesser》为了探究汽车在超车时与旁边骑自行车的行人之间的距离而专门组建了一个由由记者、物理学家和机器学习专家组成的团队。该团队设计了一个应用程序和传感器,并把它们分发给 100位志愿者。经过两个月的数据收集和三个月的数据可视化分析,该团队于 2018年 12月公布了研究结果。研究发现,在 13000多公里的有记录的距离中,发生了 16700次汽车对自行车的超越,其中 56%是非法的(汽车与自行车距离过近)。我们看到,西方媒体在数据获取的过程中,不局限于调研、问卷等传统的获取方法,且更为频繁地使用最新的技术来实现数据的精准获取和收集。不过,这与项目强大的资金实力也不无关系。Medieninnovationszentrum Babelsberg为该项目提供了资金的赞助。目前的信息显示,财新网等国内媒体在制作数据新闻时,接受的除广告之外的社会资金支持非常有限。
三、社会环境对数据来源的影响
此外,欧美国家在数据的开放性方面也优于我国,这为其国内媒体数据新闻的数据来源提供了重要的基础。2009年,时任美国总统奥巴马签署了《开放政府令》,并建成数据门户网站(data.gov),人们可以从这一网站上查询到关于就业、医疗、环境、教育等领域的数十万项政府专用数据。一时间,全美掀起了“数据民主化”浪潮。这些开放数据为数据新闻制作者们提供了天然的养料。他们从庞大的数据库中挖掘到有用的信息,并将其加工制造成为丰富有趣的数据新闻作品。
近年来,我国中央政府也多次提到要进行数据开放。复旦 DMG实验室发布的《2018 中国地方政府数据开放报告》显示,我国的政府数据开放平台建设呈现出从东南沿海地区向内陆地区不断扩散的趋势。目前,山东省、广东省和长三角地区地方政府开放数据的积极性较高,但是,全国各地法规政策中对于开放平台建设、数据标准管理、开放数据标准和推动利用等方面的要求存在着较大的地域差异。可以想见,在不远的未来,随着我国政府数据的进一步开放,数据新闻将迎来围绕着数据来源的新一轮快速成长。而届时,能否掌握从庞大的数据库中提取具有新闻价值的部分,将成为各数据新闻制作团队的竞争焦点。
参考文献:
[1]Albert-László Barabási.Bursts: The Hidden Pattern Behind Everything We Do[M].Plume Books ,2012.
[2]陈莎.国内网络数据新闻发展中存在的不足——以网易、新浪、搜狐数据新闻为例[J].声屏世界,2016.
[3]孟笛.开放理念下的新闻叙事革新——以《纽约时报》数据新闻为例.新闻界,2016(3).