“数据新闻”发展与“数据新闻”教育
2014-03-04沈浩谈和文蕾
沈 浩 谈 和 文 蕾
“数据新闻”发展与“数据新闻”教育
沈 浩 谈 和 文 蕾
数据新闻作为一种跨学科的新闻报道方式,正成为全球新闻界热议的话题。本文通过分析新闻报道方式的演变来研究数据新闻的产生和发展,并在此基础之上,就如何开展数据新闻教育与培训展开讨论。
数据新闻;精确新闻学;计算机辅助报道;可视化
数据新闻(Data Journalism),又称数据驱动式新闻(Data Driven Journalism)。数据新闻的概念起源于西方媒体的实践,诸如《纽约时报》《卫报》都是最早的实践者,有着众多优秀的数据新闻作品。2010年8月在阿姆斯特丹召开的第一届国际数据新闻圆桌会议第一次将这一概念拿到业界探讨,会议讨论了这个新兴领域发展的可能性、所需的工具、工作流程以及发布的方式。2011年在伦敦的Mozilla大会(Mozilla Festival)上,来自多个新闻机构的数据新闻倡导者以及业余爱好者,共同创作了《数据新闻手册》一书,将专家们对于数据新闻的理解,以及各媒体做过的尝试都写于书中,以知识共享的方式在互联网上供大家免费阅读。在国外,无论是业界还是学界,都对这一新兴领域表示了肯定和支持,比如2012年谷歌与全球编辑网合作设立了首个国际数据新闻奖,用以鼓励数据新闻领域的探索和实践;还有纽约大学、哥伦比亚大学以及加州大学伯克利分校等都开设了与“数据新闻”相关的课程。2013年,中文版的《数据新闻手册》在网上面世,数据新闻的概念首次以中文的形式在国内传播。2014年春节期间,央视新闻的“数据说春运”和百度的“春节人口迁徙图”让人们眼前一亮,“数据新闻”迅速成为国内新闻界热议的话题。2月19日,千龙网发布了一张信息图“习主席的时间都去哪儿了?”,对习近平主席上任以来的出行记录进行统计和可视化的展现,吸引了大量网民的关注。于是,国内众多主流媒体都纷纷启动了“大数据报道两会”的数据新闻实践。
一、国内关于数据新闻的研究
相比业界的积极实践和创新,国内学界从2013年开始出现研究“数据新闻”的文章。笔者以“数据新闻”为主题关键词在中国知网内进行搜索,2012年有3篇搜索结果,但都不是本文要讲述的“数据新闻”概念;2013年有26篇,清华大学的李希光教授和张小娅博士通过介绍《数据新闻手册》一书,最早在学术界对“数据新闻”的概念、意义以及应用实例进行了介绍,并认为数据新闻是“在数据时代精确新闻的发展”。西南政法大学的郭晓科教授也认为数据新闻是“精确新闻学的进一步延伸”①。人民大学的方洁老师,综合国内外关于数据新闻的文献,对数据新闻的概念内涵和特征进行了详细的阐述,并在比较数据新闻与精确新闻、计算机辅助新闻报道、可视化三个概念之间的区别时,认为数据新闻“这一新的新闻领域与新闻学其他领域之间存在着一定的历史延续性,它不是无根之木,而是基于已有的学科基础发展形成的”②,但这种观点侧重于比较数据新闻与三个概念之间的区别,并没有对数据新闻与三个概念之间的继承和发展关系做过多的阐述。北京交通大学的文卫华老师也认为,“数据新闻并非一种全新的形式,它与精确新闻、计算机辅助报道之间具有密切的联系”③。
数据新闻作为大数据时代最热的新闻形态,被一些学者认为是“大数据时代新闻生产的核心竞争力”,也被认为是“全球新闻界的新宠”,就连“互联网之父”蒂姆·伯纳斯·李(Tim Berners-Lee)都说“数据新闻是未来”。复旦大学的陈沛芹博士在研究美国新闻报道方式的演变时,认为新闻报道是“在特定时间特定社会中受到各种政治、经济、文化、技术因素综合作用的产物”④。数据新闻产生在“大数据”时代,从字面上来看,这其中必定有一定的联系。但是学界对于数据新闻的产生,只是简单地从信息爆炸、数据海洋等角度来进行介绍,并没有对数据新闻产生的社会环境、媒体环境、技术环境做详细的论述。笔者认为信息过剩的媒介环境和可视化技术的发展对于数据新闻的产生具有重要的作用,正如人大彭兰老师说的“大数据技术加速了数据新闻的发展”,“通过信息图等手段对已经拥有的数据进行更好的呈现与解读……是通往数据新闻方向的必由之路”⑤。
数据新闻在业界和学界并没有一个明确的定义,学界和业界多半是从数据新闻的生产过程来对其进行描述。《数据新闻手册》里曾给出一个简单的定义:用数据报道新闻⑥,道出了数据对于数据新闻的重要性。人大的方洁老师总结的狭义数据新闻内涵为“基于数据的抓取、挖掘、统计、分析和可视化呈现的新型报道方式”,为数据新闻做的注脚是一种“新型报道方式”,也是从数据新闻的生产过程下的定义。虽然关于数据新闻并没有一个确切定义,但是关于数据新闻的特征和形态,学界的认识和总结却是基本一致的。
从学界的研究我们可以看出,数据新闻的产生与精确新闻学、计算机辅助报道具有继承和发展的关系,但同时社会环境、媒介环境和技术的发展也为数据新闻的产生创造了条件。
二、数据新闻发展
1.数据新闻与精确新闻学:报道理念的一脉相承
20世纪60年代,美国新闻报道方式的发展有两个趋势,一个是新新闻主义⑦,试图通过文学性的表达方式来弥补客观新闻报道方式的不足;另一种与之相对的趋势,则是偏向科学性,主张运用科学的方式和手段来收集数据和分析数据,从中得出事件的真相,这种新闻报道方式被称为“精确新闻学”⑧,其创始人为美国记者飞利浦·迈耶(Philip Meyer)。精确新闻学的出现,是对新闻报道的准确性和客观性的追求,它要求记者通过使用社会科学的方法和手段,诸如调查法、内容分析法、田野调查等,以保证新闻的准确和客观。而精确新闻的这一追求,数据新闻同样有所继承,王斌先生认为数据新闻“从关注社会表层现实到发掘社会深层现实……在一定程度上改进了客观性的具体践行方式”,数据新闻同样是用科学的手段和方式去获取数据,并用科学的理论去分析数据、挖掘数据,最后得出事件的真相。
迈耶作为精确新闻学的创始人,他的成名之作,也是让精确新闻得到社会认可的一个标志,就是1967年其为《底特律自由报》做的关于底特律种族动乱的报道。当时报社记者以及民众对于种族骚乱的解释,普遍认为骚乱者是社会经济底层的人,由于发展的机会和表达的空间受限而通过骚乱的方式表达不满。但是,在迈耶的报道中,他使用了社会科学的研究方法,将参加骚乱和没有参加骚乱的人的社会经济地位做对比,最终发现结果并非人们所预料的那样,社会经济地位并不是导致参加骚乱的原因。迈耶因为这个调查获得了当年的普利策奖,也让精确新闻学的理念为社会所接受。
同样作为研究社会骚乱的新闻——英国《卫报》所做的关于伦敦骚乱的报道,也让《卫报》获得了首届数据新闻奖的奖项,并成为数据新闻的代表作。伦敦骚乱在英国政界看来是由于Facebook、Twitter等社交媒体对谣言的传播和对民众的煽动。然而《卫报》的记者通过收集法院和地方政府关于骚乱的数据,使用地图显示骚乱发生地与该地贫困程度的对应关系,一定程度上证明了骚乱与贫困的相关性。同时,研究者还对Twitter上的内容进行内容分析,最后得出Twitter并非只是传谣,它也对谣言的纠正和街区秩序的恢复起到了重要作用。
通过上面两个例子我们可以看到,精确新闻严谨科学的精神在数据新闻上也得到了充分体现。只是在数据新闻所处的时代,数据获取方式解决了精确新闻费时费力费成本的问题,数据处理方式在电脑技术的发展下变得更加轻松可靠,丰富的多媒体可视化展现形式解决了精确新闻深奥、枯燥、可读性差的问题。
2.数据新闻与计算机辅助报道:传播技术的继承和发展
陈沛芹认为“在新闻报道的发展历程中,技术的应用不仅在早期报纸的发展中,在现代报道方式的形成中起到重大作用,今天技术更成为一种核心的因素,促使新闻报道方式发生革命性变化”⑨。计算机和互联网技术,从诞生之初,便一直影响并改变着我们的新闻报道方式。
早在20世纪50年代,计算机刚刚出现不久。记者们就把这种“高效”的计算机器用来处理政府提供的数据库信息,并用来制作调查性新闻。60年代,随着精确新闻学的发展,计算机被用来处理、分析记者收集到的数据。70、80年代,随着PC机的普及和各种商业、政府数据库的开放,以及互联网技术的诞生和发展,计算机职能范围日益扩大,被新闻工作者们用来收集信息和处理信息。到了90年代,商业网络开始发展,计算机和互联网开始普及,这时计算机开始成为媒体工作者在工作中不可或缺的工具,而互联网也作为一种媒介形式,开始进入到大众的生活中。
早在20世纪80年代,国外一些高校已经与时俱进,开设了CAR(Computer-Assisted Reporting)课程,课程内容包括如何运用计算机进行文字处理和编辑,还有如何利用数据库、互联网等资源发现和制作新闻。如今,随着计算机和互联网技术的发展,我们不仅离不开计算机和互联网,我们还即将进入物联网时代,虚拟世界和现实世界的界限将越来越模糊。
在20年前,计算机辅助新闻报道需要掌握的工具是:电子数据表、数据库管理软件、上网软件、字处理软件、统计软件、图像制作软件以及制作用户界面的软件等⑩。在今天,电子数据表、上网软件、字处理软件已成为计算机基础技能,而新闻专业的在校生也多少会接受图像处理软件和非线性编辑等专业技能的学习。数据新闻“生产过程更为精细化,它对新闻工作者的技能要求除传统的文字写作、音视频制作外,还包括社科研究方法、计算机数据抓取、处理、可视化、平面/交互设计、计算机编程等多个领域(11)”,其需要从业者掌握更多的计算机技术。因此在国外,数据新闻团队往往集合了记者、编程人员、设计人员、数据分析人员等,而具备这些能力的复合型人才或团队在未来媒体中的作用愈发凸显。
从技术在新闻报道中发挥的作用来看,我们认为数据新闻是计算机辅助报道在新的媒介环境下的继承和发展,只是在30年前,我们强调的是计算机能力在新闻报道中的重要作用;而现在,计算机能力已经成为信息社会的基本技能,新闻报道对计算机技术的运用提出了更高的要求。但比起技术对新闻报道的重要性,数据新闻更强调从数据中发现新闻价值的重要性。若把数据新闻理解成一种基于数据的抓取、挖掘、统计、分析和可视化呈现的新型报道方式,那么笔者认为数据新闻的每一个环节都要采用计算机技术,并且计算机的功能不可替代。
3.数据新闻与“大数据时代”:信息爆炸与可视化
回顾新闻报道发展的历史,我们会看到,新闻报道“也是在特定时间、特定社会中受到各种政治、经济、文化、技术等因素综合作用的产物”。放眼当今的社会环境,笔者认为促使数据新闻产生的社会背景,一个是信息生产方式的变化,一个是信息展现技术的发展。
社交媒体的兴起,带我们进入“自媒体”时代,信息的生产方式改变,信息的生产速度加快,这给我们带来诸多问题。信息生产方式的改变,要求新闻不能够仅仅是“对新近发生的事实的报道”,在“人人都是麦克风”的时代,受众有时会比记者更早了解到新闻事件。面对海量的信息和纷繁的线索,新闻记者往往会被表层的现象和碎片化的信息迷惑,因而难以发现事件背后的真相。为了解决海量数据信息给新闻记者带来的困难,数据新闻应运而生。“与记者在某一个视野有限的观察点上对事物进行的观察与分析不同的是,有效加工的大规模数据可揭示更大范围内的或更接近事实的情状”(12)。通过对海量数据的挖掘,数据新闻有助于我们从纷繁的信息中,深入全面地了解事情的真相,从而在及时性不占优的情况下,依靠报道的准确性和深入性来树立专业性。
海量信息伴随的是信息过剩给人们带来的困扰,于是在各种信息的狂轰滥炸中,人们寻求一种既能获取信息,同时又能使信息的获取不那么痛苦的方式。这种情况下,信息可视化受到人们的追捧。信息可视化最早是在1989年由斯图尔特·卡德、约克·麦金利和乔治·罗伯逊创造出来的,用以减轻抽象信息和庞大数据带给受众的认知压力(13)。信息可视化来源于几个交叉学科:平面设计、网页设计、计算机图形学、用户交互等。
可视化在数据新闻的具体操作中,有两方面的作用:洞察数据和传达数据。可视化“是进行数据分析的第一个战场,可以揭示出数据内在的错综复杂的关系,在这一点上可视化的优势其它方法无可比拟”(14)。数据是抽象的、复杂的,通过颜色、位置、大小或几何形状等可视化方式,我们可以将数据的不同维度用一种直观形象的方式表现出来,对图形的解读有助于我们从数据中挖掘出新闻价值。可视化在这个过程中的作用,就是将我们不擅长的对抽象数据的理解,用我们更擅长的对图形的认识来进行转换。正因为可视化拥有这种能够直观地传达信息的能力,因此数据新闻最后的呈现才往往会选择可视化的表现形式。从目前来看,数据新闻领域的可视化表现形式主要有传统的静态信息图(infographic)、交互式信息图(interactive infographic)和动态信息图(Motion Graphic)。“信息可视化可以将枯燥的信息和数据转换成美丽、能给人深刻印象并且有意义的图形”(15)。
综上,我们认为数据新闻是新闻报道方式随着社会、经济、技术等因素的发展,在信息日益丰富和可视化技术日益成熟的当今社会所产生的一种报道趋势。数据新闻强调数据获取时的准确性,数据分析时的科学性和报道结论时的开放性,这是对精确新闻学追求客观准确的新闻报道精神的继承和呼应。同时,它又超越了计算机辅助报道的概念,更加强调的是数据对于新闻报道的重要性。社会化媒体的兴起,越来越多的开放数据和日益更新的信息生产成为孕育数据新闻产生的沃土,可视化技术则是让它发展成长的阳光雨露。尽管如此,数据新闻仍然属于新闻学发展的一个分支,仍然担负着传播信息、监测环境以及社会整合等功能。
三、数据新闻教育
数据新闻正在成为国内外新闻界热议的话题,包括精确新闻学创始人菲利普·迈耶在内的很多专家学者都很看好数据新闻的前景。央视“数据说春节”的示范作用,让国内众多媒体、门户网站纷纷投入到数据新闻的实践中来。于是,如何在新闻媒体内部开展数据新闻培训,组建数据新闻团队;如何给在校的新闻系学生开设数据新闻相关课程,成为既现实又紧迫的问题。
1.在职记者培训和组建数据新闻团队
“采、写、编、评”是传统的新闻生产流程,而新闻机构若想推行数据新闻,首先要了解数据新闻的生产流程。数据新闻记者Lorenz认为数据新闻的工作流程是:获取数据、清洗数据、挖掘数据,可视化地呈现数据并合成新闻故事(16)。这与传统的新闻制作流程有着明显的不同,传统新闻的“采”是记者对客体进行观察、询问、倾听、思索和记录的过程,是一个主观探索的过程;数据新闻在确定了新闻选题之后,虽然第一步也是收集数据,但收集的都是网上公开的内容或是开源的数据库,这需要记者会使用一些互联网搜寻工具,掌握一定的搜索技巧;对于那些非现成的、需要人工去处理的数据,我们需要借助爬虫抓取或是编程的技术来解决,比如如何从大量的PDF文档中提取有用的数据。在数据获取之后,要想获得数据内部隐藏的有价值的信息,用收集的数据解答我们之前提出的新闻问题,我们必须拥有一定的统计常识,或掌握一定的数据分析能力。在得出结论之后,记者需要运用自己擅长的写作能力将结论写成新闻故事,并与设计人员商议如何运用可视化的形式将结果展示出来,若要放到网站上,还需要后台维护人员和前端网页设计人员的参与。
因此,在职记者要转型成为数据记者,除了需要具备写作、调查、解读数据、制图等基本业务能力,还需要在后期的培训中熟悉数据新闻的整个制作流程、常用工具等。在数据新闻的制作过程中,传统记者的功能并没有被弱化。从选择选题到结果呈现,记者的角色贯穿始终,并且要求他们了解编程人员、数据分析人员、设计人员和网页开发人员的工作,以便能够引导他们一起完成数据新闻报道。
参考国外的数据新闻实践,一个完备的数据新闻团队,一般由数据记者、信息设计人员、编程人员和数据分析人员组成。工作流程是:确定选题、收集数据、挖掘数据、编辑数据、制图、成稿展现。在这个过程中,团队成员相互配合,工作有所交叉。在跟媒体朋友的交流中我们了解到,数据新闻在媒体内部的实践过程中,经常遇到的问题是团队内部成员之间,由于知识背景不同导致交流出现障碍,无法理解对方的想法和意见。解决这个问题的办法,就是通过培训让记者、设计师或研发人员相互学习、相互了解,不断增加对彼此专业领域的熟悉和了解。
2.新闻系学生的数据新闻教育
传统的新闻专业教育,主要以文科类课程为主,主要培养的是学生采写编评等新闻基础素养和能力。而在大数据时代,新闻专业的学生需要掌握更多的专业技能。哥伦比亚大学的Tow Center在2012年4月收到20亿美元的资助,以支持该中心数字新闻学(Digital Journalism)的研究工作。在他们发布的“后工业时代的新闻”(Post-Industrial Journalism)(17)这份报道里,提出后工业时代记者应该具备三项软技能和六项硬技能,其中这六项硬技能为:(1)具备专业知识,成为专家型记者;(2)熟悉数据和统计知识;(3)了解用户分析工具,更好地理解受众;(4)熟悉基本编程知识;(5)会讲故事;(6)懂项目管理。
从这份报道里我们可以看出,在大数据时代,数理统计、计算机编程等理工类课程也应纳入到新闻教育课程体系中来。高雁老师在反思大数据时代的新闻教育时,也认为新闻专业课程里应该增设如“网络新闻”“计算机辅助报道”“数据挖掘”“新媒介基础技巧”“新媒介先进技术”“数据可视化”等课程(18),而且在条件允许的情况下,还应该建立“新媒体实验室”等让学生进行实践。
国外一些高校已经开设了数据新闻课程,比如纽约大学的小数据新闻(Small Data Journalism),教授学生处理数据的技巧和可视化的制作方法;纽约大学新闻学院还开设了一门在科学、健康、经济等领域如何制作数据新闻的课程(Data Journalism at SHERP),教授学生如何制作数据图表、基础网页制作、数据探索、地图制作、相关专业术语、开源的制作工具以及AI等制图软件的操作等。国内高校里,香港大学新闻学院也开设了数据新闻课程,教授学生如何查找和询求信息,学习基本的计算机辅助报道技能,并增加了数据可视化、社会网络分析等新兴技术。
数据新闻作为一种跨学科的新闻生产方式,秉承了精确新闻学准确客观的精神,同时更加依赖计算机来进行辅助报道,因此笔者认为,数据新闻教育应在原有新闻业务基础之上,根据学生的兴趣,有选择地开设以下几门课程:(1)社会科学研究方法:掌握诸如调查法、内容分析法等科学的研究方法;(2)数据分析:要求学生掌握基础的统计学知识,会使用如SPSS等数据分析工具对数据做最基本的分析;(3)视觉设计:包括PS、AI等制图工具的使用,以及HTML、JS等网页编程基础;(4)计算机编程:了解计算机编程原理,掌握一门如Python或R之类的编程语言,能够运用编程语言从互联网上抓取简单的数据。
四、结语
美国圣地亚哥新闻与媒介研究学院的Amy教授在2013年年末对新闻业的预测中说到,2014年,数据驱动的新闻报道和新闻故事将在新闻业扮演更加重要的角色,并道出了数据新闻领域未来的五个趋势(19)。我们可以看到“数据新闻”已经不仅仅是新闻业里的热门话题,而且已经成为一个核心关键词。大数据改变了我们的生活,同时也创造了全新的新闻传播形式、改变了大众媒体。从新闻报道方式发展的历史来看,数据新闻正是新闻媒体对大数据时代作出的一种回应。
注释:
① 李希光、张小娅:《大数据时代的新闻学》,《新闻传播》,2013年第1期。
② 方洁、颜冬:《全球视野下的“数据新闻”:理念与实践》,《国际新闻界》,2013年第6期。
③ 文卫华、李冰:《大数据时代的数据新闻报道——以英国〈卫报〉为例》,《现代传播》,2013年第5期。④ 陈沛芹:《论美国新闻报道方式的演变》,复旦大学出版社2008年版,第99-100页。
⑤ 彭兰:《“信息是美的”:大数据时代信息图表的何值及运用》,《新闻记者》,2013年第6期。
⑥ Gregor Aisch等:《数据新闻手册》(中文),http://xiaoyongzi.github.io/web/index.html。
⑦ 李公昭、胡亚敏:《新新闻主义:六十年代美国文化的产物——兼论其与越南战争的关系》,《当代外国文学》,2002年第4期。
⑧ 程道才:《西方精确新闻学理论的内容及应用》,《当代传播》,2004年第3期。
⑨ 陈沛芹.:《论美国新闻报道方式的演变》,复旦大学出版社2008年版,第78-79页。
⑩ 卜卫:《计算机辅助新闻报道:信息时代记者培训的重要课程》,《新闻与传播研究》,1998年第5期。
(11) 郭晓科:《数据新闻学的发展现状与功能》,《编辑之友》,2013年第8期。
(12) 王斌:《大数据与新闻理念创新——以全球首届“数据新闻奖”为例》,《编辑之友》,2013年第6期。
(13) 刘迪:《网页中交互式信息可视化设计研究》,江南大学出版社2013年版,第1-2页。
(14) Gregor Aisch等:《使用数据可视化洞察数据》,《数据新闻手册》(中文),http://datajournalismhandbook.org/chinese/understand
ing_data_7.html#sthash.uRrKdpQ6.dpuf。
(15) 彭兰:《“信息是美的”:大数据时代信息图表的何值及运用》,《新闻记者》,2013年第6期。
(16) Lorenz M.Data Driven Journalism:What is There to Learn//Innovation Journalism Conference(IJ-7),Stanford,CA.2010.
(17) Anderson C W,Bell E,Shirky C.Post-industrial Journalism:Adapting to the Present:a Report.Columbia Journalism School,2012.
(18) 高雁:《大数据时代下的新闻专业教育反思》,《传媒观察》,2013年第11期。
(19) Amy Schmitz Weiss.Data-Driven Journalism Trends for 2014.http://digitalamy.com/2013/12/30/data-driven-journalism-trends-for-2014/.(作者沈浩系中国传媒大学新闻传播学部新闻学院教授;谈和系中国传媒大学新闻传播学部新闻学院硕士研究生;文蕾系中国传媒大学新闻传播学部传播研究院硕士研究生)
【责任编辑:李 立】