APP下载

数据新闻:定义、生产与展望

2018-09-20曾冲冲

河南教育·高教 2018年8期
关键词:数据新闻大数据人工智能

曾冲冲

摘要:数据新闻从一出现便是个热搜词语,国内外的学界和业界对其的定义也是多种多样的。数据新闻的出现和发展以互联网为背景、以大型的互联网技术平台为依托、以人工智能和大数据为核心技术,深刻地影响着新闻的生产和报道。面对数据新闻带来的巨大变革,传统的新闻媒体一方面要加紧技术的研发,一方面积极与各大技术平台展开合作,以寻求新的发展方式来适应新的环境。在这一过程当中要充分认识到数据新闻的优势和不足,从而在编辑记者、新闻伦理道德、专业主义与技术发展三者之间找到一个平衡点。

关键词:数据新闻;人工智能;大数据

数据新闻(Data Journalism)在今天早已经不是一个新鲜的词语了,但其热度依然不减。2013年和2017年分别是大数据和人工智能出现的元年,标志着这两种技术开始了产业化和商品化的应用。以互联网为基础,探索数据化、智能化发展成为了各大行业发展的趋势和目标,新闻行业也不例外。数据新闻在信息的挖掘、整理、分析和新闻的编辑、生成等各个方面的优势,使得新闻媒体纷纷向其靠拢,以求能在未来竞争中谋得一席之地。

一、什么是数据新闻

关于数据新闻,中西方学界的定义是多种多样的,我国对数据新闻的定义也多是借鉴或者延用西方学界的。西方学界对数据新闻最常见的提法是“Robot Journalism”“Robot Journalist”和“Algorithmic Journal-ism”,我们暂且将其称为“机器人新闻”“机器人记者”和“算法新闻”,这也是目前中国学界对数据新闻的几种主要称谓。

这种新闻的生产方式与传统的新闻生产方式最大的区别在于对数据非人为的处理和加工,所体现出的就是“计算机程序思维”,与人脑思维相比,在内容与效率上有巨大的优势。“智能新闻以‘机器思维处理文字和数据,完成新闻稿的写作与编辑,速度远远超过人类的大脑……这些新闻思维器没有机器人的模样。却以惊人的速度完成了令人震惊的新闻故事。”这段论述给出了数据新闻的另一叫法——新闻思维器。将新闻的这种生产方式定义为“新闻思维器”,其侧重点在于非结构化的数据的处理,传统的新闻生产主要依靠记者和编辑的人脑思维,而这种新闻生产方式则是靠“计算机程序思维”。

由此不难看出:同数据新闻一样,中西方学界对其定义的重点全部集中在了大量非结构化数据和对这些数据非人为的加工与处理上。所谓数据新闻,指的是基于大数据技术、人工智能技术,通过对历史信息和即时信息的高效处理,更具备归纳统计能力、可视化呈现能力以及更高新闻生产效率的新型新闻报道方式。由于数据在报道中的核心地位,又被称作数据驱动新闻。单从定义来看,“机器人新闻”“机器人记者”“算法新闻”“新闻思维器”都侧重对新闻生产过程或者技术手段的描述,而数据新闻的定义则是把重点放在了经过一系列的过程和技术手段之后所呈现出的新闻的可视化的最终结果。正如陆定一先生对新闻的定义,他将新闻归结为报道,即对新近发生的事实的报道,“数据新闻”这一定义也同样注重事实的呈现,而且“数据”一词不仅概括出了新闻的表现形式,还指出了新闻生产的技术手段。从这一层面理解的话,“数据新闻”这一定义是包含了前面所提到的几种定义的。

二、数据新闻产生和发展的技术支撑

数据新闻的产生得益于互联网技术的不断发展,大数据和人工智能的出现是其不断发展的关键所在。

数据新闻的来源是数据,大数据的意义和价值主要体现在一个“大”字,数据的“大小”决定了其价值大小和隐含信息的多少。但是当大量的数据汇集在一起的时候,这些数据就会呈现出一种非结构化的特点,其内容涵盖各个行业和领域,而且真假难辨。目前,我国很多互联网科技公司都建立了属于自己的大数据使用与研究平台,除阿里巴巴、腾讯、百度等一些综合性的大数据平台外,还有很多专业性的数据平台,如爱奇艺指数(爱奇艺网站的视频播放数据以及用户关注度等)、高德地图(全国交通情况的周期性报告)等。

大数据的分析和处理离不开人工智能技术的运用。人工智能技术发展到今天已经越来越为各国所重视,我国在2017年颁布了《新一代人工智能发展规划》,目的在于综合提高各个产业智能化的水平。谷歌在今年5月8号的开发者大会上推出了新一代的人工智能芯片——tpu3.0,据其CEO孙达尔·皮才透露,新一代tpu3.0性能是上一代tpu2.0的8倍,并且谷歌有可能采用最新的人工智能技术来为谷歌新闻提供支持。人工智能在新闻写作当中的应用主要是通过数据的分类、抓取,进而找到新闻线索,然后再将这些数据填充到事先编写好的新闻模版中去,这些工作往往会在瞬间完成。

三、数据新闻的采集、分析与生成

(一)智能化搜集

在信息的搜集上,数据新闻依托于人工智能技术支持下的各种智能产品的应用:无人机可以到达记者无法到达的地方去拍摄照片,并且呈现出不同的视角:语音合成技术可以快速地将音频转化为文字:视觉分析技术不仅能采集受访对象的面部信息,而且还能根据其面部表情的细微变化来推测出其可能会有的反应和情绪……早在2010年,英国《卫报》就开始了对数据新闻的应用:他们根据维基解密所披露的数据将伊拉克战争中的人员伤亡情况进行可視化的呈现(用红点标注在一张地图之上,每一个红点就是一次伤亡事件),在点击某个红点后地图上还会显示出来相对应的事件详细状况,最终红点的数量有39万个之多。这则新闻也成了后来英国从伊拉克撤军的一个重要原因。

(二)数据化分析

在对信息的分析上,数据新闻将数据库中汇集的大量非结构性、无目的的数据进行分类,进而能够发现一些传统新闻无法发现的新闻线索。比如,在加拿大《环球邮报》的一则报道《无据可依(Unfounded)》中,通过对事先搜集的整理过的大量信息进行有针对性的数据分析,并且把这些数据都以一个多维度的方式来进行点状的排列组合,发现了关于性侵案件的重要线索,最后向受众传递出一个信息:在所有的性侵案件中,加拿大的警察认为有近20%的指控都是毫无根据的,并没有出现相对应的犯罪事实。这则报道是《环球邮报》在对数据深入分析的基础之上形成的,各种数据的搜集和分析历时近两年的时间,并且在2017年的GEN数据新闻奖(Data Journalism Awards)评选中荣获年度调查奖。

(三)模板化生成

目前,数据新闻主要应用在财经、体育、自然灾害、重大会议等报道模式相对固定的新闻事件中,“根据它‘人工模板+自动化数据填充的内在设定,可以极为快速地向受众传递新闻事实”。而且,现在的数据新闻中报道模板的使用已经不再只局限于人工模板了,随着人工模板和数据新闻报道数量的不断增加,人工智能会对先前所使用的模板和发布的报道进行分析和学习,运用“计算机程序思维”来创造出新的模板以适应不同新闻事实的分析和报道。

四、数据新闻的前景与展望

各大互联网技术平台对于新型媒介技术的研发和运用由来已久,数据新闻所依赖的核心技术(人工智能、大数据)也大多掌握在这些平台手中。时至今日,传统媒体已经越来越重视与这些互联网技术平台的融合,但是怎么样融合,传统媒体如何跟上技术平台快速发展的步伐,仍是学界和业界要研究和思考的一个重要课题。

(一)互联网平台掌握关键技术

目前,有关人工智能和大数据的技术研发活动主要是由互联网技术平台进行的,国外如美国的微软、谷歌、亚马逊、Facebook等,國内如阿里巴巴、腾讯和百度等。这些技术平台在人工智能的系统、计算机算法、机器人学习、传感器研发等方面投入了大量的人力、物力、财力。2016年微软开始涉足人工智能技术的研发领域,组建了一个5000多人的团队,力图将自己公司的产品智能化:谷歌推出的“谷歌大脑”(Google Brain)计划中的人工智能技术具备自我学习技能,是世界范围内最大的中枢网络系统之一;2017年腾讯在贵州建立贵安七星数据中心,运用最新的T-block技术来存储核心大数据,并且为用户提供高端的云服务……除了这些比较大的技术平台,还有很多中小型的技术平台。这些平台的很多技术和数据来自于大的技术平台,它们的着力点在于为媒体提供一些基于人工智能技术的新闻产品。

(二)媒体与平台的融合

新闻媒体所使用的技术大多是从各大互联网技术平台引进过来的,这也是当下新闻媒体与技术平台融合的一个普遍做法。2013年,亚马逊首席执行官(CEO)杰夫·贝佐斯(Jeff Bezos)宣布收购《华盛顿邮报》,他表示被收购后的报纸依旧在为受众提供新闻报道。这可以看作新闻媒体与技术平台融合的一个典型案例——平台主动想新闻媒体输出技术。这种融合方式“让内容生产者扬长避短,专注于内容的生产,把新技术的研发外包给技术公司,用技术整合内容,依据技术路线的要求重组生产流程。就像当年报纸出版摒弃铅和火,启用光和电,由激光照排公司提供成套解决方案,重组出版流程”。这种融合方式与其他方式的区别在于:前者是用内容适应技术,后者则是用技术适应内容。技术的发展是二者融合的动力,但是技术新闻媒体仍然需要保持理性的态度,既要勇于尝试又要保证自己的独立。

(三)技术的引进

目前,新闻媒体对人工智能和大数据技术的引进与运用主要表现在机器学习、语言技术、语音转换技术、计算机视觉、新闻机器人和人工智能+VR报道等领域。以2018年的两会为例,新华社与阿里巴巴合作研发的“媒体大脑”正式上线,包括八项功能:“2410”(智能媒体生产平台)、新闻分发、采集、版权监测、人脸核查、用户画像、智能会话、语音合成。服务内容覆盖从线索、策划、采访、生产、分发、反馈等全新闻链路,让云计算、物联网、大数据、AI等多项技术为媒体赋能。此外,《人民日报》《经济日报》等多家新闻媒体也与百度联手,开辟出了针对两会各种议题的页面,涵盖了“提案提议”“两会前瞻”“两会知多少”等几大内容区域。

五、数据新闻存在的局限性

从目前人工智能和大数据技术的发展水平来看,数据新闻只能在报道模式固定、思维含量较低的新闻报道上有明显优势,在一些深度报道、调查性报道和解释性报道中,技术的运用只是辅助作用,记者和编辑仍旧是报道的主要力量。

清华大学李彬教授曾在其文章《新闻学若干问题断想》中指出:“所以,严肃认真的新闻记者无不把亲历新闻现场、把握新闻事实,把亲眼看、亲耳听、亲身感受、亲身经历等,视为新闻工作的天经地义或第一要义……”由此可见,编辑、记者深入实地采访调查,力图获取第一手资料的做法至今仍是无法替代的,而且由于生产自动化,数据新闻在真实性、客观性以及伦理性等方面都离不开人工的核查。离开了这一环节,数据新闻的真实性和客观性将无法得到保证,在对数据十分重视的美国“许多数据都是虚假的(如伊拉克有大规模杀伤性武器、向国际原子能机构提供虚假情报等)”。这充分说明了数据不等于真实,新闻报道不能仅仅依赖于数据。

在一些特定体裁的新闻报道中数据新闻的能力依然有限,如深度报道、调查性报道和解释性报道等。在这些体裁的报道中往往需要报道内容不孤立地呈现一个或一种新闻事件,要对报道的对象有一个多维度的思考,围绕一个主题全面立体地组织报道所需的材料,这些报道往往都会带有一定的倾向性(批判、引导、歌颂等),记者和编辑在这些报道中所运用的思考和判断以及我们现在所提倡的新闻专业主义和编辑记者的实践经历都是数据新闻无法替代的。各个孤立的新闻事件背后的因果联系也是数据新闻无法发现的,即使有大量翔实的数据,要想透过数据的表面现象来深度挖掘其背后隐藏的各种关系,也必须依靠编辑记者人工的筛选和分析,而不能只依靠大数据和人工智能技术。

六、结语

尽管数据新闻还存在一定的局限性,但是其对新闻生产和报道的积极作用是有目共睹的。传统的新闻生产方式必须积极应对人工智能和大数据带来的技术变革:编辑、记者需要摆正人与技术的关系,技术无论如何发展,它终归是为人服务的,是为了让各种不同领域的人更好地完成工作,所以编辑、记者仍然将是新闻报道中不可或缺的力量。但是,新闻媒体如何去应对数据新闻所带来的种种变化?编辑、记者如何去运用人工智能和大数据技术?在飞速发展的网络时代如何坚守新闻工作者的伦理道德和专业主义?这些问题的思考显得尤为重要,否则“他们的饭碗不会被自动化机器夺走,却能被不思进取、故步自封的陈旧工作方式所砸碎”。

责编:清欢

猜你喜欢

数据新闻大数据人工智能
2019:人工智能
人工智能与就业
数读人工智能
中外数据新闻编辑流程比较研究
大数据时代新闻的新变化探究
媒介融合时代数据新闻可视化教学探索
从“数据新闻”看当前互联网新闻信息传播生态
基于大数据背景下的智慧城市建设研究