APP下载

姜进章:计算新闻的特征与趋势

2016-02-13陈鑫胤

中国传媒科技 2016年7期
关键词:新闻报道可视化

本刊实习记者/陈鑫胤

姜进章:计算新闻的特征与趋势

本刊实习记者/陈鑫胤

2016年6月23日,在英国关于是否脱欧的公投中,脱欧派以3.8%的微弱优势获胜,并在世界范围内引起了一系列的“蝴蝶效应”。然而这次脱欧事件的结果,很多西方媒体在结果出炉前10天就非常准确地预测到了,多数金融市场并没有发生重大灾难的原因,是因为在一个月前几乎都做了防备。

这是数据新闻所带来的社会效益。数据新闻会预测公投脱欧的结果,也会预测后脱欧时代的英国人口将经历怎样的流动,以及英国的GDP会产生怎样的改变。如果这些统统叫做数据新闻,那计算新闻是怎样的呢?

在中国新闻技术工作者联合会2016年学术年会上,来自上海交通大学的姜进章教授带来了关于《计算新闻的特征与趋势》的演讲。计算新闻如何引导新闻报道回归本质,如何更全面地预防灾难以及如何在新一轮的广告市场争夺战中,变被动为主动,形成真正的卖方广告市场?姜进章教授进行层层抽丝剥茧,揭开计算新闻的核心价值。

1.计算新闻的含义与趋势

1.1计算新闻的定义

关于什么是计算新闻?哈密顿和特纳的定义是“社会科学的算法、数据和知识的结合,以补充新闻的责任与义务的功能。”自新闻诞生以来,新闻的任务和责任是永恒的,计算新闻业则是建立在两种方法——计算机辅助报告和社会科学工具在新闻业中的应用。其通过利用一些模型和算法,旨在帮助记者探索结构性和他们寻找故事的非结构化信息。

姜进章表示,在过去,学界为新闻界提供的数据都是表格化的,这显然不符合记者对文字的偏好。多媒体时代来临后,大量的非结构化数据通过认知计算得以解决,避免了异常庞大的统计学数据所做出来的报道。

从传播学的角度,仅仅看统计学的应用对记者来说很不适用,而未来的计算新闻和各种表格已经没有太多联系,更重要的是非结构化数据的处理和可视化。

1.2计算新闻广义的应用

把计算新闻扩大化来讲,计算新闻的定义将包括计算工具和他们与定量方法、定性方法的结合。美国对计算新闻的研究已经确定的方法包括统计分析、调查、测量和观察、收集和解释各种信息,如公共记录、访谈和直接参与的事件。

现阶段中国新闻报道的方面已经逐步开始变化,政治新闻、财经新闻、娱乐新闻以及各种社会新闻层出不穷,娱乐化、个性化的趋势明显。在这种情况下,计算新闻可以在主题的检测、视频的分析、个性化、聚合、可视化等方面发力,当认知计算的技术链完成以后,对记者最大的改变就是——技术不仅成为手段,而且可以建构意义。

在技术支撑下,记者、编辑的工作方式发生颠覆性的变化。信息的采集和存储、分析、挖掘和展示,都由技术来解决了,那么记者或者是人类还能做哪些事呢?姜进章认为有两个方向:

第一,设计数据内含和反馈系统,设计适应人类的数据指标与标志,与自然环境数据互动。今后记者和编辑的第一线工作就是设计向这个社会要贡献的数据,设计媒体用什么样的反馈系统去反映人类的社会生活。

第二,当技术已经能够完全把思想都展现出来的时候,最重要的是能够把它放到不同的领域,放到不同的分众当中进行应用,创新其应用。

1.3计算机技术助力新闻领域

计算新闻有这样的应用取决于计算机技术能在新闻报道领域,以数据推动报道,以故事的展示方式来完成,同时进行大量的信息筛选。这个筛选就是各类媒体对自己反馈系统的设计,借助反馈系统,才能让技术扮演筛选信息的角色,以形成每一个媒体自己的特色。除此以外,技术也将影响跟踪。

姜进章说,技术将影响所有发生事件的跟踪水平,在一个强大的跟踪系统下,记者过去在事情发生的背景、发展的过程等方面的大量的注意力,可以转移到事件发展的未来,也就是反馈系统要完成对任何一个新闻事件的未来预测。举例,上海水上飞机撞桥事件,如果航拍人员提前对飞行路线进行分析,则可以预测评估飞机撞桥的可能性,从而预防重大事故的发生。

现在正值美国大选,美国媒体对竞选的过程都进行着实时计算新闻的报道,锁定特朗普和希拉里二人间的选举会发生怎样的变化。计算新闻在事件发生之前不断地捕捉、不断地进行互动,且大量的新闻报道是跟现场融合的。姜进章认为新闻媒体报道真正的融合是让受众跟现场完全融合在一起,给人巨大的现场感和参与感。

就如电影的本质是沉浸性,新闻报道的特质是新闻事件现场的参与性。实现参与性,呈现现场感受并预测未来,才是新闻报道回到了自己的本原。大众媒体的组织一定会焕发青春,而这个青春是在重人才、重技术、重装备、重场景、重未来的情况下实现的。

1.4数据与计算新闻的趋势:预测性

要搭建前文所说的反馈系统并创造参与性,就要利用数据与计算新闻的趋势——预测性。

大数据的聚集可以使人们在事情发生之前准确预测。数据新闻依靠数据创建和填充新闻内容已被广泛使用,而计算新闻依靠机器人及程序创建新闻报道,也已在新闻界进行更多的尝试。籍此,通过大数据技术的应用,新闻工作者将能够准确地做出预测并据此生产出第二天或未来的新闻头条和相关内容。

正如很多财经报道在讨论的,能否预测到下一次股灾的来临,世界新闻对预测性的讨论更多,人类思维习惯于根据历史和经验,判断和重建未来。大量的事件都是人类自身的重建,所以它是可预测性的。

2.计算新闻的历史

2.1计算机辅助报道和精确新闻

要深入认识计算新闻就要从其历史的进程中去寻找。历来在讨论人类的发展进程时会讨论基因,与环境的适应性交互形成了今天的人类。同样在讨论一个事物的时候,也要看它的基因是什么,从而在基因的链条上来与环境交互,这也是每个媒体组织发展的根源。

自1952年以来,计算机被用于记者生产新闻故事的这种做法,往往被标注为“计算机辅助报告”,并得到了国际社会的支持。1967年,美国联邦信息自由法案开始实行,民众有权要求政府公开信息,信息的流传性开始极大增长,需求越来越大。

70年代初,人们都认为计算机辅助报道是在小数据下完成的,是在封闭的量化状态下完成的,因此人们认为检验数据是否准确是最重要的,从而进入“精确新闻”时代。但是精确新闻的概念很快被淘汰,因为大数据侧重于多维性而不是个别数字的精确,多维性的交叉验证可自动产生精确性。70年代以后,新闻界引入了社会科学调查方法。

从90年代开始,计算机辅助报道开始在全美编辑室稳定发展。

2.2数据新闻

到了21世纪初,互联网成为主导力量。“数据新闻”一词最早并不是出自美国而是英国,用于英国政府报道当中。当时计算机辅助报道明显具有技术驱动的背景,随后技术逐渐从每个人的工作界面退出,进入后台,新闻记者也更易于接受和运用。人们开始用数据来驱动新闻报道,不是技术驱动。

2002年,借助数据驱动,这一阶段称为的“资料新闻、数据新闻或数据库新闻”都开始发展起来,人们习惯于把数据看做小数据,即结构化数据。这一阶段数据只能起到支持性的作用,无法成为主流。

一直到2010年末2011年初,全球掀起大数据热潮,“数据新闻”开始从边缘走向人们视野的中心。根据谷歌趋势,记者可以挖掘政府发布的海量数据。数据新闻则被定义为收集、清洗、组织、分析、可视化并发布数据以此来支持事件的一种新闻形式,并且数据新闻和计算机辅助报道在实践当中的发展与数据开放的进程密不可分。

由于数据新闻起源于计算机报道,互联网的趋势是逐步走向交互性,所以交互性成为数据新闻的核心。即使在没有可视化的情况下,交互性也是可以进行的,这是如今腾讯新闻发展的一个重要标志。

2.3计算新闻

当然,数据新闻从业者常常会运用一些非结构化信息,如文本、音频、视频,而不仅仅是那些老旧形式的信息,如充斥着行列数字的电子表格和数据库。

在社会管理越来越复杂的情况下,新闻报道可以预测并增加人类未来的确定性,从而让人类避免各种各样的灾难和不幸,姜进章认为,新闻报道在未来一定会迸发出更加强大的力量。

3.计算新闻的最新要求

3.1计算新闻的辨识

在计算新闻的辨识上,很多人把它和计算机辅助报道、数据新闻混为一谈。一般来说,区分出计算新闻可以从四个方面着手。

第一,计算新闻带来了一个崭新发展的新闻领域,不是以更多的技术手段进行“业务照常”。当下新闻界存在误区,即使物理方面的设施得到更新,业务照常依然是行不通的。技术需要颠覆整个业务,只要是业务照常,都是十分危险的。

第二,计算新闻是一个记者如何工作的新认识,是新的经济体的分布式和共同创造性的知识生产,协同创新将成为计算新闻的核心。

现在市场上流行三个关键词,第一,共享经济,第二协同创新,第三众包合作。姜进章教授认为这三种方式一方面将在未来十年摧毁一半以上的制造业,另一方面将诞生强大的新的经济组织,包括新闻媒体。这三者中,被摆在第一位的是协同创新,姜进章认为所有的记者、编辑未来将在一个与外界完全链接的平台上工作,任何一个报道都是对整个媒体价值的反映,是局部融入到整体的工作方式。

第三,计算新闻预示着一个扩展视野、扩展管理、扩展生产经营和扩展协同创作的新闻价值网。虽然当前大量的媒体组织还在价值链上生存,但需要意识到价值链正在逐渐被价值网摧毁,而价值网就是一个众包合作的模式。同质的内容意味着没落,整个社会都要进行价值网络的再分配,每个媒体拥有自己唯一的核心业务,而且是其他组织的非核心业务,这样才能获得长期竞争力。

第四,协调记者基于数据的分布式任务而进行的元数据报道。大量的策划,整体性的平台策划将成为计算新闻的核心。数据新闻是在开放、开源运动的推动下生产的,它融合了统计分析、计算机科学、可视化与网页设计等用于新闻报道;计算新闻则似乎无所不包,它综合使用算法、数据和社会科学方法。

3.2数据报道、可视化与交互

在数据报道的要求当中,一定要知道数据报道是获取、清洗和分析数据,以此来为新闻报道服务。其要求包括:有效利用计算机辅助报道或分析,来进行新闻写作;运用各种精确新闻,包括出于新闻的考虑使用社会科学研究方法;可视化数据(包括绘制地图和图表),以服务问题的深化和分析;进行编程来获取和分析数据,最终完成新闻故事等。

在技术要求方面,数据报道要求援引公共记录法、发送请求、获取数据;具有使用网络爬虫工具的能力、使用相关数据库软件的能力、理解统计概念及软件的能力以及使用绘图及可视化工具的能力。

数据可视化一定是一个交互的过程,所以要通过代码来做数字出版,以及通过编程及数据库管理来建立交互式数据新闻作品。可视化与交互的要求有:利用可视化中的交互式图表与信息图来进行展示;交互式应用,包括检索数据库、帮助读者深入理解新闻故事的游戏等。这些应用都可能成为数据新闻项目的一部分。

3.3计算新闻的绩效:卖方广告为例

计算新闻技术可以提供调查新闻的新基础,增加新形式的范围与读者互动,并吸引和留住在线的受众。因为其增强了读者的经验和参与度,同时更好地利用新的信息环境,降低调查报告的成本。

在计算新闻中,实时性广告、卖方广告将占主导。众所周知,新闻媒体长期处于买方广告为主的商业模式,所以媒体的经营方式日趋固化——通过广告主的委托进行广告销售。在这样的情况下,媒体的工作能力和传播市场的感受是被动发生的状态,并且显然广告主对传播效果的把握一定不及媒体机构,也有极大的不确定性和不可测量性。

未来的营销方式是卖方广告,即在新闻事实中植入广告,回头根据广告主的持续要求和实际效果收取费用。姜进章预测卖方广告10年后将占据80%的比重,因此要求媒体不能沉浸在往日的辉煌中。正如社会最中坚的力量来源于民智——民间智慧,可以用以对抗未来一切的不确定性,因此智库、思想市场在2017年将在全国范围内建立起来,智库的核心就是卖方研究。

供给侧改革一定是把买方主导的社会转化为卖方,才能让精英和专业成为社会主导。从前是粗放的买方的市场经济,现在则必须颠覆。与此关联的广告也需要进行转型升级,不需要通过谈判来委托买方,而是通过优质效果的广告让企业自愿掏腰包。

另外,由于计算新闻可以提高用户的参与度,并使更大化的互动通过新的传播形式,包括网络社区和社会网络工具提供给读者。因为参与性不仅包含了受众,也包含了广告业主,所以基于这样的互动性,在播放的过程中,就会有广告主在平台上请求添加广告内容,这也要求媒体在传播过程中有实时的传播效果报道,如观看人数等,可以形成实时的卖方广告。由此发展出来的实时性的众包营利模式将成为市场经济的主体。

4.计算新闻的机会和挑战

4.1计算新闻的机会

美联社做了这样的一个设想,因为将来的技术是可以生成思想的,因此某些已经被定义好了的问题通过算法一次开发,可以进入无限次低成本的撰写新闻,还能用不同的语言适应不同读者的个性化需求,并且相比于记者,算法可以更快速地输出。

这些明显的经济效益,完全符合新闻机构的诉求:降低成本的同时,增加新闻数量、提供个性化的内容。正如中国现在出现的很多网红、播客等直播视频,这些产品很快会植入更多的计算新闻的内容。

计算新闻的核心是协同创作,根据目前媒体发展的趋势,对于计算新闻来说存在五大机会:

第一,不同的数字来源的信息结合;

第二,信息大量的提取,全方位的提取。如果做到这样的提取,一定能在过去的文档中探索,在冗余的信息中进行再利用,形成突破性的创新。

第三,就是文档探索和冗余,包括寻找新的和累积的文档,并自动探索和消除冗余。

第四,音频和视频索引。当触摸媒体发展到一定程度以后,语音智能将成为第二个时代。Siri的发展就是一个前提,今后许多记者将通过计算新闻的语音识别来解决大量的影像、视频问题。

第五,提取表单和报表数据的作用。今后可以对照excel等表单直接提取内容发表言论,不需要记者再调用数据函数。这样的软件开发将大大提高记者的生产效率,同时开拓记者广大的视野。

4.2常见的数据陷阱与预防

当然,姜进章教授也表示,只要是利用了数据,就会存在一定的数据陷阱。常见的数据陷阱有,第一,相关性不等于因果;第二,数据源使用不当会带来结果偏差,草率代入无法代表真相,第三,忽略数据背景,个体无法指代全体;第四,遗漏方法论,在报道中没有注明是使用什么方法。这些都会是使报道受质疑诟病的因素。

因此,对于完成数据新闻报道的记者来说,需要具备一定的数据素养,以预防此类陷阱,每个记者不仅仅要做人文的内容还要具备批判性的思维,对数据要有一定的敏感性。现在学界提倡三大思维,第一科学思维,第二人文思维,第三个是2012年国际上出现的叫偶然观思维,也就是人类对于该系统为什么能够避免风险,把环境的变量引入到系统中来再分析。记者探究的领域需要扩大,与环境不断交互一定会发现更多的东西。

除此以外,数据素养还有对数据搜索能力,有数据分析处理能力,利用数据进行最终的决策等。正如前面提到的上海金山水上飞机首航撞桥事件,如果在报道现场不是采用传统报道的方式,不是仅仅带着摄像机上飞机,而是通过无人机计算出航行路线和目的地,无人机的摄像可以在飞机的上方做出大面积的扇形扫描,可以发现桥梁,惨案也是可以避免的。

“最伟大的新闻是预测并拯救人类的一切危机,给人类不断提供确定性”,媒体改革的最终目的还是服务于人类社会的发展,计算新闻不仅是手段,也将成为人脑的一部分,将成为媒体产业的部分主体。

(以上内容根据姜进章教授在中国新闻技术工作者联合会2016年学术年会上的主题演讲整理。)

猜你喜欢

新闻报道可视化
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
思维可视化
自然资源可视化决策系统
基于CGAL和OpenGL的海底地形三维可视化
“她时代”新闻报道中的“时代精神”呈现
论新闻报道中的流行语
防台新闻报道与全媒体传播的“变”与“不变”
浅析如何在新闻报道中彰显以人为本
“融评”:党媒评论的可视化创新