APP下载

数据新闻作品版权辨析

2017-03-01翟红蕾陈心怡黄子吟

新闻前哨 2017年2期
关键词:数据新闻版权大数据时代

翟红蕾++陈心怡  黄子吟

[摘要]数据新闻是全球新闻业应对大数据时代变革所产生的新的应对措施,融合了计算机科学、统计学以及社会科学在大数据研究方面所得到的成果。近年来,数据新闻伴随大数据时代的到来而逐渐兴起而成为业界的一个重要研究课题。但由于其特殊的制作流程,数据新闻往往避开了对其他新闻作品的直接侵权行为,而转向为间接使用他人新闻作品,因此,其所制作出的新闻作品是否存在侵权问题亟待讨论。同时,大数据时代新闻作品的版权保护呈现出新的发展态势,找到合理使用和科学保护新闻作品版权的方式方法是当下急需解决的实际问题。

[关键词]数据新闻 大数据时代 版权

一、数据新闻与其操作过程

(一)数据新闻的定义及特点

数据新闻,又指数据驱动新闻,至今为止,学界和业界对数据新闻对其还没有一个统一的定义,在德国之声的数据新闻记者米尔科·洛伦兹看来,数据新闻是一种工作流程,包括以下基本步骤:通过反复抓取、筛选和重组来深度挖掘数据,聚集专门信息以过滤数据,可视化的呈现数据并合成新闻故事。[1]数据新闻可被视为一个不断提炼信息的过程,在这一过程中,原始数据转换成有意义的信息。当把复杂的事实组织成条理清晰、易于理解和记忆的故事时,公众才能获取更多益处。[2]这是业界对于数据新闻定义的一个比较主流的定义。由此定义我们可以发现,数据新闻不仅仅是将数据和新闻简单的进行组合,而是通过对数据的分析、过滤以及结构化的加工,通过数据来表达新闻,通过对数据的处理来表现新闻要素。

数据新闻并不是首次将数据应用于新闻制作过程中,传统新闻中也涉及到将与新闻相关数据进行分析处理后融入新闻作品之中,但数据新闻与传统新闻的不同点就在于是将数据以更为直观的方法呈现到受众面前。在国内的新闻媒体中,当提到数据新闻一词时,我们更多想到的会是数据可视化以及信息图表这两个词。数据可视化是指,将大量数据进行组合而构成数据图像,同时又将数据的各个属性值以多维数据的形式表示,使人们能够更为直观的观察到数据所隐含的信息。信息图表是将所搜集到的信息以图表的形式表现出来,我们可以从图表中更直观的了解到数据所包含的信息。[3]信息图表包括图表、图解、图形、地图以及表格等表现形式,其与数据可视化的区别在于,数据可视化需要对数据进行一定的处理,而信息图表则通过这些形象化的呈现将数据不经加工处理的进行综合整理。因此,信息图表是对数据的直观表现,而数据可视化则是对数据的二次处理,其具有一定的重叠部分但却存在一些本质性的区别。在我看来,数据新闻并不能与数据可视化以及信息图表直接画上等号,其还是存在一定的区别。数据可视化只是数据新闻制作过程的其中一环,它只是数据新闻对数据的处理方法,而信息图表则是数据新闻中的表现手法。这二者都是构成数据新闻的重要组成部分,但数据新闻不仅仅是由数据可视化和信息图表构成的,还有更多的其他要素。

由数据新闻的定义,我们可以将数据新闻的特点总结为以下几点。

1.将抽象的概念形象化。

数据新闻将抽象的数据及信息内容进行形象化的操作,使得新闻内容变得更加直观形象。数据仅仅是一些算法或数字,其所表现出来的意义更加抽象,不如图表及地图等更加形象,能够更加直接的表现出其所包含的含义。

例如,2015年全球新闻中,马航MH370的失联报道受到了全世界的瞩目。从3月8日马航证实飞机失联,到3月24日马来西亚总理宣布客机坠入南印度洋,事件的发展一直受到各家媒体机构的热切报道。其中,纽约时报等媒体所制作的数据新闻成为了受众的引用热点以及主要的消息源。事件伊始,华尔街日报在3月8日率先制作出了实时动态更新的专题页面,主要通过地图的形式展现出了飞机原本的航线路程以及其失联地点。之后,华尔街日报通过图表的形式发布了机上乘客信息,并重点标红了护照被窃以及实未登机乘客的信息。腾讯新闻后来也引用了这些表格,并将制作出了可搜索表单,受众可以输入乘客姓名或出生年月进行搜索。到官方确认飞机坠入南印度洋后,纽约时报制作了一张地图,并将飞机可能的坠毁地标红,使得公众能够更加直观的看到飞机黑匣子可能的坠毁地,也能够帮助受众监督官方进行搜索营救。随着事件的不断发酵,华盛顿邮报、纽约时报等权威媒体一直不断将信息制作成地图式的数据新闻,给与受众更加直观的形象化视觉指引,通过这些图表,能够让受众对这一新闻的进展把握得更加深入。[4]

2.將复杂的过程简单化。

大数据时代,受众接收到的数据往往都存在着数量庞大而又过于复杂的缺点。受众在接收到这些繁杂的数据后,需要花费大量的时间以及手续进行筛选和处理,然后才能得到对自己有用的信息。而数据新闻的一大特点就是帮助受众将受众所需要的信息进行整理,直观地展现在受众面前,让受众对信息的搜集变得更加简单。

例如,薄熙来案是近5年来我国反腐的重大案件之一,其相关的新闻报道同样也引起了社会大众的强烈关注。以凤凰网为例,其在制作薄熙来案相关新闻时,采用了信息图片的方式,其数据新闻采用了树状图的方式,将与该案相关的人员及其相互关系在树状图中标注出来,并在每一个人员旁边附上相关信息及网页链接。[5]但凤凰网为求将全部人员信息进行一次性的罗列,导致其图片上的元素过多,画面太过于杂乱。而网易则对其作出了优化,其将图片变得更为简洁,且将主体薄熙来位于图片正中,将其他人员安排在薄熙来周边,并标明其与薄熙来的关系,使得该数据新闻变得更为简洁,将原本复杂的人物关系变得更加简单,受众在阅读新闻时也更能选择自己需要或感兴趣的人物进行阅读,使得新闻传递的新闻变得更加具有针对性。[6]

(二)数据新闻的操作过程

与传统的新闻制作相比,数据新闻的操作过程有其自身的特点。美国学者,在线新闻主管保罗·布拉德肖曾经提出了数据新闻的倒金字塔机构[7]。在这个结构中概括出了数据新闻的几个重要制作步骤。

1.Compile编辑。

在这个步骤中,主要是对数据的收集。首先,新闻制作方需要收集大量的数据,并在数据收集完成后标注清晰数据的来源,或者对已有数据进行进一步挖掘,获得更为深层次的数据信息。

2.Clean清理。

这是对数据的整理以及进一步解读。是帮助数据如何由单纯的“数字” 变成“新闻”。在这个过程中,需要将上一步搜集到的大批量信息进行不断筛选,找出真正能够对应到该主题的数据,将错误的或是与该主题无关的数据清理掉。

3.Context情境。

在这个步骤中,我们需要了解数据的背景以及数据的相关知识,好在正式制作数据新闻时能够将数据的含义充分发挥出来。例如,在制作薄熙来案件新闻时,凤凰网所制作的数据新闻中,将相关人员的相关信息同时附上,以便受众想要了解时可以直接通过该新闻进行查找。这种背景信息的提供可以使得受众对新闻的整体把握得更加准确,也能够将新闻内涵更加完整的展现。

4.Combine综合。

当完成了对数据的收集、清理以及背景信息的整理过程后,我们需要做的就是将相关的数据进行综合,可以将新闻的更多层面展现出来。例如,在制作马航MH370事件的新闻时,纽约时报在制作的数据新闻中就将曾经发生过的相似空难事件进行关联式报道,让受众能够多层次多角度的了解这一新闻事件,这样整个系列的新闻就能够更加完整的呈现至受众面前。

5.Communicate传播。

完成了以上步骤之后,我们就完成了整个数据新闻的制作过程,剩下的就是将制作好的数据新闻呈现到受众面前。数据信息的呈现需要依赖的就是各种可视化手段,包括上文中提到的数据可视化以及信息图表等。使数据在先、文字在后,通过数据来驱动新闻,使不会说话的“数字”变得生动起来,表达出其所隐含的信息。

二、数据新闻作品版权侵犯探因

数据新闻之所以会产生侵权的风险,主要还是由于传统媒体对于版权意识普遍较为薄弱。在互联网兴起初期,我国有大量新兴媒体与传统媒体进行合作,共享资源及新闻作品。双方的合作尽管在加强我国互联网新闻领域做出了贡献,但由于其具体合作方式过于简易,不仅没有形成行之有效的系统化合作,不利于新媒体平台的发展,同时也没有对传统媒体所制作的新闻作品版权进行保护,导致部分新闻作品在多家新兴媒体同时转载,其多次转卖导致版权保护本身变得艰难以及成本高昂。这种薄弱的版权保护意识问题同样出现在了数据新闻领域,在数据新闻之中,我们常常看到许多媒体所制作的新闻成品中出现了对于其他数据库中数据的直接引用,有的虽然标明了数据的出处,但并未提供数据的原始样貌以及原始出处,呈现出的大多数都是已经经过加工处理的数据。而这种行为已经存在着侵权的风险,故而我们应该对此采取一些措施。例如,在进行新闻数据的引用时,应该仅提供新闻标题以及链接,用户如果需要阅读这些数据,需要点击链接回到新闻数据的原始刊登页面进行阅读,以保障不产生任何侵权的行为。

在传统媒体时代,新闻作品版权意识普遍存在着意识薄弱这样一个“通病”。传统媒体本身对于保护其所制作的新闻作品的版权就存在着意识不足,能力不够这样的缺憾,由此导致的便是普遍新闻作品版权得不到应有的保护。长期以来,传统媒体之间相互使用彼此所制作的新闻作品已经成为一种“行业惯例”,甚至是没有进行告知就随意对其他媒体所制作的新闻作品进行篡改或使用,从而形成了一种“版权乱象”。而到了大数据时代,新兴媒体之间同样也与传统媒体一样对于版权意识注重不到位,版权问题同样存在,而因此所导致的版权纠纷案也是层出不穷,其中最具代表性的就是2014年多家传统媒体集体状告《今日头条》并乘其侵犯版权,其中《广州日报》更是将运作《今日头条》的背景字节跳动科技有限公司诉至北京市海淀区人民法院。各大传统媒体纷纷状告《今日头条》利用大数据分析手段获取新闻资讯并提供给其用户所使用的客户端。而这一行为也巧妙地避开了传统的侵权模式,其对于新闻作品抓取行为的定性属于间接引用,而在关于新闻作品的版权问题上却存在着模糊不清的问题,因而对于其是否侵犯到原有新闻制作方的版权还有待商议。因而,这一案件也将大数据时代新闻作品的保护问题又一次地提到了广大新闻从业人员的眼前。且到目前为止,《今日头条》案依旧还处于舆论的风口浪尖,但大数据时代才刚刚开始,因此,我们急需讨论如何在大数据时代对新闻作品的版权进行保护,从而推动新闻业在新时代的新发展。

大数据时代新闻作品版权不受重视,除了由于媒体版权意识不足之外,著作权中概念不清晰同样也是一个重大原因,由此所引发的媒体争议也不在少数。在我國现行的《著作权法》中规定到:“时事新闻不受著作权保护。”而对于“时事新闻”这一概念,法律解释为:“指通过报纸、期刊、广播电台、电视台等媒体报道的单纯事实消息。”而对于这种解释,各大媒体在实际操作过程中却又不同的解释,在引用他人新闻作品时,为了规避版权问题,往往就会往时事新闻这样的一个模糊的概念上牵引,在上文中提到的《今日头条》案件中,同样也存在着这样的一种规避侵权行为,因而,各大媒体对于这样一个概念的不同解释也就导致了各种各样的争议,从而无法对这一行为作出真正侵权的定义,新闻作品的版权也就得不到保护。

数据新闻产生侵权风险的另一个原因就是我国新闻行业相关法律法规对新闻作品版权侵权的赔偿额度过低,导致部分媒体为了追求更大的商业效益而不在乎为此付出看似“微不足道”的“代价”。而要追要这些补偿,却是需要付出高昂的成本,这种“高投入,低收益” 的“不合算生意”导致传统媒体在新闻作品的版权保护问题上往往积极性不高,这也就使得更多的新兴媒体在制作数据新闻时大批量使用二手数据。且当这些数据被引用到数据新闻之中后,往往已经被制作成为类似表格、图表等可视化形式,由于形式的改变,原始数据出处也无法找到更多直接的侵权证据。由于这种证据很难被直接找到,导致数据新闻制作过程中的侵权行为也被“掩盖”了起来。因此,这种难度极高的维权过程使得更多原始数据的出处更难维护自己的权益,导致侵权行为变得更多更难制止。要解决这种侵权风险,我们就应该将相关法律法规进行一定的修订,提高赔偿额度,简化维权之路,让维权变得更加“简单”,也让侵权行为所需付出的代价变大,让原始数据库能够有更大的维权积极性。

三、数据新闻作品版权问题的实例分析

为了剖析清楚数据新闻的版权问题,在此特将新华网数据新闻部出品的《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻进行倒推,寻找其数据的原始来源,查看其原始新闻元素,讨论数据新闻的版权问题。

在《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻中,从救援人员、医务人员、亲历者、亲属及志愿者这五个事件关系人的角度对天津爆炸事件后相关人员的生活轨迹所发生的变化来展现事件发生后天津滨海新区的样貌。在讲述医务人员时,讲述的是天津市泰达医院肾内科医生李青的故事。在《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻中,讲述了李青赶到医院时间、地点以及他的故事。其文字内容来源于《新京报新媒体》2015年8月13日的《泰达医生:消防官兵伤情太惨了,许多同事嚎啕大哭》这篇报道。在《新京报新媒体》的报导中,采取的是以第三人称为口吻的客观描述,而在《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻中则是改成了第一人称式的口吻。而在讲述救援人员时,讲述的是消防开发区支队第三大街中队消防员刘晓静的故事。在《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻中,讲述了刘晓静的救援时间、救援地点、口述时间、口述地点以及他的故事。而其图片资料直接使用的是《每日新报》2015年8月14日的《扛下两次爆炸冲击波凭左耳辨听爬出火场》这篇报导,而其文字内容则是对《每日新报》的文字内容进行了部分修改。在《每日新报》中使用的是第三人称的客观描述,而在《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻中则是将这段文字改编为第一人称的口吻。

而在《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻后三个事件关系人的故事中均是采取这样的套路,亲属、亲历者及志愿者的文字部分分别来源于《京华时报》、人民网以及中国新闻网的报导,并统统都是将原本新闻素材中的第三人称式的客观报导改为第一人称式“倾述式”的口吻,增添了受众的真实感,营造出了一种身临其中参与对话的感觉。

《天津滨海新区爆炸亲历者的故事:爆炸之后......》这篇数据新闻的全部文字部分均改写于其他报纸及网站的新闻作品,其没有任何表达作者本身思想及作者参与采访的文字内容,这种“引用式”的新闻,其版权如何定义,亟待商榷。通过对这样一则数据新闻的倒推我们也很容易发现,数据新闻的“立论基础”就来源于其他新闻,对其他新闻做出小幅度的修改与装饰便成为了一篇新的数据新闻,这种形式是否对其原始新闻素材造成侵权,还需要相关法律法规做出更为明确的定义,否则,我们将无法对数据新闻以及其原始新闻进行相关的保护。同时,数据新闻将其他新闻素材进行加工制作后所形成的新的数据新闻本身也存在作者本身的理念及知识,故而也成为该作者本身的作品而产生一定的版权,因此,数据新闻本身的版权如何去界定同样也是一个亟待解决的问题。

数据新闻的基础在于对大数据时代对于数据的分析与处理,其价值也在于基础数据的海量化,受众能够在海量的数据中找到真正有意义的数据内容。根据数据新闻的制作过程我们可以发现,其基础数据的收集及清理过程与传统互联网新闻制作过程不同,绕开了直接侵权的方法,但其实质上却是一种间接的侵权行为。因此,大数据时代的技术手段虽然可以产生很多有利的效果,但同时却是一把双刃剑,引发了许多针对于版权的思考。

四、保护数据新闻作品版权的思路与方法

早在1999年王蒙等人状告北京世纪互联通訊技术有限公司一案,我国网络版权侵权问题就已经开始走入人们的视野之中。多年来,我国也在不断的完善数据新闻作品版权保护的方法。想要完善数据新闻作品的版权保护就应当按照以下这几步的思路与方法来做。

要想真正做到大数据时代新闻作品版权的保护,首先需要做到的就是提升各大媒体及新闻从业人员的版权意识,提到其对于版权的认知。在大数据时代,保护原创作品版权及媒体版权尤其重要,只有提高意识,才能在根本上杜绝侵权行为的产生,还给新闻业一个绿色的竞争环境。将意识提升之后,媒体行业就应该相应建立自律机制。在新媒体时代,如若整个行业有了完善的自律机制,才能进一步推进行业自身的发展。由“今日头条”一案就可发现,整个行业的完善与进步,才能够促使版权保护得到进一步的推进。行业的发展离不开整个行业的所有从业人员的自我保护与维护,只有行业自身有了保护的意识,才能推动法律及其他行业的共同监督。因此,我们应当建立例如版权保护协会这样的自律机构,制定完善的行业自律机制,立出“行规”,使得行业主体自身既有动力又有压力,让版权保护真正深入到每一个从业人员的内心之中,让从业人员懂得捍卫自身的权利,履行自身的义务。

其次需要做到的就是完善监管力度,在发生侵权行为后要做到违法必究,建立专门的监管机构负责新闻作品的版权审核,严惩侵权媒体,对相关媒体施压,使得媒体自身不愿意形成侵权行为,不抱侥幸心理,这样也能对新闻作品版权进行进一步的保护。同时强化立法与司法保护,让法律这“一把枪”能够强力保护新闻作品版权。在这里国内的新闻从业人员也应该向国外新闻组织及新闻行业学习。例如在意大利,其版权法规定:“在实际公报发布16小时内,或在通讯社授权发布的报刊发布之前,转载或广播通讯社发布的新闻公报[8]”的行为被视为违法行为即侵权。而其对于侵权行为的处罚决定也是十分严厉的,有效地阻止了新闻作品被侵权的行为出现。由此我们也不难发现,任何一个强调新闻自由的国度对于新闻作品的版权问题都是十分重视的,因此我们应当学习这种对于作者切实利益进行保护的行为。在版权保护方面,我国法律存在的最根本问题就是制度不完善以及缺乏专门的立法,在先行法律之中,很少涉及到与数据新闻这种新媒体时代下的新兴产物有关的专门立法,因此,很难对侵权行为进行司法上的审定,而这也就让一些不法分子钻了空子,在转载使用他人新闻作品时,往往以第三方链接为由,逃避法律责任。并且,在我国现行法律法规中,许多条文仅仅涉及到概念的理清以及原则性的指导层面,并不涉及到实际应用的层面,因而无法完全深入到数据新闻作品保护的问题中来,使得数据新闻作品的版权保护完全停留在从业人员自觉性的问题上,使得其作品版权问题一直处于虚无以及得不到保护的状态之下。

最后就是要从技术方面着手,建立协议禁止各大媒体利用大数据分析手段对网络平台中的新闻资讯进行随意抓取及使用,从技术上对其进行限制,使其无法利用海量数据进行侵权行为。在控制访问数据库的技术让各大媒体在“入口”处有了限制后,我们也应当在“出口”处设置一定的“门槛”。我们应当设置好作品使用的控制,设立专门的技术系统对成型的数据新闻进行内容分析,检测其文字内容、图片信息以及视频等的制作情况,如若发现其出现侵权的问题,应主动对其侵权行为进行警告并不准许发表,同时搜集其侵权的内容作为“证据”,发送给原作品作者,提醒其保护自己的作品版权以及自己的权利。从“入口”和“出口”这两方面紧抓数据新闻作品版权的保护,使得有侵权行为的新闻作品无法顺利发表,同时也使得原作品作者有了进一步的版权保护意识。这种从技术上实现的保护措施,能够进一步推动整个行业对于数据新闻作品的版权保护。

总而言之,要解决侵权风险最基本的,还是要加强版权知识的普及工作。数据新闻制作过程中,数据使用方提高新闻作品版权意识,不管是在数据引用还是在数据处理方面,都应该加强版权保护意识。在大数据时代,虽然新闻作品的传播渠道变多,但如果其内容产生了根本的危机,渠道再多也无法帮助新闻行业本身的发展。因此,对于内容的保护就是根本解决这些风险的方式。只有提升媒体的版权保护意识,我们才能制作出更加精良的数据新闻作品,促使数据新闻行业有更大更好的发展。

注释:

[1]马玉霞:《数据新闻的兴起与发展文献综述》,《传媒观察》2015年第6期

[2]Lorenz.Mirko.Data driven journa

lism:What is there to learn.http://www.

slideshare.net/mirkolorenz/datadriven-journalism-what-is-there-to-learn

[3]百度百科:《数据可视化》.http://baike.baidu.com/link?url=3fXpmJ7b0W

_b97cOKeFeN2vu6B8vrvKNiLHPyP3c

AEcDQ0pqn67aR3k-FPPC3wi0BnM-

TuWO-pbPm1eyzYWIq

[4]http://djchina.org/2014/05/13/mh3

[5]http://news.ifeng.com/mainland/

special/boxilaian/tujie.shtml

[6]http://news.163.com/special/boxi

laitupu/

[7]The inverted pyramid ofdata journalism,http://onlinejournalismblog.com/2011/07/07/the-pyramid-of-data-journalism/

[8]路平:《新媒體环境下新闻作品的版权保护》,《科技与法律》2015年第4期

(翟红蕾:武汉理工大学新闻传播系副教授,传播学博士;陈心怡、黄子吟:武汉理工大学新闻传播学研究生)

猜你喜欢

数据新闻版权大数据时代
媒介融合时代数据新闻可视化教学探索
从“数据新闻”看当前互联网新闻信息传播生态