大数据时代下数据新闻的信息安全与规范
2019-09-17王艾琴袁悦
王艾琴 袁悦
【摘 要】随着信息科学的逐渐发展壮大,大数据时代的到来,导致大数据思维下的产物越来越多,数据新闻跻身其中。抛开传统新闻的面纱,开创新的新闻制作模式,与此同时也带来了安全隐患。本文主要从数据的采集、使用和存储几个方面入手,浅析数据新闻面临的信息安全问题,并提出规范意见。
【关键词】数据新闻 信息安全 规范
一、数据新闻中数据处理的特点
1.数据采集更广泛。就当前数据采集途径,主要可以归为政府政务部门发布统计数据、涉及公共服务的企业和营利企业发布的企业相关数据、通过调研得出的研究数据和零散的网络碎片化数据。在当前信息需求日益扩大的情况下,线上线下联动,一个人的信息分散在各个区域,形成信息网,而数据采集过程则将所有的信息网整合在一起,形成更大的信息球,围裹着新闻主题,不断向外延伸扩展。
2.数据采集更隐形。“应用赋权”是当今技术发展中最使人担心的,它在无形中获取你的信息,例如要使用地图必须打开GPS,这就意味着你的位置被手机软件实时监控,同时,除了地图还有更多软件拥有获取位置的权限,它们与GPS共同将你的位置信息以及软件中夹携的注册表信息等向外部进行扩散传输。但你毫不知情。隐形的数据采集包括你的IP、电话号码、真实姓名等与你在任何软件上输入的信息产生联动,并且环环相扣,不可分割,形成链条。因此我们很可能在不知不觉中就被网络公司拿走了与个人生活相关的一些数据,甚至网络公司也是在不知不觉的情况下通过技术“无意”盗走了一些信息。
3.数据核实不够严谨。当前数据新闻在数据核实环节有较大的缺失和不足。核实数据并不是打个电话、发个邮件即可,应有严谨的求证逻辑。学者方洁通过对新华网《数据新闻》、搜狐网《数字之道》、网易《数读》、财新《数字说》和澎湃新闻《美数课》等5个国内知名数据新闻栏目的定量研究,发现在总体样本中,除了7.4%的数据新闻没有对数据来源进行描述以外,尚有73%的样本描述模糊,这个数据远远超过描述清晰的19.6%。即目前制作的数据新闻还处在权威性不够、数据来源不可靠、缺乏可信度的阶段。
4.数据开放产生威胁。为了实现数据最大限度循环利用,有越来越多的新闻媒体延长生产链,以免费或收费的方式公开数据集。2010年英国《卫报》就遵循开放数据的理念,在它的新闻网站上搭建“数据商店”频道,针对不同的主题进行分类,提供各式各类的在线数据并允许用户免费使用。Propublica在其网站上也设置了类似的“数据商店”栏目,有收费和免费两种类型的数据集可供下载,数据内容涉及医疗健康、就业体系、司法行政、犯罪、公共教育、政治时事、商业、交通和军事等多个方面。但这些方面所涉及的内容具有一定的保密性。数据公开不可避免地带来了威胁,即使当前有新闻媒体采取了将个人数据转为匿名数据的措施,但数据资料的增大、数据内容的交叉仍然使得数据背后的隐私无所遁形,再加上去匿名化的成本也越来越低,数据开放产生了极大的威胁。
二、数据新闻带来的信息安全问题
1.个人信息安全问题。2018年3月,“Facebook”被曝光有超过5000万用户的信息数据被盗,此次事件中,一家名为“剑桥分析”的公司成为信息泄露源头,它是英国剑桥大学心理学教授亚历山大·科根设计的一款名为“这是你的数字化生活”的APP,这款软件声称能帮助用户做性格分析和心理测验,一旦下载并同意该软件查看自己的“Facebook”资料请求,该软件就可以获取用户和他们“Facebook”好友的个人信息。由此,信息泄露一觸即发。
越来越广泛的数据采集、挖掘必然引起信息的公开化、透明化。但公民的隐私权不可侵犯,当挖掘深度需要时,个人数据很容易被他人收集和利用,但在数据采集越发隐秘的当下,个人很难追踪自己的信息是否被采集,被深入挖掘甚至被做成数据样本,更难知道他人收集了怎样的信息资料,打算用作何种用途,又会以何种方式被呈现。
法律规定“个人有权了解谁在收集其信息资料,搜集了怎样的信息资料,搜集这些信息资料用于何种用途,所搜集的信息资料是否客观全面,个人对信息资料是否有自我利用价值或者允许他人利用的权利等”。
但在当下信息泛化、赋权流行的互联网背景下,个人时刻面临着信息输入的要求,这也意味着它即将被输出到另一个终端进行存储,在存储的过程中,它也同时被数据库容纳了,一旦数据库被挖掘和调用,许多信息同时被暴露,可以任意取用,个人信息安全很难保障。
2.集体信息安全问题。在医疗卫生、教育行业、银行保险等机构拥有大量的客户信息,这些信息一般都具有保密性质。一旦被取用,集体信息很快就泄露。而在数据新闻中,数据量是新闻制作的一大亮点,因此涉及许多相关集体信息。
目前主要限制数据交易发展的三大技术瓶颈,是大数据的寻址、定价和安全隐私保护问题。在交易过程中,即使采用匿名等技术手段,也难以保证公民的隐私在挖掘和申请过程中不受侵犯。对许多公司来说,恢复私人数据并不困难。有大数据公司为规避风险,在数据销售过程中,将涉及公民隐私的数据拆分成不同部分,每段均无法识别到个人,是零碎的、散乱的信息,通过碎片化的传输进行加密,到了需求端再自行整合起来,形成对个人的完整数据。
数据新闻中亦是如此,数据即使被拆分又整合,进行了重新定义,但其中的内涵并没有变化,对于“有心人士”,对数据进行反向解读,通过大量的数据造成更大规模的安全隐患。
三、数据新闻应对信息安全隐患的建议
大数据时代的到来,对数据开放提出了更高更紧迫的要求,对数据全方位主动推送、数据分享、互动联通形成了倒逼机制。当下我们不得不重视有关问题,并从各个方向提出解决意见。
1.推进技术改进。科技产业应当制定保障大数据安全的总体规划,构建大数据安全的技术保障生态系统。制定大数据采集、传输、存储、交换等安全规范技术标准体系。创建大数据安全系统,把安全紧紧握在手中。建立大数据安全人工智能系统,力争做到“可以预防、不能进来、可以预警、不能带走、不能打开、不能读取、可以自毁、可以跟踪、保存证据”。从技术上保护大数据不受外界影响,保证实时安全;保证被攻击时的有效监测和预警;保证真伪信息的自动筛选;保证垃圾危险信息的主动删除;加强密码技术在保护大数据安全中的辅助作用;及时有效地控制和处理安全漏洞,以加强实时安全管理。
此外,需要将大数据安全技术加入国家科技创新和产业发展重大工程规划,从政策和资金方面给予大力支持,加强大数据安全技术基础设施建设。
2.加强管理力度。当前,海量数据的收集、传输、存储、互联、共享、应用、交易和安全管理的权利和责任不明确,海量数据的所有权、使用、运行和安全责任不明确。数据资源和用户的发展往往走在法律的边缘。在大数据已逐步成为互联网时代的最大资源的情况下,国家应该对其更加重视,有人说“互联网战争”是世界发展格局下的必然走向,那么大数据就会走上战略舞台。我们应提前进行整顿开发,针对数据隐患进行专项研究,厘清一套管理体系以便实践和参考。
3.针对数据新闻下的信息安全——媒体行业的自我改进。在大数据背景下,互联网行业应加强自身建设,推进自身改革发展。在数据新闻的条件下,媒体行业成为主体,随着数据新闻的日益发展,媒体对数据的需求日益增大,在行业内外,数据的转让、购买成为普遍现象。媒体在以有偿、无偿的方式获取数据时,首先要核定数据提供者是否是依法获取的数据,对到手的数据进行积极求证,减少和避免使用通过非正当渠道获得的、存在一定隐患的数据。并且要对数据提供方进行核查,如数据提供方是否具有数据所有权,是否對数据可以支配,以免产生法律纠纷。而数据的真实性更需要媒体反复研究。
4.法律渠道下的信息安全保护。在大数据时代,如果我们从立法角度考虑信息安全的保护,会有以下三个问题值得深思:
一是数据是否可以被使用,如何界定其隐私性与敏感性。当前互联网环境下,信息产生的联动是赋权的,许多APP、网站都通过联动登录的方式获取用户数据,抓取用户数据是网络服务商获取信息的前提和基础。在2013年2月的《指南》将个人信息区分为一般信息和敏感信息,在互联网抓取数据的同时,需要对一般信息和敏感信息进行快速分类,并且做出处理,例如对敏感信息进行锁定或者加密。另外要明确的一点是,授权登录和授权使用是两个概念,用户在“必须”的语境下进行网站授权登录,但是网站并没有获得用户数据的使用权,这是当前法律需要严格界定的。
二是数据到底应该掌握在谁手中,由谁主导其编辑与使用的过程。各类门户网站、软件都需要采集信息,但从采集到储存,从储存到用以某种需要,公众很难知晓各个环节自己的信息被如何应用了,本应该属于公众的信息被他人获取并使用,而公众很难知情,也鲜有权利决定自己的数据在哪、怎么用、去哪里等等问题。法律应该从规范上明确公众对自我信息的主导权,给予公众自身主导意识,加强自我信息保护。
三是当隐私信息受到侵犯,被非法使用后,如何追责的问题。现下的数据安全领域,法律知识匮乏,并且很难界定责任主体。例如数据新闻中用到了部分用户的隐私信息,谁来承担责任呢?新闻工作者认为自身只是进行了数据搜集工作,由数据提供者承担责任;数据提供者认为自己只是存储了相关信息,侵权行为产生于新闻工作者挖掘过程中,应由新闻工作者承担责任;还有的认为个人上传了信息,导致信息被抓取,由个人承担责任。在责权过程中矛盾时时存在,应通过缜密研究对各类侵权行为作出严密界定,以引起各方面注意,同时使个人明确自己的责任,在责任之上运用信息,避免越轨,保障信息安全。
四、结语
变革的背后总有无穷尽的问题等着我们解决。数据信息发展的广阔与快速为我们带来了生活的便利,也为数据新闻的发展铺了路,但这条路上有置于明处的阻碍和隐于暗处的危险。信息安全就是其中之一,唯有通过行业、个人和法律层面的约束加以规范,才能使数据新闻更长久地走下去。
(作者学校:湖北大学新闻传播学院)
【参考文献】
[1]方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013,35(06):73-83;[2]王忠.大数据时代个人数据隐私规制[M].北京:社会科学文献出版社,2014: 52-53;[3]陈绚.大众传播法规案例教程[M].北京:中国人民大学出版社,2009: 178;[4]王利明.“个人信息资料权”是——项独立权利[N].北京日报,2012-07-09;[5]邱雨.大数据时代对新闻传播的影响[J].传媒论坛,2019(01):52+54;[6]许向东.数据新闻实践中的法律问题分析[J].新闻爱好者,2017(04):25-28.
【基金】国家级大学生创新创业训练项目:《大数据时代下数据新闻的发展与规范——基于信息深度与信息安全》(项目编号:201810512028)。