议新闻机器人网络安全的隐忧及对策
2018-06-30黎文松
【内容提要】在担忧新闻机器人是否将代替人类记者时,人们或多或少地忽视了其网络安全。随着新闻机器人逐渐渗透至网络的各个领域,其作为“技术”的本质或将引发多种问题,威胁着网络安全,我们有必要采取相关措施以防患于未然。
【关键词】新闻机器人 网络安全 对策
2017年“两会”期间,人民网、《光明日报》、新华社等数十家媒体共推出15台虚拟及实体新闻机器人,在“两会”新闻报道中可谓赚足了眼球。作为新兴科技的新闻机器人以高效、精准的数据挖掘及分析大大解放了人类记者的生产力,使其得以投身于挖掘数据背后的潜在关系,以生产更高质量的新闻。然而,在担忧其是否将取代新闻记者时,不少研究者却忽略了新闻机器人的网络安全。相较于传统的网络安全,新闻机器人所引发的网络安全问题将更为集中,防范及控制难度更大,这是必须要引起重视的问题。
一、新闻机器人的发展趋势
所谓“新闻机器人”,实际上是一套软件或算法语言,它自动采集数据,然后撰写出人类可读的内容。①通过哥伦比亚大学对“叙事科学”公司的新闻机器人进行的数据公开,我们可以发现,新闻机器人的新闻生产主要包含五个步骤,即数据抓取、“新闻性”评估、确定角度和框架、填充“故事点”和文本生成。这一新闻生产流程全程实现自动化,能通过低廉的成本生产海量的新闻资讯,大大减轻了记者的数据信息采集负担,有望开启“人机分工”新闻生产模式的新篇章。以美联社所使用的Wordsmith为例,其在相同时限内生产的新闻数量是人类记者的十倍不止,打破了人类的新闻生产极限;同时,基于互联网断点式数据抓取技术,新闻机器人能在天气、财经及体育等有着“纯净数据”的信息领域,高速发布较为准确的新闻资讯,目前已在欧美各主流媒体得到广泛推广。2015年,腾讯公司成功开发Dreamwriter写作机器人,迄今为止以每天产出超过2000篇财经科技类稿件、500篇体育类稿件的速度进行写作。同时,随着新华社的“快笔小新”、《南方都市报》的“小南”以及今日头条的“张小明”等新闻机器人投入使用,我国的机器人写作也逐渐步入发展的上升期。
然而,新闻机器人在为新闻工作者带来极大便利的同时,也为网络安全带来不小的隐患。从“安全”的指数来看,网络安全侧重于网络社区的安全,强调“网络系统中的数据内容是否遭到破坏、更改、泄露,系统是否连续可靠地正常运行等”,②着眼于信息的机密性、真实性以及可验证性。随着新闻机器人全面兴起,其广泛的数据抓取分析、高度的自动新闻生产在一定程度上不断地侵蚀着这一网络信息安全基础,同时其自身的“技术”本质也或使法律责任判定陷入混乱,使得网络安全面临新的考验。
二、新闻机器人网络安全的隐忧
(一)广泛的数据抓取或导致个人信息泄露
“叙事科学”公司的CTO曾指出在未来的15年内,将有超过90%以上的新闻由机器人生成。换言之,未来的新闻机器人将不局限于天气、体育及财经等“公共数据”领域。随着软件的推陈出新,机器人算法逻辑的不断增强,新闻机器人将能胜任新闻行业大部分领域的数据采集及信息挖掘工作,其数据覆盖范围将逐步脱离“纯净数据”的范畴向着大众化、生活化的信息内容方向发展,基于强大互联网索引及数据抓取技术的新闻机器人,在拓展了信息收集及传播技术的同时,也对网民的个人隐私安全提出了挑战。
据CNNIC发布的第39次《中国互联网络发展状况统计报告》显示,截至2016年12月,我国网民规模已达7.31亿。③庞大的用户群体产生的UGC内容已占据互联网知识信息的大半江山。浩如烟海的数据信息中实则包含了丰富的个人资料数据,如用户的居住地、职业、年龄、兴趣爱好、个人习惯等等,加之接入互联网所产生的Cookie信息包,用户在机器人算法面前可谓一丝不挂。鉴于先前“传感器”新闻生产的成功运用,如今有着强大的数据处理能力的新闻机器人,对于大数据的处理分析已是轻车熟路,因而对于互联网用户的个人生活轨迹的分析更是不在话下。随着新闻机器人不断渗透生活的各个领域,依照其已被压缩至毫秒的信息处理、分析及评估过程,新闻机器人能在现有模板支撑的情况下,在短时间内完成某特定网站所有用户的个人情况报告。如果说在大数据时代用户的个人隐私保护已是形同虚设,那么当“90%的新闻由机器人撰写”的时代来临之后,用户个人隐私安全将面临更为严峻的考验。
(二)“脱缰”的新闻生产或引发舆论动荡
2014年,谷歌公司的“維基百科实时监测”机器人曾因《纽约邮报》关于失踪球员昆顿·罗斯的一则乌龙新闻自动发表一条推特简讯,称该球员的尸首已被发现。虽然这则新闻在之后得到报社的澄清,但谷歌旗下的新闻机器人却因内在算法的限制未能对已发布的消息进行改正,导致这一“假消息”得以继续传播,存在散布不实消息之嫌,造成了不小的舆论动荡。
依托算法程序的机器人新闻生产模式的一大亮点便是高度的自动化,在数据爆炸的今天能够快速、准确地挖掘新闻素材并迅速以简报的形式进行上报或直接发表。“黑箱”技术的特点却决定了其运行过程的不可逆且难以控制,程序一旦检测出数据异常波动便立即触发新闻写作流程,能在极短的时间内完成新闻的写作及发布。然而现阶段基于程序运作的机械缺乏人类所具备的批判性思考,也无法亲临现场获取一手资料以验证消息真伪。在上述案例中,新闻机器人的新闻生产流程之所以被触发,是因为在同一时间段内出现五个人对三个语言版本的“昆顿·罗斯”词条进行修改,算法在没有也无法确认事实真伪的情况下判定这是一条“重大新闻”。不可否认,新闻机器人在数据监控挖掘、信息整理及撰写速度上远超人类,然而其错误的产生及传播的速度也同样远远领先人类。同时,病毒性的网络传播模式能使机器人产生的错误或有害的信息,以前所未有的速度扩散至整个网络社区。另外,新闻机器人的新闻写作尚未摆脱“陈述事实”的模式。这种客观事实陈述虽然在一定程度上避免了人类记者所持有的个人偏见,然而冰冷的数据罗列在缺乏新闻工作者所必须具备的人文关怀的同时也将留下巨大的解读空间,存在被过度解读的危险。一旦发生信息误读或恶意的信息投食行为,“脱缰”的机器人新闻生产便可能引发网络舆论动荡。
(三)“技术中立”或导致责任判定混乱
一旦新闻机器人产生上述行为对网络社区利益造成损害时,人们最先想到的便是诉诸法律以求制裁。然而,新闻机器人在本质上属于一种技术手段,其复杂的技术背景以及作为互联网技术的本质,或将使法律责任判定因“技术中立”原则陷入困境。
从早期的“索尼案”到“Napster案”再到2016年的“快播案”,“技术中立”一直是新兴技术领域所不可避免的话题。一方面,技术本身无罪,并且新闻机器人作为非“自然人”在法律上无法承担相应的法律责任,这将导致造成个人隐私泄露或引发舆论动荡的新闻机器人无法作为被告被起诉。另一方面,回顾新闻机器人的发展史,谷歌公司拥有新闻机器人源代码的专利权,并授权于美国“叙事科学”、“自动洞见”及法国“耶索”等公司进行开发使用。新闻机器人的开发初衷并非为实施违法行为,因此谷歌公司作为“实质性非侵权”技术的提供者也同样不承担法律责任。那么,是否授权开发公司或网络中间商应为新闻机器人产生侵权行为或发布不实消息而接受制裁呢?依据现有案例分析,中间方责任的认定主要是基于行为人是否能被证明存在“指示、鼓动”的言论,是否存在“共同”犯罪的行为。然而,暂不提在取证、立案等技术层面对上述责任进行判定存在极大的困难,我国现有法律在新闻机器人违法事件追究责任方面依旧是空白,而走在新闻机器人领域前沿的美国也依然处于立法讨论阶段,并无明文法律进行指导。同时,从科技立法角度看,过早地对尚未成熟的新闻机器人进行专项立法存在投入大、回报小的缺陷,并不利于该技术的完善和发展。因此,法律的缺位使得当新闻机器人造成违法行为后,因“技术中立”的抗辩理由而使得责任方判定陷入混乱,为网络安全的有序发展埋下祸根。
三、新闻机器人隐患之对策
(一)限制数据库接入,完善机器人访问协议
新闻机器人对于个人隐私信息的获取,是基于对社交网站及公共网络数据的监测及抓取。然而,全球至今尚未对机器人数据覆盖边界做出明确的规范。出于新闻工作的要求,我们不能摒弃新闻机器人算法中所包含的数据监测及评估系统和联想机制,反而应大力发展之。因此,采取一定措施限制新闻机器人对网站数据库的接入并完善机器人访问协议,对保护用户隐私、防止侵权行为的产生有着极为重要的作用。被监测网站可与包含敏感信息的数据库(如用户Cookie数据)设立相应的机器人监测及排除协议,并做好信息漏洞的检查及防范措施;同时,新闻机器人的运作方需明确“新闻”与“隐私”的边界,从数据喂食的源头控制新闻机器人的数据库覆盖范围,并规范机器人新闻生产的内容,杜绝涉及个人隐私信息的新闻发布,在技术层面做好互联网社区的隐私保障工作。
(二)坚持“把关人”角色,做好审查及补充工作
美联社于2014年开始在机器人新闻撰写方面取消了原有的人工审核制度,新闻机器人可以不经由人工审查自动完成从数据采集到新闻发表的全过程。但美联社很快表现出了对新闻机器人的不放心,并推翻先前声明,坚持对“每篇自动生成的报道进行审阅后再发表”④。笔者认为,随着新闻机器人逐渐深入人类生活的各个领域,在大力发展其新闻生产自动化的同时必须保证内容审查工作的进行,对于部分深度新闻写作更是需要“把关人”对新闻内容进行审核把控,在提高新闻生产效率的同时保证新闻内容的真实性。同时,鉴于新闻机器人的语言组成技术依旧处于发展阶段,运行方在对稿件进行润色的同时也可对部分缺乏逻辑或停留于陈述层面的内容进行补充说明,在提升机器人新闻的可读性的同时完善新闻内容,防止新闻被过度解读所引发的舆论危机。
(三)完善标准评估,确定相关责任方
目前,我国的数据库建设依旧处于发展中状态,技术发展的不对等使得相关利益方的平衡关系发生了改变。因此,在采用“知道原则”“诱导原则”⑤之余,各利益方可集中进行協商并结合实际国情制定相应的责任评判标准。同时,虽说“技术中立”原则是科学技术得以迅猛发展的一大“保护伞”,但是一旦技术被投入市场并广泛使用,技术的开发及运营方就肩负着一定的社会责任及义务。在新闻机器人开发公司不断对算法进行更新以及发布补丁的同时,新闻机构作为技术的使用方在做好相应的技术更新及审核工作之余,必须履行对所属新闻机器人的监管责任,在运行新闻机器人的过程中不忘掌控机器人的“电源”。“解铃还须系铃人”,技术所导致的问题还须交由技术解决,因运营不当所导致的后果也应由相关运营方承担,而非法律或社会为其买单。
注释:
①邓建国.机器人新闻:原理、风险和影响[J].新闻记者,2016(9).
②王世伟.论信息安全、网络安全、网络空间安全[J].中国图书馆学报,2015(2).
③中国互联网络信息中心.第39次《中国互联网络发展状况统计报告》.http://www.cnnic.net.cn/gywm/xwzx/rdxw/20172017/201701/t20170122_66448.htm.
④孙瑛.机器人新闻:一种基于大数据的新闻生产模式[J].编辑之友,2016(3).
⑤武万方.论技术中立原则[D].中南民族大学,2015.
作者简介:黎文松,南昌大学外国语学院硕士研究生
编辑:王洪越