新闻业数据化转型发展的现状与建议
——以个人信息保护为视角
2019-03-28刘曼
刘曼
麦肯锡全球研究院2011年发布研究报告指出,大数据时代已经到来,数据正成为与物质资产和人力资本相提并论的生产要素。《中国互联网络发展状况统计报告》显示,截至2018年12月,我国网民规模8.29亿,普及率达59.6%;网络购物用户规模6.10亿,年增长率为14.4%;手机网络支付用户规模5.83亿,年增长率为10.7%。互联网和大数据的迅猛发展,不仅为包括新闻业提供了难得的机遇,也对处于数据收集和共享“底层”的个人信息保护带来了挑战。
自2013年棱镜门事件曝光美国电子监听计划以来,个人信息因主观、客观原因发生泄露,甚至造成严重危害的事件就不时见诸报端,包括雅虎于2014年遭到黑客网络攻击并造成5亿用户信息泄露,京东12G用户数据泄露,全球勒索软件“WannaCry”爆发,“剑桥分析”获取脸书(Facebook)8700万用户个人信息并被指对选民进行精准信息投递和影响选民决策,山东临沂学生徐玉玉因遭受电话诈骗不幸离世,四川母亲将孩子照片晒到社交网络导致孩子被绑架勒索等。本文以个人信息保护为视角,探讨新闻业数据化转型发展过程中如何兼顾个人信息保护。
新闻业数据化转型发展的现状
2015年8月,国务院颁布《促进大数据发展行动纲要》,要求全面推进我国大数据发展和应用,加快建设数据强国。新闻工作者在创作作品时需要收集、整理、分析现有数据,所形成的作品又体现为数据成果,成为各行各业进行研究工作的数据来源。可见,数据收集使用贯穿于新闻工作者创作全过程,新闻业需要切实维护所收集、使用个人信息的数据安全。
新闻传播方式的数字化
近年来,新媒体发展的重点从门户网站、搜索应用等PC端转移至智能手机、平板电脑等移动终端。伴随着数据技术对新闻业的渗透,基于对数据的反复抓取、挖掘、统计、分析和可视化呈现的数据新闻也日益成为新闻报道的重要方式。
2009年,英国《卫报》网站首次推出数据新闻博客,路透社、彭博社、英国广播公司等媒体也开设了数据新闻栏目。2011年伦敦骚乱发生后,《卫报》与伦敦政治经济学院合作,历时一年多完成了名为《解读骚乱》(Reading the Riots)的专题融合报道,对与谣言相关的260万条Twitter信息进行数据分析,并对数百名研究对象深度访谈和问卷调查,该报道引发了广泛关注。
在国内,搜狐、网易、新浪、新华网、财经网等媒体从2011年开始陆续开设数据新闻栏目,用数据、图表展现和解读新闻信息,提升了读者的视角效果和直观感受。同时,为解决海量数据导致的“信息过剩”问题,根据用户的注册信息(如职业、年龄、性别)、阅读行为、地理位置、社交关系等信息对用户需求进行人工智能分析,推送个性化信息以满足用户需求的信息定制服务逐渐普及。“今日头条”即是以数据挖掘、用户需求图谱分析为基础的推荐引擎产品,为用户推送个性化信息内容,提升用户阅读体验和客户粘性。
新闻创作的线上化
2014年,美联社利用机器写作软件Wordsmith采写财经新闻、突发新闻;同年3月,《洛杉矶时报》机器人在3分钟内报道了洛杉矶4.4级地震。2015年,腾讯财经开发写稿机器人Dreamwriter,并将其用于自动化新闻写作中;新华社也推出了机器人记者“快笔小新”,依托大数据技术对数据进行实时采集、清洗和标准化处理。2017年8月九寨沟发生地震后,中国地震台网机器人用25秒完成了540字的文字稿件,配发4张图片,内容包括速报参数、震中地形、热力人口、周边村镇、周边县区、历时地震等。写作软件的产生,得益于互联网技术发展和大数据运用,可以发挥写作软件收集、分析财经数据的优势以及在突发事件中快速反应、挖掘数据的能力,适用于财经、突发类新闻报道。
同时,众包新闻逐渐流行。众包新闻是基于UGC(Users Generated Content,即使用者创造内容)的新闻创作,把新闻创作变为信息采集过程。对于新闻记者难以独立完成、调研成本较高或难度较大的调查性报告,众包新闻能为新闻从业人员提供及时、大量的信息,有利于新闻写作效率提升。
新闻从业人员需提升综合素质
大数据的普及,会使媒体人员获得海量新闻更为便捷,同时获取独家新闻和强时效性新闻的难度,较之传统传媒也更大,这也对新闻从业人员提出了更高要求。正如美国皮尤研究中心2014年媒体研究报告指出的,正在寻找那些能够适应数字媒体采编流程的新闻采编多面手,比如数据库记者、可视化记者和计算机记者。新闻记者不仅需要学会收集、使用和分析数据,采编人员还需要和程序员、图表分析员等数据处理团队进行合作,利用数据分析和图表等方式提高受众的直观感受和易读体验。总之,在大数据时代,新闻从业人员的转型升级显得尤为重要。
转型发展对个人信息保护的挑战
在大数据时代,个人信息成为新闻创作的重要信息源,新闻作品又不可避免地出现个人信息。在新闻业转型发展过程中,个人信息保护面临着如下挑战:
我国个人信息保护的法律体系尚不健全。首先,个人信息保护法律规范统筹性不足。2017年《民法总则》第111条仅将“个人信息”作为法益,未上升为个人信息权,增加了对个人信息保护和权利救济的难度。作为生产、使用数据重要部门的新闻业,也缺少就新闻创作时如何兼顾个人信息保护的专门规定。其次,现行法律未对个人信息进行分类管理。我国从征信业角度对个人信息尝试了差异化管理,列举了敏感信息并对其特殊保护。但并未站在全行业的统筹角度划分个人信息类型,也未从新闻行业角度对个人信息进行类型划分和保护,容易造成新闻从业人员对可使用个人信息的范围和判断标准产生困惑。
新闻从业人员收集共享和分析数据时,存在侵害个人信息利益的隐患。从数据来源看,作为大数据时代的产物,新闻业转型发展过程中形成的数字化作品以个人信息的收集、分析和挖掘为前提,客观上可能因为信息来源渠道、信息使用范围等方面原因侵害个人信息。从表现形式看,诸如前述数据新闻、写作软件,在新闻创作过程中就需依托海量数据进行分析和挖掘,不可避免地涉及到姓名、性别、兴趣爱好、行为习惯等个人身份和行为信息;前述个性化信息定制、众包式新闻,以掌握用户的年龄、职业、地理位置、浏览记录、社交关系等作为新闻推送和创作的基础。新闻从业人员享受大数据带来信息便利的同时,需要兼顾新闻自由和个人信息保护,避免泄露、不当使用个人信息。在数据新闻、机器写作软件等新闻创作方式日趋普及的今天,新闻从业人员收集、使用和挖掘现有数据时如何判断所涉及个人信息是否已经个人授权同意或者属于个人主动披露,机器写作软件挑选、分析个人数据的判断标准和辨识能力如何明确和提高,这一系列问题有待在实践中予以规范。
存在侵害个人信息利益的道德风险。随着互联网技术尤其是移动互联、智能化技术的发展,新媒体日益成为信息传播的主导力量,但同时假新闻也逐渐增多。方兴东等学者将全球互联网发展历程划分为五个阶段,分别为20世纪60年代至1993年的前商业化阶段、1993年至2000年的第一次浪潮(Web 1.0)、2000年至2008年的第二次浪潮(Web 2.0)、2008年至2016年的第三次浪潮(移动互联时代)以及2016年之后的万物互联时代(智能时代)。在万物互联时代,假新闻突出成为社会文化方面的关注热点。大数据时代,媒体获得信息的渠道更加多元、分散,有些信息真假难辨、良莠不齐,假新闻不仅混淆了受众对于常识和事实的认知,还极有可能损害新闻当事人的个人信息和隐私。同时,个人信息的商业价值日渐明显,出现了以数据销售、倒卖为业的中介机构,新闻从业人员使用这些数据时可能侵害个人信息甚至是隐私权。此外,随着新闻业的数字化转型,新闻从业人员掌握着大量个人信息,如何防止从业人员监守自盗,防范个人信息从新闻媒体内部流出并造成当事人的损害,成为亟需解决的问题。
个人信息保护的相关建议
在大数据时代,为推进新闻业转型发展,强化优化个人信息保护,笔者提出如下建议:
完善相关法律规范。在评估各类现行规范及其实施效果基础上,研究制定个人信息保护统一规则,统筹规范各类信息收集和使用行为。将个人信息从法益升格为法定权利,将知情同意权、信息查阅权、信息安全维护权、信息更正权和信息删除权等,作为个人信息权的权利内容。梳理和总结新闻从业人员创作时侵害个人信息的典型案例和事例,由新闻主管单位或行业组织牵头制定新闻从业人员收集、使用和分析个人数据时保护个人信息的行业规范或操作指引,明确保护个人信息的原则、要求、实施要点和责任追究等内容,并根据新闻媒体融合发展情况进行定期动态更新。健全法律法规执行机制,对销售、倒卖个人信息获利或造成严重后果的中介组织与个人追究法律责任,净化网络空间。
健全新闻业对个人信息的使用机制。应根据个人信息和隐私、人格尊严的关联程度,区分个人的敏感信息和非敏感信息,对于前者建立更严格的保护机制并限制信息使用场景,对于后者推动形成更便捷的利用机制。个人敏感信息通常包括身份证号码、手机号码、种族、政治观点、宗教信仰、基因、指纹、性取向、性生活、银行账号密码、财产情况、病史等。新闻从业人员在收集、使用和分析上述个人敏感信息时,应尽较高的注意义务并严格限制使用范围,实现个人敏感信息来源渠道正规化和可溯源,并在经过个人事前授权以及新闻单位内部审核后方可使用。新闻媒体需建立对个人信息的风险评估机制,可以通过建立健全工作数据库、个人信息使用的白名单与黑名单(即明确新闻媒体可以使用的个人信息和不能使用的个人信息、区分真实信息与虚假信息等)、数据使用认证(即能够证明具有合法来源或已经本人授权同意的个人信息)等机制,减少新闻从业人员泄露、未经授权使用个人信息等情况。同时,对于机器写作软件、个性化信息推送等使用大数据、人工智能的新闻创作方式,应加强新闻媒体从业人员对作品和新闻的关键词筛查、最终审核把关,兼顾新闻创作的效率和质量,避免对个人信息的非法使用。此外,新闻媒体在收集、分析和使用个人信息时,可通过数据加密、数据匿名化等技术保护方式以及数据模糊化处理等处理方式,切断数据和个人身份的关联性,减少信息泄露风险。
加强新闻媒体内部管理。要着力提高新闻从业人员的数据分析协作、真伪信息甄别、个人信息来源判断等专业能力,促进新闻从业人员转型,切实推动传统媒体数据化转型和融合发展。要制定发生个人信息泄露和新闻侵权时的处理预案,做好危机处理;对于因故意或重大过失导致个人信息泄露或损害的从业人员,应严肃追究其法律责任、纪律责任。要通过培训、宣导和警示教育等方式,增强新闻从业人员的信息保护意识,规范个人信息使用,从源头上杜绝个人信息滥用和泄露的风险。