APP下载

“深度伪造”背景下新闻事实核查的路径探析

2021-07-06徐燕萍

新媒体研究 2021年4期

徐燕萍

摘 要 社交媒体时代,虚假新闻泛滥,原先的新闻事实核查已经发生了变化。但“深度伪造”技术的出现,给新闻事实核查又带来了新难题。应对这一困境,需要国家、社交媒体、把关者的共同努力,同时,更重要的是技术层面的探索,如开发检测技术、联手区块链等新兴技术以及研发“数字取证”技术。

关键词 深度伪造;虚假新闻;新闻事实核查

中图分类号 G2 文献标识码 A 文章编号 2096-0360(2021)04-0008-03

根据中国互联网数据资讯网最新发布的报告显示,2020年Deepfake增长率超330%,美英成重灾区。自2017年“深度伪造”技术被某Reddit用户制作伪造色情视频以来,“深度伪造”已逐渐渗透至政治、媒体等多个领域。至2020年,伪造品的数量已经达到49 081个,创下历史新高。“虚假新闻泛滥”这一现象长期以来都困扰着媒体,而“深度伪造”可能会使这一问题更加严峻。面对移动互联网和社交平台的日益普及,传统的人工核查已经难以应对,原先的事实核查也发生了一定嬗变。应对“深度伪造”,事实核查的路径还需做出更多转变与创新。

1 “深度伪造”简述

“深度伪造”是“deep learning(深度学习)”和“fake(伪造)”的合成词,作为“深度合成”技术的一种,“深度伪造”本质上是一种人体图像合成技术,能够根据人类的行为特征,合成图片、视频、语音,完成人脸替换[1]。催生“深度伪造”的是技术人员的一个简单想法,将两个深度学习的算法相互叠加,即可获得逼真的图像输出结果。两个算法分别是生成器与判决器,生成器负责原始数据的收集、复制,判决器负责鉴别伪造数据。

“深度伪造”的代表性应用是AI换脸,多应用于色情领域,如今,“深度伪造”已经开始涉猎政治、广告、科学、医疗等其他领域。“深度伪造”开发者表示,该技术正在迅速发展,他们可以模仿的对象没有限制,这意味着每一个人都是潜在的目标,未来“深度伪造”可能带来一系列风险。同样地,“深度伪造”技术对新闻真实性也会构成威胁。在“后真相”时代,公众对媒体已经产生了信任危机,而“深度伪造”技术的出现会加剧这一现象,对新闻媒体的公信力造成进一步的冲击[2]。

2 新闻事实核查的现状

基于“深度伪造”技术篡改的视频、图片,虽然对虚假新闻的传播会起到推波助澜的作用,但虚假新闻并非起源于“深度伪造”。自新闻诞生的那天起,虚假新闻便如影随形。新闻事实核查作为应对虚假新闻的有效措施,能从源头避免虚假新闻的传播,在社交媒体环境下,原先的新闻事实核查也发生了一定变化。

2.1 核查范围广泛

為确保政治新闻的真实性,2007年,《华盛顿邮报》针对2008年的美国大选推出了名为“Factchecking”的事实核查项目。同年,《坦帕湾时报》也成立了“PolitiFact”网站,并于2009年破格获得了普利策新闻奖。起初,这些机构和平台核查的内容均为政治或公众人物的言论。然而,在媒体“抢新闻”的社会化媒体时期,海量信息的实时化传播虽然获得了可能,但也造成了虚假新闻的泛滥,严重影响了新闻的传播品质与媒体的公信力[3]。由此,核查对象由政治人物扩散至社会化新闻,这一转变以2010年4月美国“Storyful”网站的创立为标志,该网站致力于对美国各社交媒体上的用户生产内容进行核查,并根据信息的真实情况贴上相应标签。

2.2 核查方式多元

传统媒体时期,事实核查工作主要依靠人工,核查人员通过已有的知识与经验、查阅文献资料、跑现场沟通等途径核查信息。随着技术的迭代与进步,新兴技术成为了核查人员提高核查效率的得力助手。核查人员能够利用大数据、算法提供的数据库进行智能核查,迅速准确地定位、识别、排除虚假信息[4]。美国的信源调查网站“Storyful”发明的信息检测工具——“新闻专线”便是基于大数据等技术进行信息检测。一些机构还专门推出了事实核查客户端,如国外《华盛顿邮报》的“事实核查者”(TruthTeller),国内的“腾讯较真平台”等,这些平台利用机器人和新兴技术,能自动对网上冗杂的新闻数据进行核查,及时纠正错误信息。

2.3 核查过程趋动态化

传统媒体时期,新闻发布由专业媒体垄断,核查一般在事前,且核查主体为专业的新闻从业者。社交媒体时期,普通网民的主体地位凸显,话语权提升,这种垄断被打破[5]。同时,传播速度的实时化要求与海量信息使得核查人员的工作负担加重。由此核查过程发生了两点明显的变化:第一,核查顺序由“事前核查”变成了“后续纠正”或“事件追踪”;第二,核查主体由专业媒体扩散至普通网民。移动互联时代,新闻由新近发生的事件转变为即时发生的事件,事实核查也转变为动态的过程,需根据事件发展状态及时跟进核查进度。而普通网民在提供一手信息,搜集信息素材方面能够起到重要作用,因此一些核查机构也鼓励网民主动参与核查工作[6]。

从以上几点变化可以看出新闻事实核查在不断完善,但从互联网上“虚假新闻依然泛滥”这一现象可以发现,新闻事实核查存在以下效果困境。第一,社会化新闻鱼龙混杂,加重了核查人员的负担。第二,信息处于即时更新的状态,大数据提供的数据库未必全面。算法在定位虚假信息时存在立场偏差,这些虚假信息未必最值得核查,但一定最吸引人的眼球[7]。第三,网民缺乏专业媒介素养,容易被虚假信息蒙蔽双眼。而“深度伪造”技术的出现,则为核查新闻事实带来了更多难题。

3 “深度伪造”技术下新闻事实核查的困境

3.1 伪造内容成为虚假新闻的信息素材

在“全民皆记者”的社交媒体时代,社交媒体是重要的新闻来源场所。移动网络的广泛普及,使得专业记者不需要跑现场,滑动手指便能获取最新信息。但社会化媒体作为一个以用户生产内容为主体的平台,信息质量参差不齐。虚假新闻久久得不到根治,主要是因为有盈利市场,能博人眼球。如今图片、视频等元素使得新闻的形式更加多元,而经过“深度伪造”合成的图片、视频更具趣味性,更能贴近用户需求,抓住人们的猎奇心理[8]。在“深度伪造”技术加持下,各类虚假照片、视频在社交媒体上疯狂蔓延。不仅误导了大众,也误导了专业媒体人,将这些合成内容作为新闻来源,进行二次传播。

3.2 伪造内容常人难以鉴别

早期,“深度伪造”需借助同一面孔的多张不同角度照片才能完成人脸替换,且替换痕迹较明显。随着技术的不断进步,如今仅凭一张照片就能实时匹配面部表情,生成换脸视频,还能自动调节替换后脸部的色差、亮度及替换边缘的差异。虽然已有相关检测技术能识别出伪造内容,但未来前景仍不乐观。在“深度伪造”技术背后,生成器和鉴别器是相辅相成的,鉴别器在识别伪造内容方面可能会做的越来越好,但同时,生成器也能通过当前的鉴别技术进行防御和反击。这意味着,鉴别技术无法永远保持在生成技术前方[9]。面对技术都无法完全鉴别的伪造内容,常人更是难以鉴别。

3.3 伪造信息的传播范围广泛

在每一次的重大事件中,我们几乎都会在社交媒体上发现误导性视频和照片。这背后体现出的是社交媒体病毒式的传播特征。与传统媒体相比,社交媒体具有即时、互动、分享、“多对多”交流等特点。社交媒体UGC的形式得以让每个用户成为关系链传播中的一个节点,因此,往往能取得“病毒式”的传播效果[10]。2018年4月网上流传的“奥巴马辱骂特朗普”的造假视频,2020年初在社交媒体上引起广泛转发的“被火烧焦的澳大利亚”的造假图片,这些伪造视频、图片都是结合时下人们关注的热点,再借助社交媒体的涟漪效应,造成了大规模的扩散,误导了大众。

4 “深度伪造”背景下新闻事实核查的应对之策

4.1 国家、社交媒体、把关者的共同努力

在社交媒体信息泛滥的背景下,网络信息本就让人真假难辨,而“深度伪造”技术进一步提高了可靠信息的获取成本,增加了新闻事实核查的难度。为应对这一困境,国家、社交媒体、把关者需携手应对。

首先,国家应出台规制“深度伪造”的相关法案,法律规制是应对技术风险的必要手段。当前,美国、欧盟、德国在立法方面较为积极,相关法案也比较细致,值得我国借鉴。我国尚没有针对“深度伪造”专门立法,但相关法案已有涉及,未来还需继续完善[11]。其次,作为虚假新闻肆虐的重要场所,社交媒体也应担负起平台的责任,完善管控措施。添加事实核查标签、资助研究机构研发“深度伪造”检测工具等都是必要的措施。此外,社交媒体也应积极与其他平台、机构合作,完善核查数据库,提高核查效率。最后,把关者作为新闻事实核查中最重要的一环,应做好把关,回归“事前核查”[12]。在发布新闻前,尽到“把关”的职责,从源头阻断虚假新闻的传播。虽然利用相关技术能提升核查效率,但技术可能存在漏洞,人工核查仍是核查工作中不可或缺的一步流程。

4.2 技术层面

随着“深度伪造”技术的门槛大大降低,普通人逐渐也成为了“应用者。未来“深度伪造”可能被用于篡改图像、视频,制造大量的虚假新闻。为避免“深度伪造”严重挑战新闻真实的边界,在改善新闻事实核查的过程中,更应注重将“深度伪造”考虑在内,探索技术方面的应对措施。

1)开发基于人工智能模型的检测技术。目前,学界和业界对“深度伪造”检测技术的开发如火如荼。其中,研究最多的是基于人工智能模型的检测技术。国内清华大学的人工智能企业RealAI发布的深度伪造视频检测工具——“DeepReal”,主要利用深度學习算法、大量数据集训练模型,可在1秒内对超过10人同框的图像与视频进行识别,识别率可达99%。“DeepReal”还于近日完成了新一轮的服务与算法升级,在原有基础上,新增批量导入、输出检测报告等功能,检测范围及防御对抗能力大大提高。2020年1月,北京大学与微软亚洲研究院联合推出深度伪造识别工具“FaceX-Ray”,能将假脸重新混入目标图像或视频,以从中寻找边界,能有效地识别出未被发现的假图像,并可靠地预测图像混合区域,精准度可达99%以上。国外也有许多研究成果,美国Adobe公司推出的反向PS工具。依托于AI算法,该工具能自动识别出人像图片中经过图像液化工具修改的部分,并将图像还原,准确率高达99%;滑铁卢大学的研究人员开发了被称为“Darwin.AI”的技术,该技术使用深度学习来检测虚假新闻;加州大学河滨分校的研究人员研发出了一种由递归神经网络和编码过滤器组成的自动检测算法,能够将伪造图像分成若干部分,在更全面的层次上去考虑整个图像的情况,准确率在71%~95%之间[13]。以上这些检测工具为核查新闻事实、打击伪造内容带来了新希望,但基于“生成对抗网络”的技术原理,这些检测技术也很容易被识破。因此,未来技术人员仍需不断开发、完善检测技术。

2)联手数字水印、指纹与区块链,对视频进行溯源。应对“深度伪造”,确保信息真实,仅依靠人工智能模型远远不够,有必要结合数字水印、区块链等新兴技术。数字水印是信息安全领域的前沿技术,能够通过信号处理的方法在多媒体数据中嵌入隐蔽的标记,这种标记只有通过专用的检测器或阅读器才能提取,通常不可见[14]。数字水印安全性高,难以篡改,会随着原始内容的变化而变化,从而能够检测出原始数据的变更。此外,数字指纹同样适用于检测伪造视频。在发布相关视频前,可以提取视频中一些重要信息作为视频指纹,如此每个视频都能够生成一个特定的指纹,相当于该视频身份的标识,也利于鉴别伪造视频。区块链作为记录互联网数据的新方式,同样是应对“深度伪造”的有效方式[15]。区块链最大的特点是能对原始数据进行溯源,既有利于版权保护又能识别篡改内容。除了追踪视频内容的来源,也可以在区块链上创建视频的同时加上验证标签或者图形。当遇到可疑的音视频文件时就能进行身份验证,与原始文件比较,将伪造内容剥离出来。为了应对“深度伪造”滥用的增加,Ambervideo.co公司开发了检测软件,可以查看视频和音频轨道及其中的各个方面,以寻找可能的修改痕迹。但这种追溯方法无法检测到新的“深度伪造”算法,为此该公司以区块链作为基础结构,每30秒存储一次哈希值,若参数被更改则暗示着视频被篡改的可能性。

3)聚焦新闻媒体,加快“数字取证”技术的研发。目前反“深度伪造”检测工具已经有了一定研究成果,但媒体生成和操纵技术也在快速发展,当前的检测技术还不足以检测伪造的媒体信息,因而为媒体研发应对虚假新闻的检测工具迫在眉睫。在这方面,我国可以借鉴美国国防高级研究计划局设立的“媒体鉴证”项目,该项目旨在寻求“深度伪造”识别工具,应对大规模的自动化虚假信息攻击活动。鉴于目前的检测技术可能会随着篡改技术的飞速发展而不断失效,国防高级研究计划局还研发了“语义取证”技术,检测遭篡改媒体中的“语义错误”。这些“语义错误”往往是伪造媒体容易忽视的细节,如人物佩戴的耳环前后不一致。这种语义不一致性检测工具若能最终形成,将会显著提高媒体伪造者的作恶成本,防御者也可以轻松判断媒体真伪。此外,“深度伪造”作为人工智能的一个分支,我们自然也能通过人工智能来反向助力数字媒体取证。谷歌母公司Alphabet推出的一款名为“Assembler”的AI工具,能够帮助人们检验原始照片是否被篡改。对于新闻媒体而言,“Assembler”或许可以成为一款得力的事实检查工具。目前“Assembler”已经被法新社、CodeforAfrica和Rappler等在内的新闻和事实检查机构所采用。媒体内容作为网络数字内容的主体,在网络安全中占据着重要的地位,数字取证与安全可以维持现代数字社会秩序,确保数据的真实可靠,维护媒体的信誉。国内目前还未出现成熟的数字媒体取证技术,但首届中国媒体取证与安全大会已于2020年11月6日至11月8日在合肥成功举办,相信不远的将来数字媒体取证与安全会发展至一个新的台阶。

技术是中立的,“深度伪造”作为一种技术,并无对与错。“深度伪造”也带来了许多信息红利,如帮助电商平台实现“数字试穿”,帮助广告主实现“千人千面”的营销,满足受众的多样化需求等等[16]。但不能忽视“深度伪造”造成的色情犯罪、声音诈骗、虚假新闻等问题,尤其是虚假新闻,对媒体、政府、社会的信任体系会造成猛烈的冲击。因此,新闻事实核查仍要坚守,除了政府、社交媒体、把关者的共同努力,更要在技术层面积极探索,开发检测技术。

参考文献

[1]张涛.后真相时代深度伪造的法律风险及其规制[J].电子政务,2020(4):91-101.

[2]殷文,张杰,郑方惠.网络谣言传播过程中的中介化信任研究[J].当代传播,2019,05:36-39,60.

[3]袁玥,冯广圣.突发公共事件中农村社区大喇叭强动员效果探析:以新冠肺炎疫情报道为例[J].新闻知识,2020(11):47-53.

[4]孙梦婷,何晴,黄蓉.故宫文创的跨媒介传播策略[J].东南传播,2020(9):83-85.

[5]李惠敏.助力乡村文化自信:涉农纪录片的当代价值研究:以记住乡愁为例[J].东南传播,2020(6):35-37.

[6]杨鑫,冯广圣.基于趣缘的隐形连接下文化的狂欢:基于“惊雷”“淡黄长裙”现象的考察[J].东南传播,2020(11):83-85.

[7]位云玲,冯广圣.算法新闻推荐的社会责任反思[J].新闻知识,2020(9):23-26.

[8]冯广圣.报业“一体化”转型模型构建[J].新闻与写作,2018(3):94-96.

[9]魏书音,刘玉琢.深度伪造技术正在颠覆网络空间的可信性[J].网络安全和信息化,2020(10):27-28.

[10]李越,吴斯,冯广圣.UGC视角下的网络社区内容分层管理个案研究:以站酷社区为例[J].东南传播,2019(7):121-123.

[11]位云玲.原创文化类综艺节目持续走红的原因探究:以《上新了!故宫》为例[J].艺术评鉴,2019(7):169-170,76.

[12]位云玲.新闻反转的内在机理、影响及治理探究[J].新聞知识,2019(4):86-89.

[13]张桦.网络空间“深度伪造”的威胁及治理[J].网络空间安全,2020,11(5):45-51.

[14]陈昌凤,徐芳依.智能时代的“深度伪造”信息及其治理方式[J].新闻与写作,2020(4):66-71.

[15]梁瑞刚,吕培卓,赵月,等.视听觉深度伪造检测技术研究综述[J].信息安全学报,2020,5(2):1-17.

[16]丁月明.试论网络直播对农产品销售的影响[J].东南传播,2020(5):56-58.