深度仿冒技术下表演者权制度的反思与完善
2022-08-10何炼红
何炼红,付 耀
(中南大学法学院,长沙 410083)
引言
深度仿冒技术,是借助“对抗生成网络”(GAN 模型)进行大样本生物识别数据学习,将个人的声音、面部表情及身体动作拼接合成虚拟内容的人工智能技术。由于其具有高度真实性、泛在普适性和快速演化性的技术特征,近年来被广泛应用于合成虚拟内容。2017年,社交新闻网站Reddit用户利用Deepfake制作色情视频并提供开源后,深度仿冒技术便开始进入公众视野。2018 年,“Lyrebird”公司开发的“语音合成”技术只要对目标人物声音进行1 分钟以上的录音,就能生成目标人物任何想说的话。2019 年,阿里巴巴利用该技术成功帮助一位失独母亲听见“女儿”的语音。2019 年3 月,一位AI 技术爱好者利用该技术将港版《射雕英雄传》中“朱茵版”黄蓉的脸换成明星杨幂,引发舆论热议,有媒体评论道:“视频中,杨幂的五官与朱茵的表情几乎全部融合,难辨真假。”[1]
2021 年,元宇宙概念①人们将供人类娱乐、生活乃至工作的虚拟时空称谓元宇宙。AI语音、NET 生成艺术、虚拟演唱会、全息人像投影、虚拟数字人、AR购物等都属于元宇宙的重要组成部分,同时也是深度仿冒技术的具体应用。的爆发,为深度仿冒技术提供了更加宽广的应用场景。2021 年洛天依登上央视春晚,虚拟偶像从“小众亚文化”走进大众视野。《人民日报》修复了老照片中志愿者的面孔,歌颂“最可爱的人”,其公众号平台播放量高达130 万人次,以新颖生动的形式传播了红色精神。北京冬奥会期间,全球首个手语AI 合成主播“小聪”解说谷爱凌夺冠,其播报可懂度达85%以上,有效帮助了听障人群及时接受资讯信息[2]。2022 年江苏卫视跨年晚会舞台上,周深与虚拟邓丽君影像合唱了《小城故事》等歌曲,“复活”后的邓丽君延续其演唱风格,呈现出“真人”现身的表演效果,带给观众不一样的视觉享受和内心冲击。
面对不断涌现的使用需求,深度仿冒制作内容愈加丰富多元。深度仿冒视频数量最多的类型是影视音乐,包含电影、电视剧、音乐等方面的内容。这类深度仿冒内容在互联网大量传播,深受用户喜欢和关注。据统计,2021 年新发布的深度仿冒视频点赞数已超过3亿[2]。由于被深度仿冒产品和服务覆盖的影视音乐,是大众文化传播交流的主要载体,与著作权关联紧密。2020 年5 月21 日,知识产权与人工智能产权组织对话会第二届会议将深度仿冒表演者权益问题作为著作权领域的一项重要议题提出[3],以探讨技术制作者、基底素材的原表演者(被替换者)与目标人物(替换者)等各类主体的权利和义务,引导受著作权法保护的影音文化正向传播。
一、深度仿冒的技术逻辑及对表演者权制度的挑战
(一)深度仿冒的技术逻辑
深度仿冒译自英语中出现的一个组合词Deepfake,是计算机“深度学习”(Deeplearing)和“仿冒”(fake)的组合。深度仿冒过程可抽象为将图片、音视频等源数据“喂养”给换脸、换声等以深度学习、虚拟现实为代表的合成类算法,再由算法借助机器进行数据“消化”,完成换脸、换声等操作[4]。深度仿冒内部采用双链条对抗机制,即GAN 模型。该模型运行的原理在于,由两组定位不同、相互协作的神经网络相辅相成。其中一组负责搜索、筛选、分类整理源数据,从而创建目标形象模型,作为生成器,完成“伪造”使命;另一组负责基于现实中的目标人物,归纳真实形象特征,从而对“生成器”伪造的内容进行验证,作为“鉴别器”,完成“侦察”使命。两组神经网络持续对抗优化,最终使得伪造结果通过侦察检验,达到以假乱真的效果[5]。2020 年5 月,澳大利亚战略政策研究所发布《深度仿冒武器化》,报告中详述了七种常见的仿冒工具,包括换脸、重新投射、口型同步、动作迁移、图像生成、音频生成、文字生成[6],这些工具的叠加使用使得仿冒效果更加立体。
与简单的P 图或一般的数字处理技术相比,深度仿冒技术具有高度真实性②Robert Chesney, Danielle Citron, Deepfakes and the New Disinformation War: The Coming Age of Post Truth Geopolitics, 98 FOREIGN AFF.147(2019).、泛在普适性[7]和快速演化性[8]。德国和意大利科学家曾以1 000 段“换脸术”视频为实验样本进行测试,发现普通人必须经过专业训练,才有可能鉴别真伪[9]。美国纽约大学和密歇根州立大学研究员通过AI 系统DeepMasterPrints 复制了23%的指纹数据,成功骗过了扫描仪,系统错误率仅为千分之一[10]。为普及技术应用,深度仿冒采用“无监督学习”。其训练数据不需标注,源数据获取便捷,应用软件无需安装编程语言和开源软件库就能运行,操作流程简化,极大降低了一般公众的应用门槛。GAN 模型使得运行机制会随着反制技术的升级而反向升级③例如,技术人员通过研究反制技术,从真假混合视频中,将光线明暗、皮肤纹理、眨眼次数及表情自然程度等细微差别点甚至血液流动特征转变为代码,加入反制工具的算法中,用于识别揭穿虚假音视频。然而,随着算法黑箱透明化的趋势,一旦反制算法公开,仿冒方便会依据再次反向的原理,同样将该差别化特征的代码加入“鉴别器”中,即在双链条对抗机制的循环中,只有当“生成器”生成内容符合正常光照条件、人物微表情连贯自然,肌肤肌理细致通常人无异以及眨眼次数、血液流动极限符合自然人规律等条件时,才能通过“鉴别器”的验证并顺利输出。毫无疑问,此时输出内容迷惑性倍增。,这种循环增强的模式决定了深度仿冒的快速演化性,促进深度仿冒内容愈加真伪难辨。
(二)深度仿冒技术对表演者权制度的挑战
行为是人类有目的的活动,技术是中立的,只有被注入恶意的滥用技术的行为才应当受到规制,从而倒逼技术的正向使用。深度仿冒行为是对深度仿冒技术的控制、利用和操作的行为。深度仿冒技术运用而生的新型“表演”形态正冲击表演者权制度,给客体和相关主体权利及义务的明晰带来系列挑战。
在客体方面,深度仿冒合成的数字化虚拟“表演”能与传统真人表演呈现效果无异,能否纳入邻接权客体范畴,亟须论证。
在权利内容方面,数字化虚拟合成“表演”融合了原表演者的面部、肢体表演和目标人物的肖像、声音等生物识别特征,公众难以识别真正的表演者,合成内容如何署名值得商讨。当表演形象被丑化或篡改时,原表演者可主张其保护表演形象完整权受侵犯,关于“歪曲”的认定标准争议是否受深度仿冒的影响进一步升级,“歪曲”内涵亟须界定。此外,原表演者能否一揽子控制对其表演数字化改动后合成的虚拟“表演”的数字传输,需结合实际情况分析。
在责任主体方面,深度仿冒从技术使用到内容创制再到网络传播,涉及主体广泛。直接主体多以技术使用者(普通用户)和内容制作平台(机构用户)的形式存在于内容制作等初始环节。间接主体多表现为负责发布传播和履行审核监管义务的信息与技术服务平台。现有规范性文件多对局部主体的相关行为一刀切禁止,且实践中将不良影响扩大的主体也即仅传播主体更容易被发现并问责,这就导致其他责任主体易钻法律漏洞而逍遥法外,相关行为也预先被烙上违法印记,不利于深度仿冒技术的良性应用与发展。为避免公众混淆,哪些责任主体应被附加何种义务,在合法履行义务的前提下,其合成内容可被用作文化内容的正向传播,需作进一步明确。
二、深度仿冒技术下表演者权制度之反思
(一)深度仿冒合成数字化虚拟“表演”法律属性不明
在邻接权制度下,表演者权的对象是指表演活动本身,即演员的形象、动作、声音等的组合。受保护的是活的表演,而不是死的剧目[11]。传统影视中人是表演的主体,演员以真实的身体为媒介进行创作,塑造人物形象。而在元宇宙时代,特别是影视“生物工程”时代,数字化表演正对当代影视故事世界的发展起到一种潜移默化的重构作用。其中,深度仿冒视频涉及对目标表演形象的盗用和对原表演形象的替换,最终合成的表演形象是经过仿冒的、以数字化的形式进行的虚拟表演。这种通过数字视效虚拟制作的人物,也可以匹配有现实逼真的形态动作和丰富细腻的面部表情,为虚拟表演注入情感和灵魂[12],实现与普通现实表演无差异的“活”的表演效果,甚至相比传统表演,达到更加良好的观众效果。数字化合成“表演”形式的出现,使之区别于《中华人民共和国著作权法》(以下简称《著作权法》)中的现场表演和机械表演。显然,传统的“表演”概念难以涵盖这一新的表演形态。
(二)表演者权利内容有待重新审视
1.深度仿冒合成数字化虚拟“表演”署名不清
表演者署名权是保护表演者表明表演身份的权利。深度仿冒合成表演过程中涉及诸多主体,利益复杂。原表演者提供原始表演素材,目标人物提供仿冒源数据,技术制作者提供技术操作、素材筛选与目标设置等人工干预,三者均有一定贡献投入,在获取署名权方面均有合理诉求,但又存在逻辑不足。若署名原表演者,则当深度仿冒完全切断了基底素材与原表演者之间的联系而建立起与目标人物之间全新的联系时,表演者与表演内容无法对应,这会导致过度扩张表演者的权利范畴。若署名目标人物,按照《罗马公约》对表演者的定义④《罗马公约》对表演者的规定为:“表演者是指演员、歌唱家、音乐家、舞蹈家和表演、歌唱、演说、朗诵、演奏或以其他方式表演文学或艺术作品的其他人员。”,目标人物以数字化形式即“其他方式”参与了表演,但其往往以被筛选盗用的方式被动参与,合成表演并未体现其主动参演的意志,同样存在表演意志和表演内容割裂的问题。若署名技术制作者,尽管其通过人工干预存在仿冒合成表演的意志,但由于其并未直接或间接参与表演,无法建立起精神联系,不存在表演形象维护等人身权利,这与我国《著作权法》第38 条关于人身权利的系列条文难以自洽。
2.保护表演形象完整权中“歪曲”标准争议升级
表演者权系邻接权,而邻接权与著作权关联紧密,由著作权产生,对表演者权中“歪曲”的解读离不开著作权中保护作品完整权“歪曲篡改”之解释。换言之,保护表演形象不受歪曲的权利即表演者维护其表演完整性的权利[13]。一般而言,保护作品完整权的侵权判定存在主客观两种标准,这是源于我国《著作权法》关于保护作品完整权的定义相对于《伯尔尼公约》省略了“有损作者声誉”之行为后果的限定,导致司法裁判不一。主观标准将“未经同意”直接等同于“歪曲、篡改”。客观标准将“有损作者声誉”作为认定“歪曲、篡改”的必要条件。相应地,在保护表演形象完整权中,持主观立场的学者认为表演者五官、台词和声音等产生的视听觉冲击是独一无二的,对表演形象和内容的任意改变将影响原有的表现力,是对凝聚了表演者智力劳动不尊重的表现[14],这种未经同意随意改变原貌的行为可直接认定为侵犯保护表演形象完整权的行为。而持客观立场的学者认为必须存在改变内容的事实和达到有损表演者声誉的效果[15]。
从立法原意考察,立法者在著作权法通过后对相关条文的原始解读为:“作者有权禁止任何未经许可而对自己作品的删改、补充,以及其他有损作者尊严、声誉或损害作品原意、原形的改动。”可见,我国立法原意将“有损作者声誉”与“损害作品原貌、原意”的改动并列作为认定侵害保护作品完整权的情形。但需注意的是,两者存在一定的逻辑关系,“有损作者声誉”必然存在“损害作品原意”的改动,而“损害作品原意”的改动不一定会达到“有损作者声誉”的程度。在深度仿冒背景下,以AI换脸的影视作品为例,选取某一片段,对某一演员AI换脸,若仅是影迷与影视的互动娱乐行为,尽管对原作修改,但难以上升至对制片人的声誉损害。同样地,在表演中也存在违背表演原意和最初传达的价值思想,但并未达到使表演者声誉受损的情形,如将喜剧演员的五官和声音数字化到偶像剧中,将产生不同的表达效果,并不会丑化原表演者形象。显然,立法原意的考察仍然无法划分“歪曲”和“尚未达到歪曲程度的修改”之间的界限。
存在以上问题的根本原因在于“歪曲、篡改”的指向对象模糊,忽略了表演内容与表演者之间的同一性。“未经同意改变原貌”和“违背原意”指向表演内容,“有损声誉”指向表演者,主客观标准之争和立法解释都暗示着将歪曲、篡改的表演内容与表演者割裂开来,从而使得社会公众在侵权判定结果上争执不下又互不退让。深度仿冒技术的应用,相比传统侵犯完整权的行为,更大程度地切断表演内容与原表演者间的联系,建立起基底素材、表演内容与目标形象的新联系,加剧了表演内容与表演者的割裂,“歪曲”标准之争进一步升级,“歪曲”内涵亟须明确。
3.表演者信息网络传播权垄断性较强
《著作权法》第38 条规定信息网络传播权的对象是“其表演”,在表演者未被赋予改编权的情形下,对其表演数字化改变,表演者能否继续控制其信息网络传播存在疑问。笔者认为,在深度仿冒合成表演过程中,其手段不在于录制,而在于数据的抓取和仿冒。对于难度较低的仿冒,尽管进行了换脸等操作,但未改变表达方式和表达思想,对观众的迷惑性不高,对深度仿冒生成内容的传播实质就包含了对原表演的传播。但随着GAN 不断升级,难度较高的仿冒不断出现,若使得表演者权人能继续控制对表演数字化改变后的内容的传播,将使得表演者处于较大的权利垄断中,容易导致对深度仿冒正向传播和恶性传播的一刀切禁止;若将对表演数字化改变的内容的传播不等同于对原表演的传播,一些低俗的深度仿冒内容泛滥对表演者的影响又无从规制,两者的冲突给表演者信息网络传播权的稳定性带来一定威胁。但总的来说,后者问题可以通过平台过滤等其他手段得以事前规制,但前者问题将直接影响使用者的创意化表达。
(三)深度仿冒责任主体范围及义务有待进一步厘清
1.深度仿冒责任主体尚未被全面覆盖
2018 年3 月,原国家新闻出版广电总局印发的《关于进一步规范网络视听节目传播秩序的通知》(以下简称《广电通知》),对视听节目歪曲、恶搞、丑化作品的制作和转播行为明令禁止。2019年5月,国家网信办公开《数据安全管理办法(征求意见稿)》,第24条同样对网络运营者利用人工智能自动合成信息的谋利或损益行为直接禁止。上述文件实际上也无法充分规制深度仿冒行为,这是因为其规制对象仅限“视听节目网站”,而深度仿冒的泛在普适性使得从事仿冒行为的主要是公众个人,而不仅仅是网络运营者。
2019年11月,国家网信办、文旅部、广电总局联合印发了《网络音视频信息服务管理规定》(以下简称《音视频管理规定》),第11条第2款虽将网络音视频信息服务使用者纳入规制对象,但存在网络信息服务使用者与网络信息内容制作者的概念混淆和交叉。另外,规制范围仅限于发布、制作、传播虚假的“新闻信息”,而对于不构成“新闻信息”的制作、发布、转载没有明确提及。一般而言,新闻概念有广义与狭义之分,但均以保障公众对相关情报的知情权为目的⑤新闻概念,就其广义而言,除了发表于报刊、广播、互联网、电视上的评论与专文外的常用文本都属于新闻之列,包括消息、通讯、特写、速写等;狭义的新闻则专指消息,消息是用概括的叙述方式,以较简明扼要的文字,迅速及时地报道国内外新近发生的、有价值的事实,让别人了解。。而事实上,深度仿冒内容呈现形式多样,表现为文本、图像、音频、视频;内容涉猎广泛,涉及国家政治、经济、军事等诸多领域的消息。但在我国多出现于娱乐领域,表现为不以彰显某种特定价值或让人了解某一事实为目的的非新闻信息,旨在达到混淆甚至取代的效果,这就使得有相关行为的主体难以被列入规范性文件控制之列。2019年12月,国家网信办公布的《网络信息内容生态治理规定》,第23条重申禁止利用深度仿冒技术从事禁止性行为。2022年初,进一步发布了《互联网信息服务深度合成管理规定(征求意见稿)》(以下简称《深度合成管理规定(征求意见稿)》),更是直接将制作、发布、传播的组织和个人合并称为深度合成服务使用者,仍然存在行为主体类型杂糅的问题。
从以上规范性文件不难看出,政府监管机构对深度仿冒有一定的认知和评估,但因概念瑕疵问题,导致规制对象与规制内容存有逻辑错位,责任主体尚未被全覆盖。第一,网络信息服务提供者(网络运营者)、网络信息内容服务使用者(普通用户)与网络平台内容生产者(机构用户)是享有不同权益义务的不同主体,发挥作用于深度仿冒内容生成与传播利用的不同环节,有必要明确区分,并在每一次规制时保持相同表述;第二,深度仿冒内容形式多样,涉及广泛,“新闻信息”这一形式门槛容易缩小规制范围;第三,深度仿冒虽本质上是一种人工智能技术,但其具备独特技术特征,有明确概念,有必要明确列举释明,使得相关规范更具说服力,而非以现有“等外”解读的方式引用规制。在《深度合成管理规定(征求意见稿)》中,该问题已得到初步重视,有待于进一步实施落实。
2.未经标识的深度仿冒合成内容易导致公众混淆
深度仿冒可基于大数据的抓取和算法的精确计算,尽量捕捉到目标人物的细微特征和表情变化,甚至关注光线的强弱和合成语音语调的节奏,使得其合成效果与仿冒人物高度贴合。美国参议院Bend Sasse在相关法案中介绍,深度仿冒所呈内容是以合理的观察者(普通公众视角)误认为是真实记录人类实际言论或行为的方式制作或修改视听记录而创作的结果⑥原文是:The term“deepfake”means an audiovisual record created or altered in a manner that the record would falsely appear to a reasonable observer to be an authentic record of the actual speechor conduct of an individual.。2021 年初,网剧《山河令》热播,有网友将其中两位主演分别换脸为沙溢和沈腾,视频流畅,表情也几乎和原角色表情完全融合,对于新受众来说,若不加说明,极可能以为是沈腾与沙溢两位演员的新作。7 月,电影《1921》热映,而后萧子升扮演者因被网友爆出严重失德行为而被娱乐圈封杀,为保障电影在线上平台的正常播出,该演员整张脸被换成了另外一位新人演员,对其说话声音也进行了深仿,由于画面没有任何违和感,对于之前未在影院观看过的观众来说,萧子升的真实演绎者就是该新人演员。
上述事实均表明深度仿冒后的内容大大削弱了原表演者在原素材中的地位,同时新增了目标形象与表演内容的联系。对于未经许可的仿冒,若仅表明原表演者身份,而不表明目标形象来源,或者仅表明目标形象来源而不表明原表演者身份,或者未直接标明内容源于深度仿冒,将使得这种误导进一步加深。未经标识的虚假内容一旦被发布和分享,经过互联网的病毒式传播,其影响便很难消除。现有文件虽提出相关主体应对上传的深度仿冒内容进行显著标识,但对于具体哪类主体应落实这一标识义务,如何履行标识义务,标识的具体形式和样态均没有具体说明,实践操作缺乏统一的标准。
3.网络服务提供平台的审查义务有待进一步明确
自人类进入“双层社会”以来,人们的事实认知方式便发生了根本性的变革。据统计,全球网民基数已达46.6亿,除去休息时间,每位网民日均花费约42%的时间上网[16],网络已发展成为深度仿冒向公众渗透的主要渠道。由此,作为主要阵地和重要媒介的网络平台,若能在信息传播伊始就扮演好“守门员”的角色,及时制止、阻断或退改不良应用或明显侵权的内容,那么深度仿冒的负面影响将被提前遏制⑦Holly Kathleen Hall.Deepfake Videos:When Seeing Isn't Believing,27 CATH.U.J.L.&TECH 51(2018).。
针对直播、上传一般的剪辑、拼接视频,我国平台企业有常规固定的审核流程并逐步统一标准。2019年5 月,今日头条、抖音、西瓜、火山小视频等发布的《平台直播自律白皮书》,介绍了对违法有害信息的内容审核标准、流程、机制等一般的内部管理方式。但是对于更为逼真且难以识别的深度仿冒音像内容,有必要进一步强化平台的审查责任。在目前规范性文件中,要求网络服务提供平台具有与新技术新应用发展相适应的技术保障措施,用于部署鉴别机制和建立辟谣机制。这一建议确有一定的前瞻性,以问题为导向,致力于解决误导公众的难题。但同时也过于加重了平台的运营负担。一方面,基于深度仿冒的快速演化性,深度仿冒的伪造效果总是随着鉴别效果的提升而反向提升,鉴别一方总是处于落后挨打的状态,要求平台负担绝对化的技术保障义务无疑为之设置了技术难题,增加了管理成本;另一方面,为规避风险,平台会尽可能设置并提高不合理的数据编辑和内容上传门槛,使得深度仿冒内容的正向传播也受到直接阻碍,违背了规制初衷。
平台不仅作为被控制的对象受到制约,还要扮演好控制者的角色主动规制。这是因为,中立性不但是我们评价中间服务商这一角色的关键,而且也是能贯彻版权法利益平衡原则的决定性要素⑧Maria M. Frabboni.“File-Sharning and the Role of Intermediaries in the Marketplace: National, European Union and International Developments”in Copyright Enforcement and the Internet, Irini A. Stamatoudi(ed), The Netherlands: Kluwer Law International,2010,p.119.,平台必须在维持“利益钟摆”的平衡中不偏不倚。欧盟是软法规制的典型代表,平台除了依照法律规范履行法定义务,还可以自设规范行使私权力来实现监督目标,如可以通过在平台设置TOS协议,来规范发布者的平台发布义务,从而减小深度仿冒内容的侵权风险。我国在平台主动规制方面还有待进一步创新。
三、深度仿冒技术下表演者权制度之完善
深度仿冒可以为教育、艺术、电子商务、刑事侦查等领域带来较大的发展空间,促进思想文化的创意化表达,同时深度仿冒的便捷性和快速演化及传播性使得相关权益人处于较大的侵权风险中。进一步完善表演者权制度,回应深度仿冒技术提出的挑战是当务之急。
(一)进一步拓展“表演”的范围
1.将数字化虚拟“表演”纳入邻接权客体的事实依据
数字化技术拓展了表演艺术的内涵和表现力,数字化合成的虚拟表演也应视为“表演”。究其原因,本质上,利用目标形象进行深度仿冒的表演仍然是真人表演的表演传递和呈现。通过捕捉真实演员的动作、表情在三维空间的运动轨迹,驱动目标形象的表情库使得生成的虚拟仿冒形象与真实表演者的动作、表情一致,运动频率相同,可达到以假乱真的效果。换言之,数字化表演经历建立目标人物形象的数字表情库、捕捉原表演者的表情或其他表演动作,以及最终数据分析和驱动三个阶段,生成的仿冒形象可以和真实演员一样正常表演。可见,仿冒形象是目标形象与原表演形象的有机贴合,真实表演为仿冒表演提供内在表达,目标形象的“数字化表演”是真实表演的外在呈现。“表演”的范畴应涵盖“数字化表演”“真人表演”“数字化与真人表演结合的表演”三种形式差异、但本质相同的表演形态,不是对影像本体论的颠覆,不是对表演概念的无限泛化,而是重新解读表演内涵从而适应新的表演形态。
2.将数字化虚拟“表演”纳入邻接权客体的法律依据
将数字化虚拟“表演”纳入表演范畴,符合邻接权保护的门槛要求和所追求的价值目标。在大陆法系国家和地区,邻接权的设置以保护投资为依据。邻接权制度并不要求客体具备很高的独创性,且能够不以作品及著作权存在为前提。邻接权的主体也不是作者,不能要求其对技术生成物的独创性作出较大贡献。邻接权保护对象是传播者的利益,存在实质性贡献的投资人是其法律保护的重心。这符合法经济学视角下的成本效益法则,即按照“科斯定理”,权利应尽可能配置给实质性贡献投入最多者或发挥效用最大者,以降低其法律运行成本,达到“帕累托最优”[17]。从《视听表演北京条约》(以下简称《北京条约》)和《著作权法》新增职务表演规定所传达的立法精神分析,《北京条约》第12 条明确了表演者与制片者可就财产性权利归属作出约定与推定,《著作权法》第40 条明确了单位组织可以以约定的形式行使财产性权利,这两条规定为表演者以外的非创造性投入的制片人、单位组织对外彰显权利主体身份做出了相应的制度设计,通过邻接权制度中的权利主体身份获取利益回报。
在深度仿冒背景下,技术制作者存在主动筹划虚拟合成表演的意志,但缺乏出演的行为条件,无法认定为表演者。但其又类似于职务表演中的单位角色,通过筛选表演素材和海量源数据,合成符合特定期待的表演内容。最终结果的输出和传播都离不开技术制作者在各个环节的主动干预,其对表演的制作与流转运用均功不可没。因此,把权利配置给交易成本较高的技术制作者,可以有效降低合成表演流转传播的附加成本,并最大限度地发挥表演内容的价值。从价值导向来看,将数字化虚拟“表演”纳入邻接权客体,既有助于为权益归属和分配提供明确依据,又为技术制作者在内的投资人参与投入提供了担保。邻接权设置的宗旨在于通过保护投资者的利益鼓励有利于精神文明建设的内容传播。技术制作者不论是基于兴趣、爱好、荣誉等因素的非商业性群体,还是以文艺传播如合成语音播报、复活历史人物等为职业的商业性群体,赋予其经济权利,都有助于激励其进一步为促进公共信息交流、文化多元化发展作出更多努力。
综上,技术制作者与因技术制作者介入产生的数字化虚拟“表演”一脉相承,将数字化表演纳入邻接权的保护范围,契合邻接权保护传播者利益的法律功能。不过,仿冒合成应当以征得基底素材所有者即著作权人的同意并向其支付报酬为前提,从而协调深度仿冒合成表演作为邻接权客体与著作权法作品保护的冲突。
(二)对表演者权利内容的重新解读
1.区分表明不同参与主体身份
《著作权法实施条例》(2013 修订)第5 条规定了表演者的主体外延,即包括自然人和演出单位。然而,2020 年修改后的《著作权法》第40 条新增了职务表演的规定,演出单位不再作为表演者,其仅可以获得表演者权中的财产权性权利,但不具备人身权。可见,表演者与表演权主体不能完全混同。根据文义解释,表演者更倾向于自然人或自然人的集合,且这种理解更靠近普通大众的基本认知。根据国际条约和域外立法考察,《罗马公约》⑨同④。、WPPT⑩WPPT第2条(a):“表演者”指演员、歌唱家、音乐家、舞蹈家以及表演、歌唱、演说、朗诵、演奏、表现,或以其他方式表演文学或艺术作品或民间文学艺术作品的其他人员。、《北京条约》⑪《视听表演北京条约》第2条(a):“表演者”系指演员、歌唱家、音乐家、舞蹈家以及对文学或艺术作品或民间文学艺术表达进行表演、歌唱、演说、朗诵、演奏、表现或以其他方式进行表演的其他人员。、德国的《著作权法与邻接权法》⑫德国《著作权法与邻接权法》第73条:“表演者”是指将作品或者某种类型的民间艺术进行表演、演唱、演奏或以其他方式进行表演的人,或者对上述艺术活动进行了参与的人。、西班牙的《版权法》⑬西班牙《版权法》第105条:“表演者”是指发表演讲、歌唱、朗读、背诵、解释以及以任何形式表演文学作品人。等均明确表演者为演出的自然人,负责组织、筹备、投资投入的单位组织不纳入表演者范畴,但其在委托、雇佣等情形下可以享有准表演者权,即表演者财产性权利。表演者因其人身权利不可转移具有唯一性,表演者权主体则既可以是表演者,也可以表演者之外的其他自然人或者单位,后者为表演活动的完成做出了实质性贡献,从而享有一部分财产性权利。而当两者不一时,署名权仅归属于享有人身权利的表演者。
在深度仿冒背景下,原表演者在基底素材中真实参与了表演,可认定为表演者,且不论其对于新合成的表演能否实现权利扩张,表演者的身份使其在原有表演范畴内维护自身的人身权益并无不妥。目标人物本身并未参与表演,其面部肖像或声音仅是被数字化到原表演者身上,换言之,其对虚拟合成表演的贡献本质上并非其呈现的表演内容,而是其独特的生物识别数据。既然目标人物无法被认定为表演者,则难以享有署名权,但这并不影响其通过民法典等规定维护人身利益⑭现有法律框架下,《民法典》第1019条已对侵害目标人物肖像权的深度仿冒行为做出回应,未经同意制作、使用、公开他人肖像,侵犯了权利人的肖像自主权,创制深度合成内容须以征得目标人物的同意为前提。《中华人民共和国民法典》第1028条对公开内容失实导致他人社会评价受损的名誉权侵权行为,为受害者提供请求更正、删除的救济,并以法院的强制力保证救济的落实。例如“英国女王挑战TikTok舞蹈”、“美国众议院议长佩洛西醉酒演讲”等视频火爆出圈,均导致目标人物的社会评价被降低。而“杨幂换脸朱茵”、电视剧换脸劣迹艺人、普通APP一键换脸等并不会造成杨幂、朱茵、电视剧艺人以及普通用户的原有社会评价降低,无需以名誉权受损寻求法律援助。仅在有丑化、污损之嫌的条件下,深度仿冒技术使用者应对目标人物的名誉受损承担责任。《民法典》第1034条明确了用于识别自然人特定身份的声音、面貌等个人生物识别信息受法律保护。这是因为这类信息一旦被泄露或盗窃,会使受害人的人格尊严遭受严重的侵害,并会给信息主体带来永久且不可逆的损失。根据裁判文书网公开信息显示,从2018年开始相继出现不少犯罪嫌疑人利用该技术制作换脸视频突破系统认证,不仅直接窃财还对不同对象身份信息倒卖牟利。欧盟最早做出针对性回应,赋予数据主体被遗忘权与删除权,以遏制其他数据控制者对其信息的不当处理和利用。当前,我国《民法典》第111 条、《网络安全法》第41 条、《个人信息安全规范(2020)》第5.4(b)也均有体现信息主体的知情同意权或称信息自决权的规定。综上,现有法律框架下肖像权、名誉权和个人生物识别信息保护足以为之编制严密的保护法网。。技术制作者类似职务表演中演出单位的角色,不享有表明身份的人身权,无法享有署名权。由此,每类参与主体均难以享有或完全享有署名权,通过署名表明身份区分来源的功能也无从实现。为规避这一矛盾,国外有法案提出附加署名义务的做法,值得借鉴。将表明身份来源这一署名义务而非权利附加给责任主体,用于维护原表演者和目标人物的人身权益,同时达到区分效果。区分义务本质上是责任主体的标识义务,该义务如何进一步落实将在下文责任主体部分详述。
2.明确保护表演形象完整权中“歪曲”的内涵
“歪曲”是指违背了表演内容的思想表达和价值观传递,也即采取相对主观标准,强调表演形象与表演者的同一性,维护表演者个性与表演人物情感、内容、风格的融合与统一,保护视听形象的完整性。若采取严格主观主义,则所有深度仿冒行为可能都将被视为侵权违法行为,导致使用者始终处于担心表演者随时行使“保护表演形象完整权”的状态,从而丧失模仿创造的积极性。若采取客观主义,提高侵权门槛,容易在社会上引发一阵虚假之风。只要不会损害表演者的声誉和形象,人物、台词、配音、情节的任意代入都被允许,这将严重影响影音产品的传播质量,使得网络文化陷入低俗化发展趋势中。
实践中,与之相似的保护作品完整权侵权判定中,天下霸唱诉《九层妖塔》侵犯著作权一案,一审“有害作者声誉”的客观标准被二审“曲解原作思想情感表达”判决推翻,是传统行为下对该相对主观标准的践行⑮北京知识产权法院民事判决书(2016)京73民终587号。。深度仿冒技术应用的情形下,滥用行为将变得更为便捷,当今传播环境的本质增强了深度仿冒造成声誉损害的能力,认知偏见和算法促进的结合增加了深度仿冒内容传播的机会,对于表演者思想表达的尊重和精神权利的维护应更加重视。不仅应排除客观高标准对深度仿冒侵权判定的适用,未来,随着该技术性能的提升,在相对主观标准的基础上进一步降低侵权门槛也未可知。
3.限制表演者对高度仿冒合成表演数字化传输的控制
原表演者能否控制深度仿冒生成内容的互联网传播取决于深度仿冒的结果能否认定为“其表演”,归根结底在于判断合成表演的仿冒程度是否已经超出了原表演的范畴。本文认为,这取决于仿冒对观众的混淆效果。低程度的仿冒较易被观众依靠基本的素养识别,在观众眼中,仍可看到合成表演中原表演的影子,这种情况下对该仿冒内容的传播实质是包含了对原表演的内容传播,受原表演者信息网络传播权的控制毋庸置疑。
但是,对于高度逼真完全替代原表演形象的情况下,已完全切断了原表演者与原作品表达之间的原始联系。新合成的整体表达对表演形象甚至表演内容做出了焕然一新的改变,观众不借助技术手段难以发现深度合成的痕迹。这种情况下,基于表演者没有改编权的背景,若判定深度仿冒使用者侵犯表演者“许可他人信息网络传播其表演”之权,将会使得广大试图进行其他创意化表达的使用者处于仅能模仿制作但不能在互联网以个人选定时间和方式传播的尴尬境地,无法传播,制作亦无意义,变相地增加了表演者权的权利内容,阻碍了深度仿冒技术的正向化利用。因而,对高度仿冒内容的传播不能等同于对“其表演”的传播,对于表演形象的商业或其他不当利用可以借助其他方式得以规制,而并非必须以破坏权利秩序作为唯一手段。
(三)明确深度仿冒责任主体的范围及义务
1.明确规制对象为“技术制作者和平台”双主体
解决规制主体范围不明确的问题,需从以下三方面着手:第一,弥补《广电通知》规定仅限视听节目的不足。2018年,美国议员Ben Sasse提出的《深度仿冒责任法案》[18],对具有主观过错的个人及平台进行双主体规制,即“对制造深度仿冒内容引发犯罪和侵权行为的个人,以及明知内容和深度仿冒还继续分发的平台,进行罚款或判处最长2 年的监禁。如果扰乱政府或选举,监禁将长达10 年”。虽然该法案因过于偏激暂被搁置,其处罚力度之严厉并非可借鉴之处,也与我国法治环境不符,但其关于规制对象的包容性值得采纳。深度仿冒具有泛在普适性,深度仿冒潜在造假群体正指数级跃升。应将使用网络信息服务制作虚假音视频产生侵权行为的个人与应知明知内容系深度仿冒仍继续分发的平台均纳入规制范畴,确立深度仿冒行为的规制对象为“制作者和平台”双主体,有助于突破当前责任主体范围局限的困境。其中,平台既可作为生成内容的直接主体,也可作为履行发布传播义务的间接主体,还可扮演审核其他主体制作、发布的管理者角色。前者对应于“网络平台内容生产者”,后两者对应于“网络信息服务提供者”,自然人制作者对应于“网络信息服务使用者”。由此,责任主体可被全面规制。第二,明确规制对象触及监管防线的条件范围是具有夸大的、煽动性的、侮辱性的等有损国家安全、公共利益、公民权益的虚假音视频信息,而非仅仅是新闻信息。第三,将“深度仿冒”以列举的形式纳入“制作、发布、传播非真实音视频信息的新技术”。美国已通过《深度仿冒报告法案》,以定期报告的方式实现对深度仿冒技术运用的监督审查,保证专项监管。我国可通过明确列举的形式,在各类规范性文件中直接以“深度合成”“深度仿冒”“深度伪造”等名称出现,引起重视,同时为执法和司法提供明确的法律指引。
2.明确技术制作者的“声明与标识”义务
为防止公众混淆,法国政府规定经过修图处理的模特照片必须标注“已修图照片”。美国的《深度仿冒责任法案》明确要求视频创作者对发布虚假仿冒视频负责,要求使用数字水印进行标记,即明确了技术使用者负有告知明示的署名义务,同时辅以刑事处罚予以威慑⑯《深度仿冒责任法案》规定,对未对作品进行水印标记,且具有羞辱他人的主观目的,提供含他人虚假的性行为或者裸体的视频的,进行不超过5年的刑事处罚。,完全履行义务的责任主体不应被追责。以此为参考,我国《音视频管理规定》也强调了显著标识的作法⑰《网络音视频信息服务管理规定》第11条第1款:“网络音视频信息服务提供者和网络音视频信息服务使用者利用基于深度学习、虚拟现实等的新技术新应用制作、发布、传播非真实音视频信息的,应当以显著方式予以标识。”,但该规定的效力与责任条款的衔接仍有上升空间。我国新公布的《深度合成管理规定(征求意见稿)》中也提及标识义务的履行,但将该义务更多附加给本就负担较重的平台,技术使用者仅在平台要求时方可依照平台提示对合成内容进行显著标识,且该标识要求是“可以”而非“必须”⑱《互联网信息服务深度合成管理规定(征求意见稿)》第14条第2款:“深度合成服务提供者提供前款规定之外的深度合成服务的,应当向深度合成服务使用者提供对深度合成信息内容进行显著标识的功能,并提示深度合成服务使用者可以对深度合成信息内容进行显著标识。”。前述规定忽略了公众作为技术使用者自我约束的主动性和能动性。在深度仿冒背景下,应当明确并细化技术制作者的“声明与标识”义务。
具体而言,技术制作者需要履行:(1)声明义务。在通过平台上传时需要备注声明该内容的“深度仿冒属性”。(2)标识义务。包括明确标识的方式、类型、技术措施、效果、效力和法律责任。笔者综合实践情况,归纳三种标识方式。其一,以附加链接的形式达到标识效果,在制作合成内容后,附件基底素材并以链接的形式合并上传。这种方式最为直观,也助于提前保存证据,但操作复杂,整理耗时。其二,直接标明替换者与被替换者,即目标人物和原表演者。其三,直接以“深度合成”或者“深度仿冒”字样标识。这种方式相比前两种更为简易,也更多被提及,具有普遍适用性。标识类型根据合成内容的呈现形式具体划分,对于以表演视频呈现的,直接在视频开头、结尾或者开头与结尾处或者全过程显著标识;以文本和图像呈现的,在文本稿源说明处和图像明显位置显著标识;以仿冒音频形式呈现的,在音频开头或结尾或全过程以“深度仿冒”字样标识或者仅在开头或结尾处插入“深度仿冒”来源的简短说明;以虚拟场景呈现的,在虚拟场景内容的明显位置予以显著标识。标识功能的实现需要以技术措施作为支撑,可以通过区块链技术以数字水印的方式加以编辑,由网络服务提供平台向技术使用者开放对内容进行显著标识的功能。标识效果应当以不影响用户使用、不过分影响合成内容的整体感官效果为目标。作为规范性文件的补充和细化内容,这一义务应上升至行为主体的法定义务,对技术制作者产生直接的约束力。不履行该义务的,应承担相应的法律责任。《深度合成管理规定(征求意见稿)》虽列举了对平台违反审核义务的惩戒条款,但对于机构和普通用户违反标识义务的后果未有提及,这一欠缺无形中纵容了行为主体怠于标识。文件中对利用仿冒技术实施知识产权侵权的组织和个人的惩戒也仅做出提示性规定,上位依据的空缺使得知识产权惩戒条款形同虚设⑲具体而言,征求意见稿第6条提及“任何组织和个人不得利用深度合成服务从事侵害他人知识产权等法律法规禁止的内容”。法律责任部分第22 条第2 款和第3 款对此做出的回应分别是“违反本规定第6 条的,由主管部门按照有关法律、行政法规和部门规章的规定予以处理”和“违反本规定给他人造成损害的……构成违反治安管理行为的,依法给予治安管理处罚”。而实际上,根据《著作权行政处罚实施办法》,列举的受行政处罚的七种违法行为并未包括未经著作权人许可,运用深度仿冒技术利用其作品或者未经表演者许可,对其表演形象数字化改变信息网络传播的违法行为。。为此,应细化违反标识义务的行政惩戒措施⑳对违反标识义务的机构和普通用户予以警告,责令改正,要求停止继续制作和上传;对于拒不改正或情节严重的,处一万元以上十万元以下的罚款,并可以责令关闭账号、永久拉入黑名单。对于侵害他人知识产权同时损害公共利益的组织和个人,由主管著作权的部门责令停止制作和传播,予以警告,没收违法所得,并处违法收益一倍以上五倍以下的罚款,违法收益难以计算或不足五万元的,可以并处二十五万元以下的罚款。,实现执法的可操作性。
3.强化平台的监管责任和审核义务
为防止技术使用者未能实际履行“声明与标识”义务导致法律后果蔓延,现有规范性文件提出要求平台能够及时审核,一经发现,停止传输,反馈给技术使用者,直到按照规定显著标识后方可继续传输。这实际上是对“通知—删除”规则一定程度的突破,化平台的被动监管模式为“识别—删除”的主动监管模式。其中,“识别”依赖鉴别技术措施和人工审核两种途径。与深度仿冒相适应的绝对技术保障义务和成本较高的人工审核都大大加重了平台的审核负担。为此,针对技术要求,应当由行业组织综合各平台发展规模和经营状况划分技术标准等级,明确不同类型的平台适用特定类型的技术标准,达到技术标准的视为已经履行技术安全保障义务,可在该标准之内部署鉴别技术识别深度仿冒内容。在此基础上,平台仍适用“通知—删除”的被动监管模式,在收到通知后,对未履行标识义务的仿冒内容予以删除。针对人工审核要求,增设平台的提示说明义务。在用户上传内容时,以显著的方式,如醒目的弹窗展示不履行标识义务可能引起的法律后果的文字、图片或者事例短视频,提前提醒用户注意标识,从而减轻一部分人力负担。
平台可以依靠技术措施和外界监督提高审查质量与效率,还可通过内部软法规制,增设与其他主体间的权利义务规范,为前期防御设置合理的数据使用和内容上传门槛,为后期追责提供明确依据。例如:以平台为中介建立个人信息主体或版权方与使用者之间的生物识别数据使用许可协议,协议规定禁止擅自转让、倒卖生物识别信息数据给第三方,禁止制作者上传利用深度仿冒技术制作的未经授权的具有虚假、夸大、煽动性、侮辱性等的不良音视频。使用者无需单独取得被编辑的个人生物识别数据所有者或者版权方一一同意。使用者使用的范围受限于平台协议管理的范围。使用者需要按照平台的提示说明履行标识义务即可上传内容,而非征得平台的许可同意。平台应对使用者进行真实身份信息认证,否则,平台不得为其提供发布便利。凡是经过发布传播导致他人权益受损的,权利人均可凭借身份认证追溯责任源头。由此,信息主体生物识别数据和权利人作品也通过平台得以安全管理和正向利用。
结语
技术的社会属性是技术社会风险形成之根源。深度仿冒作为一种内容创建工具,其本身是中立的。人类既可以发挥其积极广泛的应用价值,实现创意化表达与传播;也应对其消极效应进行严格限制,完善与新技术新应用发展相适应的表演者权制度。当然,法律手段并非唯一的规制手段,未来,随着深度仿冒技术的规模化应用,还需保障数据和算法的安全性,并制定配套措施,提高鉴别技术的开发和鉴别技术应用的普适性,引导并促进新业态的良性发展。