全媒体时代智能洗稿的著作权法律规制研究
2023-05-30卢珏蓉
卢珏蓉
[摘要]在全媒体时代,随着人工智能与算法技术的发展,智能洗稿行为出现,且具有隐蔽性,而流量变现成为洗稿行为屡禁不止的动因。文章深入探究洗稿的内涵与表现类型,发现依据对人工智能的依赖程度,智能洗稿可分为辅助型洗稿与委托型洗稿,智能洗稿表现类型的划分有利于解决智能洗稿的著作权法律规制困境,形成智能洗稿行为性质认定、侵权判定标准适用与责任承担主体明确的智能洗稿的著作权法律规制路径。同时,智能洗稿的著作权法律规制还应结合案例具体分析,通过整体比对法、抽象分离法做出实质性相似的量化判断,以明确法律责任主体。此外,在传播媒介深度融合背景下,智能洗稿的著作权法律规制也离不开新媒体平台完善作品审核制度以及司法机关加大惩罚力度。
[关键词]智能洗稿;实质性相似;人工智能;法律规制
随着互联网与信息技术、算法技术的发展,我国进入全媒体纵深发展时代。截至2018年1月,微信和WeChat合并月活跃账户数超过10亿;截至2017年12月,微博月活跃用户达到3.92亿[1],用户数据与流量成为核心竞争力。为了满足用户需求,获取更多流量,由算法推荐实现用户个性化定制成为全媒体时代作品的创作方式。
然而在全媒体时代,新媒体作品的创作现象纷繁复杂。2015年,霍炬起诉杭州麻瓜网络科技有限公司对其“歪理邪说”微信公众号的文章进行改编、洗稿,虽然最终法院认定原告证据不足,驳回诉讼请求,但是洗稿事件就此进入大众视野,且愈演愈烈。2019年,微信公众号“呦呦鹿鸣”发布的《甘柴劣火》遭到财新网记者王和岩质疑,他认为该文存在洗稿,该事件引發社会广泛关注和关于洗稿的争议,引起新闻传媒界与知识产权界的辩论与思考。
当前,随着算法技术的发展,洗稿行为频繁出现,且出现智能洗稿行为。首先,个体利用数据库中海量作品元素可实现内容的智能化归整,从而迅速创作出贴合用户喜好的伪原创内容,吸引大量流量。流量变现与内容夹杂的广告收入又可抵减人为洗稿的成本消耗,这是洗稿行为屡禁不止的主要原因[2]。其次,新媒体平台文稿原创性检测功能逐渐被智能算法技术迭代,而智能算法在文稿原创性检测过程中则存在识别机械性,即其可能出现识别失灵的情况,从而使伪原创内容得以发表[3]。最后,如今各新媒体平台是独立运营的,其所呈现的内容基于平台数据库推荐。在平台数据库中,一面是用户界面,另一面连接相关的技术及其敦促者[4],双方的信息技术具有封闭性,即用户对平台内容产生消费依赖,平台又对用户阅读习惯的数据存在依赖,两者共生共存,从而使伪原创洗稿作品得以出现在不同平台上。
洗稿产生于新闻传媒领域,并非著作权法意义上的法律概念。洗稿性质如何界定、智能洗稿是否属于著作权侵权行为,是智能洗稿是否纳入著作权法律规制的重要前提。因此,文章尝试对洗稿内涵及其表现类型进行深入研究,准确辨析当前智能洗稿的表现类型,分析其著作权法律规制可能存在的困境,以期寻求全媒体时代智能洗稿的著作权法律规制路径。
一、洗稿的内涵与表现类型
(一)洗稿的内涵
当前,学界对洗稿的内涵界定不一而足。有学者指出,洗稿就是新闻记者根据其他媒体报道的新闻事实撰写文稿,或与其他记者分头采访并进行文稿交换,最终各自撰写新闻稿进行发表[5];有学者认为,洗稿就是部分传媒忽略作品真实来源,并对稿件进行多次编辑,逃避著作权法律规制的手段[6];有学者则总结,在自媒体语境下,洗稿指对原创作品内容进行转换性表达,属于对原创作品的变相“克隆”[7];也有学者将洗稿与刑法中的洗钱罪相比较,认为其就是通过替换文章的段落和词句,掩盖非法目的,使读者产生与被洗稿作品相同的阅读体验[8]。综上所述,无论通过何种视角进行解读,洗稿都脱离不了对原创作品所含元素的隐蔽性使用,如人物、情节等,这种隐蔽性使用是洗稿内涵的核心。
(二)洗稿的表现类型
张文德、叶娜芬指出洗稿的表现类型大致可分为两种:一种是混淆来源,另一种是改头换面,前者通过篡改作者身份或原创作品标题来混淆来源;后者则对原创作品内容偷梁换柱,使文稿原创性检测软件无法辨识所检测作品是否存在著作权侵权行为[6]。然而这种划分标准较为模糊,并不能涵盖洗稿的全部表现类型。在全媒体时代,洗稿不局限于人为,人工智能也能实施洗稿行为。
基于此,文章按洗稿形式不同,将洗稿的表现类型划分为人工洗稿与智能洗稿,并依据“思想与表达二分法”原则,将人工洗稿细分为表达型洗稿与思想型洗稿。表达型洗稿使用原创作品的内容情节和人物特征、人物名称、人物关系等表达元素,思想型洗稿使用原创作品的主题或观点等思想元素[5]。而智能洗稿则依据洗稿者的要求,利用算法技术和软件进行特定搜索,并形成专门的主题数据库,再筛选数据库中文章的词句,采用转述、替换、糅杂等算法程序进行内容的加工转化,最终“洗”出看似具有独创性的伪原创文章。智能洗稿又根据对人工智能的依赖程度划分为辅助型洗稿与委托型洗稿两种表现类型。辅助型洗稿利用智能洗稿软件作为作品创作过程的辅助工具,仅对原创作品的人物关系、内容情节等某种表达元素进行洗稿。而委托型洗稿相当于洗稿者与人工智能之间建立委托创作协议关系,由洗稿者向智能洗稿软件提出作品创作要求,智能洗稿软件依据该要求全盘完成作品创作,被委托对象并非法律意义上的自然人(具体详见表1)。
二、智能洗稿的著作权法律规制困境
(一)行为性质认定艰难
从洗稿表现类型的划分可以看出,智能洗稿相比人工洗稿更不利于文学艺术产业的持续性发展。在网络数字出版的生态环境下,智能洗稿比人工洗稿的被洗稿作品覆盖范围更广,传播速度更快,负面影响更为严重,侵权认定也更为艰难。有学者认为洗稿等同于抄袭[9],或称为高级抄袭[2],也有学者认为洗稿和抄袭内涵一致[10],学界对洗稿的行为性质认定众说纷纭。
司法实践要认定著作权侵权案件被告存在侵权行为的逻辑前提是涉案作品的著作权属于著作权法的保护范围。而“思想与表达二分法”原则作为著作权法保护范围的界限标准,思想和表达之间的边界划分是具有隐喻性的[11],甚至这种划分是一种政策导向性区分,具有法官的主观随意性[12]。在全媒体时代,智能洗稿可能存在与原创作品思想保持一致,并对原创作品可利用元素进行隐蔽性表达的情况,在一定程度上难以受到法律规制。
(二)侵权判定标准适用困难
在“思想与表达二分法”原则的基础上,司法实践判定涉案作品存在侵权行为常用的判定标准为“接触+实质性相似”。在全媒体时代,依靠流量的智能洗稿作品通常通过广大受众关注的新媒体平台传播,因此,要判定智能洗稿作品与原创作品之间是否存在“接触”,司法实践可以借助互联网电子数据存储技术进行时间证明,而如何判定智能洗稿作品与原创作品之间存在“实质性相似”才是判定的困难所在。根据作品思想部分是否剔除比对,整体比对法与抽象分离法这两种不同的实质性相似比对方法得以产生。整体比对法是将涉案作品在整体比对的基础上综合其他因素,进而判定涉案作品是否构成实质性相似,而抽象分离法是先剔除原创作品的思想部分及其与涉案作品构成相似的部分,然后比对论证剩下的内容是否构成实质性相似[13]。
然而,智能洗稿不同于人工洗稿,其通过智能洗稿软件海量剔除原创作品的特定元素,并进行内容的整合表达,从而使作品比对过程无法相对确定地进行一对一的内容肢解式分析。同时,在整体比对过程中,智能洗稿作品很可能因其与原创作品所涉的独创性表达元素相似比例较低,或在抽象分离下智能洗稿作品的表达元素与原创作品的表达元素并不具有紧密性,从而无法达到实质性相似,进而无法判定智能洗稿作品存在侵权行为。由此可见,在智能洗稿的著作权法律规制中,这两种比对方法存在比对作品数量及其相似程度无法准确量化的困境。
(三)责任承担主体存在争议
随着人工智能技术的不断发展,智能洗稿软件的智能化程度存在差别,其对原创作品的参与度也有所差异,与人工洗稿的法律责任主体不同。在智能洗稿过程中,除了原创作品作者与洗稿者,还存在人工智能洗稿软件。因此,人工智能生成物的可版权性问题影响智能洗稿的法律责任承担主体的选择。然而,这一问题至今在学界仍存在巨大争议。
三、智能洗稿的著作权法律规制路径
(一)行为性质的认定
第一,被认定为抄袭、剽窃都不是对智能洗稿精确的法律定性。从语义上来说,抄袭与剽窃概念本身就具有模糊性。抄袭源自拉丁语“plagiarius”,原意指“绑匪”,后来被指代“盗窃文学作品的人”,而剽窃指“故意挪用他人的创造性成果或学术成果而不注明出处的行为”[14]。智能洗稿与抄袭或剽窃之间的关系在学界争议颇大,且用一个模糊性词汇定义另一个模糊性词汇并不能从根本上解释智能洗稿的行为。就侵权类型而言,《中华人民共和国著作权法》第五十二条规定了剽窃是侵权行为之一,而智能洗稿虽然完全可能存在侵犯原创作品发表权、署名权、保护作品完整权、改编权、信息网络传播权等其他著作权以及与著作权有关的权利的行为,但是仍需要结合具体案例进行具体分析。
第二,“思想与表达二分法”原则在一定程度上是著作权法利益平衡的体现。尽管智能洗稿在“思想与表达二分法”原则下存在免于著作权法律规制的可能,但也不能限制“思想与表达二分法”原则的适用[8]。同时,将智能洗稿全盘认定为侵权行为也具有武断性。智能洗稿需要结合客观现实案例进行具体判断,避免打破个人主体与公众主体之间的利益平衡。只有严格限制智能洗稿的法律可归责性,保护原创作品作者的合法权益,防止权利滥用,才能更好地满足文学艺术创作领域公众的创作需求。
(二)侵权判定标准的适用
第一,智能洗稿的侵权判定过程可运用技术进行反向追踪,解决海量作品比对的问题。部分高级智能洗稿软件通过深度学习生成相关内容,且生成过程隐秘,使用原创作品的元素并不明显,内容也具有不确定性,甚至以程序设计和拼接、糅杂等形式来模糊原创作品的来源,而司法实践可借助技术手段对智能洗稿生成过程进行反向破译,确定特定洗稿元素的数据库范围。
第二,智能洗稿的侵权判定可通过智能洗稿的表现类型划分,灵活适用实质性相似的判定标准。对辅助型洗稿而言,其隐蔽性地使用原创作品的特定表达元素,且使用所占比重不大,甚至有些洗稿者在作品的洗稿过程中,将原创作品的其他表达元素通过排列组合来体现一定的“独创性”,使内容具有一定的“创作构思”,但若采取整体比对法,普通用户通过观感即可对其形成实质性相似的判断。对委托型洗稿而言,洗稿者并未参与洗稿过程,而是由智能洗稿软件完成洗稿,并生成大量蕴含其他被洗稿作品的思想元素与表达元素,而通过整体比对法、抽象分离法无法具体量化其实质性相似程度,若将整体比对法置于抽象分离法之前,并进行叠加适用,则可形成对其实质性相似的加成判定,即在把握洗稿作品思想脉络的基础上,以不影响作品中心主旨为前提,抽离出思想与公共领域有关的表达,对作品中剩下的表达内容进行判断[15]。
(三)责任承担主体的明确
在人工智能生成物可版权性问题的讨论中,少数学者认为,“人工智能生成物是一种模仿,其生成过程不具备个性创作,生成结果也仅是算法推演”[16]。这就意味着一旦洗稿存在侵权行为,洗稿者就必然承担侵权责任,这使得软件开发者、设计者、投资者在一定程度上有脱离法律规制的可能,从而导致责任配置的不均。然而,大多数学者则认为,对该问题应采取阶段式的判断,文章也认同此观点,即以弱人工智能到强人工智能的不同智能化阶段来具体判定人工智能生成物的可版权性。弱人工智能是一种自学习的系统,基于学习(监督或无监督),其算法可以解决某个级别的问题,对人类智能进行模拟,利用人类所期望的学习类型数据库来完成特定目标。而强人工智能指能够产生智能行为的机器,其能够表达自我意识以及真正的情感,可以理解所做的事情及原理[17]。
結合前文智能洗稿的表现类型,辅助型洗稿属于弱人工智能类别,是一种辅助创作工具。若辅助型洗稿使用的是原创作品中无独创性的表达元素,则该行为不具有法律可责性,若其在洗稿过程中大量使用原创作品独创性表达的特定元素,则该行为需要承担法律责任,责任承担者为洗稿者。而委托型洗稿并未达到强人工智能的程度,处于弱人工智能和强人工智能之间的过渡阶段,可在深度学习过程中自主完成限定命题式的指令任务。因此,委托型洗稿所生成的行为结果是现阶段人工智能生成物可版权性问题争议的焦点。
从著作权法的应然层面而言,在人类中心主义伦理原则的制约下,部分学者认为,作品创作的版权很难归属于人工智能,不仅因为人工智能从人类辅助工具转换为法律主体会给著作权法存在的根基带来严重打击[18],直接原因更在于人工智能无法承担法律责任。但也有不少学者采取折中态度,从生成结果的实然层面出发,依据作品的独创性标准进行判定,认为人工智能生成物与人类创作作品成果相比并无明显差异,可以承认人工智能生成物具有可版权性,但其权利归属与法律责任承担仍要体现人本主义,追溯人工智能洗稿软件的开发者、设计者、投资者和使用者[19]。在智能洗稿的委托型洗稿中,人工智能与洗稿者之间是一种委托创作协议关系,洗稿者委托智能洗稿软件按照要求进行作品创作,但这并不意味着承认人工智能的法律主体性。同时,委托型洗稿虽在现阶段是命题式的半开放式自主创作,但智能洗稿程序设计仍体现软件所有者(投资者或开发者)的一定思想。因此,该委托关系真正具有法律意义的双方主体是智能洗稿软件所有者与使用者。在一般情形下,该委托关系的法律责任由委托人即智能洗稿软件使用者来承担。但在委托型洗稿的法律责任认定中,洗稿的主观意图和所使用的元素要进行具体分析,除了使用思想元素与无独创性表达的特定元素不具有可责性,委托型洗稿使用大多数原创作品具有的独创性表达特定元素,则存在主观恶意,属于《中华人民共和国民法典》第一百五十四条规定的行为人与相对人恶意串通,损害他人合法权益的民事法律行为,智能洗稿软件所有者与使用者要共同承担法律责任。
在全媒体时代,智能洗稿要得到法律规制,还需要各新媒体平台加强原创作品的鉴定审核工作,司法机关也要严格明确新媒体平台的法律责任。若新媒体平台以传播大量洗稿作品为运营方式,与洗稿者共同谋利,侵害原创作品权利人的合法权益,就需要承担法律责任;若新媒体平台尽到事前审核义务,不具有主观故意,且在事中按照“通知—删除”规则及时复查,并对洗稿作品进行删除,则新媒体平台不需要承担法律责任。此外,司法机关还可以根据智能洗稿存在的主观恶意程度来加大惩罚力度,辅助型洗稿与委托型洗稿相比,后者的主观恶意程度更深,严重侵害原创作品权益,应予以惩罚性赔偿,从而规制智能洗稿行为,保护原创作品创作者的合法权益,降低智能洗稿对文学创作领域的负面影响。
[参考文献]
[1]克劳锐指数研究院.克劳锐2018自媒体行业白皮书[EB/OL].(2018-03-22)[2021-05-22].https://max.book118.com/html/2018/0914/7115114152001146.shtm.
[2]卢婷婷.微信公众号“洗稿”现象探析[J].新闻研究导刊,2019(06):55-56,90.
[3]莫家辉,俞锋.网络“洗稿”的法律属性、社会危害及治理策略[J].中国出版,2019(24):56-60.
[4]卢西亚诺·弗洛里迪.第四次革命:人工智能如何重塑人类现实[M].王文革,译.杭州:浙江人民出版社,2016.
[5]许春明,潘娟娟.“洗稿”的法律定性及其规制[N].上海法治报,2019-02-20.
[6]張文德,叶娜芬.网络信息资源著作权侵权风险分析:以微信公众平台自媒体“洗稿”事件为例[J].数字图书馆论坛,2017(02):48-51.
[7]余为青,桂林.自媒体洗稿行为的司法认定规则及其治理[J].科技与出版,2019(03):86-89.
[8]王雅芬,韦俞村.自媒体“洗稿”的著作权法规制[J].出版广角,2019(18):68-70.
[9]张乾.互联网时代“洗稿”现象的可责性及保护路径[J].出版广角,2020(05):38-40.
[10]周勇.智能洗稿法律规制研究[J].当代传播,2019(04):76-79.
[11]李雨峰.中国著作权法:原理与材料[M].武汉:华中科技大学出版社,2014.
[12]李琛.“法与人文”的方法论意义:以著作权法为模型(英文)[J].Social Sciences in China,2007(04):37-50.
[13] 苏志甫.利用他人作品元素改编行为的判断思路与逻辑展开:从“武侠Q传游戏”侵害改编权及不正当竞争案说起[J].法律适用,2020(18):141-149.
[14] Mary W,John. M. The Intersection of Copyright and Plagiarism and the Monitoring of Student Work by Educational Institutions[J].Australia and New Zealand Journal of Law and Education,2006(11):73.
[15] 康瑞.自媒体“洗稿”的著作权法审视[J].传播与版权,2019(02):177-179.
[16] 王迁.论人工智能生成的内容在著作权法中的定性[J].法律科学(西北政法大学学报),2017(05):148-155.
[17] 费尔南多·伊弗雷特.人工智能和大数据:新智能的诞生[M].吴常玉,译.北京:清华大学出版社,2020.
[18] 曹新明,杨绪东.人工智能生成物著作权伦理探究[J].知识产权,2019(11):31-39.
[19] Bridy A. Coding Creativity:Copyright and the Artificially Intelligent Author[J].Stanford Technology Law Review,2012(05):1-28.