网络“洗稿”的法律属性、社会危害及治理策略*
2019-01-28莫家辉
□文│莫家辉 俞 锋
科技进步助力经济社会高速发展,但也帮助各类侵犯知识产权的行为呈现强隐蔽性特点。在原创作品的著作权保护上,许多侵权者早已改变过去直接“抄袭”的手法,而是借助高科技加持的“洗稿” 手段,以便更快速、更隐蔽地窃取原创作者的精神成果。在著名的“锦绣未央系列抄袭案”中,作者周静被指将多部小说以“打散+拼凑”的方式进行“洗稿”,共涉嫌抄袭200多部作品。从目前已公开的一审判决书所揭露的具体侵权行为看,这类“洗稿式侵权”隐蔽性高、维权难度大,但公众对此重视程度却并不高。以至于近年来洗稿现象在网络文学、公众号等领域频繁爆出,整体呈扩张趋势,并有向学术领域蔓延的风险。
一、网络“洗稿”的法律属性
网络“洗稿”在法律上呈现很复杂的运行结构:行为人在主观上多具有故意侵权的动机,行为实施过程中常有借助第三方信息网络技术而技术方“明知且放任”的情形,相关证据又因形成于网络空间而极易被隐藏和篡改。而到了最后,侵害著作权人版权利益和扰乱文化市场竞争秩序的危害后果也不必然被触发,因为网络侵权的发现机制本身也有很强的技术依赖性,洗稿技术在研发时就刻意对此进行了回避。因此,很难用单一的方法路径直接对其法律属性开展评价,更多是结合个案以及网络“洗稿”现象的表现特征做综合性的分析研判。
1.网络“洗稿”的法理界定问题
“洗稿”一词最早是新闻界用于描述记者们相互抄袭稿件的行为。所谓“洗稿”即通过语言重组、改变表达方式,在短时间内将他人原创的稿件改头换面变成一份“新稿件”。[1]它之所以能在新闻界形成一定的气候,是因为新闻稿件的核心内容、有效资讯是新闻事件本身所承载的客观事实,而单纯的新闻事实并不受著作权法所保护。起初,在只能由人工对新闻稿件中他人原创部分进行篡改或删减的情况下,实际上也有“重新创作”的成分和属性,而且通常都会“洗”到能够通过复制率检测或形式上“面目全非”的程度。于是就形成了著作权侵权认定的一个灰色地带,“主观上是抄袭,客观上难认定”的新闻洗稿。正是因为这种特殊的灰色属性,使“洗稿”现象存续下来,并在数字出版产业迅猛发展的今天得以扩张,更因为有了信息网络技术的加持,衍生出新型的网络“洗稿”。学界对此形成了几种观点:余为青、桂林认为“洗稿”的实质是通过对原创的剽窃来达到“复制式创作”的效果;[2]周勇则认为智能洗稿与我国司法实践中的剽窃具有内在一致性;[3]王晓巍认为由智能软件与人工共同形成的“混合文字内容”能够冲击源作品的专有权利控制范围和源作品的既定著作权益。[4]综合起来看,在“洗稿”行为可能构成侵权的定性上,绝大多数学者的意见是一致的。
结合“洗稿”所依赖的产业生态链条,做更进一步的分析可知:从行为主体上看,数字出版生态下,以获取流量为中心的新商业模式使得利益流转结构更趋复杂,直接导致网络“洗稿”参与主体呈多元化格局。除了“洗稿”后的署名作者,还可能涉及网络服务运营商、平台等数字出版产业链的其他利益主体;从行为客体看,网络“洗稿”所涉及的领域已由原来的新闻报道蔓延到数字出版的几乎全部领域。尤其是自媒体行业和网络文学行业,在巨大利益驱动下,丑态百出、乱象丛生,俨然已沦为网络“洗稿”重灾区。令人堪忧的是,由于长期缺乏有效治理,网络“洗稿”还有向科研学术领域蔓延的趋势和迹象。从行为主观方面看,网络“洗稿”的出发点就是“抄袭”,牟利性特征明显,且背后多有结构复杂的不法利益驱动,并以不被发现为心理期待的“质量标准”;从行为客观方面看,网络“洗稿”作品的生产模式已由纯人工改写转型为利用换词软件等技术手段,或在此基础上再叠加人工辅助的智能化生产,在影响广度和治理难度上都较过去的新闻洗稿有明显“升级”。由此可以看出,基于信息网络技术的加持,数字出版产业生态链条为网络“洗稿”行为提供了十分肥沃的土壤,而且以获取流量为中心的新商业模式也可能架空停止侵权、赔偿损失等民事责任,使司法救济归于无效。可以肯定的是,网络“洗稿”绝不应成为当前数字出版领域的主流生产力。因为无论是纸质时代还是数字时代,借鉴都不能超越一定的界限。尊重他人劳动,促进原创,才是推进内容产业前进的不竭动力。[5]
2.网络“洗稿”的伪原创性本质
网络“洗稿”作品的“伪原创性”,是其无法获得著作权法认可和保护的根本原因。尽管当前很多“洗稿”作品通过换词、拼凑、“多稿一洗”“多稿多洗”等手段进行“伪原创化”的生产包装后,使得新作品在表现形式上与原作品产生了明显的差异性,需要经过海量片段的比对才能找出“被洗” 作品的痕迹,而且这种差异性通常会带给受众一种全新的感知、陷入错误认识,但无法改变其“伪原创性”的本质。通过剖析这种“伪原创性”的生成机理可知:
出版业的流程再造帮助“洗稿”作品披上伪原创的外衣。当前出版业的内容生产和作品创作过程中,许多原先依靠人工审查的环节都被集成化的智能算法所替代或简化。但目前应用的智能算法只能算是一种“人工弱智能”,存在一定的机械性。虽然能够快速识别关键词、句的近似吻合情形,并对涉嫌抄袭的内容发出一定的预警,但对那些被“洗” 得“面目全非”的作品根本没有甄别能力。“洗稿” 作品可以很轻易地通过那些在算法设置上偏向于追求工作效率的智能化审查,并以一个全新作品的身份公开问世。
数字化阅读习惯使得“洗稿”作品的伪原创性得以巩固。数字化阅读中,读者所依托的智能终端通常是单一的,平台或APP也是独立运营的,再加上平台之间存在市场竞争和博弈关系,必然在内容呈现上构筑起一个无形的 “封闭圈”或“隔离带”。当用户对某一平台或APP产生消费依赖后,其实也同步生成了数字化阅读的路径依赖。这时内容呈现的封闭和隔离效果也被进一步固化,用户一般不会刻意花时间去对不同平台或APP的内容进行比对和识别,这使得“洗稿”作品的伪原创性得到了巩固。
立法上的利益平衡为网络“洗稿”的伪原创性提供了合规空间。“思想表达二分法”是著作权法平衡作者权益与公共利益的重要原则,著作权法的保护范围限于作者“独创性的表达”,作品中蕴含的“思想”并不受到著作权法的保护。基于网络“洗稿”而产生的伪原创作品,与正常借鉴作者“思想” 进行独立创作形成的作品具有相似性,这为网络“洗稿”行为提供了一件“合法”的外衣。
平台政策使得网络“洗稿”的伪原创性成为牟利关键。近年来各大平台为争夺市场份额先后推出类型多样的补贴政策,包括百家号的百亿分润计划、腾讯的内容扶持政策等。为了拿到补贴,他们“采用独有的分词引擎和自创同义词库,模拟百度的中文切词手段进行伪原创,生成后的伪原创文章更贴近百度等搜索引擎的收录模式”。[6]一方面可以通过这种手段使自己看起来具有“原创性”,另一方面可以利用这种方式在短时间内推出大量的“洗稿” 作品来迅速地占领网络空间,然后以此获取流量,实现牟利目的。特别是在彻底摸清政策内涵的情况下,网络“洗稿”行为可以根据数据平台的资源倾斜偏好进行定向“洗稿”,由此更高效地赚取高额补贴。
3.网络“洗稿”的侵权认定标准
在信息网络技术的掩护下,网络“洗稿”颠覆过去“剪刀+糨糊”和“复制+粘贴”的粗暴抄袭模式,转而采取“片段拼凑、打散重组、同义换词、情节再生”等相对隐蔽、不易于直接发现的形式来侵犯著作权。在这样一个更高级的隐蔽抄袭时代,判定网络“洗稿”是否构成侵权的难度也越来越大。
过去通过与原作品进行比对,如果构成“实质性相似”,又无法证明有合法来源,就可以确定为构成侵权。[7]这里所谓的“实质性相似”,并不是常说的“复制率超标”现象,而是指后作品与在先作品在表达上存在实质性的相同或近似。其判断的主要标准是“读者对对比作品是否产生相同或近似的欣赏体验”。司法实践中对其认定通常有两种主流标准:一是主要适用于文学作品的“整体观感法”,即以普通观察者的理解和认知水平,判断两部作品整体上给人的内在感受是否存在明显的“相同或相似感”。二是常用于计算机软件等功能作品的“过滤比较法”,即将整个判定过程分割为“过滤—比较”两大步骤,先将原作品中不受著作权法保护的元素过滤出来,然后再将受保护部分的内容(字符)与后作品做对比比较,根据相同或相似程度做出是否构成“实质性相似”的判定。
据此可知,“整体观感法”似乎更适合用于网络“洗稿”的侵权认定:一是因为网络“洗稿”本身所依赖的信息网络技术通常自带回避“字符相似度检测”的功能,很可能导致“过滤比较法”失效;二是通过网络“洗稿”形成的后作品,常常可以借助数字出版的技术多样性,较先作品以更立体的新媒体、更多元的数字出版形式加以呈现,对比作品之间在阅读渠道、阅读方式、理解方式和精力分配方式上会显得“毫不相干”,一般不会出现标题和具体语句相同或相似的“直观”问题。必须系统深入地考量“整体非文字相似”问题,注重对作品创意、人物关系、主要情节以及发展顺序做整体性比对,并进一步以作品是否足以引起市场受众混淆为标准,否则很难完成对“实质性相似”的认定。当然,如果涉案作品不构成“实质性相似”,不足以引起相关受众混淆,则应当根据著作权法鼓励智力创作、促进知识流动的初衷,将其认定为具有独立知识产权的新作品,而不应冠以“洗稿”之名。
值得注意的是,现实中还有一种利用“合同组合”来规避侵权责任认定的新形式:一些社交网络服务提供商,将“允许其上传的内容在社交网络平台内部被自由转载”的条款预设在用户注册时必须确认的《最终用户使用许可协议》中,虽然这种做法有“格式条款”的瑕疵,可能产生争议,但综合社交网络服务自身特点和维权意识并不高的用户群体来看,这种做法确实在一定程度上降低了侵权风险。
二、网络“洗稿”的社会危害
目前,网络“洗稿”已经呈现出十分明显的野蛮生长和无序扩张态势,甚至已经向高校、学术界等领域蔓延,各种负面新闻层出不穷。但人们对其社会危害的认识和重视似乎都还不够。其实网络“洗稿”并不单纯是对原创作者著作权造成侵害、对国家知识产权保护体系造成破坏这么简单。缺乏合理引导和有效治理的产业化网络“洗稿”可能会引发许多不利后果。
1.严重挤压原创作者的生存空间
“内容为王”是出版产业的不二法则,内容创作也是原创作者的生存根基。谁能生产出优质的内容,谁就能在其中把握主动权。但以技术手段为核心的网络“洗稿”借助作品数量多、传播范围广和精准投放效率高等优势,对原本的内容生产秩序、利益分配规则造成巨大冲击。原本需要精心打磨才能产出的优质作品,可以在技术手段的帮助下通过“洗稿”软件一键生成。特别对于那些由作者耗时费力、精心打磨而成的付费文章,原本预期通过内容收费的形式获取相应的利益回报,然一旦其文章被“洗”,在不同平台上出现大量的类似作品,必然导致流量分化和利益分流,使原创作者的实际收益大幅减少。更糟糕的是,现有的维权机制并不健全,在遭遇这种情况时,原创作者常常是维权无门、救济不畅,久而久之将会严重挤压原创作者的生存空间,造成内容产业的核心驱动力消减。
2.加剧引发出版平台的恶性竞争
根据2018年《自媒体行业白皮书》所言,一般出版平台的商业变现过程大致分为以下几步:第一步是发掘优秀的原创作者,第二步由原创作者创作优质内容吸引读者,第三步是在经过一段时间的内容投喂后将一般读者沉淀为相对牢固的平台用户,最后通过广告等手段影响用户的购买行为等实现商业变现,并以此形成良性循环以维持商业化盈利。而在网络“洗稿”产业帮助下,平台在完成第三步的用户吸附后,商业再循环中的优质内容创作过程就可以被省略,直接换以网络“洗稿”的方式进行内容生产。当通过成本较低的伪原创作品也能够获取足够的“流量”时,平台就会在其逐利本性的驱动下做出“降成本”的举动,甚至出现主动谋求与网络“洗稿”产业的深度合作来降低平台运营成本也不足为奇。因为这种做法可以让平台和“洗稿”者之间建立一道防火墙,便于平台在面对著作权侵权投诉时可以利用“避风港原则”隐去自己的责任。一旦平台持续放任甚至保护网络“洗稿”行为深度嫁接到自己的产业链上,后续的竞争必然导致各大平台采取类似手段进行反制,形成恶性竞争,最终导致伪原创作品充斥出版平台。
3.严重威胁国家文化软实力
从目前的现状看,由网络“洗稿”生产的大量伪原创作品通过各种渠道快速流入文化市场,为平台带来了流量、为网络“洗稿”产业带来了经济收益、为中低端消费者提供了内容产品,形成文化市场的表面繁荣,也使许多文化统计数据变得光鲜亮丽。但这种繁荣下隐藏的原创力“泡沫”也越来越大,国家文化软实力并没有得到真正有效的提升。如果网络“洗稿”现象长期得不到科学规范的治理,伪原创作品会在“洗稿”技术的帮助下,以流水线式量产的流量、网络点击率等不断制造出漂亮的文化产业数据。但这些其实都是对原创作者著作权利益的侵蚀,是对原创作者的逆淘汰,会进一步加剧文化市场原创力的萎缩,一旦繁荣“泡沫”被戳破后,文化市场将有“降级”风险,国家文化软实力也将遭遇重创。
4.逐步侵蚀国家基础科研能力
网络“洗稿”向科研学术界蔓延的现象已经发生。目前在各种渠道大量出现的“论文降重服务”,就是利用网络“洗稿”技术作为支撑,服务对象主要是大中专院校的在读学生,甚至包括层次较高的硕、博士研究生。由于目前教育部门对高校毕业生的毕业论文有较高的质量要求,但每年毕业生数量太过庞大,导致论文质量把关工作量巨大,为提高效率,最后质量把关的系统性工作被论文“复制率检测”的单一性流程所替代,通常在学生完成初稿后提交中国知网等平台进行检测。为了顺利通过这项“复制率检测”,一些学生就会利用“洗稿”技术来对论文进行加工,“降重”服务也因此而产生并形成一定的规模效应。一定数量的高校毕业生借助“洗稿”技术通过了论文考核,这为我国基础科研的未来埋下了重大隐患。大学生作为未来国家科研的生力军,其独立自主的基础研究能力遭到破坏,长此以往,可能对国家科研人才的培养秩序造成冲击,进而逐步侵蚀国家基础科研能力。
三、网络“洗稿”的治理策略
网络“洗稿”以数字出版产业生态现状为依托,利用数据平台唯“流量”论的运营心理,借助“网络爬虫”、大数据、云计算等网络信息技术的发展而野蛮生长、蔓延扩张,对著作权保护体系、数字出版产业生态都造成了消极的破坏作用,也对国家文化软实力、基础科研能力造成了一定程度的威胁,已经到了“非治不可”的地步。
1.以源头治理为目标,切断网络“洗稿”行为的生存根基
网络“洗稿”已形成一个巨大的产业链。它以市场需求为导向,利用现行著作权法律体系的灰色地带,在网络信息技术的掩护下攫取“互联网经济+数字出版”双重领域的巨额利益,更干扰文化市场的正常发展,对其治理必须狠抓“洗稿”泛滥的源头,也即对“洗稿”软件和“洗稿”技术的治理。对“网络爬虫”等网络“洗稿”赖以生存的技术土壤,应当考虑通过专门立法、行政政策等手段设置其在数字出版领域、内容生产环节的准入机制,使其只能用于“反抄袭、反洗稿”的监管,不能用于内容生产。配以“负面清单”形式将已知的“洗稿” 手段进行排除,禁止其在内容生产环节的应用,以此压缩网络“洗稿”的“弹药库”,缩小网络“洗稿” 的生存空间。同时还应通过正确的价值引导,打破相关企业“唯流量论”的经营理念,改变由平台自查自纠式的反“洗稿”模式,强化第三方机构对各大平台伪原创作品的筛查机制,提高对平台纵容或合谋“洗稿”的查处和惩治力度。
2.以综合治理为手段,联通网络“洗稿”行为的治理路径
网络“洗稿”涉及众多主体、诸多环节和巨大利益,治理手段必须讲求综合性。一方面,可以通过设立技术全面、客观中立的第三方“反洗稿平台”,以区块链技术的创新应用来进行定期或不定期的反洗稿摸排,增强智能化“反洗稿”治理能力,打破目前企业“自查不自纠”的局面。另一方面,相关政府部门应主动介入、参与治理。网信部门把好上游的技术关口,掐断网络“洗稿”的技术支持;文化部门加强内容生产领域的价值引领,打破“流量”称王的行业陋习,积极营造鼓励原创的正确理念;建立健全综合执法体系,完善行刑对接机制,在行政监管、行政执法和犯罪惩治上形成对网络“洗稿”现象的合围治理。还有就是优化行业自治的模式和体制机制,同时应致力于原创作者维权路径的疏通和拓展,切实优化用户端的反洗稿举报和投诉功能,加强法治宣传,提高国民保护知识产权的综合法治素养。
3.以依法治理为保障,完善网络“洗稿”治理的制度体系
制度是治理的长效保障,开展网络“洗稿”治理离不开科学完备的法治制度体系。一是要对现行著作权法补齐短板,厘清网络“洗稿”的界定标准,使具体的监管和执法都有明确的法律依据。并通过适当的刑事政策来加大刑法惩处力度,以强化对著作权人利益和原创价值的保护,进一步激发著作权人的原创积极性。二是要在司法实践中,加大多元化判定方法的应用,以针对作品“伪原创性”的审查作为对“实质性相似”判定的有效补充,切实防止“洗稿”侵权认定的扩大化,有效保护好数字出版产业的创新活力。三是要以《反不正当竞争法》等为依据,加大对平台放纵“洗稿”的查处力度,倒逼平台主动加入到网络“洗稿”的治理中,积极打造共建共治共享的产业生态,提升自查自纠的自治效能,实现网络“洗稿”治理的常态化。
注释:
[1]任渝婉.自媒体“洗稿”的治理难题及其多元破解[J].出版发行研究,2018(11)
[2]余为青,桂林.自媒体洗稿行为的司法认定规则及其治理[J].科技与出版,2019(3)
[3]周勇.智能洗稿法律规制研究[J].当代传播,2019(4)
[4]王晓巍.智能编辑:人工智能写作软件使用者的著作权侵权规制[J].中国出版,2018(11)
[5][7]窦新颖.自媒体“洗稿”能否洗掉侵权之嫌?[N].中国知识产权报,2018-02-12
[6]翟冬冬.自媒体进入高级抄袭时代 反“洗稿”大旗谁来扛?[EB/OL].人民网,http://media.people.com.cn/n1/2018/0506/c14677-29967453.html