中国首例人工智能生成内容著作权争议与前瞻分析
2019-12-24林嘉琳
【摘要】从体育实况转播到股市行情、房地产新闻乃至诗词创作,人工智能生成内容技术在实践中的应用越来越广泛,也引发一系列法律问题和伦理争议。通过对人工智能生成内容著作权纠纷第一案为研究对象,具体分析人工智能生成内容在当前法律体系中的法理依据和实践中的技术窘境,并对未来的立法思路展开了探讨。此案具有划时代的意义,也是对人工智能侵权的开拓性探索。
【关键词】人工智能生成内容;机器写作;版权
自从微软人工智能机器人“小冰”在学习519位诗人的现代诗、训练超过10000次后,创造出诗集《阳光失了玻璃窗》,中国的人工智能内容生成技术在谱写歌曲、撰写小说和电影剧本、绘画绘图等各领域得到了越来越广泛的应用,由此也引发了人工智能生成物在法律上如何认定的一系列问题。
2019年4月25日,北京互联网法院一审公开宣判北京菲林律师事务所诉北京百度网讯科技有限公司侵害署名权、保护作品完整权、信息网络传播权纠纷一案,首次对人工智能软件自动生成内容的属性及其权益归属作出回应。
案件判決后,业界和学界意见存在分歧,争议的焦点包括:统计数据分析软件生成的图表和报告是否构成著作权所保护的作品?如果人类在其中也做了分析工作,同时由系统生成图形图表,著作权究竟应该属于机器人还是自然人?
笔者认为,此案的判决没有突破现行立法,有法理依据,比较符合实际,但也比较保守,存在一定的瑕疵。同时,学术研究应有一定的前瞻性,在弱人工智能时代可以适用现行法律,当强人工智能时代到来时,我们必须根据机器人的行为能力考虑AI的主体资格及相应程序链中的各类主体及责任分配。
一、现行版权保护和规范的是自然人的智力劳动成果
这起“人工智能生成内容著作权第一案”的原告为北京菲林律师事务所(以下简称“菲林”)。菲林主张其为涉案文章《影视娱乐行业司法大数据分析报告——电影卷·北京篇》的著作权人,涉案文章由文字作品和图表作品两部分构成:文章的图表来自于法律统计数据分析软件(威科先行法律信息库)生成的数据报告,文字则是基于该报告而进行的分析。
法院认为,涉案文章中的图形为人工智能软件自动生成,不符合图形作品的独创性要求,不构成图形作品,原告对其享有著作权的主张不能成立。根据现行法律规定,文字作品应由自然人创作完成,涉案文章中的文字内容是人工智能软件自动生成的内容,既非自然人创作成果,也未能传递软件研发者和软件使用者的思想、感情的独创性表达,因此,该分析报告不能被认定为著作权法意义上的作品。但是,原告作为法人组织,确实主持创作并首次发表了涉案作品,故涉案文章可被认定为原告的法人作品,原告对其享有著作权。被告在未经原告许可的前提下,私自在自己的平台上发布涉案文章,侵害了原告的信息网络传播权,应为此承担相应的民事责任。
《中华人民共和国著作权法》(以下简称《著作权法》)第十一条规定:“著作权属于作者,本法另有规定的除外。创作作品的公民是作者。由法人或者其他组织主持,代表法人或者其他组织意志创作,并由法人或者其他组织承担责任的作品,法人或者其他组织视为作者。如无相反证明,在作品上署名的公民、法人或者其他组织为作者。”由此可见,著作权的法律主体包含且仅包含自然人与法人,即“生物意义的人”与“具有法律拟制人格的组织”。根据我国现行的法律规定,只有自然人或者法人创作的作品适用著作权法保护,也只有自然人和法人具备主张相关权利的资格。若使用人工智能技术生成内容,该技术本身或利用该技术研发的软件产品不能被认定为著作权人,无法作为适格主体进行权利主张。
本案法院的判决思路没有突破“创作是人类专属的或者特有的”法律逻辑。法院将涉案文章划分成软件生成的图形部分、数据报告以及由前言构成的文字部分,法院认为由原告创作的包括前言部分的文字作品具有版权保护;而图形不是基于创作产生的,不能满足独创性要求。在现有法律体系仍能充分保障相关软件智力、经济投入能够获得相应报酬及其他权利保护的前提下,暂时无须对民法主体的基本规范作出改变。软件生成的数据报告虽具有文字作品的形式要求,但它不是自然人创作的,从而否定了“人工智能创作物”获得著作权保护的可能性。
同时,人工智能技术及软件生成的内容虽然在形态及表达方式上日趋接近自然人,但人工智能的“心智”未能达到相应法律规定的主体资格,无法与自然人同等地享有权利和承担义务。即便人工智能有“写作”的事实行为,但其所依赖的算法仍由自然人所控制,仅满足外部条件而缺乏内心意志的表达,也依然无法划归为法律意义上的“意思表示真实”。目前的技术尚处于弱人工智能阶段,机器本身并不具备意识能力,即不具备预测和控制人工智能写作所经历的数据挖掘、数据分析、内容生成中任一环节的结果的能力。所以,从根本上而言,“弱人工智能”机器人并不具备获得民事行为能力以及权利主体资格。虽然此分析报告实际由数据软件威科先行法律信息库利用输入的关键词与算法、规则和模板结合形成,一定程度上表现为由威科先行库“创作”而成,但数据软件威科先行法律信息库并不能成为权利主体。
二、“人工智能生成内容”依托的是大数据,缺乏独创性的思想或情感表达
人工智能生成内容受著作权保护和规制的前提条件,是其所生产的内容符合《著作权法》中对于作品的“独创性”要求。《中华人民共和国著作权法实施条例》第二条对“作品”作出了明确定义:“著作权法所称作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。”其核心要件在于“独创性”。所谓独创性,是要求作品独立完成且具有最低限度的创造性,并且现有的表达与过往所有作品的表达存在差异。[1]判断这种差异是否存在的标准并不单纯以外观的形态展现为准,而是取决于作品中所蕴含的作者的思想或情感的独创性表达。
目前实践中机器写作的各个环节尚离不开自然人的介入,本案威科先行法律信息库软件的开发和使用环节都有自然人作为行为主体直接参与,智能人本身的独创性不足。虽然在现有的法律体系之下,人工智能本身并不能成为《著作权法》的适格主体,但这并不意味着所有人工智能参与制作的成果都无法享有法律的保护。在本案判决中,法院将涉案文章划分成软件生成的图形部分和文字部分,分别对其内容是否具备“独创性”进行了讨论。
法院认为,分析报告中所出现的由人工智能自动生成的图形虽两两相异,但出现差异的原因仅仅在于每个图形所依据的数据差异,是根据原始数据变换而形成的机械系变化,不能划归为具有独创性情感或思想表达的智力成果的范畴。涉案文章中所出现的图形是原告基于收集的数据,利用威科先行法律信息库软件制作完成,虽然图形会因数据变化呈现出不同的样态,但这种样态的不同是基于数据差异产生的,而非基于创作产生。针对相同的数据,不同的使用者应用相同的软件进行处理,最终形成的图形应是相同的;即使使用不同的软件,只要使用者利用常规图形类别展示数据,其表达也是相同的,此类图形在法律意义上无法符合满足图形作品的独创性要求。
就本案所涉分析报告的文字部分而言,软件设计者只是对软件作出了技术性开发,并未在特定报告的内容中体现出使用者和设计者思想和情感的独创性表达,因此,软件设计者不能作为涉案文章的著作权主体。软件使用者虽然对报告进行了信息输入,但这一输入仅包含特定客观性关键词,关键词既算不上智力型成果,更无法定性为主观上的思想和情感表达。综上所述,威科先行法律信息库软件的开发者和使用者都未能对涉案报告作出独创性贡献,也无法成为涉案报告在法律意义上的作者。考虑到原告完成涉案报告过程中的指导性行为,以及其在经济和时间成本上的支出,法院最终将涉案报告定性为原告主持创作的法人作品,基于该作品的传播价值,原告对该作品享有《著作权法》上的信息网络传播权。
目前人类社会正逐步迈入人工智能时代。智能机器人往往是人类预设好的“算法程序”,运用计算机算法抓取和处理信息數据,并经过加工整理自动生成数据、图表或新闻稿件。2016年2月搜狐推出一个智能股市播报系统“智能报盘”,由机器人自动跟踪、捕捉股票市场动态,产出信息流同步推送到搜狐新闻客户端财经频道。中国在机器生产新闻的领域还相继推出了腾讯“Dream Writer”、新华社“快笔小新”、Giiso资讯机器人、搜狐“智能报盘”、《今日头条》“机器人记者”小明、新华社“媒体大脑”等。这些都预示着大量的数据分析和新闻采编都可以由人工方式转向智能自动化生产模式,人工智能技术在冲击新闻传播行业的同时,也将对现有的法律体系发起挑战。
三、本案判决的局限性与机器写作的前瞻性分析
从目前人工智能生成内容的能力来看,新闻生产领域主要的技术仍集中在数据搜集、信息整理及基于上述两个环节的内容加工层面,机器写作的成果与经由人类深度调查、思考、分析所完成的作品相比还有相当大的距离。缺乏人工的把关,机器写作所依据的海量互联网数据良莠不齐,数据分析报告的准确度难免受到影响。技术层面,基于概率的算法逻辑本身的不确定性[2]也威胁着人工智能生成内容的可靠性。此外,从机器学习到算法决策,大数据分析的原理仅能使人工智能在拼凑信息和数据时,在形态上越来越趋近于人类的语言表达习惯,却无法取代自然人通过文字图像展示情感的能力,更无法模仿自然人利用语境、语气、社会背景、人生经历挖掘信息碎片背后的故事的能力。
本案中,以数据报告为体裁的文字表达尽管“体现出针对相关数据的选择、判断、分析”,但法院否定了“人工智能创作物”的可版权性,而其判决思路与版权法律制度的法理仍值得探讨。倘若强人工智能到来后,软件生产的内容和体裁,具备了版权作品的形式要求和实质要件,具有一定的独创性,那么仍简单地认为非人类独创就没有著作权是否合适?如果机器写作的作品已经完全具有版权法意义的独创性,能否赋予机器写手独立的作者身份,从而成为独立的著作权主体呢?
笔者认为,虽然人工智能不是自然人,但它已然展现出区别于传统意义上的“物”的特征,甚至通过对自然人语言思维、行为习惯的学习和模仿,在一定意义上正逼近人类的思维、认知与行为。在这一趋势下,不能因为人工智能生成内容的主体不是自然人或法人,或基于当前弱人工智能阶段的技术瓶颈,就全面否定其未来的可版权性。将人工智能生成内容纳入传统版权分析框架,实际上是一种“人工智能对设计版权的演绎作品”,人工智能之“智能”,将设计者之设计版权与智能作品上的版权区分开来。[3]对于现阶段的人工智能生成内容,应在现有法律体系中明确各权利主体的权利范围,为人工智能技术的研发、设计和实际应用更好地服务人类提供良好的法律环境。
尽管目前还处于弱人工智能时代,但世界上已有国家开始考虑在法律上为机器人预设其作为行为主体的经济地位与社会地位,欧盟甚至立法赋予智能人以电子人格,承认未来的智能人具有行为能力与权利能力。按照我国目前的法律环境,给机器人写作或其他人工智能技术施展的空间并不多。当算法出现了问题,目前的法律环境使它无法独立为自己的行为承担相应的法律后果。在现有讨论中,有学者指出,编辑或出版商将成为算法输出的责任人,但是算法的开发者也不能完全没有责任,若算法规则存在错误,导致数据挖掘存在不准确或偏见,导致输出的信息或数据有错误,那么也应当承担部分法律责任。[4]可见,面对未来的人工智能生成内容,当前学界对人工智能身份归属的多种讨论已然预示着不能简单地将人类实体与法律实体当成“人工智能创作物”的主体。从算法程序的研发到算法程序的应用,从机器学习到算法决策,涉及的各主体包括设计算法的程序员、软件公司、数据录入者、人类作者等。在主体资格层面上,可考虑在围绕机器记者的主体范围内,思考如何对主体进行角色分配,并制定相应的责任配比。通过对多类主体资格的开放性探讨,为特定条件下能够在真实世界的环境中不受任何形式的外界控制而长时间运行人工智能“自主性”[5]研发预留空间,不失为一种思路。
总之,现阶段可以将机器人写稿内容纳入到自然人或其所在机构的权责范围,但长远看它仍存在一系列的法律问题,特别是一旦机器人独立写稿且作品符合独创性版权要求以后,如何认定作品和著作权人?笔者认为,法律应该为人和机器人划出界限,在数据生成与作品生产的各个流程中,按各个主体进行责任分配,以此作为应对未来法律问题的基础。或许未来要构建一个新的法律框架,以主体的法律边界为基础,认定机器若发生侵权可能性的行为所指向的对象、所承担的责任者,判定机器带来的损害及因果联系,规定如何收集机器损害行为的证据等。
[本文为国家社科基金重大项目“人工智能时代的新闻伦理与法规”(项目编号:18ZDA308)的阶段性研究成果]
参考文献:
[1]项贤军.人工智能创作物的著作权问题研究[J].现代商业,2018(29):160-161.
[2]Mittelstadt B D,Allo P,Taddeo M,et al.The Ethics of Algorithms:Mapping the Debate[J].3,2(2016-11-01),2016,In press(2).
[3]易继明.人工智能创作物是作品吗?[J].法律科学(西北政法大学学报),2017,35(05):137-147.
[4]Ombelet P J,Kuczerawy A,Valcke P.Employing Robot Journalists:Legal Implications,Considerations and Recommendations[C]// International Conference Companion on World Wide Web.International World Wide Web Conferences Steering Committee,2016.
[5]郭少飞.“电子人”法律主体论[J].东方法学,2018(3).
(林嘉琳为清华大学新闻学院博士生)
编校:王志昭