著作权视野下人工智能生成内容的研究
2018-03-28董梦晴
董梦晴
(安徽大学法学院,安徽合肥230601)
近年来,随着人工智能的飞速发展,有关其生成内容的著作权保护问题也愈来愈受到人们的关注。不同于以往提供辅助功能的计算机,人工智能可以在大数据的基础上不断学习、进步,甚至生成出具有独创性的内容,比如说由人工智能生成的新闻报道、小说、绘画、音乐作品等。然而,当前的著作权体系并没有对此类具有独创性的生成内容进行准确的定性,我国著作权法保护的客体也未涉及这些由人工智能生成的内容。因此,对于此类由人工智能生成的内容,我们需要讨论是否应将其纳入著作权法的保护范围。但在此之前,我们更需要确定的是那些由人工智能生成的内容到底是不是作品,以及是否符合独创性的要求,毕竟,只有在符合的情境下,才有必要进一步讨论它是否也应受到著作权法的保护。所以,下文也将在此脉络下对人工智能生成内容的相关问题展开论述。
1 人工智能生成内容研究范围的确定
在著作权视野下探讨人工智能生成内容的有关问题,并不意味着只要是由人工智能生成的内容都值得我们讨论,就如同并非所有由人类输出的内容都可以称之为著作权法中的作品一样,如果一项内容即使是由人类创作也不属于作品,那我们再探究此项内容由人工智能生成的话会不会成为作品就显得毫无意义。譬如说,某人临摹名家字帖得到的临摹成果或按照姓氏字母顺序精心编排的通讯录,虽然从表面上看,这些像是付出了一定的劳动后而得到的创作成果,但事实上它却不是我们著作权法中所说的作品,所以即使上述“作品”是由人工智能所输出的,也不可能因此摇身一变成为作品。所以,我们需要讨论的应是那些由人类输出可以称之为著作权法中作品的内容,如果是由人工智能生成此类内容的话,该如何在现有理论中对此进行定位的问题。
但在实际研究中,我们又不免发现把人工智能生成内容的研究范围限缩在符合著作权法中作品的内容似乎不够严谨。因为根据目前著作权法理念,人才是创作的主体,在谈论某项内容符不符合著作权法中的作品时,我们无法把“人”这个主体排除在外,但在探讨我们今天的主题时,如果按照当前的理论最先考虑主体因素的话,我们就无法再进行接下来的讨论,甚至仅凭此一点,我们就可以轻易地得出结论——因为人工智能不是人,所以其生成的内容也不可能是作品,所以它也没有所谓的作者,也就更无需再探讨谁是作者以及该著作权的归属和保护等的问题。
所以,我们在探讨人工智能生成的内容是否可称之为作品时,应暂时先不考虑主体的因素,先考量其在形式上是否与人类创作的作品相似,如果它在形式上与人类作品无异,那么我们就可以进行接下来的研究,即判断其生成的内容是否具有独创性。对于那些不符合独创性要求的内容,如仅仅用其生成的临摹复制品等,就应将其排除在我们的讨论范围之外,毕竟此类内容本身就不是作品,不受著作权法的保护,无须再对其进行讨论。而对于有可能被认定为著作权法中作品的内容,我们需要再进一步讨论是否该突破作品必须源于人类的传统理论将其认定为新的作品形式。就如由人工智能生成的新闻报道、美术或音乐作品等,由于其在形式上满足著作权法对作品的要求,就非常值得纳入我们的讨论范围之中。所以,下文我们讨论的主要就是那些在形式上与人类作品无异,其本身也符合作品独创性要求的内容。
2 独创性的内容是否源于人工智能自身的创作
2.1 人工智能目前的发展概况
目前,人工智能的定义在学术界仍有争论,在定义时通常还强调应区分“弱人工智能”和“强人工智能”的区别。相关研究人员也对此两种观点进行了阐释,如弱人工智能是在数学的基础上进行问题求解的机器学习算法,先由程序设计者预测出可能会出现的所有情况,然后再设计出一系列相对应的处理方案,最后再由机器进行判断是否符合相关条件并加以选择和执行;而强人工智能则要求程序能够有自己的思想,可以脱离人的干预,自我理解外界的事物并做出自己的决策或行动[1]。事实上,学者们虽然对人工智能的发展和定义有不同的观点和看法,但就目前来说,人类在人工智能上取得的进步仍主要集中在所谓的弱人工智能上,例如,机器视觉、自然语言处理、智能语音搜索等等的迅速发展和大量运用,而强人工智能的发展仍未有实质性地进步。
此外,计算机学界的多数研究者也都认为,人造机器是没有自身目的的,其运行的目的都是人类预先创设的,并非来源于其自身,它与人类的具有的目的性质完全不同。同时,它也没有自身知识的积累,机器知识库的知识都是人类预先输入的,往往输入的还仅仅是某一方面的特定内容,尽管机器可以具有一定的学习能力,但也仅仅是在特定领域内进行的学习,难以具备直觉、想象、灵感和审美等能力[2]。但也有学者称,虽然“强人工智能”尚未实现,但随着人工神经网络“深度学习”的发展,“强人工智能”的到来也许并不遥远[3]。
笔者认为,“强人工智能”的实现还是存在很大的疑问。因为,制约人工智能发展的限制条件不仅有神经网络,还有大数据和算法。事实上,深度学习常被看作是一种需要大型神经网络的深层次结构,是对人和动物大脑进行仿生模拟的过程,是需要通过特定算法并以大数据作为模型不断训练,进而发现规律并形成经验的一种学习状态[4]。神经网络在深度学习的过程中充当模拟人类大脑的角色,目前大型神经网络的技术发展已经可以为深度学习提供支撑,但仍未突破算法和数据这两个条件的限制。以谷歌阿尔法狗(AlphaGo)战胜人类顶级围棋高手李世石为例,不似普通大众因此产生人工智能已超越人类的简单推想,在人工智能研究领域的科研人员看来,AlphaGo战胜人类棋手并不足为奇,因为围棋博弈有着明确而严格的操作规则,只要设置好符合规则的程序,人工智能完全可以依靠其强大的策略存储能力和推算能力不断进行“学习”,并赢得比赛。所以,即使是目前的“深度学习”也没有摆脱算法和数据的限制,它与以往不具“学习”功能的人工智能相比,较为突出的一点就在于程序编写者为其设定了学习的过程和方法,即授予人工智能收集、学习数据的方法,但此类人工智能仍未脱离编程者的算法架构,仍不具备独立创作的能力。
基于此,目前的人工智能还主要处于“弱人工智能”的阶段,仍然摆脱不了算法程序的限制。人工智能也未能脱离“人”的因素而主动参与实质的创作,其所具有的“创造性”也只是在已有的逻辑和数据模式下进行的重新排列组合或所谓的“重新学习”而成,其主要依靠的还是它原来的算法和程序。
2.2 人工智能生成独创性内容的实质
上文已经把研究范围限缩在不考虑主体的情况下由人工智能生成的且具有独创性的内容,下面再结合当前人工智能的发展概况进一步探究该独创性的内容是否出于人工智能自身的创作。
经上述分析,从人工智能的工作机理来看,我们可以发现人工智能所生成的具有独创性的内容实际是通过算法程序运行,经过分析、选择之后而输出的结果,如一些自动生成新闻、音乐、绘画等内容的智能系统,从表面上看与它人类创作的作品并无区别,如不加以说明,可能就会被理所当然的看成为人类创作的作品。但这种创作明显有别于著作权法中的创作,因为实际上人工智能自身并没有参与任何实质地创作,仅仅只是对已有算法或程序的运行而已,并不具备独立自主的智力创作能力,即使其可以脱离人的控制自主运行也是一样,毕竟设置其可自主运性的程序也是由人事先编入的。因此,不能认为人工智能自身真正参与了此类具有独创性内容的创作。
譬如说,那些由人工智能撰写的新闻,从工作机理上来看,人工智能撰写新闻主要就是利用算法编程建立的庞大数据库,通过收集和分析大量的优秀新闻稿件以及在各种令人耳目一新的题材中进行“学习”,写作的过程就是从庞大数据库中寻找类似信息和数据的过程,完成之后便自动生成了相应的新闻稿件。从中我们不难看出,人工智能所谓的“新闻创作”仍是一种算法运行的机械过程,仍是以现有的信息库为基础,通过一定模式的筛选和分析对信息进行处理,然后对其进行重新排列和组合,并最终输出结果[5]。显然,这一撰写新闻的模式运用了智力成果,即各种算法、程序或模板,毫无疑问,设计出这样的运作模式和算法是需要付出大量的智力劳动,但我们也必须明确此项智力劳动成果与人工智能自身的智力劳动成果的区别,正如王迁教授所言,“算法、规则或模板是不是智力性创作成果,与应用该算法或模板的过程是否为智力性创作并无必然关系”[6]。所以,虽然看上去这些具有独创性的内容是由人工智能直接生成的,但实质上却只是给算法程序披上了一层人工智能的面纱而已,它自身并没有进行任何实质性地创作,也没有生成任何算法程序之外的新作品。
除此之外,还有近年来比较容易引起争议的由人工智能生成的音乐和绘画作品等。比如,索尼计算机实验室开发的可以进行音乐创作的人工智能,项目开发人员主要运用德国音乐家巴赫的曲目训练该智能系统,之后该人工智能使用352首巴赫的作品,将其转换成不同的音符,并进行重组,最终形成了2503个音乐作品,而且在后来的测试中,有超过一半的专业听众都以为这些是巴赫本人的作品。这看上去似乎人工智能可以独立进行音乐创作了,然而相关研究却表明,人工智能的“作曲”主要是通过以下三个步骤来完成的,首先是建立规则表和数学模型,其次随机生成单个的音符,最后再根据既定的规则和模型测试各音符间和谐度,通过不断地重复和测试,大量的有效音符便被挑选出来并组成新的的乐曲[7]。所以,不难看出人工智能创作音乐的过程也是依靠算法和程序的运行。再如,由英国艺术家Harold Cohen开发的可以自动绘画的AARON软件,该软件创作的部分作品甚至还在伦敦泰特美术馆展出。但此软件之所以能够自动绘画,无非也是凭借研发者预先设置的程序,其软件开发的研究对象仍是“数据采集系统和机械控制系统设计”“人物肖像轮廓提取算法”和“细节处理算法”等。这些设计模式主要是用来对采集的各类数据进行的定量化分析,也从侧面表明了人工智能“绘画”的本质上仍需依靠属既定算法程序的运行,其自身并不具有独立创作的能力。
3 保护人工智能生成内容的现实考量
根据前文的论述,我们得出在不考虑主体的情况下,在形式上与人类作品无异的人工智能生成的内容,其所具有的独创性仅仅是既定算法和程序运行后的结果,人工智能自身并未提供任何具有个性化的智力创作。所以,我们并不认为人工智能进行了创作,其也并没有生成除既定算法程序之外的具有自身独创性的内容。但是,虽然人工智能自身未生成任何新的作品,但其运行后的结果往往却生成了具有独创性的内容,而对此类具有独创性的内容,我们需要讨论是否要把它纳入著作权法的保护范围。
根据目前著作权的相关理论,人类的智力性创作成果才有可能成为著作权法保护的对象,我国《著作权法》第二条也将其保护的主体确定为“中国公民、法人或其他组织以及满足各自条件的外国人和无国籍人”。在学界,学者们也对此有不同的看法,比如说,有学者坚持“独创性”属于人类专有,只有人类才具备独创性的思维表达,作品必须是人类的智力成果,不是人类“创作”的作品不能视为著作权法中的“作品”[8];但同时也有学者认为,虽然人工智能作为编程者的创作物,其本身属于权利客体和权利支配的对象,但如果不赋予人工智能创作物“作品”一定法律性质的话,社会将因此产生大量的“孤儿作品”或“无主作品”,极不利于文学艺术的保护和发展,因此,人工智能生成的内容如若符合作品独创性的要求,就应该赋予其相应的法律性质[9]。
笔者认为,虽然目前著作权法未把人工智能生成的独创性内容划入保护的范围之内,但在著作权法的实际运行中它同样也能得到保护。比如说,一篇由人工智能生成的具有独创性的小说,如果其操作者没有披露其真实的来源,甚至还在上面署上自己的名字,那么对外界而言,我们一般也就会推定此署名人就是作者,除非有人质疑,并提供相关证据证明该内容是源于人工智能的生成,并非此署名人,否则在一般情况下,该内容依旧会被认定为著作权法中的作品并受到保护。所以,同样基于此种考量,日本2016年5月出台的《知识产权推进计划2016》也承认在当前知识产权制度下,人工智能自动生产的创作物,无论是它的创意内容还是技术信息,都不能成为知识产权的客体。但又表明,“由于人类的创作物和人工智能的创作物在外观形式上通常难以分辨,所以,除去那些明显不具独创性的生成物,人工智能的创造物应与人类的创作物受到相同的对待”[10]。这实际上也就指出了虽然人工智能的创造物没有成为知识产权保护的客体,但在实践中其仍可以得到知识产权法的保护,这实际上也是实然法和应然法在一定程度上的融会贯通。
所以,虽然人工智能的出现给著作权的保护增加了一些新的难题,但它尚不足以推翻目前著作权的体系制度,其所产生的新问题可能会加剧著作权纠纷中证据证明上的复杂性,但并不会对基本的著作权理论产生实质性地突破。
4 结语
从目前人工智能发展的阶段来看,其仍处于算法智能的阶段,人工智能所谓的“创作”也只是按照人类预先设定的模型算法进行的机械运作,其自身未对所得到的独创性内容付出任何智力性的劳动,这也是它不适合成为著作权法权利主体的根本原因。但如果真的有一天,人工智能达到了可以完全模拟人类思维的程度,能够独立完成最初设置程序之外的创作时,我们也不排除授予其权利主体地位的可能性。但就目前的发展状况来看,这一天的到来似乎还是遥不可及的,即使未来真的发展到这一步,那人工智能给人类社会带来的冲击定是无法估量的,人类社会的各个方面都将面临结构性的调整,而法律方面的调整也不会是由著作权法首先作出回应,民法定会先在主客体方面进行调整和革新,而后著作权法中的主客体自然也会随之变动,根本不必仅因人工智能发展过程中带来的些许挑战而大规模地变动目前著作权的基本理论体系。
[1]贺倩.人工智能技术发展研究[J].现代电信科技,2016,46(2):18-21,27.
[2]钟义信.人工智能:“热闹”背后的“门道”[J].科技导报,2016,34(7):14-19.
[3]杨婕.全球人工智能发展的趋势及挑战[J].世界电信,2017(2):15-19.
[4]孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012(8):2806-2810.
[5]贾媛媛.有关“机器人记者”的著作权争议探析[J].青年记者,2016(22):74-75.
[6]王迁.论人工智能生成的内容在著作权法中的定性[J].法律科学(西北政法大学学报),2017(5):148-155.
[7]李星燕.算出音乐来[J].新发现,2009(8):98.
[8]李明德.著作权主体略论[J].法商研究,2012(4):8-11.
[9]熊琦.人工智能生成内容的著作权认定[J].知识产权,2017(3):3-8.
[10]知识产权推进计划2016[EB/OL].[2017-11-28]http://www.kantei.go.jp/jp/singi/titeki2/kettei/chizaikeikaku20160509.pdf.