APP下载

ChatGPT视野下知识产权保护困境及对策研究
——以成渝治理者对ChatGPT数据产品确权为视角

2023-08-21仪,王

关键词:商业秘密知识产权权利

李 仪,王 蒙

(1.重庆理工大学 重庆知识产权学院, 重庆 400054;2.西南政法大学 民商法学院, 重庆 401120)

一、引言

(一)ChatGPT的兴起背景

作为生成式人工智能(Generative AI)的代表,由美国人工智能实验OpenAI开发的人工智能聊天机器人ChatGPT一经问世便空前火爆。2023年3月14日发布的多模态预训练大模型GPT-4,已经具备强大的图像识别、文字生成图片以及创意文本生成等多项功能。ChatGPT具有强智能性。一方面,ChatGPT 以大量语料库为基础,包含了对真实世界的语言理解和文字生成能力,使得ChatGPT能够根据上下文的互动表现出与真正人类交流几乎相同的聊天场景。此外,ChatGPT可以在几乎没有人指导操作的情况下,撰写复杂的文章和诗歌、创建功能代码、根据文本描述构建图表和网站等。另一方面,在RLHF和RBRM的加持下,ChatGPT不仅具有极强的自我学习能力,其自我纠错功能也得到了提升。ChatGPT具有多样功能。ChatGPT不仅是简单的聊天机器人,它也成为经济、教育、医疗领域的重要应用工具。在教育领域,ChatGPT可以作为创建教育内容和辅助语言学习的强大工具,它可以运用多种语言,几乎不需要人工输入便可以生成教科书和论文。教育工作者可以利用ChatGPT实现教学工具的多元化,而学生则可以通过自主提问的方式查漏补缺,进而构建真正意义上的智能教育体系。在经济领域,ChatGPT能够通过大数据整合、自主学习后给出合理的商业方案,以此可以轻松实现金融资讯的自动化生产,快速提升机构运营效率。在医疗领域,ChatGPT可以帮助普通患者快速理解医疗文件、录入电子病历减轻医生工作压力,以此来提升医生的工作效率。

(二)研究现状

2017年国务院印发的《新一代人工智能发展规划》指出:“在大力发展人工智能的同时,必须高度重视其可能带来的安全风险挑战,加强前瞻预防与约束引导,最大限度降低风险,确保人工智能安全、可靠可控发展。”[1]然而,科技迭代升级的极速性同法律法规的滞后性之间存在着难以自动纾解的矛盾[2]。一方面,我国对于“人工智能”的相关知识产权保护制度尚未明确。另一方面,对于“生成式人工智能”这一新兴科技,是否能被视为传统的知识产权保护对象也尚不清晰,这就加大了生成式人工智能的知识产权保护难度。我国学界目前对于ChatGPT的态度主要分为3种:一是认为以ChatGPT 为代表的大型语言模型,从本质上讲尚处于一种“低智能”的状态,不具备成为知识产权主体的资格[3]。二是认为ChatGPT具有很好的连续多轮对话功能并能够发现错误,它的出现会颠覆传统的教育、医疗、传媒等多个领域,进而引发包括版权规则冲击等一系列的知识产权问题[4]。三是认为ChatGPT只是一种新的技术形式,而非成熟的技术应用,引发的知识产权问题整体上处于可控的状态[5]。由此看来,ChatGPT给生活带来便利的同时,也隐藏着潜在的知识产权运用风险。基于此,本文从版权归属、可专利性、商业秘密和数据确权角度出发分析ChatGPT的知识产权困境,并给出当下的治理建议。

二、困境解析

(一)版权归属难以判定

如前所述,ChatGPT 是一种依靠大量数据和算法整合而运行的智能机器人,生成的智能产品内容具有随机性[6],因此认定其生成物的版权归属并加以保护意义重大。目前,对于人工智能生成物的版权归属并无明确的法律界定,学界对于人工智能生成物的作品认定和版权归属问题也一直存在争议:人工智能生成物是否能视为作品?如果能满足作为作品的独创性,其版权归属者是谁?

首先,作品认定问题。我国《著作权法》规定满足独创性是认定作品的基本要件。李岳林[7]认为,当前阶段的人工智能是人类创作生成物的工具,属于人类智力劳动的成果,且其生成物在表现形式上符合独创性,所以可以认定为作品。而持不同观点的王迁[8]认为,创作是人独特的认知和价值观的表达,而人工智能生成物是算法和数据处理的结果,因此不具有独创性,不能被认定为作品。基于此,本文认为:其一,生成式人工智能ChatGPT是帮助用户获取和生成信息的语言模型,因此,ChatGPT是机器模仿人类思想以创作作品的工具,其生成物是凝结人类价值取向的“智力成果”;其二,经过“深度学习”的ChatGPT具有强大的理解能力,可以快速地模拟人类的思维模式继而生成答案,表达方式上更加多样化,因此满足独创性。

其次,人工智能生成物权利归属问题。学界观点大致有以下3种观点。第一种观点是版权应当归软件设计者所有[9]。该观点指出,人工智能研发过程中的算法优化、数据供给是软件设计者创造出来的,因此人工智能生成物是凝聚了软件设计者创造性的智力劳动来源。第二种观点是版权应当归软件使用者所有[10]。该观点认为在内容生成过程中,人工智能生成物的内容和表现形式体现的是使用者的创作需求与价值取向。虽然人工智能在生成内容的过程中具有自主性和模拟性,但是最终的生成结果是使用者意志的体现。第三种观点是将版权归入公共领域[11]。该理论认为,《著作权法》规定版权的权利主体必须是自然人或非法人组织,而人工智能并不满足这一条件,因此可以将人工智能生成物视为“无主作品”,归入公共领域。

(二)可专利性认定困难

要探讨ChatGPT生成物的可专利性,首先需要明确其生成发明是否属于可专利的客体范畴,能否满足专利授权的“三性”(实用性、新颖性、创造性)要求。

首先,可专利性的判定。我国《专利法》第2条规定:本法所称的发明创造是指发明、 实用新型和外观设计。《专利审查指南》第二部分第一章4.2规定:如果一项权利要求仅仅涉及智力活动的规则和方法,不具有技术特征,不能被授予专利权;如果还包括技术特征,则获得专利保护就具有可能性[12]。显然,要想判断人工智能生成物是否属于专利法所保护的客体范畴关键是判定其是否具有技术特征。ChatGPT 本质上是一种在数据运算和算法指挥下模仿人脑来解决问题的程序,若能通过执行其程序算法来解决技术问题就说明其具有技术特征,属于可专利主题,这是判断人工智能生成物是否具有可专利性的难点,也是现实中专利申请时容易被驳回的原因[13]。

其次,审查ChatGPT的生成物是否满足“三性”标准。第一,具备实用性的发明创造应当能够被制造或使用,具有可实施性。显然ChatGPT的生成物能轻而易举满足实用性的标准。第二,新颖性要求不是现有技术且不存在抵触申请。ChatGPT自身的算法程序以及数据运行决定了新颖性,由于算法和数据具有多样性,故ChatGPT可以凭借其卓越的数据分析处理能力在生成内容的过程中隐匿使用现存技术的风险,从而达到新颖性要求。第三,创造性要求发明必须有创造性和实质性,也就是说要通过对现有技术的排列组合产生实质性的有益效果。而在具体的创造性审查中,审查人本身专业领域和学科知识的局限性带来了创造性审查标准的挑战性。ChatGPT拥有强大的数据处理以及算法整合能力,所创造的生成物在某些领域甚至可能会超出人类认知,所以排除掉人工审核的误差,ChatGPT生成发明能够满足《专利法》创造性的要求。

(三)商业秘密保护风险

《反不正当竞争法》规定:“商业秘密是指具有非公知性、价值性的技术信息与经营信息,并且应当采取适当的保密手段。”[14]也就是说,只要信息具有价值且已被合理保护即可视为商业秘密。从定义上来看,商业秘密比前述著作权、专利等的保护范围要更加广泛,强度也就更大。一旦OpenAI将ChatGPT的技术方案作为商业秘密,能最大程度地防止ChatGPT的技术方案被剽窃和曝光。但是,将ChatGPT的算法作为商业秘密来保护也有隐忧,最大的风险就是算法“透明度”问题[15]。首先,算法运行具有随机性和多样性,如果算法透明度不够高,ChatGPT在运行的过程中有可能窥探到用户的个人隐私,加剧个人隐私泄露的风险。其次,算法的“不透明”增大了企业运用ChatGPT实施不正当竞争行为的风险[16],商业秘密的不可解释性使得算法也具有不可解释性,这导致相关监督机关很难发现这种不正当竞争,这对市场秩序有着极大的负面影响。最后,算法“不透明”还可能引发某些歧视效应[17],数据偏见可能会导致ChatGPT的运行结果产生某些不公平现象。 基于此,ChatGPT能否作为商业秘密受保护存疑。

(四)数据产品权属难以界分

习近平总书记在主持中央全面深化改革委员会第二十六次会议时强调:“促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。”[18]在数智化时代,数据是数字化、网络化、智能化的基础,正作为新型生产要素带动着“数据生产力”的快速发展。ChatGPT基于海量数据训练构建起巨大模型,其数据具有复合性和非排他性,权利设定面临着巨大障碍。我国 《民法典》明确要对数据进行依法保护,这保证了建立数据规则体系的正当性,但是同时由于我国法律并未对数据的内涵和性质进行明确的界定,因此无法对构建数据规则体系提供明确的指引。首先是数据权利。学界目前主要存在以下3种观点:第一种,人格权说[19]。人格权属于民事法律权利类型,具体来看包括姓名权、隐私权、肖像权等具体权利。“人格权说”主张数据与其所描述主体的人格直接关联,强调在分析数据权利体系构建时,不能忽视数据流通和运行过程中所蕴含的人格属性[20],不能完全将数据权利局限于商业模式下的权利之中,使个人人格在数据权利体系中处于法律保护的空白之中[21]。因此,应当为数据创设一种人格权——个人信息权,使个人数据能够得到有效保护,但是这种权利制度的局限性主要在于:个人信息权适合作为个人数据的确权,这样就缺少其他主体的数据权利,所以还需要构建其他数据权利模型,加大了数据立法和规制难度[22]。第二种,知识产权说[23]。这种观点主张以独创性作为数据类型划分的标准,将有独创性的数据排列和人工智能生成物列入著作权的保护体系之中;而对于难以认定其独创性的数据排列,则将其归入邻接权的保护路径。这似乎解决了数据权益配置和规制难的问题,但“知识产权说”存在严重的弊端:一方面,对于绝大部分数据来说,很难对其独创性进行认定。另一方面,数据的流通以及识别利用属性使得数据具有非排他性,这与排他性显著的知识产权相冲突,因此“知识产权说”不仅会限制数据相关产业的发展,还违背了知识产权立法鼓励创新的初衷。第三种,新型财产权说[24]。其一,数据具有经济价值。ChatGPT的数据经过获取、汇集、清洗、排列组合等一系列行为,能够被处理者及时有效地用于预测事物的客观规律,从而生成有效信息,带来某种商业价值或者其他价值[25]。此外,随着大数据的发展,数据交易实践也体现了数据的经济价值,数据交易市场将数据作为资产,明确了数据的经济价值。其二,数据具有可交易性。体现在事实及法律两个层面,在事实层面上的可交易性基于数据的可流通性以及可以为人们所控制。人们可以基于ChatGPT以及互联网传输实现数据的流通共享。在法律层面上来看,数据承载了多方法律权利,可以被多方主体所控制[26]。数据生产者对于数据的产生付出了劳动成本,因此具有可交易性。

三、困境对策

(一)ChatGPT视野下知识产权保护规则的完善建议

1.ChatGPT生成物版权的归属规则

首先,要对可版权化的ChatGPT生成物进行界定。ChatGPT的产生意味着人工智能逐渐进入强人工智能时代,人工智能生成物的数量也将大大增加。因此,要界定ChatGPT生成物的可版权化标准,对ChatGPT生成物的“独创性”制定合理的标准,既不能盲目授予版权,也不能排斥授权。从形式上来看,ChatGPT的生成内容可以是文字、图片、视频或音乐等。根据我国《著作权法》授权的作品类型,如果ChatGPT的生成物不在文学、艺术、科学作品范围内的话,则不应该授予版权。ChatGPT数据和算法的运行具有随机性,但是有些常识性的生成信息是基于系统内算法事前设定的结果,对于这种生成物,不论是谁操作结果都差不多,没有凝聚作者的智力劳动,不具有独创性,则不应该被授予版权。相反,如果ChatGPT的生成物是算法和数据随机运行的结果,可以根据操作者的不同而生成不同的作品,则可以授予版权。

其次,要明确ChatGPT的版权归属问题。遵循我国《著作权法》的基本规则,即让人工智能生成物的版权归作者所有,以从事创造性的智力劳动为标准。然而,ChatGPT生成物的产出是从软件设计者搭建数据算法的运行规则到软件使用者发出搜索指令的过程,因此认定版权归属时应当先判断设计者和使用者从事创造性智力劳动的多少,谁的贡献多谁享有版权。当设计者和使用者本质上付出了同等程度的智力劳动时,如果双方提前有版权归属的规则约定则遵从事先约定好的规则,没有则由软件设计者和使用者共同享有。

2.ChatGPT生成物专利权取得规则

第一,应该根据激励理论明确专利权属。《专利法》存在的意义之一在于激励创新,创造发明。从上文对ChatGPT生成物可专利性的分析中我们可以得到,ChatGPT生成物能够满足专利申请“三性”的要求,将ChatGPT生成物纳入《专利法》保护的客体范畴具有可行之处。所以,应该首先明确专利权属,才能更加有针对性地实施创新激励。ChatGPT生成物的主体涉及投资者、所有者、使用者和开发者,笔者认为应当将专利权归属于所有者。一方面,ChatGPT的所有者是软件开发公司,更清楚软件的运用场景从而优化技术,不断创新推出更优的软件。另一方面,一项权利的归属必然牵扯到责任的承担,而ChatGPT的所有者具有唯一性,根据“权责一致”原则,当出现侵权行为时避免因责任主体太多而造成责任承担不均。此外,ChatGPT生成发明创造的过程可能是ChatGPT模拟人脑自主生成新内容的过程,所以如果交给将专利权授予其他主体,在侵权发生时可能会有失公允。

第二,应该从利益平衡的角度合理构建专利保护制度。《专利法》促进创新的最终目的是推动国家发展与社会进步,所以需要在保护私权和维护公共利益间寻求平衡。一方面,由于ChatGPT生成物的成本低、时效快以及数量大,权利人可能通过ChatGPT获取大量专利而造成专利滥用,因此要加强对权利人的管理和约束。另一方面,要根据生成物生成的难易程度、价值合理设置ChatGPT的保护期限,以防止专利垄断。

3.ChatGPT的商业秘密保护规则

如前所述,商业秘密旨在保护有价值的信息,而ChatGPT算法“不透明化”和“透明化”其实是不同主体之间追求利益冲突的问题。“不透明化”是经营者选择经济利益的结果,所涉及的ChatGPT的算法是基于商业竞争关系而产生的保密性,体现的主要是其软件研发者、经营者的主观意愿,而非智力劳动或者其他具有创造性的活动。对此,要制定适当政策、提高技术运作能力以加强对算法设计、编排、运用过程的监督,在一定程度上突破相关信息的“不透明性”。同时,要平衡好“算法透明度”与“商业秘密保护”之间的利益冲突,遵循“适度保护,适当透明”原则,避免形成“算法霸权”或者“商业秘密壁垒”。此外,ChatGPT应用过程中具有高度的数据依赖性,在数据规模和算法构建方面会产生庞大的需求,也必然超出技术范畴,提高了用户的使用门槛。这就要求ChatGPT在选择技术路径、构建数据算法程序时不要超出对ChatGPT算法本身安全性以及开放性的评价范畴。在现实中,ChatGPT算法天然的非公开性可以通过商业秘密制度来获得保护。ChatGPT算法应该属于适格的商业秘密保护客体,应体现对相关技术开发者、人工智能控制者知识利益和投资利益的尊重与保护。

4.ChatGPT数据产品权利规则

研究ChatGPT的数据产品权利制度的构建,一是要讨论数据能否成为新型财产权的客体。数据成为新型财产权的客体必须具备3个条件:确定性、独立性、价值性。数据的价值性体现在数据具有经济价值和可交易性。数据的确定性表现于数据在生成后具有一定的稳定性和可控制性,另外数据可以通过一系列的技术手段形成独立性。因此,数据可以成为财产权的客体。关于数据财产化的法律规制立法原则。首先是要加大对数据开发的投资。用户数据涉及用户隐私权、人格权和数据财产权等多方面权益,要加大对用户数据的保护力度,激励数据生产使用时的投资活动,从而带动数据市场的活跃。二是数据各方利益平衡原则。数据的共享性导致数据法律权利设置中存在着自利与公益相渗透和融合的趋势,要确保数据公益是数据私益实现的前提,以此建构权利的保护与限制的利益平衡机制。三是促进数据流转和交易原则。当前,国内外数据产业的竞争,无不以促进数据流通、发展数据市场为目标。我国有关数据的保护却以静态保护为主,对数据的流转不够重视,因此在设计数据财产权专门法律规制中要尤其重视该原则。

(二)规则实施的保障措施

1.行政监管

首先,作为国家层面的合作先行示范区,成渝地区治理者适宜通过区域协同加大ChatGPT知识产权的法律保护力度。数字经济背景下,ChatGPT知识产权所有者的自主权利范围和网络平台的运营权利界限是紧密联系在一起的[27]。为了保障ChatGPT类人工智能知识产权所有者的合法权益,应对ChatGPT所涉及的知识产权内容进行合理的授权和保护。而在授权过程中产生的权利纠纷,应当采取合理、合法的方法来处理。同时,对ChatGPT知识产权所有者的权利范围、授权方式、报酬的支付等都应该作出明确规定。其次,要完善ChatGPT知识产权保护的司法程序。目前,我国对于ChatGPT类人工智能所引发的技术纠纷和知识产权侵权,没有专门的法律界定,这就给现实中的司法保护带来极大挑战。因此,要立足于司法实践,健全ChatGPT类人工智能的知识产权和技术纠纷的诉讼程序,提升相关损害赔偿的标准和力度,增强司法裁量的力量和效率,以保障当事人的合法权利。最后,需要建立健全的客体审查机制。大数据时代,ChatGPT等人工智能新一代技术的兴起助力网络技术的发展步入了一个新的阶段,同时也带来巨大商业模式的改变和对社会制度保障的冲击,人工智能知识产权的保护需要通过新的技术来重新定义商业模式,以适应经济和行业的发展变化。可以建立司法认定和刑事责任等多层次的诉讼机制,充分利用大数据和网络的优势,完善ChatGPT的客体审查制度。同时,也要加强对侵权行为的规制,利用电子商务、大数据、云计算等技术对数字知识产权进行事前、事中、事后监管。

2.行业自律

平台要树立正确的观念来平衡好私利与公益的冲突,在寻求行业利益的同时履行好相应的社会责任[28]。首先,开发高质量算法,提升ChatGPT生成物质量。ChatGPT 的强智能性使得其能模仿人脑思维生成答案,甚至可以达到以假乱真的地步。这就需要平台提高自治能力,开发新的技术手段来加强对生成物质量的审核和监测,区分生成内容是来自人工智能还是人。平台还可以通过开发高质量算法程序来辨别高质量内容,对高质量内容采取优先审核、优先发布的规则,甚至可以给予产出高质量内容的用户补贴和奖励,不断激励平台生成高质量内容。其次,建立信息分层制度来强化内容分类。具有一定的自治能力的平台是作品生成和传播的源头,在生成结果的过程中,平台必须承担好自己的审查义务。可以通过建立信息分层制度来管理用户信息,将用户使用ChatGPT所产生的信息细分敏感指数,对敏感的数据和信息严格监管,防止泄露和侵权。最后,构建数据安全治理平台,提高对数据安全风险的感知,提升数据质量。第一步,平台要加强预审核力度,提前对数据库中繁杂错误或者缺失的数据进行审核,把数据清洗作为数据审核的第一个步骤。第二步,ChatGPT数据运行过程中要重点排查软件运行中出现的不适当的数据组合并及时删除。这一步要去除数据的重复值,填充数据的缺失值,继续清洗异常值,还要重新读数并且验证各数据的关联性,保证数据的连贯性和其严谨的逻辑。第三步,平台要完善数据的传播规制,对ChatGPT生成物可版权性存在较大的争议,目前已经有少数学术机构以及期刊社明确规定拒绝ChatGPT生成内容的投稿。因此,平台应该采用辅助工具标注ChatGPT的生成物,这样能提高ChatGPT对生成物内容的优化和识别能力。

3.用户管理

ChatGPT在带来无限便利的同时,也可能引起潜在的用户侵权风险。因此,需要用户做出以下几个方面的努力:首先,提升信息素养,强化甄别能力。信息素养是指用户借助特定的工具或思维对于不同途径生成内容的真实性、合法性以及准确性的评估[29]。用户可以通过3种途径来强化信息素养。一是培育用户批判性思维,不要对生成内容全盘接受,要保持一定理性的认知。二是养成从正规权威的渠道获得信息或答案的习惯,保证信息来源的正当性以及信息的准确性。三是对生成结果进行相应的信息比对,降低使用错误数据或信息的概率。其次,标明ChatGPT生成物的授权主体情况。这样就方便了平台和其他用户对生成物内容的监督,及时对未经授权或者超越授权的生成物内容责令删除。对于授权情况不明的生成物,不允许使用。最后,将用户分为专业用户和非专业用户。用户对 ChatGPT 的技术逻辑、使用方式以及潜在风险认知上的差异决定了注意义务的设置应当有所区别。营利性组织或非政府组织这种为专业目的使用AI输出的实体为专业用户,对于ChatGPT产生的负面后果应承担法律责任。而非专业用户由于尚无法注意到潜在的风险,则可以免除相应责任,但经平台提示违规之后,拒不改正的,应当承担法律责任。

四、结束语

生成式人工智能ChatGPT带来技术革新的同时,也在版权归属、可专利性、商业秘密、数据权属4个知识产权领域面临着潜藏知识产权保护困境。文章分析了ChatGPT应用在这4个方面的知识产权困境,并在此基础上探究了知识产权困境对策以及规则保障实施的措施。提出了ChatGPT生成物独创性的认定标准以及版权归属、可专利性的三性认定、作为商业秘密的保护规制以及数据权利制度的构建,最后从政府、行业、用户管理方面提出了管理建议。

猜你喜欢

商业秘密知识产权权利
我们的权利
论不存在做错事的权利
重庆五大举措打造知识产权强市
美国《保护商业秘密法》的立法评价
关于知识产权损害赔偿的几点思考
权利套装
侵犯商业秘密罪中“重大损失”的内外审查方法
美国对涉华商业秘密的“337调查”及国内行业的应对做法
知识产权
爱一个人