文生视频类人工智能生成物著作权保护路径探讨

2024-09-11郑梦孙智

传播与版权 2024年17期

［摘要］文生视频是人类创作者通过输入一系列指令而生成的视频内容，指令涵盖了人类创作者对生成视频内容的构思，是人类创作者风格、选择、个性的体现。文生视频在满足独创性及体现人类实质性贡献的前提下可以构成作品，承认此类文生视频的可版权性符合著作权法激励创作的立法宗旨。在现行著作权法体系下，相关主体通过新设AI作品类型为文生视频提供保护是选择成本最低、效果最好的方案。同时，相关主体对文生视频的保护应给予必要限制，以实现激励作品创作、传播和利用之间的合理平衡，赋能生成式人工智能的持续创新和发展。

［关键词］生成式人工智能；文生视频；独创性；著作权保护

在信息时代浪潮下，人工智能技术日趋成熟。2024年2月16日，文生视频大模型Sora的出现像一枚重磅炸弹，在科技圈、影视圈等多个领域引起了轩然大波。Sora以其卓越的技术性能和创新性为人工智能领域带来了新突破的同时，也引发了著作权保护问题。自人工智能出现以来，人工智能生成物是否属于著作权法意义上的作品以及如何保护的问题，有着较大争论和分歧。文章通过对以Sora为代表的文生视频类生成式人工智能运行原理的分析和文生视频类人工智能生成物可版权性的证立，提出文生视频类人工智能生成物的著作权保护路径，以期为著作权法赋能生成式人工智能发展提供新启示。

一、以Sora为代表的文生视频类生成式人工智能运行原理

（一）以Sora为代表的文生视频类生成式人工智能概述

人工智能文生视频大模型Sora将ChatGPT所用的大型语言模型（LLM）与扩散模型相融合，用户输入文字后，文生视频大模型依靠GPT语义解释能力针对视频内容进行详细的概述，再根据此内容将用户输入的文字转换成视频。例如，文本是“一位时尚女性走在东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意”。GPT对文本进行解释，生成一些与文本内容对应的“高楼”“繁华夜景”等场景。与Runway、Pika等只能生成十几秒的文生视频技术不同，Sora能够实现60秒的一镜到底，人类创作者因此可以借助Sora构建各种各样的场景、塑造生动形象的人物，为影视作品增添多样化的创意元素。不仅如此，Sora还可以基于原有的视频进行视频扩展、调整框架和角度、图像动态化等多种操作［1］，体现了文生视频类生成式人工智能在影视制作、虚拟现实等多个领域的广阔前景。

（二）以Sora为代表的文生视频类生成式人工智能运行步骤

以Sora为代表的文生视频类生成式人工智能的运行主要包括文本输入处理、文本编码、生成器生成视频、训练和生成视频输出等几个步骤［2］。

第一是文本输入处理阶段。当用户输入一段文字后，文生视频大模型首先会对该文字进行预处理，利用深度学习和语义分析技术来理解并解析这段文本描述。文生视频大模型会完成词性标注等自然语言处理任务，捕捉文本中的关键信息，分析出人类创作者的大致要求。在理解文本内容的基础上，文生视频大模型会进一步将这些信息转化为向量表示［3］，以便在后续处理中进行文本编码。第二是文本编码阶段。文本编码阶段的结果则是生成一个或多个计算机可以识别和处理的向量表示。这一步通常会使用到循环神经网络（recurrent neural network，RNN）或转换器（Transformer）等深度学习技术，以便文生视频大模型能够理解文本含义以及上下文之间的关系。第三是生成器生成视频阶段。生成器能够将经过文本编码后的向量表示转化为视频内容。同时，文生视频大模型基于强大的深度学习和生成能力，能够识别出不同元素之间的关系。因此，生成器在生成视频过程中起着关键作用。第四是训练阶段。文生视频大模型之所以具备视频生成的能力，是由于其基于海量的数据进行训练。在训练阶段，文生视频大模型融入了一种可以用来生成图像的模型—去噪扩散概率模型（Doiseing Diffusion Probabilistic Models）。该模型对现有图像逐步施加高斯噪声，在图像被破坏后，再根据给定的高斯噪声逆向还原图像［2］。第五是生成视频输出阶段。此阶段是文生视频大模型运行的最后一个阶段。在经过生成器生成视频后，判别器会对生成视频进行评估，生成器根据判别器反馈的评估结果进行调整，以生成更加贴合用户要求的内容。生成的视频最终会输出为视频文件，以供用户观看。

由此来看，创作文生视频离不开生成式人工智能算法，但这并不与文生视频具有独创性相悖。如果文生视频的表现形式具有独创性，同时能够证明人类创作者的参与对文生视频的独创性具有实质性贡献，可以认定该文生视频属于作品，因此受到著作权法的保护。

二、文生视频类人工智能生成物可版权性的证立

（一）文生视频符合作品的独创性要求

我国著作权法第三条规定，作品是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。其中，独创性是判断是否构成“作品”的关键和核心。现有理论中，存在主观论与客观论两种判断标准。主观论认为，作品是作者精神的产物，基于作者独立、个性的创作风格形成［4］。而人工智能生成的内容由机器依据算法自动生成，无法体现人类创作者独特的创作思想，不具备独创性。客观论认为，应从作品客体本身出发，只要人工智能生成的内容区别其他作品，具有独特的表达形式，同时并非抄袭、剽窃、复制的结果，就具备独创性。文章认为，主观论以人工智能生成内容的过程不具备人类的创作思想、创作情感为由否定其独创性，忽略了作品的外在表现形式和客观判断标准。虽然我国著作权法对“独创性”认定没有明确规定，但从法院判定来看，大多采纳客观标准。文生视频作为新兴的人工智能生成物，与人类作品相比已达到难以区分的程度。因此，文生视频表现形式若能够满足客观判断标准，可以被认定为作品。

客观上讲，作品独创性认定一般从“独”和“创”两个层面来展开［5］。所谓“独”即独立完成，包括两种情况：一是从无到有，二是独立创作。独立创作要求作品的产生由作者独立完成，表达形式上并非抄袭、剽窃、复制的结果。所谓“创”即创造性，指创作过程中须体现一定的智力创造水准，如果仅是单纯的劳动，则无法满足创造性要求。目前，各国对作品创造性的程度要求存在差别。大陆法系国家认为作品是作者人格的外化，对独创性要求较高；英美法系国家侧重保护作者利益，对独创性要求较低。在我国，根据最高人民法院的相关判决，作品须具有最低限度的创造性，这要求作品须达到一定的智力高度。

文生视频是人类创作者风格与个性的体现，相关主体不能仅因为人类创作者对该文生视频智力贡献值低便否定人类创作者的智力表达。法律的保护应当针对最后的表达结果，即只要文生视频是由人类指导完成，表达形式上具有创造性，至于是因何种方式而产生的，不影响对创造性的判断。换言之，“作品”之所以受到保护，是因为作品中蕴含创造力，而创造力并非特指人类所具有的创造力［6］。

（二）人类创作者对文生视频的独创性有实质性贡献

文生视频类人工智能生成物是在人机交互过程中所完成的，由人类和机器共同创作。因此，与传统作品认定不同，相关主体除了需要对其独创性进行认定，还应考虑输入指令的潜在影响。只有人类创作者对文生视频的独创性具有实质性贡献，才能将文生视频认定为作品。例如，2024年捷克布拉格市法院在审理一例人工智能生成图片侵权案中就指出，创作者如果能够证明生成的图像是其独特的实质性贡献的结果，则该生成图像构成原创作品，满足著作权法规定的客体要件，受著作权法的保护［7］。

人工智能本身并不符合著作权法规定的主体要件。但如果人类创作者对文生视频具有实质性贡献，那么人类创作者可以被视为文生视频的作者，满足著作权法规定的主体要件，人工智能在这一过程中则发挥着等同于工具的辅助作用。ChatGPT、Sora为代表的生成式人工智能无论发展到何种阶段，仍属于是人类的智力成果，只能是供人类利用的智能工具。

从人工智能生成视频的全过程来看，文生视频的产生大致需要经过以下步骤：人类创作者输入指令、机器识别指令、机器根据指令输出内容、人类创作者根据输出内容进行修改和调整。其中，文生视频大模型生成视频往往依赖于人类创作者的指令。人类创作者根据自己的审美标准和要求，对生成视频进行筛选、优化，使其更符合自己的需求。即便文生视频大模型算法能够辅助人类的意志行为，但这种算法终究只是机器学习的产物，而新技术并不能够取代人类感性与理性的意志行为［8］。在文生视频生成过程中，虽然文生视频大模型发挥了重要作用，但究其根本，文生视频的产生始终来源于人类创作者独特的指令，人类创作者在文生视频生成全过程中发挥着主导性作用，文生视频大模型所发挥的是工具性的辅助作用。例如，在2023年“春风图”侵权案中，法院认为人工智能生成图片本质上是人利用工具进行创作，创作过程中进行智力投入的是人而非人工智能模型，从而认定该人工智能生成的图片属于作品。虽然本案中谈及的是生成图片侵权问题，但文生视频是由一帧一帧的图片整合而成，因此对文生视频的作品认定具有一定的参考性。

（三）承认文生视频可版权性符合激励创作的立法宗旨

著作权法自产生以来，鼓励作品创作是最核心的一项立法宗旨。文生视频作为新兴的“创作成果”，对其给予合理的保护，符合现行著作权法保护的立法宗旨和价值追求。

有观点认为，人工智能的核心是算法、规则、模型等，不可能受到著作权法的激励而创作［9］。文章认为，承认人工智能生成物可版权性，受到激励的是利用人工智能进行创作的创作者，并非人工智能。承认文生视频可版权性，能够极大地激励创作，推进生成式人工智能与文娱行业的合作，促进影视行业的发展。例如，2024年3月，Sora母公司OpenAI与合作的部分艺术家发布了利用Sora制作的首部专业级艺术短片《空中梦想家》［10］。该艺术短片呈现了一个完整的故事，具有较高的专业性和艺术性。再如，2024年2月26日至3月2日，首部中国原创文生视频AI系列动画《千秋诗颂》于CCTV-1综合频道播出［11］。该动画一经播出，收视率居高不下。文生视频的数量规模在不断扩大，在艺术、影视领域创造出了巨大的经济效益，符合著作权法的价值功能。因此，承认文生视频类人工智能生成物的可版权性，既符合著作权立法宗旨，还满足价值追求，能够使著作权法更好地“回应新技术、新业态发展的需要”［12］。

三、文生视频类人工智能生成物著作权保护路径定位

（一）新设AI作品类型为文生视频提供著作权保护

人工智能应用领域复杂多样，“创作”速度极快。面对大量涌入市场的文生视频，相关主体应该应用能够快速、合理、全面解决此类问题的保护方式—置于现行著作权法体系下进行保护。但学界对保护模式存在争议：有观点认为应通过邻接权保护；有观点提出在著作权法之下对该类生成物专门立法。这两种方式均有缺点，而通过新设AI作品类型进行保护是选择成本最低、效果最好的方案。

主要原因在于，文生视频等人工智能生成物在满足一定条件下是能够具有独创性的，相关主体以邻接权保护，忽略了文生视频等生成物的独创性，也忽略了邻接权保护制度的前提。相关主体对文生视频类人工智能生成物进行专门立法的方案看似可行，但在现行著作权法足以对此类作品提供保护的情形下，暂无必要。

新修订的著作权法对“作品”的定义进行了调整，将兜底性条款修改为“符合作品特征的其他智力成果”，同时将“电影作品和以类似摄制电影的方法创作的作品”修改为“视听作品”。这似乎意味着在立法层面，著作权保护范围呈现扩大的趋势。因此，相关主体可以在现有著作权法的作品制度下，新设AI作品类型进行保护。随着科技的创新，著作权法不断适应各种新兴技术，越来越多的新兴技术和产品被著作权所接纳。文生视频作为一种新兴技术的产物，通过新设AI作品类型进行保护恰逢其时。在创作主体方面，相关主体可将人工智能看作辅助工具，将人工智能使用者视为具有法律地位的主体；在权利归属方面，相关主体可以根据贡献程度合理分配著作权归属，平衡使用者、开发设计者、投资者之间的利益；在作品认定方面，相关主体可根据现有认定标准进行适当调整，对文生视频是否构成作品进行认定。

（二）文生视频著作权保护的必要限制

文生视频大模型生产文生视频具有高效率、低成本的特点，能够让缺少经验甚至无经验的用户能够和资深的创作者一样，制作出高质量视频。大量文生视频的涌入会使得人类创作的传统视听作品在版权市场上面临着更大的竞争压力，甚至面临贬值风险。为激励自然人创作出更多高质量的视听作品，相关主体不宜给予文生视频过于宽泛的保护，要对其保护给予必要的限制。

首先，在著作人身权上，相关主体有必要保留文生视频作者的发表权、署名权及保护作品完整权，但介于文生视频的特殊性，修改权是否需要为作者保留仍须进一步探讨。保护文生视频的初衷是为激励创作，如果立法上能够明确使用者对文生视频进行合理修改无须经过文生视频作者的许可，势必能够进一步激励此类创作，促进作品的传播和文化的交流。在著作财产权上，相关主体过于宽泛地为文生视频作者保留财产权会极大地影响视听作品的创作和传播，因而不宜为文生视频作品保留完整的著作财产权。为了方便公众对文生视频的使用，相关主体仅须保留文生视频作者复制权、发行权、信息网络传播权等对文生视频作者利益影响较大的权利。

其次，相关主体应当将文生视频纳入法定许可范围。文生视频大模型生成能力的提高离不开对在原先作品的利用。因此，在立法上相关主体有必要明确公众对文生视频的使用无须经过文生视频著作权人的允许，其只需要付费即可使用。随着生成式人工智能技术的飞速发展，公众利用人工智能进行创作的热情空前高涨。因此，相关主体应拓宽文生视频的合理使用范围，以避免文生视频等生成式人工智能作品利用的著作权纠纷。相关主体应当允许不以营利为目的的对文生视频的使用。

最后，相关主体还应当缩短对文生视频著作权的保护期限。著作权法中对作品保护期都有一定的限制，合理保护期限能够维持文化表达的多样性，给社会带来更大的价值。我国著作权法规定，自然人对其作品享有的相关权利保护期限为作者终生及其死亡后五十年。但鉴于文生视频类生成式人工智能的特点，文生视频往往以高速度、批量性方式产出，过长保护期限可能会阻碍文生视频的创新和发展。为了促进文生视频的创作、传播及利用，文章认为相关主体可参考版式设计权保护期限，给予文生视频著作权人自文生视频创作完成之日起十年的保护期限。

四、结语

文生视频类人工智能生成物的可版权性是一个涉及多方面的复杂问题。文章通过相关分析认为，文生视频在满足独创性及体现人类实质性贡献的前提下可以构成作品，受到著作权法一定限度的保护。目前，司法实践中也存在对生成式人工智能作品的认可判定，为文生视频构成作品获得著作权保护提供了依据，但具体的认定方式和保护措施还有待完善。人工智能的出现是现代科技发展的必然结果。在未来，人工智能的发展势不可挡。因此，人工智能相关法律问题始终会是人们所关注的焦点。随着人工智能技术的进一步发展，人工智能生成物的著作权保护可能会面临更多的挑战和机遇，期待未来的研究能够进一步深化对这一领域的理解，为构建一个合理、公正、公平的人工智能著作权保护体系提供有力的支持。

［参考文献］

［1］Video generation models as world simulators［EB/OL］.（2024-02-15）［2024-06-10］.https：//openai.com/index/video-generation-models-as-world-simulators/.

［2］朱光辉，王喜文.人工智能文生视频大模型Sora的核心技术、运行机理及未来场景［J］.新疆师范大学学报（哲学社会科学版），2024（04）：149-156.

［3］崔雨萌，王靖亚，闫尚义，等.基于深度学习的警情记录关键信息自动抽取［J］.大数据，2022（06）：127-142.

［4］王迁.论人工智能生成的内容在著作权法中的定性［J］.法律科学（西北政法大学学报），2017（05）：148-155.

［5］王迁.知识产权法教程［M］.7版.北京：中国人民大学出版社，2021.

［6］黄汇，黄杰.人工智能生成物被视为作品保护的合理性［J］.江西社会科学，2019（02）：33-42.

［7］The first Czech case on generative AI［EB/OL］.（2024-04-04）［2024-06-10］.https：//www.lexology.com/library/detail.aspx？g=ac8c13ec-1b83-4729-bc4d-3dd42f2b8824.

［8］唐一力，牛思晗.论人工智能生成作品的权利主体及其著作权归属［J］.福建论坛（人文社会科学版），2023（11）：107-122.

［9］王迁.再论人工智能生成的内容在著作权法中的定性［J］.政法论坛，2023（04）：16-33.

［10］李豪悦.Sora开启文生视频新纪元影视游戏产业加速变局求突破［N］.证券日报，2024-03-28.

［11］李丹.首部中国原创文生视频AI系列动画《千秋诗颂》播出：一场中国诗词与人工智能的“双向奔赴”［J］.影视制作，2024（03）：24-28.

［12］蔡琳，杨广军.人工智能生成内容（AIGC）的作品认定困境与可版权性标准构建［J］.出版发行研究，2024（01）：67-74.

传播与版权

2024年17期

文生视频类人工智能生成物著作权保护路径探讨

杂志排行

传播与版权的其它文章