数字语言转向下人工智能应用于视听逻辑与电影语法中的可能性
2024-05-28张瑜
张瑜
【作者简介】 张 瑜,女,山西吕梁人,中央戏剧学院思想政治理论教研部讲师,博士,主要从事社会治理研究。
【基金项目】 本文系中央高校基本科研业务费专项资金资助(中央戏剧学院思政专项)“社会主要矛盾背景下我国文化消费现状分析及对策研究”(编号:YNSZ2302)阶段性成果。
伴随着数码转型的深入发展,基于自然语言处理技术的ChatGPT生成式语言输出模型出现并不断成熟,在改变人们对生成式人工智能的认知之余,也引发了各个领域中文字生成和文本生成使用的热潮。在电影创作领域中,网友“数字生命卡兹克”采用AI工具Midjourney与Gen2制作了《流浪地球3》的“伪预告”,这部画面完全由基于文字描述自动生成的作品很快在网络上引发热议,甚至受到了《流浪地球》系列电影导演郭帆的关注[1];导演詹姆斯·卡梅隆也曾透露计划使用ChatGPT模型来创作下一部《终结者》电影的剧本,他表示新剧本的灵感来自现实世界中人工智能技术的崛起,而电影的主人公或许也将以“编剧”ChatGPT为主角[2]。这一宣布引起了业界的广泛关注和热议,也为电影叙事领域带来了新的可能性和挑战。对此,本文将从ChatGPT在行业内的运用出发,探讨人工智能与视听语言逻辑的适配度,并描绘未来在电影语法逻辑下将人工智能技术应用于电影创作中的可能性。
一、人工智能算法与叙事学融合的原理
2022年11月,OpenAI公司推出了人工智能聊天机器人ChatGPT,它的全称为“Chat Generative Pre_trained Transformer”,是一种基于Transformer深度学习模型架构的人工智能技術驱动的自然语言处理工具。[3]ChatGPT上线仅5天注册用户数量突破了100万,并在2023年1月末破亿。ChatGPT成为历史上用户数增长最快的消费者应用,而且ChatGPT技术在全球受欢迎的程度不断攀升。[4]ChatGPT适用于处理词语或数字序列等序列数据,它可以通过连接大量的电子文本库进行模型训练,从而能够模拟人类对话并生成相应的回答。在基本原理上,ChatGPT运用语言通用的“编码-解码”模式。在开发过程中,OpenAI公司的自然语言处理算法工程师会将每个词语编码成数值型向量,让这些向量构成一个向量空间;在这个空间中每个向量都代表一个词语,而向量的数值则代表该词语在句子中的重要性和上下文关系,而向量按照前后顺序的组合则形成可供计算机“阅读”和“理解”的语法基础。目前,ChatGPT由于价格低廉、应用范围广泛且效率还在不断提高的优势,已经广泛得到用户欢迎,可谓2023年最有代表性、影响力最广的人工智能工具技术。在ChatGPT之外,也有文心一言、讯飞星火、通义千问等方兴未艾的人工智能工具,这些人工智能工具共有的原则是保持对话主题连贯,利用链式思维提高逻辑能力从而实现角色扮演等行为,甚至于人工干预后的诗歌翻译等,目前正应用于聊天机器人、智能客服、语音助手等多个民用与商用领域。
ChatGPT理解人类语言的关键在于它使用了将词语或短语被映射到实数的“词向量”模式,这一编码与解码模式模仿了人类语言中的符号学原理,而人工智能的算法本身可以理解为用于处理由语言描述生成图像或其他语言的通用模型。实际早在数字语言的时代来临前,就曾有不同专业的研究者试图将具体的表达在语言逻辑的基础上“转码”为数值与公式,并通过一套数学模型的搭建完成一门“语言”的表述。在俄国形式主义文学的影响下,俄罗斯民间文艺家普罗普曾以俄国民间故事为文本,研究这些“神奇民间故事”结构中的规律性特征,以角色行动为基础对故事形态进行相似性与差异性的比较分析,从中发现俄国神奇故事的结构要素及其组合规律。在这项研究中,普罗普将所有神奇故事拆解为“一位家庭成员离家外出”“对主人公下一道禁令”“主人公打破禁令”[5]等31个功能项,在著作《故事形态学》的最后赋予这些功能项以符号性的俄文字母,并按故事的叙述顺序将其排列成一条横轴。根据索绪尔的结构主义语言学概念,这条横轴可以视为功能项的组合关系。在横轴上的每个字母都可以被其他字母替换,而这些用于替换的字母之间形成了一种聚合关系。这样,阿法纳西耶夫故事集中的100个俄罗斯神奇故事便被抽象化为了一个可以用数学公式表达的“神奇故事公式”[6]。如果用ChatGPT等人工智能工具书写电影叙事,是否也存在着通过将人类语言文字转换成词向量的排列组合而形成“神奇故事”的可能性呢?
真正的电影叙事,是以人类语言作为叙事的文字,以相应的剧作法或叙事结构作为叙事的方式,再将人类语言按照剧作法或叙事结构组合起来,以数据构成电影的叙事。而ChatGPT创作下的生成式电影叙事,实质上是一种将人类语言文字转化为向量数据,并利用概率统计和概率分布等模型进行计算,以得出概率最大的输出作为结果的计算机式叙事。这种叙事方式成为基于数学模型、统计学模型所生成的通用算法模型的替代品。无独有偶,好莱坞编剧罗伯特·麦基也在《故事》一书中对《教父》(弗朗西斯·福特·科波拉,1972)、《阿甘正传》(罗伯特·泽米吉斯,1994)、《星球大战》(乔治·卢卡斯/哈里森·福特,1977)等经典影片进行了故事线索、角色形象、角色关系等方面的详细分析,将经典故事片的模型拆解为一连串的基本元素表达。罗伯特·麦基将电影故事设计术语分为结构、事件、场景、节拍(动作反应的明显变化)、序列、幕、故事七部分,将故事三角内的形式差异分为闭合式结局与开放式结局、外在冲突与内在冲突、单一主人公与多重主人公、主动主人公与被动主人公、线性时间与非线性时间、因果与巧合等类型。[7]由于清晰阐述了故事创作的核心原理,将复杂多变的故事解构为有章可循的基本方法,《故事》在电影业内被奉为编剧必读的经典教材。尽管这样“公式化”的故事解读与功利化的故事解构经常遭到批评,但《故事》对于实际从事编剧工作的人而言,却以简明而系统性的方式归纳总结了故事设计的技巧,具有较强的实用性。
与普洛普的形式研究与麦基的编剧实用经验相比,ChatGPT同样需要通过连接大量由人类语言文字组成的电子文本库作为其发言的“语料库”进行模型训练,这些电子文本库包含了海量的人类多轮对话以及网络上的语言文字。基于这些数据,ChatGPT能根据用户输入的上文内容立即生成与之对应的下文内容,并通过学习和模拟人类对话来回答各种问题,以及根据用户反馈不断改进和优化其回答。在人工智能创作的环境中,编剧或许可以不再关注于研究电影叙事的基本叙述单位及相互关系,而是将重点放在对数据的训练和算法模型的搭建上。与真人写作相比,人工智能写作具有判断市场趋势和优化写作结构有两个明显优势,基于大数据的内容选择使其拥有最资深的内容人也难以企及的效率,而写作结构则可以通过“语料库”的更新与算法的演进得到优化。人工智能技术最初应用于叙事时,主要的应用领域是不带有主观判断、仅需基本信息要素即可连缀成章节的新闻领域;而随着技术的加速发展,人工智能在叙事上的应用早已突破简单的新闻写作领域,甚至开始挑战写剧本这种高专业度工作。例如,中国科技新锐品牌“海马轻帆”推出了“小说转剧本”智能写作功能,该功能基于海马轻帆自研的NLP深度学习算法,在海量剧本和小说之间进行对照学习,最终能够通过人工智能语义分析,对小说进行理解、筛选、重组,生成侧重视听语言,且采用标准剧本格式的文本。目前该功能已经在实践中进行过验证,尤其适用于短视频剧,生成速度极快。
二、电影符号与叙事公式算法化的异同
ChatGPT生成电影故事的原理是使用模型会使用自注意力机制计算每个行动元或叙事要素的权重数值化,从而理解剧本或故事中的重要信息,最后通过前馈神经网络和循环神经网络模型生成新的文本。在这个过程中,人工智能会根据电影的情节、人物和场景等信息,生成符合要求的电影剧本。这种生成过程是基于已有的电影数据和算法模型进行的,因此它能够快速生成新的电影剧本,满足电影行业对剧本撰写在整体产业过程中的需求。然而,需要注意的是,虽然ChatGPT能够快速地生成电影剧本,但它并不能完全替代人类编剧。人类编剧在创作过程中需要考虑更多的因素,如人物的情感、情节的连贯性等,这些因素是目前的算法模型无法完全替代的。以ChatGPT为例,ChatGPT创作下的生成式电影叙事背后的自然语言处理技术涉及了Transformer算法模型的应用。这种算法模型是一种基于自注意力机制的深度学习模型,它被广泛应用于自然语言处理、机器翻译、语音识别等领域。通过将数据聚合、归类和统计,Transformer算法模型可以帮助ChatGPT进行有效的文本生成和对话管理。Transformer模型由Encoder和Decoder(即“编码器”与“解码器”)两个部分组成,每个部分都包含多个Block;在对人类使用的自然语言进行表述时,模型会使用词嵌入技术将每个行动元或叙事要素表示为一个向量,这些向量可以捕捉行动元或叙事要素之间的语义关系,并通过词嵌入技术从原始数据中提取出来;接下来这些向量被输入到Encoder中,每个叙事要素的向量都会与其上下文中的其他内容向量进行交互,以捕捉整体故事中的语义信息。在Decoder中,它也会接收来自Encoder的输出,并将其与目标故事的嵌入进行比较,以生成自然语言叙述的剧本。[8]Transformer模型的最大优点是它可以高效地进行并行化计算,这使得它在处理大规模数据集时非常有效。由于其基于自注意力机制的特性,它也能够在处理长句子时更好地捕捉上下文信息。
换言之,人工智能下的生成式电影叙事是一种基于词向量数据的文字叙事方式。它利用复杂的数学模型和统计学模型来构建叙事,通过数据的排列组合、聚合、归类和统计,以及求取概率最大的输出作为结果的叙事本身。这种叙事是由计算机和ChatGPT自然语言处理算法工程师共同构建的且具有自我指认的特点,同时还包含了对叙事结构与方法的解读。电影叙事研究发展到第一电影符号学阶段时,麦茨也曾试图“拆分”电影的叙事結构,并在“符号是携带意义的标记:意义必须用符号才能表达,符号的用途是表达意文。反过来说:没有意义可以不用符号表达,也没有不表达意义的符号”[9]的观念基础上,借助语言学的力量最终将电影叙事的组合分成了八大组合段类型,即独立镜头、平行组合段、括入组合段、描述组合段、交替叙事组合段、插入式段落等。这一方法的基础在于确认符号与意义的锁合关系,尽管在结构主义热潮褪去后的电影研究中备受质疑,却为电影叙事的建构提供了一种可能:“大组合段理论有助于分析各种镜头如何排列以表现一个行为过程,有助于分析电影技巧与叙事的相互关系。”[10]此外,电影第一符号学的研究还能为当下人工智能的开发与人工智能的电影叙事应用提供重要思路——既然意义活动的过程与符号的过程紧密相关,二者不可分离,那么意义必然是符号或编码的意义,解码/编码的过程就不仅是表达意义的过程,也是人工智能的逻辑内意义产生的条件。
三、人工智能应用于电影行业的局限与前景
综上所述,人工智能的叙事是通过数据资料作为文字表达,采用数学模型和统计学模型的方式。该过程涉及将数据进行排列组合,并根据相似度对不同数据进行聚合、归类和统计,以得出概率最大的输出结果,这一过程就是人工智能的叙事。这种叙事方式使人工智能能够从大量数据中提取有意义的信息,并以一种可理解和有效的方式传达给人类用户。人工智能叙事在影视行业中得到最广应用的领域并非实际创作,而是剧本评估与筛选。基于影视市场对知识产权内容的旺盛需求与大量原创内容供给的业界生态,人工利用算法评估替部分影视剧IP开发机构与网剧网站,以及电影公司与院线寻找潜力IP,其运算具有一般人类阅读难以企及的速度,并以一种更客观的方式按照制作方的标准进行验证。《伏妖白鱼镇》(刘轩狄,2017)、《大蛇》(林珍钊,2018)、《传闻中的陈芊芊》(查传谊,2020)、《我才不要和你做朋友呢》(田宇,2020)等B端影视机构是影视产业中人工智能模型最初积累市场声誉的领域;另一方面,长期的剧本评估也为人工智能对各类题材的理解积累了经验,有助于将评估级别上升到创作方法论级别的理解,从而辅助新的创作。
剧本格式是否统一对于剧组工业化管理具有极其重要的作用性,而统一化的写作正是当前编剧市场的重要需求。国内一些领先的人工智能公司将技术能力与市场结合,拓展人工智能应用与用户挖掘的边界,针对以一线编剧为主的内容创作者们推出包含智能剧本格式调整、剧本场景角色数据统筹、小说转剧本、素材推荐等核心功能的可大幅度提升内容创作效率的智能写作工具。在优秀的IP基础上,人工智能工具的应用可以从IP价值的评估开始介入,以更加科学、稳定,性价比更为突出的IP评估与改编方式提高影视工业化的效率。内容评估、统一剧本格式,以及提升创作效率等服务,指向的显然也是内容端创作流程的工业化。目前,阿里影业、优酷、中影集团、北京文化、慈文传媒、欢娱影视、新片场、有鱼、映美传媒等头部影视公司已经与人工智能服务公司建立合作关系,剧本智能评估服务在国内影视剧本市场的渗透率达到80%,累计评估包括《你好,李焕英》(贾玲,2022)、《流浪地球》(郭帆,2020)、《误杀》(柯汶利,2019)、《悬崖之上》(张艺谋,2021)等作品在内的剧集剧本3万多集、电影与网络电影剧本8千多部、网络小说超过500万部。[11]待到未来的2.0版本,在不断发展的人工智能技术中,智能工具对编剧的介入已经进入了具有一定原创性的辅助改写和续写阶段。在这一阶段,人工智能对剧本的理解更加深刻,可以在评估剧本的整体价值之余帮助创作者重新梳理架构、调整叙述顺序,以更加具有“艺术性”的创想方式帮助创作者创作出更加精彩的剧本。
不断深入的市场应用让智能工具的创作效率已经得到几何倍数的提升,人工智能在视觉信息的生成方面也具有广阔的应用前景。例如网友自制《流浪地球3》电影预告,就是用Midjourney生成了693张图,用Gen2生成了185个镜头,并在其中选择出60个镜头剪辑成的。然而,人工智能参与的叙事与麦茨创建的第一电影符号学之间仍然存在巨大的差异,其主要差异在于ChatGPT创作下的生成式电影叙事是一种独特的、私人化的、具有封闭性的私人语言式的电影叙事形式。这种叙事方式将个人或少数群体的经验内部化,并通过个性化的叙事方式进行表达。在人工智能生成的电影剧本或其他产品内,故事或叙事行为本身意义已经被预先埋藏在Transformer算法模型中,因此不同的用户可以生成不同的故事;而麦茨的第一电影符号学则是将意义与符号关联在一起,并引导人们去追寻充满意义的世界本身。“人在世界上要处理的一切,包括家庭、社会、人际关系、信仰、意识形态甚至生死态度,我们的全部人生,无非是意义的组合。因此,有理由说:没有符号给予人的世界以意义,我们就无法作为人存在于世:符号就是我们的存在本身。因此,符号学也是关于人的本质研究。”[12]如果说利用符号将叙事行为公式化、算法化的根本意义在于以符号为工具探寻世界,那么人工智能环境中生成式的电影叙事则是以算法为工具探究自身,是叙事者自我认同的一种独特方式。
在传统的认知逻辑中,故事编写与分镜策划的核心创作能力,在于将叙事者的个人视角和情感投射到电影故事中;而人工智能的叙事则无法展示叙事者“个人”的观点和经历,也缺乏真正的情感,却依然可以为观众提供与叙事者产生共鸣和理解的机会。这说明,观众对人工智能生成作品的理解更多是镜像法则之下对自身经历的关照。
目前,尽管已经有诸多艺术创作领域的内容生产者正在利用人工智能工具进行故事撰写,但他们所利用的数学模型和统计学模型是如何构建的?Transformer算法模型是如何搭建的?以及作为叙事文字的数据是从何处搜集的、搜集了多少等信息,OpenAI公司并没有向公众开源,仅仅在官方网站上发布了API(即“应用程序接口”)的文档和使用指南(提供給用户以理解和使用特定API的一套详细指南,包括使用教程、步骤指南、调用响应的操作示例、词汇表等),人类用户面对的始终是一面单向的“黑镜”;利用人工智能实现的个性化与定制化需求更是如此:人工智能生成的内容完全根据用户的需求和喜好产生,这使观众在观看这些作品时,能够满足自己的个性化需求,从而产生共鸣。换言之,人工智能作品获得的一切认同都源于数字算法对人类创作者的风格和技巧的模仿,包括其中传递的情感和价值观本身——这也是一部分人反对在文化艺术行业中使用人工智能的原因。
如今,人工智能在电影行业有着难以限量的运用前景,我们也依然不能忽视电影作为一种媒介和艺术形式的历史和文化背景。以人工智能进行电影创作不仅仅是一种文化商品的生产手段,也是一种反映了人类对现实世界的感知和理解的镜子,让人突破自身局限与现实和自然展开沟通的纽带。因此,人工智能生成的电影故事作为电影创作的一部分,也必然受到这种文化与艺术性质的影响。数码工具与人工智能创作环境下的生成式电影叙事并不应当仅仅是数学模型的累加、统计学模型的替代品,而是人类创意和想象力的一种表现形式。未来,电影的创作、拍摄、后期制作、宣传和发行,甚至放映端和影院的形态都可能发生变化;人工智能之所以能够辅助影视技术流程,从而产生不同的协作形态,使更多优秀的故事得以呈现在大银幕上。编剧或相关从业者可以借助这些模型和技术工具,通过对数据的处理和分析生成具有故事性和艺术性的文本内容;然而最终的创作成果仍然是人类创作者的思想、情感和创造力的体现。
结语
ChatGPT创作下的生成式电影叙事背后的自然语言处理技术,确实涉及了Transformer算法模型的应用。这种算法模型通过将数据聚合、归类和统计,帮助ChatGPT进行有效的文本生成和对话管理。然而,我们不能简单地将这种生成式电影叙事归结为数据或算法的替代品。事实上,生成式电影叙事不仅仅是对数据的处理和聚合,它还涉及对故事结构、情节发展、角色塑造等方面的深入理解和创作。这种叙事方式需要考虑到观众的接受度、情感反应和心理体验,同时也需要考虑到电影作为一种艺术形式的独特性。
参考文献:
[1]泽泷.网友自制AI版《流浪地球3》预告片:郭帆导演点名表扬,登上CCTV6-IT之家[EB/OL].(2023-08-13)[2023-11-29].https://www.ithome.com/0/712/100.htm.
[2]权知星球.用ChatGPT写剧本 重启《终结者》系列-知乎[EB/OL].(2023-06-02)[2023-11-29].https://zhuanlan.zhihu.com/p/634181781.
[3][8]陈颢鹏,李子菡.ChatGPT进阶:提示工程入门[M].北京:北京大学出版社,2023:15,17.
[4]苏江.ChatGPT使用指南:人人都应该掌握的AI最强工具[M].北京:北京理工大学出版社,2023:51.
[5][6][俄]弗拉基米尔·雅科夫列维奇·普罗普.故事形态学[M].贾放,译.北京:中华书局,2006:16,40.
[7][美]罗伯特·麦基.故事[M].周铁东,译.天津:天津人民出版社,2014:61.
[9][12]马睿,吴迎君.电影符号学教程[M].重庆:重庆大学出版社,2016:107,110.
[10]李恒基,杨远婴.外国电影理论文选(下册)(修订本)[M].上海:生活·读书·新知三联书店,2006:51.
[11]顾韩.一天终于还是到了,AI开始写剧本了[EB/OL].(2021-06-17)[2024-01-07].https://zhuanlan.zhihu.com/p/381650571.