赋能与重构:生成式人工智能浪潮下动画创作的新路径
2024-01-14孙亮沈超颖
孙亮 沈超颖
生成式人工智能(AIGC)通过深度学习和神经网络等技术手段,能够模拟人类思维和创造力,产生出独特而富有创意的内容。这一新的路径为动画产业带来了机遇和挑战。生成式人工智能在动画创作中提供了更高效的方式。传统的动画创作过程通常需要庞大的团队投入大量的时间和精力进行手工绘制、美术设计和动作制作等环节。而生成式人工智能能够通过学习大量的动画数据和规则,自动生成各种风格和类型的动画场景、角色和故事情节,提高了动画创作的效率和速度。传统的动画创作有时也因受限于人类想象力和技术能力,很难突破常规的表现方式和故事主题。而生成式人工智能能够通过对大量数据的学习和分析,自动生成各种不同风格和类型的动画内容,推进动画创作向更多元化、个性化的方向发展。在生成式人工智能与动画创制交融、人工智能与人的协同中,动画创作将走向新高度。
一、从计算机艺术到生成式人工智能
计算机和艺术的历史渊源可追溯到19世纪,英国诗人拜伦之女奥古斯塔·阿达·拜伦(Augusta Ada Byron)是世界上第一位程序员。在她的算法中,发掘与构想了计算机作为艺术创作工具的潜质。①1950年,美国数学家本·拉波斯基(Ben Laposky)利用示波器创造了世界上第一幅计算机“艺术”作品,它向世人展示了计算机在艺术创作方面的潜力,让“科学和艺术”的结合成为可能。②20世纪60年代“计算机图形学之父”伊凡·苏泽兰(Ivan Sutherland)发明了世界上第一个交互式绘图程序,即“画板”(Sketchpad),它允许用户使用鼠标在屏幕上绘制各种形状和线条,为后来的电脑美术发展奠定了基础。③相关技术迭代对动画艺术创作也有着更加深刻的影响,如今动画创作已更多的从“画纸”转战至“画板”,而人工智能技术的诞生更为艺术创作带来新冲击。2018年10月25日,利用人工智能技术创作而成的《爱德蒙·德·贝拉米肖像》在纽约佳士得拍卖行进行拍卖,最终以估价40多倍的价格43万美元落槌,成了世界上第一件在大型拍卖会上成功拍出的人工智能艺术品。④这一事件引发了全球对于“人工智能的这一行为究竟算不算艺术创造”这一问题的争论。实际上,当下动画创制相关领域已经出现人工智能的身影——生成式人工智能开始了“艺术创作”。
生成式人工智能,即当下火爆的“AIGC”(Artificial Intelligence Generated Content),它不仅是一种新兴的复杂技术和生产方式,能够适应和超越多个时空应用场景,同时也作为一种生产内容,嵌入至各个生产流程,并不断转化创作成果、扩展创作边界。生成式人工智能与人类学习过程存在相似性。画家的成长是从模仿到创新的过程,生成对抗网络也可以做到这一点。从此,人工智能开始进入艺术创作过程中。人类想要完成这种从模仿学习到创新创作的闭环往往需要多年的时间,而人工智能依靠计算机强大的运算能力,只需几秒钟的时间就能完成这一人类闭环。[1]由此看来,生成式人工智能作为艺术工具与艺术内容参与艺术生产,具有无限潜力。
2022年Chat GPT及2023年GPT-4的诞生颠覆了传统PGC、UGC等内容生产方式,意味着在突破性Al技術的赋能下内容生产范式的全新性进展,也是促使人类从以AI为助手的内容生产范式转向以Al为主的通用性内容生产范式的引领性和指导性实践。[2]生成式人工智能有力驱动动画创制技术革新与模式迭代,能够很好嵌合动画的各个生产环节,极大提升创制效率、规模、质量,推动产业发展。在动画制作流程中的几项关键性领域:剧本创作、角色设计、场景设计等中,生成式人工智能都留下瞩目的足迹。在文本编写上,利用“AI文字生成”,用户可以输入文字来设定不同的世界观,同时设定角色的外形、年龄、性格、喜好甚至用户与其之间的关系等,AI根据设定生成模型,用户就可以与自己设定的角色互动对话,AI会围绕设定生成回复,打造不断扩展、独一无二的世界。可见,利用生成式人工智能来丰富动画世界观的架构与人物个性是可行之道。而仅需输入文字,一幅幅色彩绚丽的图像仅需几秒就可生成,并提供下载——扩散模型Stable Diffusion凭借免费使用、输出稳定、模型开源等优势强势介入美术创作。以Stable Diffusion为首的AI制图工具在动画创作中将多方位优化、加速流程。此外,在配音方面,在一些AI配音网站上仅需输入歌词,选择已训练成型的角色声音模型,就可以用该角色声音唱出指定歌曲。通过合理训练原创模型,原创动画角色拥有“独属”自己的“脸”和“嗓音”已经不是梦。
二、动画创制中的“反身性”——超越工具性的角色
反身性最早从哲学和心理学而来,用以指涉将本身当作对象或目标的理性能力。后来其意义也加以延伸,用来比喻一种媒介或语言的自我反射的能力。[3]“反身”也可称为“自反”,意为自我反映和自我认识。在动画创制的语境中,一方面创作者们能够从生成式人工智能(既是作品也是媒介)中反观自身,吸取经验,提升自我;另一方面生成式人工智能通过分析和学习大量的艺术作品,学习创作规律和技巧来生成类似艺术家风格的作品,并且这不仅反映了艺术家的风格,也反映了人工智能自身的特点和能力——一种超越自身工具性的“智能”。
(一)生成式人工智能浪潮下的“自反”
从生成式人工智能的应用经验中学习,创作者们可以优化现有创作流程与方式,进行“自反”。全球总票房超7亿美元的动画电影《蜘蛛侠:纵横宇宙》①是由数百位艺术家参与制作、无AI介入的作品,它的美术风格多样,可谓一场视觉的饕餮盛宴。然而纵使有各个艺术大师加入,这部电影的制作团队也面临困境:不合理的工作条件和无序的工作组织导致约100名艺术家离开团队,出现诸如工作分配混乱导致有的员工工作重复、作业无效,甚至原本辛勤的成果被无奈删除的情况。②参考和借助生成式人工智能减少重复劳动、优化创制路径、促进工作安排合理规划、核心要素深度聚焦的优势,艺术家们将更有机会将精力集中在能体现劳动与创意价值的地方,凸显价值导向,遵循市场规则,形成新的“创制观念”。同时数字化泛滥、创制门槛降低导致动画作品和从业者质量良莠不齐,此时“创意为王”“价值创造”的创作和审美理念值得推崇,人们的审美经验总是要随着现实生活的发展而不断变化。在后现代主义时代,用现代美学的眼光来看待数字艺术的审美经验无疑是成问题的。[4]
生成式人工智能也具有“反身性”,它在生成内容的同时也能分析自身、接收反馈,进行优化调整。常见实现方式是引入生成式对抗网络(GAN),其中的生成器模仿真实样本输出内容,交由判别器判断是否真实,生成器根据判别器的反馈来调整改进,尽可能“欺骗”判别器,二者相互对抗,相互促进。在数字生态中,正是由于生成式人工智能也存在“反身性”,使得它不再是普通工具,而是一个能够反思与成长的智能体,是动画创作者的“伙伴”。生成式人工智能这种超越的工具性,既能够提升动画创制的效率、速度等,又能够陪伴与促使创作者的成长。应完善生成式人工智能的“反身性”,以更好加强人机协同。
(二)人机关系在“自反”中发展
数字生态中,人类与生成式人工智能形成一种“智能关联”。所谓智能关联主义,是在一定的数字生态下,通过解释性的路径,在诸信息体(包括人类和非人智能体等)之间形成了新型关联,而这些以解释为基础的新型关联构成了新数字生态下的社会关联的基础,并在此基础上形成一系列的观念和价值。[5]在这种智能关联下,人类与生成式人工智能因数字化而彼此息息相关,二者相互促进,相互反映,又形成一种“互反”,体现出个人智慧与网络智慧之间存在着“反身性”关系是一种“智慧集成”,即个人加入网络使得网络智慧更强大,后者反过来使得个人智慧更强大。[6]例如人在回路(Human in the Loop)就是由人类经验介入的人工智能学习方式,人类对人工智能的生成结果提出反馈,使得人工智能的输出不断贴近人类价值观,而人类也从人工智能的成长中获取更好的经验与成果。AI只负责生产,但是最终的艺术产品是否符合人类的审美和认知需求,还需要人类来进行“把关”和检视。[7]马克思的艺术生产理论深刻揭示了“创作-作品-欣赏”三者之间相互影响与依存的关系,生成式人工智能浪潮下,创作者、作品、消费者各层面之内与相互之间需要构建和谐的互动与生态关系。作品既要迎合受众审美期待,又要引导受众培养审美意识;受众既会进行消费,又会对作品提出反馈,由此实现良性循环、共同成长。当前生成式人工智能存在同质化严重的问题,如生成的角色形象和场景容易是同类型素材堆砌,长此以往会陷入质量低下的死胡同,也会导致消费者审美疲劳。此时就需要及时采纳人工反馈,合理利用大数据计算消费者偏好,同时注入大量优质原创数据,督促其深入学习人工经验。充分运用智能关联主义与人机间的“互反”,将使生成式人工智能在动画创制中的发展导向新的可能。
三、动画艺术创制中共融数字生态——工具理性和价值理性协同
生成式人工智能具有超越性的工具性,能够为动画产业带来强劲“赋能”,其工具理性集中体现在人工智能技术作为第四次科技革命的推动力必将会带来生产效率的大幅度提升,降低成本,使产品和服务更加广泛使用,并提供更高的准确性和精确度。[8]而价值理性同样不可忽视,它监督生成式人工智能沿着符合人类价值观的方向成长。数字生态中,工具理性与价值理性的凸显与协同将促进维护和谐数字生态,构建良好动画创制生态。
(一)工具理性为创制赋能
第一,在效率方面,动画前期环节中生成式人工智能最重要的功能就是拓宽创意思路、辅助创意设计,快速生成角色、场景等的概念草图,减少繁琐的手工绘图实验环节,极大提升创作效率。在Stable Diffusion文生图模式中,输入文本关键词如角色性别、发色、饰品、服装,场景建筑元素等,AI模型会迅速抓取所需数据,基于本地运算呈现图像。这意味着动画设计师脑海中原本模糊的角色形象或者场景将能够以数秒的速度跃然于屏幕上。更换任意关键词、调整关键词权重,再次生成图像时将做出即时改变;调整提示词引导系数等参数,可以更改指令听从程度,不论是希望生成结果更贴合设计者的要求与心目中的想象,还是疏远指令来发散式整合资源带来更多延伸与可能性,都可以轻松掌控。甚至仅需导入黑白线稿,不论是角色还是场景都能够立刻着色,并提供多种配色方案。Stable Diffusion还推出自动生成“三视图”功能,利用Openpose(姿态)控制类型,输入文本描述就可以生成规范样式的角色形象三视图。此外还可以通过训练原创模型,提高工作可持续性。如将同一动画角色或同一美术风格的大量图片“投喂”AI进行Lora模型(Low-Rank Adaptation of Large Language Models)训练,产出的模型就可作为控制框架来精细把控角色形象和美术风格。这样不论是形态各异的角色还是风格迥异的美术风格,都能够独立形成一套模型来生成指定对象,用于提升后续工作效率。在特效设计等环节,AI可以利用先验知识和海量数据进行快速模拟和渲染,加速制作过程。在3D动画场景搭建方面,腾讯人工智能实验室AI Lab已经研究出3D虚拟场景自动生成解决方案,生成一栋贴图、渲染好的建筑仅需17.5分钟。在3D角色建模方面,游戏《赛博朋克2077》已经利用人工智能生成大量非玩家角色。
第二,在规模方面,首先生成式人工智能生产的作品数量规模巨大。AI运算基于硬件性能能够多线并行,例如ChatGPT短时间可处理的数据量可达百万个,同一参数条件下Stable Diffusion单批次可同时生成8幅图像,总批次可达100。大量的产品基础可以极快满足制作需求和方案遴选需要,扩充数据资源。其次生成式人工智能單个产品规模同样巨大。ChatGPT数十秒就可为用户生成一篇千字文章,Stable Diffusion一次性能生成2048×2048画幅的高精度图像;再次,生成式人工智能使得动画制作的产业规模得以扩大。传统动画制作通常需要大量的人力和时间,而AI可以提供一定程度的替代,减少重复性和机械性劳动。动画制作中数字资产的可复制性、传输性、共享性也极大生产规模和效能。AI还可以应用于后期剪辑、音效处理和字幕翻译等工作中,自动化智能处理使得制片团队能够同时处理更多的项目;最后,AIGC模式具有规模递减优势,成本支出主要在于模型算法开发与硬件等固定成本领域,所以在元宇宙场景下,AIGC生成内容规模越大,单位内容生成的边际成本将逐渐下降且无限逼近于零。[9]可见在规模不断发展的过程中,生成式人工智能的单位成本低的优势将渐渐展露。
第三,在质量方面,首先生成式人工智能的成果完成度高。在视频风格化方面,AI可以实现真人视频转为卡通动画、现实日常风格转为赛博朋克风格、三维动画风格转为二维动画风格等各种画面渲染。2022戛纳电影短片节最佳短片《乌鸦》即是利用Open AI进行真人到乌鸦转化。Stable Diffusion中生成的图片颜色搭配精美、上色完成度高、光影生动,适当修改就可大功告成。另一款AI制图工具Midjourney相较Stable Diffusion更侧重于艺术性,其生成的图像流动性、随机性更强,画面效果也更具观赏性,直接成品让人惊叹。2022年8月美国科罗拉多州举办艺术博览会数字艺术类别冠军作品《太空歌剧院》即是用Midjourney生成初稿;在细节描绘、光影效果和纹理处理等方面,生成式人工智能可以实现精确而真实的模拟,使动画画面更加逼真和生动。此外,AI还可通过自动化、智能化的错误检测和修复功能,辅助制片人员及时发现和解决潜在问题,提高动画制作的整体质量。比如动画《中华小子》高清重制版就是借助AI来智能提升分辨率的。
(二)价值理性与工具理性交织共进
仅有工具理性是不够的,生成式人工智能应用中的价值理性也同样重要。价值理性关注的是生成内容是否符合社会价值规范和道德准则。例如,生成的图像内容是否涉及侵权或违法行为等。生成式人工智能应用中的价值理性不仅体现了技术使用者的个人信仰和价值观,也反映了社会和文化的背景和需求。在生成式人工智能技术中,工具理性和价值理性相互依赖、相互促进。一方面,工具理性的发展为生成式人工智能技术提供了更好的技术手段和方法,提高了生成内容的效率、规模和质量,同时也为使用者提供了更大的创作空间和可能性;另一方面,价值理性则为生成式人工智能技术提供了目标和方向,使技术手段能够更好地服务于人类社会。
在生成式人工智能浪潮的强劲冲击下,“以人为本”的核心观念应是基石。从受众角度出发,动画创作的目的最终仍归于满足观众的精神需求,需要用人类价值观来约束生成式人工智能生产,更好地服务大众。从创作者角度出发,生成式人工智能虽然优势巨大,但基于人的视角、人的观察、人的情感由人主导完成的作品,仍将是主流。[10]人类创意、情感与价值观念仍是动画创制不可缺失的部分。生成式人工智能的介入,并非是要抹消创作者们的激情和创意,或是站到手工、“匠心”的对立面,而是希望借助其赋能优势带给企业和创作者更多机遇与动能,减少实验成本、时间成本,凝聚核心价值,实现商业运作,更快更好地满足观众们多元化的需求。纯手绘2D动画《雾山五行》续集《犀川幻紫林篇》于2023年7月26日开播,时隔三年再度引爆口碑,目前哔哩哔哩平台播放量已超3.4亿,点赞量已超700万。①制作团队呕心沥血打造的《雾山五行》打斗情节行云流水,整体画风借鉴国画与毛笔笔触,开辟了独属国漫的风格之路,彰显中华传统文化之美,深受观众喜爱。由此可见,当创作者用深刻融入创意、创造力的“真心”来面对观众,观众也会诚心回应。当价值理性与工具理性协同,将推动动画创制生态健康发展。
四、科技艺术场域中动画创制的隐忧与应对
(一)当下生成式人工智能应用的忧虑
生成式人工智能技术仍在完善中,也有诸多问题逐渐显露。将动画的创制放置在生成式人工智能的科技艺术场域中,就会面临艺术创作的话语权利争夺、数字资源公平性、文化、伦理、版权、法律规范等方面的考验。在成本层面,若要将AI美术作品应用商业,其训练原创AI模型所需成本巨大。据悉Chat GPT硕大成果的背后是百亿美元与上万显卡的消耗,这是普通中小企业难以承受的,并且训练一个优质模型至少需要上百张高质量图片,购买版权就意味着成本高昂,也因此经常涉及到版权侵权问题。在艺术层面,人工智能深度学习的能力并不说明其能够理解到艺术的真正含义,它缺少必要的主体性意识,它的工作方式其实是一种去意识化的活动[11],具有美学局限,缺乏艺术创新。在文化层面,现阶段人工智能虽能识别和模仿文化符号的构成要素和表现形式,但在处理文化符号时面临语义多义性、文化差异、语言逻辑、指向性和隐喻性等挑战。如对于“斗拱”等建筑要素,“成语”的理解与生成存在不容小觑的问题。在利用生成式人工智能参与动画中文化语境的构建时,要极力规避其带来的误解、简化和歧視,奋力构建完善的人工智能文化符号理解与应用体系。当下生成式人工智能技术的应用更需聚焦在充分尊重伦理道德、保护知识产权,避免侵犯原创作品的权益等现实问题,确保人工智能技术的应用能够充分发挥其技术优势以及人类想象力和创造力。确保人机协同良性发展,中国动画从业者们任重而道远。
(二)忧虑应对与思考
在产业角度,生成式人工智能浪潮的袭来犹如“第二次工业革命”,若不能把握机会则会丧失竞争力与主动权。当下各大互联网巨头都纷纷争做生成式人工智能领域上的“弄潮儿”,个别企业也针对性地钻研发展人工智能技术,总体涵盖文字、图像、音频、视频、游戏、虚拟人等领域,AIGC产业链结构在不断调整。当人工智能赋能三次产业,人工智能技术-经济特征的替代性、协同性和创造性将引起产业内的要素替代、成本降低与知识创造,最终提高各产业部门的生产效率和配置效率,推动传统产业升级和产业结构优化。[12]相应的,动画产业和创制路径也应进行层次和结构调整。当下诸多动画制作公司都面临市场波动和转型困境,原本的工作程序面临断裂与停滞。但同时也有企业与项目组积极寻求突破点,纳入生成式人工智能应用环节,选择迎难而上进行转型与工作流程改进。目前就有动画CG工作室的商业作品《神印王座》漫画封面是通过Stable Diffusion制作样图并进行人工调整完成的。同时该工作室成立AI部门专门研究生成式人工智能技术应用,并将研究成果投入运营实践,不断根据技术前沿发展与市场潮流进行战略调整。人工智能产业作为新兴产业尚处于发展初期,这为中国掌握话语权提供了历史性机遇,但这需要在核心硬件和标准化方面取得突破,因而可选择以人工智能产业的应用层带动基础层发展模式和建立自主技术标准的产业发展模式。[13]生成式人工智能引入传统动画产业链后,各个环节、层次相互衔接、带动、协调,最后迎来规整与完善。
在创作者角度,动画创制新路径的开辟与延伸更需要适应新环境的创作者参与,这就将视线指向创作者能力的培养。第一,艺术培养方面,动画人才依然需要具备绘画、造型和美术等传统艺术基本功,这是动画创作的核心基础。虽然AI可以辅助绘图和设计,但创作者仍然需要通過实践提升自己的审美能力和艺术表达能力。Al不仅仅是被动的辅助性图像创作工具,在内容、技术、模式三维协同下,AlGC还意味着在人类创作之上再创作,使图像具备多重审美内涵。[14]培养创作者的审美素养、审美意识同样重要,如果创作者都无法鉴赏美,又如何能辨别生成式人工智能产品的美丑。目前大部分生成式人工智能产品都存在一定瑕疵,而要在其基础上进行修改就需要优秀艺术人才的智慧与技艺;第二,技术培养方面,生成式人工智能的应用具有一定技术门槛,人工智能、机器学习和计算机图形学等技术在动画制作中发挥着重要作用。掌握准确理解各模块功能和精确调试参数、模型等技能才能充分发挥生成式人工智能特色与优势。因此,需要注重培养创作者的技术素养,使他们能够灵活应用新技术并且解决实际问题。在各高校的动画人才培养方案中,应适当加大人工智能技术相关的理论学习和操作实践课程的力度,主动提供人工智能媒介与学习接口;第三,综合能力培养方面,应包括技术与艺术结合的能力、人际交流能力、人机交流能力、创新思维能力培养等。生成式人工智能介入并非会隔断人际交流或趋向依赖人机交流,而更强调人机、人人协同的条理性、规律性。当然,人们或许并不一定要求人机交流与人际交流达到一样的效果,甚至可能有意要利用两者之间的差异。[15]为适应快速发展的动画行业,推动行业创新与进步,创作者需要尽快提高与完善自身素质。
结语
人工智能参与动画创制提高了创制效率、规模、质量,为观众带来更加震撼和丰富多彩的视听和情感体验,提供了前所未有的可能性。通过深度学习与人机协同,人工智能将以更完善的形态参与动画创作,促进动画产业的发展。随着生成式人工智能在动画等兼具技术性与艺术性的艺术形式的创制舞台上大放光彩,“技艺融合”也将推向高潮。总之,人工智能浪潮以高昂推进的姿态走入动画创制流程,又以不可逆回的势头涌向动画发展的未来。中国动画应当乘势而动,踏浪而行,创作出更多体现中华优秀传统文化创造性转化和创新性发展的优秀作品,走出一条具有中国特色的动画创制之路。
参考文献:
[1]胡洁.人工智能驱动的艺术创新[ J ].装饰,2019(11):12-17.
[2]郭全中,袁柏林.AI能力新突破下的AIGC:内容生产新范式[ J ].青年记者,2023(13):66-69.
[3]赵艳明,李文聪.打破写实的神话——论电影的现实性与反身性[ J ].文艺评论,2011(05):123-128.
[4]程金海.数字艺术与审美经验方式的转变[ J ].电影评介,2007(03):98-99.
[5]蓝江.数字生态下的信息体与智能关联主义[ J ].中国人民大学学报,2022(03):36-45.
[6]潘恩荣,孙志艳,郭喨.智慧集成与反身性资本重组——人工智能时代新工业革命的发展动力分析[ J ].自然辩证法研究,2020(02):42-47.
[7]王毅,王伟.跨越零和博弈:论人工智能对动画创作的革新与挑战[ J ].电影评介,2018(08):88-91.
[8]蒋万胜,李冰洁.论人工智能技术对人类社会发展的影响[ J ].西安财经大学学报,2020(01):23-29.
[9]王诺,毕学成,许鑫.先利其器:元宇宙场景下的AIGC及其GLAM应用机遇[ J ].图书馆论坛,2023(02):117-124.
[10][15]彭兰.从ChatGPT透视智能传播与人机关系的全景及前景[ J ].新闻大学,2023(04):1-16,119.
[11]王璐,孙海垠.人工智能挑战下的艺术设计创作思考[ J ].艺术工作,2020(06):86-88.
[12]耿子恒,汪文祥.人工智能影响中国产业发展的路径与机制研究[ J ].工业技术经济,2022(02):100-106.
[13]杜传忠,胡俊,陈维宣.我国新一代人工智能产业发展模式与对策[ J ].经济纵横,2018(04):41-47,2.
[14]解学芳,高嘉琪.AIGC模式赋能数字文化创新的逻辑与善治:基于ChatGPT热潮的思考[ J ].江海学刊,2023(03):
86-95.
【作者简介】 孙 亮,男,安徽六安人,安徽师范大学新闻与传播学院教授,硕士生导师、动画系主任,皖江学院视觉艺术系书记,主要从事动画与数字媒体艺术、影视艺术研究;
沈超颖,女,安徽马鞍山人,安徽师范大学新闻与传播学院硕士生。
【基金项目】 本文系安徽省高校学科(专业)拔尖人才学术资助项目“我国政策解读类动画的创作研究”(gxbjZD2020030)阶段性成果。