从符号的自生成到去同步观看
——CGI技术下的影游融合新美学
2020-09-28耿游子民陈旭光
耿游子民 陈旭光
一、CGI的美学潜质
CGI即计算机生成图形。广义的CGI涵盖了整个数字系统生产过程,包括基于数字信号传输的半导体集成电路、计算机硬件系统、图形算法、显示硬件系统等。近年来,随着这一技术的不断发展,从电子游戏到电影,几乎所有涉及运动影像之处均开始广泛使用CGI。截至2019年,全球总票房前20的电影均大量使用CGI技术。同样,作为电子游戏原生技术的CGI,也一步步向电影级真实靠近。从1982年《Tron》诞生到1997年《最终幻想VII》发行,人类的视觉经验彻底迈入CGI时代。因此,研究CGI时代的视觉经验变得至关重要。
(一)影游融合下的CGI
1.游戏的电影化
正是由于CGI尤其是三维CGI技术的成熟,在游戏中建立模拟现实世界的三维空间成为可能。1998年,《塞尔达传说时之笛》由任天堂发行成为该系列第一个3D化作品,成为整个游戏产业教科书式的里程碑作品,其视角锁定系统为困扰三维CGI多年的视点转换问题提供了最合理的解决方案。同年,《合金装备索利德》上市,首次在PS1上实现了即时演算的CGI画面,并尝试使用灯光、分镜头等电影拍摄元素。小岛秀夫的合金装备系列也成为后期互动式电影游戏的渊源。时至今日,在CGI技术的推动下,大量电子游戏被赋予“电影感”,电影视听语言层面借由CGI全面渗透进电子游戏之中。如日本经典角色扮演游戏《如龙》系列,知名制作人上田文人开发的《最后的守护者》《旺达与巨像》等极度接近电影视觉经验但仍保留游戏交互性的作品。同样,欧美以《战神》《古墓丽影》《神秘海域》为首的动作角色扮演游戏,也因CGI技术的全面普及而大获成功,尤其是《战神4》依靠强大的CGI技术实现了游戏交互下的“一镜到底”,成为影游融合的经典文本。
2.电影的游戏化
在经历了《西部世界》《星球大战》这一CGI草创时期,电子游戏便借由CGI技术渗透进电影制作之中,首当其冲的是1982年第一部计算机动画电影《Tron》。而后,2004年,泽米基斯导演的电影《极地特快》,成为电影史首部使用动作捕捉技术的真人CG电影。2005年,基于《最终幻想7》的《最终幻想:圣子降临》将同名角色扮演游戏IP电影化。而后,大量游戏IP纷纷搬上银幕,且在拍摄中复用了大量游戏CGI内容。如《生化危机4》中若干打斗桥段,其分镜完全复制了原游戏CG片段中的分镜。在《最终幻想·王者之剑》CG电影中,大量电影场景建模与游戏《最终幻想15》复用。学者陈旭光指出:随着视频游戏作为娱乐方式的普及,当代观众在一定程度上都具有潜在的游戏经验,比如说追求更快的行动序列和更加奇观化的视觉特效,如《阿凡达》《黑暗骑士》和《复仇者联盟》。[1]随着CGI技术的发展,大量电影开始使用面部建模与动作捕捉技术。早在《速度与激情7》中, 片方便着重以CGI技术还原了保罗·沃克形象,到了《加勒比海盗5》《惊奇队长》和《金刚狼3》中,则分别重建了年轻的约翰尼·德普和萨缪尔·杰克逊,以及年老的休·杰克曼形象。CGI技术的突破,使游戏与影视的融合展现了新的美学可能。
二、敞开CGI:从符号的自生成系统到超真实
前文叙述中,我们看到CGI为数字时代的影视游戏创作提供了崭新且统一的技术路径,但同时也面临极大的隐患。与曾经的胶片到数字底片、模拟信号到数字信号的转向一样,我们习惯将CGI归纳为一种新的创作工具或制作方法。但这一归纳同时标志着CGI美学层面的“失语”——即对CGI本体的讨论被排除,被技术中心话语和实用主义原则遮蔽,沦落为一种工具,或是现代数字黑箱中的一环。我们只需要使用即可,并不需要研究CGI所蕴含的视知觉经验特质。
在基特勒去人类中心主义的叙事下,媒介不再作为 “人的延伸”,而成为建构人之本质的“话语网络”。媒介定义人,也改造人。他在《话语网络1800/1900》中提过一个例子:希腊人将灵魂比作蜡板;电影出现后,人的濒死体验便被描述为“放电影”。[2]罗德维克同样提到,“在这个意义上说,一个媒体不是一个受制于艺术家意愿的被动的,呆板的物质它自己就是作为思维、行动或者创造的潜力或能力表达出来的”。[3]如此说来,对人的阐释实则应当依附于媒介特性,媒介不仅是人的延伸,更是人这一范畴的构成。而研究媒介,势必要以媒介作为本体出发。唯有沿着这一逻辑下行,才能在为CGI祛魅的同时,发现其工具外表下的真正美学。
(一)符号的自生成系统
计算机生成图像由来已久,计算机生成非抽象图像最早追溯至1968年苏联的大型机BESM-4。在这台电子管大型机上,康斯坦丁诺夫等人使用一组方程定义了一只猫的轮廓。计算机通过计算该组方程,将每一个结果以坐标点的形式绘制在碳带(一种早期打印材料)上,连起来,再由胶片翻拍后播放,从而获得了最早的计算机生成动画。这个实践揭示了CGI同传统图像记录或图像绘制的不同。通常情况下,我们用笔绘制一条线,将不可避免地绘制出这条线上的每一个点,而在计算机这里,我们只需要给它一个简单的函数——如y=x,就能让计算机绘制出一条线。如果用笔绘制三条线,则我们需要绘制出这三条线的每一个点,而使用计算机,我们可以通过简单的更改函数获得。从这一角度出发不难发现,如果将绘制看作一个符号系统,则不论是手绘还是拍摄,都是对现有符号的简单拷贝或记录,其生成的符号是有限的。同样将CGI所代表的数字影像也看做一个符号系统,那么当我们给予初始条件后,这一系统即可由我们给予的符号自动生成更多符号。这与传统影像系统有着极大不同。正如鲍德里亚在《象征交换与死亡》中提出的拟像三序列(“仿冒”的拟像、“生产”的拟像与“仿真”的拟像)所阐释的,[4]如果生产的拟像代表本雅明在《机械复制时代的艺术作品》中将艺术品祛魅,消解光晕之后不再有摹本和母本之别,那么在仿真的拟像前,符号将失去原有的拷贝,以致母本和摹本均消失,成为一种比真实更加“真实”的存在。
至此,CGI技术正式构建起一个这样自发产生符号的符号系统,在符号生成符号的自我指涉中诞生的符号不断消解“摹本”与“母本”的区别,甚至母本本身,而这一点,预示着CGI所蕴涵的巨大美学潜力。
(二)从拍摄到生成:电影帧与CGI帧
数字系统/胶片系统在拍摄——即媒介物质性上具有同一性。罗德维克所言的美学范式转换并非在于拍摄本身。笔者认为,正是“拍摄影像”与“生成图像”间的根本差异造就了CGI的独特美学体验。
笔者尝试通过以下分析加以论证。在多数电影中,我们可以看到大量存在动作模糊的场景。以《星际穿越》中玉米地追逐为例。在吉普车快速移动的过程中,我们明显能看到物体快速移动时两侧植被出现了模糊与拖影,出现拖影的原因在于经典电影放映的基本原则——24帧原则,即每秒播放24张静态图像。这个规则同样意味着拍摄时每秒也要拍摄24张影像。不论采用胶片或数字底片,在拍摄时每一张静态图像均进行了1/24秒的曝光。例如在拍摄快速奔跑的猎豹时,每一张胶片(或者电子底片)都记录下了曝光时间里猎豹的所有动作,在猎豹的图像上特别是运动幅度较大的腿部会出现比较明显的拖影,同样,图1左侧中的拖影,也是小球在这张照片拍摄的过程中快速运动而产生的(当然也可理解为摄影机快速运动带来小球的相对运动)。这样的成像结果,笔者将其称为“电影帧”。而在电子游戏中,譬如我们截取一张人物跳起的动作,却并不会表现出任何模糊或者拖影。原因在于CGI成像的基本规则——按下截图按钮后,计算机将该时刻计算完成的图像保存下来,该图像每一个像素点均由计算机在截图时刻生成,可以理解为使用了一个现实中不可能存在的快门速度无穷大的照相机拍摄了一张照片,照片由一系列确定的二进制数据组成,包含且仅包含该二进制数据内的RGB信息。这样的成像结果笔者将其称为“CGI帧”。
笔者所总结的由传统光学设备拍摄的图像信息即电影帧,和由计算机生成的图像信息即CGI帧,其本质不同就在对运动的体现。传统光学影像的拍摄可以包含物体运动趋势的信息,这种运动趋势被称为矢量,即物理学上带有方向的量。我们尝试将例子简化。在图1左侧中,笔者展示了快门速度为1/15秒时,物体在加速运动下每间隔一秒进行一次拍摄的结果。我们发现,在传统光学设备拍摄的图像下,从曝光开始到曝光结束的过程中,物体产生的运动信息不断在底片上叠加,并以拖影的形式呈现出拍摄的结果——静态图像中,随着物体运动速度的不断增加,相同曝光时间下,物体矢量的距离增加,在画面中明显看到这五幅图均呈现为拖影越来越越明显。这个例子说明电影帧捕捉到了物体加速这一矢量信息。正是由于这些矢量信息的存在,我们可以完全依靠通过对比前后帧中拖影的长度,在大脑中“建立”起该物体的运动状态——加速运动。据此,笔者尝试将电影帧进一步解释为矢量帧——即在每一幅静态画面中都包含运动趋势信息的帧。与此相对的,图1右侧展示了直接使用计算机生成的图像,也就是CGI情况。在一秒一次截取的静态图像中,计算机只输出按下截取按钮时所对应的唯一的计算结果——即图像不存在传统影像拍摄中所具有的信号叠加,故图像本身、图像与图像之间均不包含任何矢量信息,没有任何拖影,在这里呈现为大小完全一致的黑色圆形,不同于之前我们分析的矢量帧。我们无法像图1左侧图形一样通过观察帧与帧之间拖影越来越大继而推断其整体的运动状态。所以这里笔者将其定义为:去矢量帧——即祛除运动趋势信息的帧。 利用方才的发现我们再次观看上文中提到的《星际穿越》的玉米地追逐场景:从《星际穿越》的矢量帧中,可以明显看到左下角拖影较右上角长,据此我们可以判断此时植被沿左下角向右上角运动(即摄影机沿右上向左下运动);但在游戏截图中,由于缺少相应的矢量信息,我们无法判断角色到底是垂直跳跃还是向前跳跃或向后跳跃。
图1
至此,我们找到了数字系统和影像系统在媒介传达性上的重大差异——去矢量性,即彻底不包含任何运动趋势信息。CGI生成的图像,每一帧皆由计算机计算而成,其独立于时空,即观看一组CGI连续生成的图像,也无法从中判断物体的运动状态——比如图1右侧的那黑色小球,因为失去了拖影,我们无论如何也不能判断它究竟在进行怎样的运动。CGI这一符号系统将通常连续且包含冗余的信息流打碎,以去矢量性为核心建立起一套独立的视知觉体系,在消解矢量信息的同时,将我们的感官体验推向未知领域。
(三)在数字符号中僭越真实
至此,我们厘清了关于CGI的两个媒介物质性特征,即第一节论述的符号自生成系统和第二节论述的去矢量性。接下来,我们结合实际的影游融合文本,在这两种CGI特征的影响下,进入CGI美学的讨论。
《双子杀手》作为一部带有强烈技术试验性质的影片,为我们讨论CGI的美学体验提供了一个绝佳范本。首先,根据我们对CGI帧与电影帧的论述,随着快门速度的不断提升,我们发现,单位电影帧内所保留的矢量信息将急剧下降,表现为帧与帧之间的拖影越来越小,在这个过程中,矢量帧不断靠近去矢量帧。众所周知,电子游戏带来的是原生的去矢量帧,玩家长期面对90帧乃至144帧的显示设备。我们的注意力被迫由极高的屏幕刷新率调动,形成一种“在场感”。反观《双子杀手》,虽然其本质仍然是拍摄而成的电影帧,但双子杀手通过120fps的放映在削减矢量信息的同时,模拟了这一种在场感,这正是对电子游戏“去矢量帧”的模仿。其次,《双子杀手》中最引人注目的通过CGI技术“生成”20岁的威尔·史密斯。为了重现威尔·史密斯真实的面部细节,视效团队开发了一项名为Deep Shapes的面部运动生成算法,尝试模拟当面部肌肉运动时,肌肉深度所发生的改变,继而计算细微的变化结果。通过这些规则和算法,最终我们得到了一个20岁的威尔·史密斯。正如我们对CGI符号生成系统所进行的分析,CGI作为一套自生成的符号系统,由它生成的威尔·史密斯形象,当然不是“现实”中的威尔·史密斯。更有意思的是,如果我们将时间退到1990年——威尔·史密斯首次在电视荧幕上留下形象的时间,彼时的电视机分辨率多为标清,采用隔行扫描,正是由于早期的技术限制,使得我们同样无法从历史资料中获得一个如《双子杀手》般清晰的威尔·史密斯。从这层意义上看,《双子杀手》中生成的同样不是历史中的威尔·史密斯。由此可见人类的共同记忆与物质遗产均没有记录过《双子杀手》中如此清晰的威尔·史密斯。在这里,由CGI所建构的“青年威尔·史密斯”成为一个没有母本的“真实”存在。
不仅如此,CGI技术进一步融合了其它尖端计算机技术。在彼得·杰克逊制作的一战纪录片《他们不再老去》中,其团队尝试使用人工智能对旧胶片加以修复,如分辨率提升、降噪、提升帧率,使用CGI技术对胶片加以上色等技术,让观众得到了拥有无与伦比的“在场感”的一战影像。这些由符号自生成系统所生成的影像,早已成为单纯的信息流,失去了能指。它既不是真实的一战亦不是幻想中的某场架空战争,仅仅是某种符号规则下的产物,是像素点与光信号。最终它们为观众呈现了一场“不存在于此世”的战争。同样,2019年小岛秀夫操刀的现象级游戏《死亡搁浅》,在极为真实的材质与物理引擎之下,二进制数据为我们展示了一张张“似曾相识”的明星面庞;而PS4大作《地平线:零之曙光》则带给我们一个文明失落后的机械世界。有趣的是,二者故事的发生地都在美国,不论是末世降临前的美国西海岸还是文明失落万年后的科罗拉多州,我们在计算机构筑的宏大中找寻到了“真实感”,但这样的真实感却被一帧帧去矢量的CGI数据悬置于世界之外,显示出一种诡谲的存在。
三、收束CGI:从失去隐含的读者到去同步观看
笔者从符号的自生成系统和去矢量性两方面,在祛魅CGI的同时为其构建起一个以“生成”为核心的系统。基于这一系统,我们尝试从接受者的角度讨论CGI可能产生的影游融合新美学。
(一)在超真实下失去隐含的读者
对于传统影像系统下拍摄的图像,接受者的全知性是作为一个应然概念而非实然概念存在的,即彻底认识图像并不现实,但却有理论上的可能。这一可能在接受美学那里被定义为“隐含的读者”。传统的书写需要依靠作者彻底编码而存在。如《寄生虫》《卧虎藏龙》等传统摄制电影,不论用胶片或数码底片,都是将镜头前的光学信息完整的、机械的保存为数据或胶片。电影每一帧每一个像素均是现实世界的光信号记录,与现实世界一一对应。虽然作为接受者,我们实际上不存在对作品彻底的把握——这些影片或多或少都包含我们未能把握的符号。但如果我们预设一个“隐含的读者”则会发现,这种召唤结构的孔洞在理论上是有可能被填充的,即存在这样一个“隐含的读者”,“她完全按照艺术作品的创作意图做出解读。”[5]由于每一个像素均有现实对应,即在历史上“真实发生”过,所以这个“隐含的读者”能做到理论上的全知。
反观CGI所代表的符号自生成系统,作者作为编码者,仅编码了CGI的“基本规则”,比如《双子杀手》中毛发的渲染规则,或者是皮肤毛孔的生成规则等等,同直接摹绘符号有着本质不同。在CGI这里,“自生成系统”如同黑箱一般无法预设“隐含的读者”,只因这个“自生成系统”的符号是可以自发生成的,是无限的。在这个系统中,视觉符号的生成与消失超越了一切现实依附,均在一套计算机预先设定的程序之下建构出来,不同于每一个像素都能找到现实对应的影像拍摄系统。CGI彻底抛弃符号物质性基础——不属于任何时空。正是这样一个特殊召唤结构下的CGI系统将“隐含的读者”彻底抛弃。一方面,我们在解码CGI生成的影像时,无法找到与之对应的能指,正如无法找到那个既不存在于当下,也不存在于历史中的年轻的威尔·史密斯,但这个威尔·史密斯却“光明正大”地出现在荧幕上;另一方面,CGI自身意味着符号的无限。对于无限的符号,我们不再具有彻底认知的,哪怕是理论上的可能。因此,我们失去了把握符号的可能。在CGI面前,不再有传统意义上的真实,每时每刻,虚无的符号、无尽的符号都在《死亡搁浅》的游戏世界中不断生成、繁衍、消亡。它似乎代表着一种克苏鲁式的恐怖——“一团不可名状的自洽之物”。正因如此,CGI美学的第一大特征被我们揭示——超真实。
诚然,早在本雅明的《机械时代的复制艺术》中就已提到:工业文明下艺术品不再有原型与复制品之分,继而笼罩在艺术品上的“光晕”在安迪·沃霍尔的“波普”中被消解了。结合鲍德里亚和艾柯关于超真实的论述,总的来说,“超真实”本质是数字操控的真实,其最大特点就是无限无缝的数字模型“复制”性再生产,终结了传统意义上的唯一性的真实——母本的存在。[6]杰姆逊提到,后工业文明下艺术由深度导向平面感,成为了能指与所指的简单对立,超真实更进一步,试图单独抽离所指,继而使得一切彻底沦为符号的玩物。
超真实中,“超”隐含了“僭越真理性”的意味。在CGI世界,纯粹的符号真实优于母本真实本身。超真实并非单纯的“符号遮蔽了的真实”,而是前者取代了后者的真理地位。在超真实世界,所有的“真实”都成为一种可被加工、吸收、改造的质料。 “虚假”,甚至“无”也一样被吸收利用。[6](28)总之,在超真实这里,真假区分失去意义,没有区分的可能性也没有区分的必要性,超真实世界里只剩下符号的价值判断与符号的功能判断。
(二)在持续去同步中观看
维利里奥在《消失的美学》中提到一个现象:“失神症”,指的是一种孩子“无法预期的‘失神’ 状态”,多见于孩子的童年时期,表现为短暂的意识丧失,突然开始,突然结束,比如在说话时突然停止或减慢速度,或者正在进食时食物就停放在嘴边。但失神症发作后,孩子总能恢复,被中断的行动在断点快速恢复,表现为孩子往往意识不到曾经历过失神,整个记忆是连贯的。维利里奥指出,虽然失神会引发短暂的无意识,且失神期间的记忆通常并不存在,但每个儿童在经历了短暂的“失神”之后,都可以快速恢复,原因在于孩子能通过某些潜意识的手段修复、剪辑出连续的场景,仿佛“失神”从未发生过。[7]这一能力被其称为 “去同步性”。它能够重新组合,链接“失神”所造成的时间断裂,继而维持身体与外界保持连续。他认为,这样一种机制是孩子为了保持同外部世界的连贯而从潜意识中产生的,由于客观世界的“时间流动”过于迅速(可理解为成人世界的变化过于剧烈),尚未发育完全的孩子,在意识层面无法承受这样的变化,继而通过调动这种具身化的“去同步性”来确保自己对主观时空连续的掌控。随着发育的完全,我们可以适应客观世界的时间流动,这种“去同步性”逐渐消失。而电影正是唤起我们“去同步性”的最佳可能。在《消失的美学》《视觉机器》等著作中,维利里奥将电影看作一种“消失的美学”。诚然,每秒24幅画面的放映中,我们不断看到画面出现消失,帧与帧之间只能借由“视觉暂留”等现象为我们补全运动。这种来自意识之外的修补,十分类似儿童在“失神”时所激发的“去同步性”[8]——正是这种借由装置所回归的“成年失神”,为我们找回了控制主观时间的感觉。但是,在传统的电影帧系统中,这样的失神仅仅发生在帧与帧之间。电影所带来的“失神感”,关键在于对运动断裂的粘合,这种粘合只发生在帧与帧之间。电影帧本身属于矢量帧,矢量帧本身已包含运动信息,故而在帧所停留的1/24秒内,我们的理性依然处于“在线”状态,为我们分析前后帧的运动关系,继而提供关于黑色小球如何运动的潜意识。而CGI生成去矢量帧,每一帧都彻底排除一切的时空关系,变成突兀于世的存在。我们无法依靠帧本身供给有关运动的“知识”,此时,失神便不只发生在帧与帧的断裂处,而将存在于影像观看的全程——持续失神。如果说,在彼时的间歇性失神中,我们仍能保留部分“理性”,那么在CGI所带来的持续失神中,我们的“理性”将彻底归零,所有的观看只能指向某种具身的感官本能。
四、结语:在感官迷狂中寻找影游融合新美学
CGI带给了我们无与伦比的视觉享受,也同时将视觉影像带回了百年前那个“杂耍时代”。CGI将我们迎入一个特殊的观看场域,借由去矢量化的影像序列与自生成的符号系统改变着我们的视知觉体验——从观看到看,维利里奥所预言的“加速”由CGI投射于整个运动影像系统,不论电子游戏或电影,都只能留下纯粹的身体器官反应。学者李洋在评述利奥塔电影哲学时指出:力比多装置是一种规范化的力比多能量流动、分布和转化的有机形式。在这个理论下,电影被理解为一种力比多装置。[9]当然,我们更可以将力比多视为神经科学中各类激素的集合体。从多巴胺到肾上腺素,它们存在于理性无法干预的肉体之中,依靠真实的生化反应支配我们。从这一点出发,CGI所代表的图像系统同样是一种力比多装置,只是无法参与对装置的反抗。在这个意义上,CGI延续了影像作为力比多装置的存在的同时,又彻底将理性排斥于外。最终,不论电影还是电子游戏,我们只能在每秒120帧的去矢量像素中感受内啡肽分泌的快感。
安德烈·巴赞在《摄影影像的本体论》中提出:“一切艺术都是以人的参与为基础的,唯独在摄影中,我们有了不让人介入的特权。”[10]这一理论从拍摄图像的角度统一了电视影像、电影影像乃至一切动态画面播放,弥合了各种媒介间的差异。但今天,CGI孕育出不同于电影帧的CGI帧,继而诞生了与“拍摄”有着根本性差异的“生成”。CGI将曾用于统一的影像本体论撕裂,成为横亘在影视游戏融合上的突兀之物。在德勒兹那里,兰花—胡蜂这一由连字符所链接的统一体,成为反精神分析简单二元的标志性概念。借用这一概念,人—CGI也可视为一个统一体。在去矢量帧带来的持续失神中,“不让人介入”不再是影像的“特权”而成为某种枷锁,向媒介自身寻求某种统一已无可能。
总而言之,在这个全民想象力消费的时代,CGI不仅作为一种想象力消费的对象,更成为一切想象力的具像化表达途径。它以生成影像,统一了当代影视、电子游戏乃至一切屏幕内容,揭示了影游融合物质性统一现象——人的视知觉统一。正如本文开头所言,媒介不再作为“人的延伸”,而成为建构人之本质的“话语网络”。我们理应重返人自身之中,在感官的迷狂里寻找影游融合的新美学。