基于视觉语法的多模态建筑术语库构建理据与路径
2023-09-26王海峰刘小青高金岭
王海峰 刘小青 高金岭
(山东建筑大学外国语学院,山东济南 250101)
0 引言
“一带一路”倡议要求建筑领域率先走出去,然而建筑领域走出国门的关键一步是突破专业领域语言障碍,实现建筑专业术语的科学统一,而后对外输出。术语是人类科学知识的语言投射[1],建筑术语的科学统一可以为对外输出中国建筑术语标准和传统建筑文化提供专业语言支撑。早在20世纪60年代,人们便开始探索术语库建设。使用术语数据库不仅能编纂各种自动化词典和索引,而且也可以实现一些传统术语工作的自动化,有效提升术语编纂工作的能力和效率[2]。随着计算机科学的发展,计算机技术和信息网络技术在术语学中发挥了重要作用,为术语数据库的建立提供了强有力的技术支撑[3]。经过几十年的发展,术语库对于语言学各个领域,例如二语习得、词汇学和句法学的发展起到了积极的促进作用。尽管术语库与翻译结合得十分紧密,但是国内外建筑领域相关术语库的建设还十分鲜见,尤其是国内多模态建筑术语库更是凤毛麟角。据研究,国内外现有建筑术语库的共同特点是规模小、模态单一、处理粗糙、用途单一等。意义的展现一大部分由非语言因素体现,单纯从语言角度不能对话语进行深入全面的分析和研究[4]。而建筑术语因表达需要不能仅仅局限于文字符号,而要转向多模态表达。Kress和Leeuwen[5]审视了图像传达意义的方式,认为视觉符号可以不依赖其他模态符号而展现各种事件和逻辑关系。有鉴于此,建设一个模态丰富的建筑术语库,为建筑领域提供专业化的术语大数据,为建筑术语的理论研究及建设提供理据与方法,进而探讨多模态建筑术语库的顶层设计理念和具体构建学理、路径及步骤,详述多模态建筑术语词条设计的宏观、中观和微观结构层面的研制与加工,对于构建中国建筑术语话语体系、中国建筑行业走出去将是一种有益的探索与尝试,从而促进中国建筑术语的国际传播。
1 国内外相关研究
1.1 多模态理论
模态是指人类跟外部进行互动的方式,用单个感观进行互动的叫单模态,用两个的叫双模态,三个或以上的叫多模态(Multimodality)[6]。Barthes是多模态话语分析最早的研究者之一,在1964年发表的论文《图像的修辞》(RhetoricoftheImage)中探讨了图像在表达意义上与语言的相互作用[7],但是当时并没有引起足够的重视。直到20世纪90年代,新伦敦小组(New London Group)最早提出了多模态这一概念,随后多模态研究迅速发展。Kress等提出了多模态构建符号转换行为的观点[8];Royce研究了不同符号在多模态话语中的互补性以及在第二语言课堂教学中多模态的协同性等[9];Kress对多元写作能力的理论进行了较全面的阐述[10];O’Halloran不仅研究了多模态的理论建构,还专门研究了数学语篇中的多模态现象[11-12];Jewitt将多模态研究区分为三个视角[13]:社会符号学分析[5, 14]、系统功能语法分析[12,15]和社会互动分析[16],这三个视角差异细微,但均属于社会功能分析[17]。另外还有两个重要的研究视角,即以认知隐喻理论为基础的多模态隐喻研究[18]和语料库语言学视角的多模态文本分析[19-20]。与此同时,国内多模态话语研究也在21世纪初如火如荼地发展起来:李战子进行了多模式话语的社会符号学分析[21];朱永生侧重于进行多模态话语分析的理论基础研究,并且对其研究方法进行了探究[22];顾曰国探讨了多模态语料库语言学方法[6];张德禄探索了多模态话语分析综合理论框架[4];冯德正从认知评价理论[23]、语篇分析[24]、多模态转喻与图像语篇意义建构[25]、英语课堂教学设计[26]进行了多模态研究;黄立鹤从语用学[27-28]、语料库语言学[29]、修辞学[30]、多模态研究范式及路径[31]着手进行了多模态探讨。
1.2 视觉语法理论的缘起与发展
视觉语法视角主要为多模态话语分析的发展奠定了基础,最早由Kress 和 Leeuwen在《读图:视觉设计的语法》中提出[5]。近年,国内视觉语法研究逐渐增多,李德志分析了广告类超文本多模态的视觉语法[32];冯德正基于图画书的视觉叙事分析框架,阐释了视觉语法的新发展[33];吴安萍和钟守满进行了视觉语法与隐喻机制的多模态话语研究[34];滕达和苗兴伟在视觉语法视域下对绘本语篇多模态隐喻的意义建构进行了探讨[35];王建华从语用学分析的角度阐释了视觉语法[36];陈冬纯和陈芝敏从儿童英汉绘本层面[37],刘丹从微电影广告隐喻构建层面进行了视觉语法分析[38]等。
1.3 术语库建设相关研究动态
20世纪60年代,术语库兴起于欧洲。欧洲共同体翻译公司为了建立一个能够有效处理信息来协助进行术语翻译的工具,进行了术语库研发。巴克拉克是术语库领域的先锋,为术语库的发展做出了许多有益的贡献。目前,国外比较著名的术语库有:欧洲共同体委员会术语库(EURODICAUTOM)、联合国多语言术语库(UNTERM)、加拿大魁北克术语库(BTQ)、西门子公司术语库(TEAM)、法国标准化协会术语库(NORMATERM)、德国语言管理局术语库(LEXIS)等。我国术语库构建起步相对于国外要晚一些。从20世纪80年代开始,我国陆续建立了各种不同类型的术语数据库,经过几十年的发展,例如术语在线、机械工程术语库、敦煌文化汉英术语库、京剧术语数据库、中国百科术语数据库、中国特色话语对外翻译标准术语库等各类各行业术语库层出不穷。同时,随着术语库研究的深入和各领域发展的需要,许多学者将视角转向专题术语库的研究。例如,郭龙生思考了如何构建应用语言学术语数据库[39];李文峰等致力于农业信息术语库系统的建设[40];李秀英结合术语与机器翻译的关系进行了实验分析,对术语数据库的构建进行了展望[41];杨福义阐述了大型术语库建设的实践与思考[42];郭剑思考了术语数据库的建设问题[43];曹丽慧等进行了农业机械化术语数据库移动客户端的应用研究[44]等。
1.4 研究述评
上述文献从多层面、多维度对多模态理论、视觉语法理论及术语库建设进行了全方位研究,为术语库的研究和构建提供了重要理论支撑。然而,从现有研究可以看出:(1)多模态理论研究涉及多模态话语分析、多模态隐喻研究、多模态文体学、多模态教学等,相比之下,多模态视域下的术语库构建研究十分鲜见;(2)术语数据库的研制路径大多囿于单模态文本层面,无法阐释视觉语法中的再现、互动、构图意义,缺乏对术语概念和客体描述的直观性,理论视角的创新研究不足。鉴于此,本文试图立足于多模态视角和视觉语法理论,对建筑工程领域的术语数据库研制进行探索;深入探讨应用术语学的内在运行机理,对建筑工程术语进行多模态化、可视化、信息化的挖掘呈现。
2 基于视觉语法的建筑术语多模态理据分析
模态是指交流的渠道与媒介,包括语言、技术、图像、颜色、音乐等符号系统,判断多模态话语时,首先看涉及的模态种类多少,其次看涉及的符号系统数量[22]。在视觉语法视角下,建筑术语在表达的过程中,除了文本模态,往往需要引入其他模态和符号系统进行表达,其中以图像信息符号最为常用。随着信息技术的发展,图像在当代社会占有越来越重要的地位[45],它通过视觉模态进行表征,受众通过视觉符号把握图像的意义。视觉语法认为,视觉符号可以再现客观世界里的客观事件并反映个中逻辑,而且还能从中判断出形形色色的人际关系。基于韩礼德(Halliday)所述的系统功能语言学中的三大元功能:概念功能、人际功能和语篇功能[46],Kress和Leeuwen认为“视觉语法将描写所描绘的人物、地点和事物如何组成具有不同复杂程度的视觉的‘陈述’”,因而提出了图像分析集中于分析图像所隐含的再现意义、互动意义和构图意义[5],如图1所示。
图1 视觉语法与多模态建筑术语分析
从再现意义层面来看,建筑术语图像能够还原术语所指的意义、术语表述的概念、术语的客观本体。图像中的元素之间形成斜线(通常为强烈的对角线)就形成矢量——叙事图像的标志,图像参与者被矢量连接起来即再现了其中事件的发生[21]。根据图像中是否存在着连接参与者的矢量,图像的再现可分为叙事再现和概念再现,概念图像中不存在矢量。概念再现过程能够对应功能语法中的关系过程和存在过程,相比叙事再现而言,其受时间因素的限制更少,更加稳定,能够表现为更概括的真理和持久的状态。本研究的多模态建筑术语VR的中英双语标注图(图2),依托选景、色彩等元素展现出建筑类型、建筑结构和术语释义,它能表达概括的、稳定的、没有时间限制的概念,而不存在由动作发出者的动作、眼神或目光构成的矢量,没有矢量指向目标的这样一个动作过程。建筑中英术语图像能够客观还原建筑物的类别、结构和颜色等,还能再现建筑物与环境统一的和谐关系。
图2 多模态建筑术语VR中英标注图(基于720云的在线标注)
从互动意义层面来看,图像可以使观看者和图像世界之间形成特定的关系从而实现与观看者的互动,这种互动意义的实现取决于三个要素:接触、距离和视点。其中图像可以根据“接触”这一要素分为“索取”和“提供”两个图像种类。“索取”指画中人与观看者有直接视线接触,似乎在向观看者索取什么,从而与他们建立起一种想象中的关系[47]。“提供”是指两者没有这种想象中的接触,一个客观展现信息,一个客观接受信息。“距离”在图像当中表现为框架尺寸,例如中英标注的建筑术语全景图给人一种威严感和距离感,而室内具体建筑构件的中英术语标注图给人一种参与感和归属感,并体现出交互感与沉浸感,凸显了建筑术语的注释性和可读性。“视点”与“距离”相似,平视、俯视和仰视角度拍摄的建筑图像带来的视觉体验是不一样的。情态也是互动意义的重要组成部分,其基于色彩的饱和度、区分度和调谐度,能反映图像的真实度,正如黑白图像总是不如色彩饱和的图像更能真实表现事实。建筑术语借助图像的形式展现给受众,受众通过图像来理解术语,图像既是术语的呈现方式,也是受众的信息渠道。笔者在多模态建筑术语库的建设中普遍使用“提供”类图像,考虑互动意义的三大要素和情态要素,选择图像时考虑互动意义。
从构图意义层面来看,信息值(information value)、显著性(salience)和取景(framing)是构图意义的三种资源[8]。构图意义的建立基础是图像中的再现意义和互动意义相互整合,以某种方式映射出一个有意义的整体。多模态建筑术语的信息值体现为图像元素通过不同的放置结构来提供特定信息,例如在展现建筑术语“榫卯”时,榫卯位于图像中心,为图像主体,是术语信息理想化或概括性的实质。榫卯图像不仅仅是“现实”的复制,也与现实世界的人与物联系,反映其构成及其在建筑中的作用,从而实现图像的价值(如图3)。显著性是指图像元素因比重、色调等因素而对观看者注意力产生的不同吸引程度。像建筑、建筑学等抽象的术语,多模态性并不十分显著,而像榫卯、斗拱这种具象的术语,多模态性赋值较高,通过某种形式展现,显著性也较高。具象的建筑术语效果图在呈现时根据术语所指选取不同位置、相对尺寸、色彩对比以引起用户注意就反映了这种显著性。取景是指用线条等构图手段来连接或割裂图像中的不同成分。在分析构图意义时,应该把多模态的语篇看成整体进行分析,其不仅适用于图片,也适用于多模态语篇的布局,在多模态建筑术语库的页面呈现方面同样适用,如图3所示,榫卯的图像展示位于第一浏览顺位(左侧),受众当下就对该术语有了一个直观概念,右侧从上至下分别为榫卯的中英术语对、所属类型及国别、中英文释义及元信息出处、视频、超链接等编纂信息,这些信息的排版结构和字体区别都体现了页面的构图意义。
图3 平台建筑术语“榫卯”页面
3 多模态建筑术语库的研制方法及构建路径
基于视觉语法视角,构建多模态建筑术语库的目标旨在助力国家“一带一路”倡议和推进国外基础设施建设工程,探索传统建筑文化和中国建筑术语标准的输出新路径。其设计思路在不同层面体现为:首先,宏观层面上,基于视觉语法和多模态理论,以全国术语标准化技术委员会制定的《中华人民共和国国家标准:面向翻译的术语编纂(GB/T 18895—2002)》为指南构建多模态可视化的建筑术语库;其次,在中观层面,对术语进行科学收集、录入、存储、加工、标注,使之成为能够提供规范的目的转换词和检索功能的大数据库;最后,在微观层面,对录入的单个词条信息进行组织、编排,结合术语所对应的多模态信息进行可视化呈现。
3.1 建筑术语的模态内翻译指征
建筑术语作为一门专业领域内的“科学”语言,其取代了此前部分学科的弥漫性语言。与一般词汇不同,术语的独特之处在于其单义性,于建筑领域亦是如此。并且建筑术语具有系统性,术语间的内部关系自成体系,其和概念、所指之间存在互动关系(如图4)。一系列结构化、具有相互关系的概念系统和经过整理规范的术语系统,能够构建起整个领域的知识系统[48]。传统建筑术语翻译用文字所指表征术语,通常属于模态内翻译;而使用图像能指来表征术语的形式不多见,模态间翻译的模式使用很少。随着信息技术在建筑行业的不断渗透,计算机科学逐渐改变了传统术语工作的方法和内容,人工智能使术语工作少了许多繁杂的过程。
图4 建筑术语的概念、术语、所指关系
3.2 建筑术语的模态间翻译表征
术语库又称为自动化词典[49],其中包含术语、术语翻译和术语相关信息。多模态建筑术语库也包含这三个模块,术语是建筑专业领域海量的数据实体,术语翻译是建筑术语的标准译文和科学释义的规范表达,术语相关信息包括和建筑术语相关的图片、音频、3D动图、AR/VR虚拟仿真图像、建筑模型等。根据语言学家Jacobson概括,翻译可以分为语内翻译、语际翻译和符际翻译[50]。多模态建筑术语库的研制实践囊括以上三类翻译类型。语内翻译发生在同一语言内,即“改变说法”,多模态建筑术语库中反映为对术语的科学释义;语际翻译发生在两种不同语言之间,是严格意义上的翻译,反映在多模态建筑术语库中就是对术语的准确翻译;符际翻译是指用非语言符号翻译语言符号,或者用语言符号翻译非语言符号,比如用手语翻译日常对话,反映在多模态建筑术语库中即是用图像或者音视频等符号表征建筑术语。一个建筑术语概念可以用多个图像表达,而一个图像中隐含的建筑相关信息,却不是几个概念或文字所能完整表征的,这是建立多模态建筑术语库的根本立脚点。
3.3 多模态建筑术语库建设的实践路径
本研究在对术语库进行结构设计时,分为宏观结构和微观结构。宏观结构是术语库的一般结构及其提供词汇单位的方式,微观结构是对术语词条的处理及内容的安排。本术语库构建宏观结构方面的问题包括:如何选择术语的排列原则(分类原则),如何确定术语库的主要结构和术语组合处理原则。本术语库构建微观结构方面的问题包括:每一词条内部编纂信息单位如何选取,如何组织、编排词条内的信息以及使用什么样的体例等。微观结构要件包括:录入参数、形式参数、词源参数、属性参数、诠释参数、联想参数、语用参数和配例参数[2]。
3.3.1 术语库设计
术语库设计阶段首先确定术语库类型及基本特征:收录术语类型、术语库用途、用户群体、术语库规模、运作系统、技术手段,还有术语库宏观结构和微观结构的设计等。本术语库是专业的建筑领域多模态术语库,有结构地对建筑术语信息进行组织,促进建筑术语库建设规范化。初步设定规模为10 000建筑术语对(词条),语言为中英双语,对于入库的每一条术语对都进行精细化加工,并进行多模态标注和呈现,依托计算机对输入的术语信息进行自动化处理,厘清术语信息要素之间的关系。具体宏观结构设计和微观结构设计见表1和表2。
表1 多模态建筑术语库宏观结构设计
表2 多模态建筑术语库微观结构设计
3.3.2 术语采集来源
采集术语时要求选择合适的术语,并进行预处理,这是术语标注的最基本工作,而权威的术语来源是术语库科学性的保证。本术语库采用全国科学技术名词审定委员会授权使用的《建筑学名词》作为术语来源,内容涵盖建筑类型、中外建筑历史、建筑教育和建筑设计等14个部分,共7461个词条,书中公布的名词是全国各科研、教学、生产、经营以及新闻出版等部门应遵照使用的建筑学名词。采集过程中充分利用该书的电子文本作为原始术语备用。
3.3.3 术语校对降噪
术语采集成功后,原始术语不能直接录入使用,而要有一个校对降噪的过程。录入时仔细校对其中是否有错别字、乱码、杂质以及前言、后记、注释、版权页等冗余信息。校对完成后,对术语进行降噪处理,然后利用EmEditor等软件去除多余的空格、空行、回车等格式,批量替换,最后将完成校对降噪的术语保存为TXT格式。
3.3.4 术语标注
术语标注体系是指对术语的加工程度,即待标注术语亟待填充的信息内容集合,这一集合能够决定术语标注的粒度[51]。术语标注有多种类型,包括元信息标注、词性赋码、语音标注等,需要选择合适的标注集。标注体系的划分应当合理,避免过粗或过细而造成术语内容不全面或者信息太过庞大等现象。多模态建筑术语库的术语标注中很重要的是元信息标注。元信息是关于信息的信息,指和术语有关的非语言信息,包括术语的外部信息和内部结构。本术语库基于建筑术语的特点和建库需要,事先制定标注规范,对建筑术语进行了多类型标注,包括文本类、手稿类、图解类、图标类、3D动态类、AR/VR虚拟仿真类、图纸类、BIM术语中英标注等8种,并且用户还可登录平台通过术语编辑器自行操作,输入文字标注、视频和网页链接等。在标注过程中充分考虑术语的复杂程度和一些不确定因素,不断完善修正标注规范。术语标注结构如图5所示。
图5 多模态建筑术语库术语标注结构
3.3.5 术语录入、存储
术语经过校对降噪和标注之后,再进行检查统计,由原始术语变成加工后的术语,使之符合术语录入的要求。加工后的术语由建筑专业人员进行审核、校对、录入、存储。海量的建筑术语数据实体、术语翻译和释义以及术语相关信息构成了最后的多模态建筑术语库组织。这一组织可以按照细分学科类别:轨道道路工程术语、桥梁隧道工程术语、建筑设计术语、建筑构造术语、建筑材料术语、建筑设备类术语等20余类建筑专业术语,在索引里进行词目编排,每个类别项目下中心词按字母表顺序排列,最终形成了有组织的多模态双语术语库。
3.3.6 术语检索
术语库平台内核是实现术语库系统的技术基础。本术语库在线检索技术基于PHP开发,数据库基于MySQL,并且支持通配符和离合模式匹配。用户登录平台网址后,在首页输入想要搜索的建筑关键词,就可以得到相应的中英术语对、中英文释义以及图片、图纸、手稿等上文提及的多模态标注资料,即可得到所搜索的建筑术语的系统信息。具体多模态术语库构建实践路径如图6所示。
图6 多模态建筑术语库构建实践路径
4 多模态建筑术语库应用
4.1 跨学科、超学科学术领域研究
多模态建筑术语库本身就是跨学科的产物,它融合了语言学科和建筑学科。语言学科涵盖术语学研究、建筑术语语义表达、语用表达、视觉语法表达、术语标准化等,而建筑学科又可细分为建筑设计、建筑构造等多个领域。跨学科研究旨在融合不同学科门类,学科之间实现齐头并进,取长补短。同时,跨学科研究可以整合研究方法、科研组织形式和人才培养方案等资源。超学科研究是多维度、多形态、多主体的,其立足复杂的实际问题引导基础科学和应用科学知识的网状聚合,超越原有的知识体系和范式,打破原有的学科边界[52]。多模态建筑术语库融合了多学科领域的研究成果,可以推动形成学科交叉融合,拓宽研究空间和研究视野,还可用于培养复合型学科背景的人才。
4.2 助力建立中国建筑术语标准体系、中国建筑术语标准输出
中国建筑艺术源远流长,它基于中国深厚的传统文化而有别于西方建筑文化。每个学科门类,尤其是新兴学科,不仅仅需要学科史的研究,也需要知识体系、术语体系的研究[53]。中国建筑术语是中国人民知识和智慧的结晶,建立中国建筑术语标准体系具有重要的文化价值和传承意义。而术语输出既要依靠科技事业的发展,也需要进行主动的战略筹划[54]。当今时代,大数据无处不在,它把世界、人类和信息联结在一起。客观世界存在的事物和信息能够转化成人类可获取的大数据形式,人们也可以将自己所掌握的数据信息输出到外界,这也是术语数据库的作用形式。术语的输出传播包含认知、语言等多个维度,多模态建筑术语库实现了术语的知识管理,可以在互联网时代助力于建立中国建筑术语标准体系和中国建筑术语标准的输出。
4.3 建筑术语的机辅翻译及翻译实践
海外工程项目的推进需要翻译的支撑,而翻译的实际效果在某种程度上也取决于术语和相关术语库的建设。在认知、语言和传播三个维度上,术语是知识体系和话语体系构建的关键要素[55]。一项研究的应用往往十分复杂,包含各个层面的不同属性。在计算机辅助翻译层面,多模态建筑术语库起到了至关重要的作用,其数据可以CSV格式的术语表导出,内嵌在翻译软件中作为一部自定义词典使用,从而提高建筑术语翻译的准确性、规范性以及协同工作时的统一性。此数据库还能提升建筑工程领域的计算机辅助翻译效用,促进建筑工程数据分析,助力建筑工程语言体系的建设,同时提升翻译质量和效率,促进建筑术语规范化。
5 结语
多模态建筑术语库的构建和应用研究是一项具有重要学术价值和应用价值的议题。术语检索与呈现的关键不应局限于追求“意义对等”,而应进一步关注术语词汇的科学性和可读性,甚至力求在超文本层面更具表达力。多模态建筑术语库在这一层面进行了有益尝试,在保证译文质量的基础上,结合多模态术语的可视化呈现来展现出建筑术语的科学美。期待学界今后在强大的科技支撑下,攻克一些术语库研发难关,不断丰富建筑术语的多模态呈现。同时,拓宽术语库的语言阈和应用阈,不断拓展研究空间,让多模态建筑术语库成为契合时代发展的产物,实现术语库的应用价值和学术研究价值。