基于语料库的商务听证会语域特征多维度分析
——以Facebook的联合听证会为例
2018-10-08杨璘璘广东行政职业学院
杨璘璘广东行政职业学院
钟伶俐湖南涉外经济学院
【提 要】多维分析法能有效地在6个话语功能维度上区分听证会英语和COCA(Corpus of Contemporary America English)通用英语的显著性差异。同时,该方法能基于67个词汇语法特征进一步揭示语料的微观语言特征差别。从话语功能上看,商务听证会语料体现出更高的交互性、较强的劝说性和较多的使用即时信息;而通用英语语料则表现出更强的信息性和显著的叙事特征。基于多维分析法可以更为客观地揭示听证会语言是如何实现信息澄清、印象管理、公关危机应对和树立企业形象等多种话语功能的。
1.引言
2018年4月10日,Facebook的CEO扎克伯格参加了美国参议院司法和商务委员会的联合听证会,被全面问询数据隐私和虚假信息等问题。一家企业的CEO在参议院出席听证,且有近一半美国联邦参议员参加,这在听证会的历史上实属罕见。因此,该听证会在全球引起广泛关注。听证会作为一种行政和立法程序的制度,其形式、效用和意义等均得到了学界的广泛研究。然而,听证会作为一种独特的口语体裁,却很少得到话语分析学者的关注。听证会中听证陈述人和听证人围绕既定的主题经过陈述、提问、回答和辩论等环节,以达到澄清事实、消除疑惑和达成共识等目标(江先贞2015:12)。因此,听证会应该具备Bhatia提出的“interdiscursivity”(语篇互类性)的特征,即同时具备信息传递、劝说等语篇功能(Bhatia 2010:32-50)。
相比起立法和行政领域的听证会,Facebook作为一个企业,其CEO扎克伯格本次所参加的联合听证会则更多体现了商务行为,如企业公关危机的应对。通过听证会,扎克伯格需要消除各界对公司是否尊重数据隐私的疑虑,重新建立用户对Facebook的信心和忠诚度,巩固Facebook在社交软件媒体行业中的地位。5个小时的听证会后,扎克伯格顶住了各议员的“狂轰乱炸”和“百般刁难”,Facebook的股价上涨了4.5%,相当于帮facebook赚了150亿美元,而扎克伯格的个人财富也增加了28亿美元(南哥2018)。由此看来,Facebook此次听证会收到了较好的效果,实现了既定的目标。正如Austin所提出的“Speech Act Theory”(言语行为理论),通过听证会这一“locutionary act”(言内行为)最终成功地产生了“perlocutionary act”(言后行为)(苗兴伟1999:25-29),即一定程度上改变听众对Facebook的负面和敌对的态度。因此,本文将采用多维度分析法对比分析Facebook听证会全程语篇与COCA美国当代语料库中的部分语篇在6个语篇维度和67个细化语言特征上的显著性差异,以揭示听证会这一独特的口语体裁是如何通过语言这一利器实现其多种语篇功能的。
2.多维度分析法
多维度分析法(Multidimensional Analysis,简称MDA)又称多维度多特征分析(Multidimensional Multi-feature Analysis)是由美国语料库语言学家Douglas Biber在其博士论文中首次提出,后经完善为其专著《口语及书面语间的语域变异》于1988年出版。MDA的本质是一种研究语域变异的量化分析方法,重点在于比较不同语域(如新闻文本和小说文本)之间在多个语言维度上的差异(Biber 1984)。正如 Halliday(1988:162)所言,“语域是一系列相互联系的、共现频率高于随机概率的语言特征”。所以,隶属于不同语域的文本在多个语言维度上总会呈现出或多或少的差异。相比以往单一或少量特征的语域对比研究,MDA在技术和统计指标上实现了前所未有的突破,首次实现了可以同时对数十个语言特征指标进行观察和量化分析(McEnery&Hardie 2012)。Biber对比了 LIC(London-Lund Corpus)英语口语语料库和LOB(the Lancaster-Oslo/Bergen Corpus)英语书面语料库,提取了67个语料特征,包含了词汇特征(如名词化)、句子特征(如各种从句的使用频率)、时态特征(如被动语态和不同时态的使用频率)、情态特征(如不同情态的使用频率)和语义或语用特征(如模糊语的使用频率)等。同时,计算这67个特征在所分析语篇中出现的标准化频率(以每1000词换算)并进行探索性因子分析。最终Biber根据每一个语言特征的因子负荷和共性,得到了6个因子,即6个维度(Biber 1988)。如在学术语篇中,名物化和被动语态这两个特征均比较常见,因此可以将他们都归入“信息性”这一维度。每一个语言特征在语篇中的因子分(factor score)用Z分数(Z score)来表示,以实现不同语域之间各个语言特征的比对(Biber 1988)。
Biber提出的维度概念是数据与语言学分析的有机结合,是语域差异系统化和数据化的体现。需要指出的是维度并非二分的两极,二是一个连续系统,任何语篇都处在维度两极的某一个点上。同时,语言特征与维度之间的关系是通过自下而上的计算系统发现的,而不是按照一定的既定标准进行归类的(江进林、许家金 2015:226)。因此,多维度分析法是一种典型的探索性研究方法。每一个维度的得分是通过计算维度内正载荷特征和负载荷特征之差而获得的。如以维度5为例,正载荷特征指的是具有高度抽象功能的语言特征,如名词化的使用;而负载荷特征恰好相反,体现的是语篇的形象性,如定语形容词的使用等(Biber 1988)。
多维分析已被广泛运用于多个领域的语域特征挖掘和分析。Sardinha(2014:81-105)运用该方法对比分析了网络语篇(网页、博客、邮件、社交媒体文本)和非网络语篇的多维度语言特征,发现这两种语域在许多语言特征上是一致的,如网络语域中的博客与非网络语域中的新闻评论相似;然而,这两种语域也存在着一些差异,最大的差异体现在网络语域中的社交媒体语篇(Twitter和Facebook)与非网络语域中的对话语篇(面对面交谈和电话交谈)在人际距离这一维度上存在很大的差异。Souza(2014:177-193)利用多维度分析法对Time进行了历时的语篇分析,并基于统计结果得到两个因子以很好地体现Time所刊登文章的语域变化,即从以叙述和提供信息为核心的语域逐渐转向为以观点讨论和人际关系建构为核心的语域。同时,分析了这种语域转变的影响因素,如编辑团队的更换、美国经济的变化等。潘璠(2012:220-232)采用多维度宏观和微观分析相结合,以揭示中国英语学习者书面语语料库与LOCNESS(the Louvain Corpus of Native English Essays)之间的语域差异,发现中国学习者语料库在交互性和说服性维度得分较高,而其它维度如信息性、叙事性等都偏低。上述研究体现了多维度分析法在共时、历时语体对比和外语教学中的应用成果。然而,已有研究以书面语为主,鲜有研究者将多维度分析法运用于“听证会”这一特殊的口语体裁中。同时,以往研究主要关注所分析语域的语言特征,较少关注语域的语用功能和非语言因素。因此,本文将运用多维分析法对Facebook听证会语篇和COCA通用英语笔语和口语语料进行对比,以揭示听证会语域的凸显性语言特征和多语篇功能。这将加深学界对商务语域的认识,同时对企业管理和危机应对也有一定的现实意义。
3.研究设计
3.1 研究问题与研究语料
本研究旨在回答以下问题:1)相比起COCA书面语语料库和COCA口语语料库,听证会语篇在多维度分析框架中的六个维度和67个语言特征中有哪些显著性差异?2)听证会语篇是如何通过凸显性的语言特征来实现其语篇功能的?3)听证会语篇中的听证演讲语篇和听证问答语篇是否存在语域差别?
本研究将Facebook将近5个小时的联合听证会视频运用“YouTube Transcription”工具进行文字转写,并进行人工校对,确保所转写文字的准确性。听证会语篇分为两部分,扎克伯格的开场陈述演讲和问答环节,共47,687词。
本研究用作对比的语料库是美国通用语料库COCA的节选,为保证两个语料库库容量的大小接近,分别节选15个笔语文本和15个口语文本。其中,笔语语料共53472词,出版于1990—2012年,具体包含4个子语域:学术、小说、杂志和新闻;口语语料共59,168词,转录于1990-2012年的口头交际录音。
3.2 研究工具
本研究采用Nini(2014)开发的多维标注与分析工具 Multidimentioanl Analysis Tagger 1.1(MAT)。该系统可以准确和自动完成Biber(1998)多维度分析全过程,包括文本标注、特征提取并最终统计出6个功能维度和67个语言特征的得分等。该软件使用的内嵌词性赋码工具是在“斯坦福词性赋码器”的基础上进行优化的。Nini(2014)分析比对了MAT工具和Biber(1988)两种方法所得的结果,从而验证了MAT工具达到很高的效度和信度。
4.结果与讨论
4.1 听证语料库VSCOCA书面语料库
使用MAT对语料进行处理后,会对文本进行自动词性标注以及报告各类赋码在每个独立文本中出现的频率(按每千词计算),并将结果存放于“ST_文件名中”,可供研究者对各类词形的使用频率和规律进行进一步的分析。在此基础上,MAT还对每个文本中出现的各种语言特征进行标注和计算频数标准分(Z Score),结果存放在“MAT_文件名中”。此外,MAT还会报告所分析文本的维度标准分,并根据Biber(1988)所架构的语域类别,以确定当前所分析语料文本所属的语域类型(Closest Text Type),结果同样是存放在“MAT_文件名中”(梁茂成2016)。
由于MAT所报告的得分均是经过标准化处理的数据,因此可以进行相关的统计分析。笔者使用SPSS对听证会语料和COCA语料的维度分进行独立样本t检验。结果显示,两个语料在六个维度上均存在着显著性差异(见表1)。
表1 听证英语和通用英语笔语语料库的维度差异t检验
图1 听证英语和通用英语笔语语料库的维度差异
如图1和表1所示,两个语料库在维度1上区别最大,其中听证会语料在该维度的得分远远高于COCA通用书面语料的得分。这一结果表明听证会语料是高度互动、讨论对话式的文本;而COCA通用书面语料则体现出较强的信息性,以单方面的信息呈现为核心的交际目的。这是因为听证会现场是以问答的形式开展的,双方有很多交流互动甚至是争锋相对的讨论。扎克伯格需要用较多的劝说性和协商性的语言,以获得听众的信任和认可。这一特点在维度4也得到了验证,听证会语料的得分为正值,而COCA通用语料库维度4的得分为负值,可见听证语料有较强的观点表达和劝说引导性的语言特征。这是因为无论是扎克伯格还是听证会的议员均需要通过语言明确的表明自己的立场和观点,如议员需要通过明确的问题导向表明对事件的各种疑虑和不满,而扎克伯格则需要通过澄清劝说性的语言表明企业对事件的态度和处理方案。在维度6上,听证会语料的得分也高于通用书面语料库,表明听证会是在一种有较大时间压力下即时产生的一种语域类型。虽然议员提问环节有可能事先准备好问题,但是在表达上也会更加呈现出即时性特征。同样,扎克伯格有可能事先预测各种提问并准备相应的回答,可是依旧会根据议员现场的提问、气氛和交际效果做出即时的调整,已达到预期的交际目的。而在维度2上,听证会语料的维度分值却显著低于通用英语语料,因此对事件的叙述并非听证会的典型特征。可见在听证会上尽管双方是围绕所发生事件展开的,但是双方的重点均不在于对事件本身的描述,而在于对事件本质、影响以及解决等思辨性问题的探讨。同样在维度3上,听证会语料的维度分值也明显低于通用英语语料,这同样证明了听证会语域的情境依赖性特征,其语言特征和交际策略的选择受现场情境的约束比较大。由于是面对面的听证,因此决定交际效果的不仅仅是话语本身,还包括面部表情、语音语调、肢体动作等副语言因素。最后,听证会语料的维度5得分也低于通用语料,表明听证会语篇在用词难度、专业度和正式程度上均低于通用语料。这是因为听证会的受众群体十分广泛,Facebook的在线注册用户已超过10亿,涉及不同文化背景、社会阶层和教育程度。因此,为了确保听证会有较好的传播效果,并没有使用过多的专业和正式词汇。综上所分析,MAT软件最终得出语域类型结果,即听证会属于互动性较强的劝说型(Involved Persuasion)语域,而通用英语属于一般叙述说明型(General Narrative Exposition)语域。
4.2 听证语料库VSCOCA口语语料库
为了进一步挖掘听证会语料更为细致的语域特征,我们将听证会语料分为两个部分,即扎克伯格的演讲部分和扎克伯格与议员的问答部分。MAT分析显示这两个部分均属于互动性较强的劝说型(Involved Persuasion)语域,但是在六个维度上的得分仍有差异。我们将听证会语料以及其两个组成部分分别于COCA语料中的口语语料进行MAT结果的比对分析,结果显示COCA语料中的口语语料也属于互动性较强的劝说型(Involved Persuasion)语域,但在不同维度上的得分同样呈现出差异。其中,听证会整体语料在6个维度上与COCA口语语料存在显著性差异,演讲语料则在维度1-5上与COCA口语语料存在显著性差异,而听证会的问答语料则除了维度3外均与COCA口语语料存在显著性差异。
在维度1上,听证会语料要比COCA通用口语语料更具有交互性,尤其是问答环节。由于听证双方聚焦共同的话题和焦点,相比起话题更为宽泛和多样化的日常口语语料,体现出更多的聚焦性和话题性。在维度2上,相比起听证会语料,COCA通用口语语料更体现出叙事性特征,可见听证会并非以叙述事情的经过为主线,更多聚焦的是透过现象看本质,以挖掘事件的核心属性。在维度3上,两个语料均体现出较强的语境依赖特征,但是相比之下COCA口语语料语境依赖更为明显。这也印证了维度1和维度2的得分差异,即COCA口语语料因涉及更为广泛的话题,因此交流双方更依赖交流语境以更好的解读意义。而听证会语料,由于话题较为集中,交流双方可以有更多的独立性和思考性,相对而言对语境的依赖程度则降低了。在维度4上,听证会语料的劝说性要高于COCA通用口语语料,可见听证会这一口头交流形式有着影响他人思想、劝说他人接受某些事实和观点的明显特征。劝说性特征最为明显的是扎克伯格的陈述演讲,通过在演讲中加强劝说型语域特征,以获得议员的信任和支持,以减少问答环节双方的争锋程度。维度5表明听证会语料库和COCA通用口语语料库均未使用过多的抽象信息词汇,而是以具体的、形象词汇为主,以加强双方交流的互动性和建立起同理心理。然而,听证会语料的抽象程度还是显著高于COCA通用口语语料。这主要是由于听证会语料话题的明确性决定的,通常讨论明确性的话题双方更容易开展更为深入的探讨。其中,扎克伯格的个人演讲抽象程度最高。在维度6上,尽管即时性是口语交流的显著性特征,听证会语料的即时性特征要显著高于COCA口语语料,尤其是听证问答环节,而演讲环节的即时性得分是最低的。这也表明扎克伯格的单独演讲是经过了深思熟虑且多次修改的,现场发挥改动的痕迹较少。而问答环节,由于有众多的议员提问,且问题均比较尖锐,扎克伯格很难完全预计到他们的提问,因此大多数为即时性信息阐述。
表2 听证英语和通用英语口语语料库的维度差异t检验
图2 听证英语和通用英语口语语料库的维度差异
4.3 具体语言特征对比
听证会语料和COCA通用书面语料在6个维度上的得分差异提供了宏观的语域比对信息,若要进一步揭示究竟是哪些具体的语言特征构成了这种语域差异则需要对67种参与多维分析的语言特征进行更为细致的观察和比较。研究发现听证会较多(Z分数大于2)使用分裂不定式(如when they’re trying to actually use them…)、指示代词和指示语(如that,this,these,those)、不定式、that从句作形容词补语(如 I’m concerned that Facebook’s profitability rests on...)、普通并列(如 I mean,the core thing that Facebook is,and all of our services...)、that引导关系从句(在从句中做主语)(如We need to build a tool that allowed people to sign in to an app...)和非限制性定语从句(如We are going to help us improve the security of the platform overall,which is why we did this)。通过独立样本t检验对比听证会语料和通用英语笔语语料中的语言特征,发现具有显著差异的特征为61个(达到91%)。表3列出了10个差异最为显著的特征。
第一、听证会语料较多使用从句,尤其是that引导的从句,体现出听证会语料的口语表达特征。另一方面从句可以将零散的信息浓缩和连接起来,体现出较强的逻辑性。其中,That引导关系从句(在从句中做宾语)的使用频率远远高于COCA通用英语,以达到对所描述对象的强调,引起听众的注意力,如例(1)。同时,也体现听证会语料库的较强语境依赖性特征,交流双方需要基于具体的语境,对信息做出准确的解码。因此,也证实了多维度分析的优势、效度和信度,维度上的宏观语域特征可以在更为具体微观的语言特征中得到验证。
表3 听证英语和通用英语语料库中差异最大的10个特征
指示代词 2.46 -0.23 .000 2.69不定式 2.16 0.02 .000 2.14 that从句作形容词补语 2 0.29 .000 2第二人称代词 1.68 -0.27 .000 1.95普通并列 2.04 0.53 .000 1.51联合短语 0.11 1.59 .000 1.48 that从句作动词补语 1.17 -0.25 .000 1.42
(1)I want to show you the terms of service that Aleskandr Kogan provided to Facebook and note for you that,in fact,Facebook was on notice that he could sell that user information.
1.2.2 哮喘预测指数(API)评判[3] 在过去1年喘息≥4次,具有1项主要危险因素或2项次要危险因素即为API阳性(API+)。主要危险因素包括:①父母有哮喘病史;②经医生诊断为特应性皮炎;③有吸入变应原致敏的依据。次要危险因素包括:①有食物变应原致敏的依据;②外周血嗜酸性粒细胞≥4%;③与感冒无关的喘息。
第二、听证会语料使用的不定式表达多于通用英语,以明确听证会双方各自的立场和加强文本的劝导性功能。如例(2)和例(3)分别表明了听证会议员提问的针对性和扎克伯格对事件处理的明确性,均是为了更好地实现双方不同的话语功能。同时,不定式也常用于表示将来时,多用于陈述对事件将要采取的行动和解决方案,如例4。通过树立Facebook有能力解决这一危机的印象,以重新取得用户对Facebook的信任和支持。
(2)Would you agree that users should be able to acess all of their information?
(3)So here are a few things that we are doing to adress this and to prevent it from happening again.
(4)And,if we find that someone improperly used data,we’re going to ban them from Facebook and tell everyone affected.
第三、听证会中的第二人称代词多于COCA通用英语。第二人称you和your词汇的使用很好地体现了听证会语料的互动特色,以实现听证双方更为有效和直接的交流。例(5)取自听证会议员的提问,连续用三个you,直指Facebook的CEO扎克伯格。通过营造一种咄咄逼人的气势,给予扎克伯格施加压力,以获得更多可靠的信息。例(6)取自于扎克伯格对议会成员提问的回答,同样用了四个you,体现了很好的现场反馈和处理效果。与听证语料相比,通用语料中更倾向于使用she,he,they,it等第三人称代词,体现出更强的叙事和描述性特征,如例(7)。同时,以COCA书面语料作为参照语料库检索听证会语料库的主题词也发现,he,her,his和its都是属于主题缺失词(negative keywords),表明听证会语料是很少使用第三人称这类客观的叙述性和信息性语言特征的。因此,这一语言特征验证了听证会语料在维度1和维度2得分低于COCA通用语料的结果,即体现出更强的互动性和非叙事性。
(5)How will you protect users’data?How will you inform users about the changes that you are making?And how do you intend to proactively stop harmful conduct instead of being forced to respond to it months or years later?
(7)Keane appeared to be advocating affirmative action for Hawaiians when he was quoted as saying that he hoped to replace McCloskey with a“lei women”.
第四、听证会语料更多使用指示词、指示代词和普通并列。相反,通用英语则大量使用联合短语,以实现信息浓缩和表达复杂语义的话语功能,在维度上则体现出一定的抽象性,如例(8)。这也回答了为什么通用语料在维度5抽象性这一指标的得分会高于听证会语料。
(8)When companies become big and powerful and accumulate a lot of wealth and power, what typically happens from this body is there’s an-there is an instinct to either regulate or break up.
5.结语
本文创造性地将多维分析法运用于商务听证英语语料和通用英语语料的语域对比分析中。结果表明,多维分析法可以较为高效地区分听证会语料、通用英语笔语语料和通用英语口语语料的语域差异和显著的语言特征差异。总体而言,听证英语语料体现出更强的交互性(如多用第二人称代词和that引导的从句)、较强的劝说性(如多用动词不定式)和即时性(如多用人称代词);然而,通用英语笔语语料则彰显出更为明显的信息特征(如多用联合短语)和叙事性(如多用第三人称代词和动词过去时)。进一步研究表明超过91%的语言特征在两大语域中存在显著差异,共同作用于语域的差别。这与江进林和许家金(2015:225-236)就商务英语和通用英语的语域比较的结论基本一致。因此,商务听证语域可以被视为商务英语这一大语域的一个子语域,具有非常明显的互动性较强的劝说型语域特征。
在进一步的比对分析中,笔者发现听证会英语语料和COCA的口语语料均属于互动性较强的劝说型语域,但两个语料库在6个维度上仍然存在一些维度的显著性差别,尤其是我们将听证会语料分为演讲语料和问答语料分别进行比对时差异更为明显。首先,从听证会演讲语料到听证会的问答语料就发生了语域的转变,如听证会演讲语料呈现出交互性较弱、更注重叙事信息的传递、语境更为独立,显性劝诱特征更为明显、信息更为抽象和较少使用即时信息阐述等特点。其次,与COCA口语语料库相比,同为及时交流的口语语料,听证会完整语料呈现出更强的交互性,更多使用非叙事性信息、语境依赖特征更为明显、更强的显性劝诱、更多使用抽象信息和即时信息等特点。同时,正是这些语域特征实现了听证会这一特殊语域的话语功能,澄清大众对Facebook信息泄露事件的众多疑惑,重新树立Facebook的企业形象。这些更为细致的子语域特征的比较以及语篇功能的分析,体现了本文的研究价值。
本文的不足之处在于听证会语料库容量较小,今后可以补充更多的听证会语料,以更好地揭示听证会语域这一特殊文体的语言特征。同时,本文借助Biber既定的67个特征,缺少对所研究语域语言特征的客观提取,因此结果具有一定的局限性。今后研究可考虑对所研究的语料重新进行因子分析并提取相应的功能维度,以提高研究结果的信度和效度。