APP下载

中外博士学位论文英文摘要的多维度对比分析∗

2022-01-26谢群马媛媛

外语学刊 2021年4期
关键词:代词语料库母语

谢群 马媛媛

(黑龙江大学,哈尔滨150080;吉林大学公共外语教育学院,长春130012)

1 引言

“除标题外,读者在文章中首先阅读的部分通常是摘要,这也是决定读者是否继续阅读的关键部分。”(Hyland 2004:63)同时,摘要索引是读者检索文献的重要工具,因此摘要撰写的质量直接影响到论文的检索率(王华2020:50)。本文借助Biber 提出的多维分析法,从6 个维度对比中国英语学习者和母语者语言学专业博士学位论文英文摘要的语域风格和语言特征,以便于学术英语教师和博、硕士生等对中外博士学位论文摘要的语言特征有深入的了解,为学术英语写作教学提供参考。

2 多维分析法

Biber(1988)基于LLC 英语口语语料库和LOB英语书面语语料库,根据67 个语言特征的共现情况对其降维处理并提取出7 个功能维度,各个维度具有不同的交际功能,用于预测口语与书面语的语域差异,称为多特征/多维度分析法(multi⁃feature/multi⁃dimensional analysis,MF/MD)。在7 个维度中,维度七仅含一个语言特征,解释力不够强,所以在多维分析法中通常只选取前6 个维度展开分析。Biber 通过一般线性模型计算前6 个维度的预测力,结果显示这6 个维度能够有效地预测口笔语之间的差异。本文参照Biber(1988)研究,只选取前6个维度展开分析。每个维度中一般含有因子载荷为正值(简称正载荷)和因子载荷为负值(简称负载荷)的语言特征,正载荷与负载荷在很大程度上呈互补性分布。“这些共现特征一起使用是因为它们起到同样的功能。”(Biber 1988:91)因此,正载荷共现具有的交际功能与负载荷恰好相反。例如,在维度一中,指示代词、第一人称代词和非限制性定语从句等因子载荷为正,它们共现使文章呈现出交互性。而名词和定语形容词等这些负载荷共现使文章呈现出传达信息的交际功能。

3 相关研究综述

“在运用多维分析法展开分析时,有两种基本的分析方式,一种是完全分析,对语料库进行因子提取生成特定的维度。另一种方式是不做新的因子提取,将不同的语体投射到Biber 提出的原有维度上。”(Sardinha 2014:90)第一种研究方式的优点是可以根据所选语料的特点提取出适合于区分自身语料的功能维度(Hardy,Romer 2013等)。基于提取出新的维度,研究者可以继续拓展研究范围,使研究具有系统性(Hardy,Romer 2013;Hardy,Friginal 2016;Cao,Xiao 2013;肖忠华曹雁2014)。采取第二种研究方式的主要做法是以Biber 提出的维度为基准,将研究对象投射到Biber 的维度中,以此判断研究对象的语言风格或与其他语域对比。国内研究较多采用第二种研究方式,如:本科生与硕士生对比(潘璠2012),中外期刊论文摘要对比(张一宁等2018),4 个学科期刊论文的历时变化(姜峰2020)等。虽然运用多维分析法探讨学术英语写作的研究大量涌现,但其研究对象侧重于议论文、期刊摘要等,对博士学位论文英文摘要关注不足,因此本研究在一定程度上对博士学术英语写作教学具有参考价值。

4 研究设计

根据研究的需要,笔者自建含有200 篇博士学位论文英文摘要的学术英语语料库,共132,763 词。其中中国博士学位论文语料库CCPS(Corpus of Chinese Ph.D.Students)包含100 篇中国外国语言学及应用语言学专业的博士学位论文英文摘要,共97,032 字,均从中国知网(CNKI)下载。本族语者博士学位论文语料库CNPS(Corpus of Native Ph.D.Students)包含100 篇由研究领域为语言学的英语母族语者撰写的博士学位论文英文摘要,共35,731 字,均从欧美博硕士学位论文数据库(ProQuest)下载。中国博士学位论文语料库的字数多于母族语者语料库,但MAT 软件标准化处理数据,在一定程度上能够确保研究的可比性。

研究步骤如下:首先,将其转换为txt 格式并逐一人工校对,确保与原文一致。其次,借助Nini(2015)开发的Muitidimensional Analysis Tagger 1.3(MAT)软件分析。该软件内嵌“斯坦福词性赋码器”(Stanford POS Tagger),能够对文本自动赋码标注,对赋码后的文本统计并自动生成每个文本的67 个语言特征分以及维度分。最后,将结果导出并使用SPSS 软件对其进行独立样本t 检验,计算两个语料库在各个维度上以及不同语言特征的使用上是否有显著差异。借助Ant Conc 软件观察索引行,结合具体实例分析二者在语言特征上的区别。本文的研究问题为:(1)中国学习者与母语者在6 个维度中是否有显著差异;(2)中国学习者与母语者具体在哪些语言特征上有显著差异。

5 结果与讨论

同一维度中因子载荷为正、负的语言特征呈互补分布,若维度分为正,说明该维度中因子载荷为正值的语言特征出现频次较多,而因子载荷为负值的语言特征出现频次较少,维度分为负则语言特征分布正好相反。

MAT 软件结果显示两个语料库均被归为学术说明型(learned exposition)语域,该语域的文本属于典型的正式的信息说明文,旨在传递信息。如表1所示,中外博士论文摘要在维度一到维度五上的维度分同为正值或负值,二者在前5 个维度上类型一致,均呈现出信息性、非叙述性、指称明晰性、信息抽象的特征,未呈现出显性劝说的特征。在维度六上正负值相反,母语者呈现出即席信息组织精细度,但中国学习者未出现该类特点。在前4 个维度中,学习者的维度分均高于母语者,当二者所属一个类型时,分值绝对值越高则该项语言风格越明显,如维度一中,学习者呈现出更强的信息性。

表1 中外语料在6 个维度上的差异

通过独立样本t 检验对两个语料库对比,发现中外语言学博士论文英文摘要在维度一、维度三和维度六中有显著差异,这与张一宁等(2018)对中外语言学类高被引期刊的研究结果不同。该研究中中外作者在6 个维度中均未出现显著差异。引起这一差异的原因可能是核心期刊中作者英文水平较高,更熟悉学术体裁的语言规范,所以二者仅在部分语言特征使用上存在显著差异,而中外学习者学术写作能力不同,因此其博士论文摘要虽然所处维度相同,但在3 个维度中却呈现出显著差异。本研究将根据各维度中语言特征的差异展开分析和解释(仅列举具有显著差异的语言特征)。

5.1 维度一:交互性与信息表达性

在维度一中,维度分为正值,倾向于交互性特征,反之则倾向于信息性特征。中外语料的维度分均为负值,都呈现出较强的信息性,独立样本t检验结果显示,二者存在显著性差异(p =.000 <0.05),中国博士论文摘要信息显著强于母语者,且中外学习者共在11 个语言特征的使用上存在显著性差异。

第一人称代词在交互性较强的文本中出现频次较高。“表达作者自我的人称代词是提高自身学术身份和使别人接受自己想法的重要方式。”(Hyland 2012:153)母语者使用第一人称代词显著多于学习者。通过检索,发现两个语料库中的差异主要体现在人称代词I 和we 的使用上,I 在母语者语料库和学习者语料库中分别出现224 次和14 次,we 分别出现34 次和173 次。中国学习者更倾向于使用复数we 隐藏自我,提高文章的正式程度。“这可能是越来越多的二语写作者被教导在学术写作中消除显性的自我,影响他们的修辞实践。”(同上:150)所以第一人称使用中更倾向于使用we,而母语者更倾向于使用I 来凸显主体意识和作者身份,承担较高的问责风险。

表2 在维度一中的语言特征差异

母语者在现在时态、WH 词引导宾语从句和指示代词使用上显著高于学习者。“WH 词引导宾语从句提供讨论问题的方式。”(Biber et al.1999:107)相对于这种讨论问题的方式,学习者更倾向于使用特殊疑问句提出研究问题。指示代词用于直接文本指称(同上:349),包括this,that,these,those,可用于前指或回指,指代单词或句子等。Halliday 和Hasan 认为“在语篇中某个成分的解释依赖于另一个成分时就产生了衔接”(Halliday,Hasan 1976:4)。指示代词是使文本衔接性更强的一种方式,使用指示代词替代名词或文章片段对文章的形符比产生影响,这也可能是母语者使用名词的频率低于学习者的原因之一。

学习者在强势语、非限制性定语从句和特殊疑问句3 项的使用上高于母语者,前两项用于增强感情和增加评论,特殊疑问句多用于提出研究问题,使读者了解文章内容,引起读者的好奇心,是与读者互动的有效策略之一。中国学习者更倾向于使用这一策略,可能是受到国内学术规范要求的影响,从而形成程式化的写作模式。

名词是文本中指称意义的基本承载者,名词的高频出现代表着信息的密度较高(Biber 1988:104)。名词、形容词、平均词长和形符比都用于精确具体地详述信息,增强摘要中的信息浓度,中国学习者在这4 项语言特征中均显著高于母语者,所以在维度一中展现出更强的信息性。“形符比比值越大理解词汇所花费的认知心理过程越长。理解这些不同的词汇时读者需要不断地根据语境进行编码和解码来理解词义。因此,语篇的难度相对就越大。”(刘辉2015:118)学习者在展现信息性的同时,忽略文本的易读性,避免晦涩难懂。

5.2 维度二:叙述性与非叙述性

在维度二中,中外博士论文摘要的维度分都为负,呈现出非叙述性的特点,不存在显著差异(p =.131 >0.05)。独立样本t 检验结果显示,学习者和母语者在第三人称代词(.002)和公共型认知动词(.028)的使用上有显著差异,在过去时态(.712)、完成时态(.138)、合成性否定(.471)、现在分词短语(.113)这4 个语言特征的使用上差异较小。

第三人称代词具有较强的叙述性,学习者较多使用第三人称代词,用于指代文本或指向事件参与者,说明作者预设与读者共享该信息。在例①中,作者在该句中使用3 次第三人称代词指代前文中的Chinese,American and Korean writers,用于详细叙述他们共享同样身份的原因,支撑第一句的论点。学习者更倾向于使用第三人称代词替代双方已知信息。

①Chinese,American and Korean writers share the common identity as scientists.They are fully ...in their abstracts is extremely low in Coh⁃Metrix scores,which shows the community of their profes⁃sional identity.(CCPS)

“公共型认知动词的功能是间接地陈述言语行为”(Biber 1988:109),包括admit,assert,de⁃clare,say 等。该类动词用于表达作者观点,能够与读者互动,有助于读者明确作者的立场。母语者使用公共型认知动词显著多于学习者,在母语者语料库中,该类动词按照出现的频次排列依次是argue,suggest,write,explain,predict 等。观察索引行发现,主要用于I argue that/it is argued 等表达上,母语者以第一人称明确申述个人观点,突出作者研究主体,使摘要具有更高的可信度,同时也在积极推销自己的研究成果。

5.3 维度三:指称明晰性与情境依赖型指称

中外博士论文摘要在该维度中的维度分均为正,呈现出指称明晰的特点。独立样本t 检验结果显示,学习者指称明晰性显著强于母语者(p =.000)。中国学习者与母语者在联合短语(.000)、介词前移的关系从句(.007)和副词(.014)的使用上存在显著差异,其他语言特征使用相对平衡(WH 词引导关系从句(在从句中作宾语)(.351)、WH 词引导关系从句(在从句中作主语)(.299)、名词化(.329)、地点状语(.148)、时间状语(.340))。

WH 词引导的关系从句在从句中作主语、作宾语以及介词前移的关系从句,这3 种形式都被认为是明确详细地识别文本中的指称的工具(Bi⁃ber 1988:110)。中外博士在前两种形式的使用上相差无几,而母语者对介词前移的关系从句的运用显著多于学习者。母语者更擅长运用从句将信息压缩到句子中,读者通过引导词理解其文内指称,从而增加文本的易读性。此外,母语者更擅长使用副词加强语气。MAT 软件对文本标注时,如果and前后连接两个相同词性的词,便标注为联合短语,学习者运用大量联合短语将信息组合成短语和句子。联合短语、名词化以及关系从句的频繁共现表明指称明晰性较强的话语信息性更强。

②In the verbal domain,I argue that the O⁃form is an incipient marker of nominal agreement which functions to license null pronouns in certain contexts.This proposal explains the observation that TPM appears to permit extraction of non⁃subject ar⁃guments,a fact which runs contrary...(CNPS)

在例②中,两个which 有明确的文内所指,母语者运用which 将大量的信息整合到该段中,使文章信息丰富。而学习者使用短语较多,对关系从句的运用能力有待提高。

5.4 维度四:显性劝说型表述

中外博士论文摘要在维度四中的维度分均为负,说明二者没有呈现出显性劝说的特征,独立样本t 检验结果显示二者无显著差异(p =.057),母语者在需要情态和说服性动词两个语言特征的使用上显著高于学习者。

“需要情态和说服性动词标志着说话人尝试劝说听话人某事是可取的或可能的。需要情态用于直接劝说。”(同上:148,150)二者在说服动词上的得分均高于需要情态,说明二者都倾向于使用更为间接的方式劝说读者。但母语者在这两个语言特征上均显著高于学习者,对读者的劝说程度更强。需要情态包括ought,should,must.“must体现内在‘允许’和外在‘必要性’。”(韩力张德禄2019:40)母语者使用must 显著多于学习者,这与以往的研究结果相反。可能是受到学术体裁的不同、语言水平的提高等多个因素的影响,国内博士生在摘要中通常避免使用must 这类强迫性较强的情态词。通过观察索引行,母语者使用must 主要用于对自身研究理论或研究思路的确信,给读者以更强的说服力。

表3 中外学习者在维度四中的语言特征差异

5.5 维度五:信息抽象与具体程度

中外博士论文摘要在该维度中的维度分均为正,呈现出抽象信息的特征,独立样本t 检验结果显示二者无显著差异(p =.754),但学习者在过去分词短语的使用上显著高于母语者。

表4 中外学习者在维度五中的语言特征差异

“该维度将信息性话语标记为具有抽象的、专业的和正式的特点。”(Biber 1988:112)二者的语言均呈现出抽象性,具有正式书面语的特点。该维度交际功能的实现多依赖于使用被动语态,被动语态注重对客观事实的描述,不注重强调动作的实施者。

③Based on Attitude system,this study...Then,based on theory of...(CCPS)

④Formulation,proposed by the enthnometho⁃dologists Garfinkel and Sacks in the 1970s...(CCPS)

中国学习者在过去分词短语的使用上多于母语者,如例③和例④所示,学习者使用过去分词介绍研究的理论基础。其中based on...句式占比达到学习者语料库中过去分词短语的一半之多,这可能是受到汉语摘要的影响,通常中文摘要中以“本文基于xx 理论”这一句式介绍研究理论,所以学习者在英文摘要中通常将其直接翻译为based on,从而大多数学习者形成这样的写作范式。

5.6 维度六:即席信息组织精细度

在维度六中,学习者的维度分为负,而母语者的维度分为正,呈现出相反的交际功能,根据独立样本t 检验的结果显示二者有显著差异(p =.000)。在该维度中,除that 从句作形容词补语(.149)外,其他语言特征都存在显著差异。

表5 中外学习者在维度六中的语言特征差异

母语者的维度分是2.5226,接近Biber(1988)研究中的即兴演讲(spontaneous speeches)在该维度的得分。“维度六表示对信息的详述是在有时间限制的情况下完成的,通过增加从句片段式地呈现信息,而不是以将信息囊括在较少的词汇和句子中这样完整的方式来详述。”(同上:113)在例⑤中,作者使用and 连接两个that 从句,不断补充argue的内容,结构较为松散。

⑤Second,it argues,on the basis of detailed case studies,that affix⁃exodus is no less natural a change than affixgenesis,and that both are types of common morphosyntactic changes...(CNPS)

从句用于补充信息,也用于表达个人或群体的态度和观点等。例⑥中,作者使用第一人称代词明确表达自己的观点,that 引导的宾语从句用于详细说明具体内容。在维度二中,我们也发现母语者语料库中较多出现I argue that/it is argued等句式,用于传递个人情感,表明个体态度。

⑥Instead,I argue that modals as being more closely related to...(CNPS)

“指示代词是这种未经计划的写作方式中重要的衔接手段。”(同上:114)所以母语者在较多使用从句的同时也依赖于指示代词实现语篇衔接连贯的目的,这也同时解释为什么在that 从句作动词补语、that 引导的定语从句以及指示代词的使用上母语者均显著多于学习者。在写作中较多使用that 引导的从句是美国学生的修辞习惯。因此,形成这一差异的原因可能是受到母语者修辞习惯的影响,使其表现出匆忙完成的特点,而学习者在英语写作时经常反复修改,从而呈现出相反的语言风格。

6 结束语

本研究基于Biber 提出的多维分析法对比分析中外博士学位论文中的英文摘要,研究发现:除维度六外,二者在维度一到维度五中都具有相同的交际功能。独立样本t 检验结果显示,中国学习者在信息性和指称明晰性方面显著高于母语者,母语者呈现出受到时间限制完成写作的特点,通过增加从句片段式地呈现信息。在语言特征的使用上,中国学习者在摘要中通过大量使用名词、形容词等使摘要的信息性更强,但型次比高可能影响易读性。对研究主体的呈现较为模糊,倾向于使用we 指代作者,承担风险的责任意识较低。过多使用联合短语和第三人称,指称清晰性强但对关系从句的运用能力较低。受中文摘要翻译的影响,对过去分词短语的使用较多,更倾向使用特殊疑问句直接提出研究问题。母语者较多地使用指示代词、现在时态、WH 词引导宾语从句,旨在增强文本的连贯性;较多地使用需要情态和说服性动词,劝说性强于学习者,在摘要中更倾向于以第一人称代词和公共型认知动词明确表达自己的观点;使用that 从句补充信息较多使文章倾向于匆忙完成的特点。虽然中国学习者在大部分语言特征上能够与母语者持平,学术英语写作教学中仍需重点关注具有显著差异的语言特征,帮助学生调整写作思路,提高学术英语写作的能力。

猜你喜欢

代词语料库母语
基于语料库翻译学的广告翻译平行语料库问题研究
母语教育:从美出发
这样将代词考分收入囊中
运用语料库辅助高中英语写作
分析母语在高校英语教学中的地位
英语代词用法练习
论《远大前程》的语言特色及其母语迁移翻译
语料库与译者培养探索
人称代词专练