APP下载

中美作者英语科技论文的语篇衔接对比——一项基于Coh-Metrix的研究

2017-11-06吉蒙蒙郭爱萍

浙江外国语学院学报 2017年5期
关键词:连接词语篇语义

吉蒙蒙,郭爱萍

(太原理工大学 外国语学院,山西 太原 030024)

中美作者英语科技论文的语篇衔接对比——一项基于Coh-Metrix的研究

吉蒙蒙,郭爱萍

(太原理工大学 外国语学院,山西 太原 030024)

文章采用Coh-Metrix计算机评估方法,选取中美作者英语科技论文“方法”部分建成语料库,分别从连接词、词汇衔接及情景模型构建三个维度对语篇衔接进行了多维考察。结果表明,连接词使用总数上,中美作者不存在显著差异,但中国作者使用的逻辑和转折连接词显著少于美国作者;词汇衔接方面,两者在利用潜在语义关系来增强语篇衔接性方面不存在显著差异,但美国作者使用的词干重叠和相邻句子间的论元重叠显著多于中国作者;情景模型构建上,两者不存在显著差异。总体来说,与美国作者相比,中国作者在英语科技论文逻辑连接词、转折连接词、词干重叠和相邻句子间的论元重叠等显性衔接的运用上比较欠缺。

科技论文;语篇衔接;对比研究

一、引言

英语科技论文是科技工作者进行国际学术交流的重要手段。由于科技论文的专业性、技术性和抽象性,“高衔接的科技文本更易于理解”[1]228。衔接手段在语篇理解中具有重要作用,可以使语篇表意更明确、逻辑更清晰、语篇更连贯[2]。根据Graesser等的观点,语篇理解包括五个层面:表层、文本层、情景模型层、体裁及修辞层、语用层[3],而衔接特征最直接地体现于文本层和情景模型层[4]。文本层“捕捉”文本的显性信息,而情景模型层反映文本的深层意义[5]。

早期,Halliday & Hasan将衔接分为词汇衔接和语法衔接两个类别[6]。2002年,Louwerse提出了两种新的分类方式:一是将衔接分为局部衔接和整体衔接;二是从衔接的来源进行区分,如连接词包括增补连接词、时间连接词和因果连接词等[7]。这两种分类方法对于分析科技文本的语篇衔接具有重要作用[8-9]。但是这些衔接理论只能指导对科技论文显性衔接特点的考察,而衔接包括显性衔接与隐性衔接两个层次[10]。与显性衔接聚焦表层形式上的连接不同,隐性衔接通过句与句之间含而不露的语义关系来呈现深层意义上的连接。虽然唐咏雪和夏伟蓉发现较多使用隐性衔接是科技论文英文摘要的一个语篇特点[11],但现有文献对如何通过隐性衔接手段实现语篇衔接以及情景模型层面的衔接有何特点研究不够。

随着计算机技术的发展,一种新的文本分析软件Coh-Metrix开始运用于衔接分析,它能自动测量多种表层及深层语言特征,突破了过去只能对衔接进行表层或文本层分析的局限[12-13]。在Coh-Metrix中,文本层的衔接手段包括连接词(connectives)和指称衔接(referential cohesion),情景模型层包括潜在语义分析(Latent Semantic Analysis,简称LSA)和情景模型(situation model)构建[4,14]。这四类指标不但囊括了Halliday & Hasan等提出的衔接手段,而且扩展到了对文本深层衔接或隐性衔接的考察。当前,作为语篇衔接特点及差异研究的重要工具,Coh-Metrix在国内对英语科技论文的研究中运用得还很少。Ye[15]虽然比较了中美作者英语科技论文摘要的语言特征,发现中国作者在指称衔接和情景模型上的得分比美国作者高,但未说明具体的指标参数。因此,本文以中美作者英语科技论文“方法”部分为语料,采用文本自动检索工具Coh-Metrix提取文本层和情景模型层的衔接数据,考察中美作者英语科技论文在连接词、词汇衔接和情景模型构建上的异同,以期为中国学者撰写更具衔接性的英语科技论文提供建议,为跨文化背景下的科技论文写作及学术交流提供借鉴。

二、研究方法

(一)衔接分析工具和指标

本研究以Coh-Metrix3.0为工具考察科技论文衔接特征。据设计者介绍,开发Coh-Metrix 的初衷就是为了测量文本的衔接特征,最新的Coh-Metrix3.0版分析系统可提供106项语言特征的量化指标。根据本研究的需要,我们选取与衔接相关的20项指标,归入连接词、词汇衔接和情景模型构建三个维度,以分析英语科技论文的显性衔接和隐性衔接特点。

其中,六项连接词指标反映文本的显性衔接特点,增补连接词、因果连接词、时间连接词、转折连接词、逻辑连接词和各类连接词总体频率由Coh-Metrix3.0自动计算并产出以每千词为基准的标准化频率。

词汇衔接维度同时涉及显性和隐性衔接特点,因为它包括呈现词汇间语义互指性的指称衔接和考察语义相似性的潜在语义分析,前者属于显性衔接手段,而后者属于隐性衔接手段[12]。指称衔接是文本中相邻句子或所有句子间的词汇重叠,相邻句子间的指称衔接反映文本的局部衔接情况,所有句子间的指称衔接反映整体衔接情况。Coh-Metrix3.0能够测量四类指称衔接,包括名词重叠、论元重叠、词干重叠和实义词重叠,各类指称衔接数值在0到1之间,数值越大,语义互指性越强,文本越衔接。潜在语义分析得出句子间语义相似性的余弦均值。如果两个句子的语义相似性余弦值接近1,则表明两个句子有较大的语义相关性,它们讨论的是相似或同一命题,句子间较衔接[16]。已知信息的使用是有效的语篇衔接手段[17]。Coh-Metrix3.0还提供了可以反映文本新旧信息衔接的指标:文本中已知信息和新信息的比值(LSA given/new),这一比值越接近1,说明已知信息越多,文本越衔接。

情景模型维度反映文本的深层语篇衔接,即隐性衔接。“它的产生是由于对语言使用的描述中还加入了可能世界、时间、地点、语用因素、语言使用者状况等信息单元,如果我们用语篇基础表示语篇(语言使用的产物)的内涵(意义),那么情景模型即成为语篇的(中介)外延,在语篇生成和理解的宏观语用描述过程中,情景模型具有更强的解释力。”[18]1“因果性、目的性和时间性是信息类情景模型构建的关键”[19]167,Coh-Metrix3.0主要通过这三项指标统计情景模型层面的文本衔接。其中,因果衔接通过因果连接词和因果动词的比率(ration of causal particles to causal verbs)、目的衔接通过目的连接词和目的动词的比率(ration of intentional particles to intentional verbs)、时间衔接通过文本中时态的一致性(tense and aspect repetition)来体现。

(二)语料收集

本研究的语料选自建筑领域的权威期刊CementandConcreteResearch,该刊是SCI来源期刊,2015年影响因子为3.48,选取范围为该刊2001年第1期到2016年第9期。本文在选取语料时遵循以下两个原则:1)为保证中美语料的作者分别是中国二语作者和美国一语作者,统筹考虑了作者的国别、机构和姓名;2)为保证语料撰写体例的一致性,所选语料均明确包括摘要、引言、方法、结果和讨论、结论五个部分。经筛选,共获得102篇语料,其中中国作者语料52篇,美国作者语料50篇。

“方法”部分是论文结果和讨论以及结论部分的重要支撑,同时也是作者引导和“控制”读者的重要手段[20]。“该部分内容表述是否清楚,语篇衔接性是否良好会影响到读者的理解和实验方法的验证以及重复使用。”[21]575因此,本文从有效论文中选取“方法”部分,经过转换、整理和文本清理,自建了中美作者英语科技论文“方法”部分的语料库,将其分别命名为中国作者语料库(Chinese Speaker Corpus,简称CSC)和美国作者语料库(Native Speaker Corpus,简称NSC)。

(三)数据分析

笔者采用Coh-Metrix3.0对两个自建语料库进行了检索,得出数据。之后,使用SPSS17.0进行描述性统计分析,并对通过正态分布验证的CSC和NSC数据进行了独立样本T检验。

三、结果分析与讨论

(一)CSC和 NSC的描述性分析

在篇数相近的情况下,CSC的总词数、平均句子数和平均词数均少于NSC(见表1)。

表1 CSC和NSC基本信息的描述性统计

总词数和平均句子数反映的是文本的总体详细程度和复杂性[22]118。表1数据显示,中国作者英语科技论文的总体详细度和复杂性低于美国作者。类符形符比反映词汇的多样性,它与文本长度有关,文本越长,这一数值可能越小[23]。NSC中的文本总体较长,所以类符形符比较小。中国作者英语科技论文的类符形符比高于美国作者。已有研究表明,一些高水平的二语作者能够使用多样的词汇,因而文章呈现出高水平的词汇多样性[24-25]。词汇使用比较丰富多样,也意味着词汇重叠的机率比较小,为了便于读者对文本的理解,加强衔接性十分必要[26]。中国作者英语科技论文在总体详细度和复杂性上不及美国同行,这可能与中国作者是非本族语使用者,受有限的词汇知识和语法知识制约有关。

(二)连接词使用对比

连接词的作用在于标记文本各片段间的逻辑关系,合理得当地使用连接词有助于提高文本的衔接性[12,27]。CSC和NSC连接词使用频率统计结果见表2:

表2 CSC和NSC连接词使用频率对比

“方法”部分需要阐明实验步骤和具体过程,连接词使用不足有可能给读者理解实验过程带来困扰。从表2可以看出,总体上,CSC中连接词的出现频率(82.78)稍高于NSC(80.00),但两者差异未达到显著水平(P=0.248>0.05)。

连接词使用类型上,中美作者之间既有共性又有差异。从表2可以看出,CSC和NSC中增补连接词的出现频率都最高,且CSC(38.99)略高于NSC(36.70),但两者差异未达到显著水平(P=0.184>0.05)。因果连接词在两个语料库中的出现频率(28.07,28.76)都仅次于增补连接词,相对较高,但中美作者并没有显著差异(P=0.665>0.05)。上述现象表明,增补连接词和因果连接词在促进中美两国作者科技论文语篇的衔接上均具有重要作用。时间连接词上,CSC(13.79)和NSC(14.80)较为相近,不存在显著差异(P=0.396>0.05)。这是由于“方法”部分的实验过程按一定时序发生。对于描写事情出现先后顺序的时间连接词,中美作者在认知上是基本一致的。然而,在逻辑连接词和转折连接词的使用频率上,CSC显著低于NSC(P=0.004<0.01,P=0.000<0.01)。

“语言是思维和文化的载体,人类语言普遍现象的个体差异折射出不同文化和思维方式的差异。”[28]118受逻辑思维差异的影响,一语作者和二语作者在连接词的使用类型上确有不同。Reynolds[17]发现,二语作者在因果连接词的使用上比一语作者少。他认为,这可能与二语作者比较依靠叙事思维有关。逻辑连接词表明句子间“是”“非”和“或”的关系,中美作者逻辑连接词使用频率的差异性反映了中西思维的差异[29]12。西方人注重实证性思维,强调概念的准确性;中国人注重意向性思维,用词比较委婉含蓄并且较少用逻辑推理去论证观点。除了表达相反的意义,转折连接词还具有统领、解释、增补、延伸和总结等功能,例如however、although等。但中国作者对转折连接词的理解基本停留在表达相反意义的层面,缺少使用转折连接词表达其他功能的意识,因此,转折连接词的使用频率显著低于美国作者。

(三)词汇衔接特征对比

词汇衔接体现的是一种语义上的衔接[6],而“英语篇章中的语义衔接保证了文章的连贯性及其可读性”[30]507。CSC和NSC指称衔接和潜在语义分析使用情况见表3和表4。

表3 CSC和NSC指称衔接使用情况对比

注:0.45表示45%的相邻句子存在名词重叠,其他以此类推。

从表3可以看出,在实词重叠上(包括相邻句子间和所有句子间),CSC和NSC之间基本一致。但在名词重叠、论元重叠和词干重叠上,NSC的数值均大于CSC,而且在相邻句子论元重叠、词干重叠,以及所有句子词干重叠三项指标上,CSC和NSC之间的差异达到显著水平(P=0.012<0.05,P=0.011<0.05,P=0.012<0.05),说明美国作者比中国作者更擅长运用论元重叠和词干重叠来增强科技论文句子间的语义互指,从而增强文本的衔接。

在论元和词干重叠的使用频率上,中国作者低于美国作者,这可能有两个原因:一方面,汉语是孤立语,不存在像英语一样的构词手法[31],所以汉语衔接中没有论元重叠和词干重叠这样的语义衔接方式。相反,英语是屈折语,其词汇的构成方式主要是派生法或词缀法,即以词根为中心,通过添加前缀或后缀的方式来构成新词。论元和词干通常可以作为词根。所以美国作者更善于用论元和词干重叠的方式来增强句子的衔接。另一方面,作为非本族语使用者,中国作者受有限词汇深度和广度的影响,对论元重叠和词干重叠的掌握不如美国作者。

表4 CSC和NSC潜在语义分析(LSA)使用情况对比

相邻句子间LSA和所有句子间LSA分别体现了语篇的局部和整体衔接情况。独立样本T检验结果显示,CSC和NSC在这两项指标上均不存在显著差异(P=0.271>0.05,P=0.503>0.05)。表4数据还显示,在已知信息与新信息比这一指标上,CSC和NSC的数值基本一致。词汇所蕴涵的语义关系对实现语篇衔接的深层功能具有重要意义[32]。从语义相似性对比数据来看,中美作者在利用语义关系来增强语篇衔接性方面不存在显著差异。

(四)情景模型构建对比

CSC和NSC情景模型构建对比即因果衔接、目的衔接和时间衔接对比情况见表5。

表5 CSC和NSC情景模型构建对比

独立样本T检验结果显示,中美作者在因果衔接、目的衔接和时间衔接方面均不存在显著差异(P=0.394>0.05,P=0.698>0.05,P=0.383>0.05)。这验证了人类认知的共性,即人类对事物之间的因果、行为的目的和事件发生的顺序的认知方式具有一定规律性,而且这种方式共同存在于人类认知机制里,是人类最基本的认知方式,但这种认知共性的深层特征和具体形式还值得探索,本文仅提供了三个维度的体现方式。

四、结论

本文使用语篇分析工具Coh-Metrix,从连接词、词汇衔接和情景模型构建三个方面考察了中美作者英语科技论文语篇衔接的异同。结果发现,两国作者在隐性衔接的运用上不存在显著差异,潜在语义和情景模型构建基本一致。但在逻辑连接词、转折连接词、相邻句子论元重叠和词干重叠等显性衔接的运用上,中国作者显著弱于美国作者。

这些发现提供了三点启示:第一,中国作者在英语科技论文写作中需要平衡各类连接词的使用,特别是恰当地选用转折连接词和逻辑连接词,使论文写作更接近一语作者。第二,中国作者在运用各类词汇重叠来增强语篇衔接时,要注意英汉语言的差异,除使用名词重叠和实词重叠等衔接手段外,还要掌握和运用论元和词干重叠等“地道”的语义衔接方式。第三,中国作者在写作时应尽量克服语言和思维差异的影响,使得论文在表层和深层上都具有衔接性,这样才能写出“纯正”的英语科技论文。

总之,为顺应学术全球化的趋势,提高学术论文的国际融入程度,中国作者在撰写英语科技论文时,要关注中英文衔接方式上的差异,逐步消除差异,以便更好地促进自身科技成果的推广。当然,受语料样本规模的制约,本研究结果有待进一步验证。

太原理工大学外国语学院张冬梅为本研究语料收集提供了帮助,特此感谢。

[1]Ozuru Y,Dempsey K,McNamara D S. Prior knowledge,reading skill,and text cohesion in the comprehension of science texts[J]. Learning and Instruction,2009,19(3):228-242.

[2]李舰君,陈艳红,杨传鸣. 语篇衔接理论在英文摘要中的应用[J]. 东北农业大学学报:社会科学版,2013(5):57-62.

[3]Graesser A C,Millis K K,Zwaan R A. Discourse comprehension[J]. Annual Review of Psychology,1997,48(1):163-189.

[4]Graesser A C,Mcnamara D S. Computational analyses of multilevel discourse comprehension[J]. Topics in Cognitive Science,2011(3):371-398.

[5]Van Dijk T A,Kintsch W. Strategies of Discourse Comprehension[M]. New York:Academic Press,1983.

[6]Halliday M A K,Hasan R. Cohesion in English[M]. London:Longman,1976.

[7]Louwerse M. An analytic and cognitive parameterization of coherence relations[J]. Cognitive Linguistics,2002,12(3):291-315.

[8]陈蓉. 基于语料库的科技英语论文引言的衔接特点研究[D]. 呼和浩特:内蒙古大学,2012.

[9]李秋玲. 从准确性、清晰性、简洁性和衔接性角度分析英语科技论文[D]. 武汉:中国地质大学,2014.

[10]牛保义. 隐性衔接论[J]. 外语教学,1998,19(3):1-5.

[11]唐咏雪,夏伟蓉. 科技论文英文摘要中逻辑衔接的运用分析[J]. 云南民族大学学报,2009(6):154-157.

[12]梁茂成. 学习者书面语语篇连贯性的研究[J]. 现代外语,2006(3):284-292.

[13]杜慧颖,蔡金亭. 基于Coh-Metrix的中国英语学习者议论文写作质量预测模型研究[J]. 现代外语,2013(3):293-300.

[14]Plakans L. Cohesion features in ESL reading:Comparing beginning,intermediate and advanced textbooks[J]. Reading in a Foreign Language,2016,28(1):79-100.

[15]Ye D M. A Coh-Metrix analysis of language varieties between the journal articles of Chinese and American scientists[J]. International Journal of English Linguistics,2013,3(4):63-70.

[16]桂林. 基于计算机评估的L1和L2作文词汇水平对比研究[J]. 外语教学与研究,2010(6):445-450.

[17]Reynolds D W. Learning to make things happen in different ways:Causality in the writing of middle-grade English language learners[J]. Journal of Second Language Writing,2002,11(4):311-328.

[18]熊学亮. 情景模型理论评介[J]. 国外语言学,1993(4):1-7.

[19]Zwaan R A,Radvansky G A. Situation models in language comprehension and memory[J]. Psychological bulletin,1998,123(2):162-185.

[20]Bazerman C. Shaping Written Knowledge:The Genre and Activity of the Experimental Article in Science[M]. Madison:University of Wisconsin Press,1988.

[21]Ecarnot F,Seronde M-F,Chopard R. et al. Writing a scientific article:A step-by-step guide for beginners[J]. European Geriatric Medicine,2015,6(6):573-579.

[22]刘辉. 学术论文方法部分词汇的比较研究——以学科性为考察维度[J]. 外语学刊,2015(2):116-121.

[23]McCarthy P M,Jarvis S. MTLD,vocd-D,and HD-D:A validation study of sophisticated approaches to lexical diversity assessment[J]. Behavior Research Methods,2010,42(2):381-392.

[24]Grant L,Ginther A. Using computer-tagged linguistic features to describe L2 writing differences[J]. Journal of Second Language Writing,2000,9(2):123-145.

[25]Jarvis S. Short texts,best-fitting curves and new measures of lexical diversity[J]. Language Testing,2002,19(1):57-84.

[26]McCarthy P M. An assessment of the range and usefulness of lexical diversity measures and the potential of the measure of textual,lexical diversity (MTLD)[D]. Memphis:University of Memphis,2005.

[27]Graesser A C,McNamara D S,Louwerse M M,et al. Coh-Metrix:Analysis of text on cohesion and language[J]. Behavior Research Methods,Instruments,& Computers,2004,36(2):193-202.

[28]崔林,成晓光. 学术论文中动词性据素使用情况的英汉对比研究[J]. 大连理工大学学报,2014(2):115-119.

[29]王玉英,张莲. 汉英语篇指称衔接对比一例[J]. 解放军外国语学院学报,2006(6):8-12.

[30]胡合元. 从文学作品看英语篇章中的语义衔接[J]. 山东社会科学,2015(S2):507-509.

[31]李丹弟. 语用化视域下英汉构词缀化对比研究[J]. 中国外语,2015(4):38-44.

[32]Vollmer H. Textual coherence:Basics of textlinguistics,seminar[D]. Osnabrück:University of Osnabrück,2002.

AContrastiveCoh-MetrixAnalysisofTextualCohesioninEnglishScientificPapersbyChineseandAmericanWriters

JIMengmeng,GUOAiping

(ForeignLanguagesCollege,TaiyuanUniversityofTechnology,Taiyuan030024,China)

Applying a self-made corpus of theMethodsection in English scientific papers,this paper uses Coh-Metrix to contrast the textual cohesion devices used by Chinese and American writers from the dimensions of connectives,lexical cohesion and situation model. Results indicate that:1)there are significant differences in frequency of logical and adversative connectives,although their total number of connectives shows no difference;2)no difference is found in terms of latent semantic analysis,but American writers use more argument and stem overlap in referential cohesion;3)as for the construction of situation model,Chinese writers and their American counterparts have no significant difference. On the whole,the English scientific papers written by American writers are more cohesive than those written by Chinese writers,who performed poorly in explicit cohesion.

scientific paper;textual cohesion;contrastive study

H313

A

2095-2074(2017)05-0055-07

2017-07-04

吉蒙蒙(1993-),女,山西襄汾人,太原理工大学外国语学院硕士研究生;郭爱萍(1967-),女,山西太原人,太原理工大学外国语学院教授,博士。

猜你喜欢

连接词语篇语义
真实场景水下语义分割方法及数据集
连动结构“VP1来VP2”的复句化及新兴小句连接词“来”的形成
新闻语篇中被动化的认知话语分析
语言与语义
宾语从句的语序
批评话语分析中态度意向的邻近化语义构建
吸引阅卷老师的“连接词”
“吃+NP”的语义生成机制研究
从语篇构建与回指解决看语篇话题
语篇特征探析