APP下载

医学语篇常见搭配框的语义序列分析

2015-06-01张继东夏梦茹

厦门理工学院学报 2015年6期
关键词:介词语料库语篇

张继东,夏梦茹

(东华大学外语学院,上海 201620)

医学语篇常见搭配框的语义序列分析

张继东,夏梦茹

(东华大学外语学院,上海 201620)

基于Hunston的语义序列分析理论,以上海交大科技英语语料库(JDEST)的医学语料库为源库,对英语医学语篇常见搭配框 the*of,a*of和be*to的前后搭配词、中间搭配词进行归类分析,发现医学语篇搭配框的搭配词多涉及医学治疗、诊断、药物使用、医学研究过程、作用、评价等医疗过程和医学研究的词汇,搭配框架的语义是有规律可循的,更是受体裁影响的。英语学习者可以不同的语义序列区分不同的语类特征,以便于掌握医学语篇的语义特点和语篇特征。

医学语篇;语义序列;搭配框架;搭配词;语料库

语义序列(semantic sequence)是在普通语料库或专业语料库中有规则地出现的一系列意义成分[1]。语义序列强调意义相同,允许形式上有所不同,主要是研究意义成分序列,既可以在普通语料库中研究,也可以在专业语料库中研究。在普通语料库中,语义序列组成部分以实词为核心项,前面为意义一致的短语,后面为that从句、wh-从句或者是介词短语等。Hunston分析普通语料库的语法型式 to make sure,N that从句的语义序列[1],Halliday和Matthiessen研究“N that”,认为名词N体现that从句所需表达的命题,that在学科认识方面具有重要作用[2]。在特定学科的语料库中,语义序列一般以语法词为核心项。Gledhill分析生物化学学科论文中介词in的语义序列,得出结论介词in的高频语义序列是“生物过程”+“结果动词”+“测量方面的变化”+ in+“生物实体”[3]。总体来看,这些研究多以借助语法型式或语法词来探索语义序列,少有从搭配框架视角研究语义序列的。

搭配框架(collocational framework)是指由两个语法词组成的非连续框架,与框架组合的词为搭配词,搭配词的取舍很大程度由框架决定,它与框架之间存在着某种词义或功能上的关联[1]。国外存有一些关于搭配框架的研究,Renouf & Sinclair以《伯明翰英语文本集》为研究对象,提出了七个常见的搭配框,指出搭配框和搭配词的特定结构关联以及中间搭配词和框架之间的语义关联[4],Eeg-Olofsson &Altenberg总体分析London-Lund语料库的搭配框架和搭配词[5],Jose &Marco分析体裁对搭配词的限制作用[6]63,但是这些研究主要集中于搭配框中间搭配词的探索和分析,对前后搭配词的分析却并不多。本文以语义序列理论为依据,以JDEST医学学术语篇为语料,研究医学语篇中常见搭配框的语义序列,因篇幅有限,将集中探究 the *of,a*of,be*to的语义序列,分析他们的中间搭配词、前后搭配词以及三者之间的语义关联,揭示搭配框与语篇的关系、搭配框与搭配词的关系、搭配词与搭配词的关系以及医学语篇的语义特征。

一、研究方法

本文的语料来源于《上海交通大学科技英语语料库》的子语料库医学学术语料库,共57篇,形符为218 373,类符为10 201,标准类形符比(默认值为每1 000词)是33.37%。使用词块提取软件kfNgram[7],分别提取出the*of,a* of和be*to,统计各搭配框在该库中出现的形符频数和类符频数,并计算类形符比。运用Antconc分析软件具体检索这三类搭配框架及其搭配词的使用情况,对搭配词的研究,既包括中间搭配词,也包括前面和后面搭配词[8]。将搭配词的左右跨距设置为(L5-R5),且最小统计频数设置为5,中间搭配词只考察一词的情况,搭配词的文本覆盖率是至少在3篇文章中出现。

二、研究结果与分析

(一)the *of,a* of和be*to三类搭配框的基本情况

从表1可见,这三类搭配框出现的频数都比较高,搭配框的文本覆盖率为100%,说明这三类搭配框在每个篇章都有出现,是较为常见的搭配框架。分析高频的语法组合,能更好地凸显语篇的特征,有利于后期的语义序列的分析。此外,通过类形符比的数值可知,3个搭配框在对中间搭配词的选择上都具有一定的选择性,分别为7.68%、10.27%和6.20%,但a*of的选择性最高。这可能是因为以下两方面的影响:一方面是由于该搭配词多为名词,名词具有较高的“搭配倾向”[9];另一方面是因为本语料体裁为医学,文章中多数值性的叙述,如“a total of”“a number of”“a variety of”和“a range of”等。

表1 the*of,a*of和be*to搭配框的频数

(二)医学语篇the*of 语义序列分析

1.中间搭配词及语义分析

表2为医学英语中the*of的前20个高频的中间搭配词及其频数。其中很多词同Macro对医学语篇搭配框the*of的中间搭配词的分析结果是一致的,如:risk、prevalence、effect、presence、end、time、use、incidence、percentage等[6]68。

表2 the*of搭配框前20个高频中间搭配词

根据Macro对医学英语的分类方法,本研究将中间搭配词的语义分类为:(1)表示数量的词,如number、incidence、percentage、majority、size等;(2)表示医疗措施的词,如use、management、method等;(3)表示性质的词,如effectiveness、effect、importance、strength等;(4)表示存在与否的词,如absence、lack、presence等;(5)表示时间的词,如development、end、onset等;(6)表示医学研究方面的词,如cause、effect、result、role等。

由上可知,中间搭配词多为表示数量、医疗措施、医疗性质等方面的词。

此外,有些词组带有明显的消极语义韵特征,如risk和incidence。在消极语义韵里,节点词吸引的几乎都是消极语义特点的搭配词[10]。词组“the risk of”在语料中出现22次,其中21次都是与疾病相关联,如:

例1.Our finding of clearly increased risks of Hodgkin disease in all groups of PWAs,and a statistically significant pre-to post-AIDS trend,show that the risk of Hodgkin disease increases with advancing immunosuppression and suggest it be considered as an AIDS-defining condition.

例2.The protective effects of increased HDL-C levels on the risk of myocardial infarction have been established by numerous epidemiologic studies.

词组“the incidence of”出现30次,其后面所接名词都是不好的事物,如“a poor structural outcome”“adverse events”“cardiovascular events”“intraoperative hypertension”“nosocomial pneumonia”等等。与其同时,the*of大多是Subject+Verb结构的转换形式,如“the use of ”词组。“the use ofroutine specimens”“the use of antibiotics”和“the use of a single quality score”实质是the author use sth,用名词化语法结构,“排除”了原作者的作用,凸显了研究的对象,使文章更具客观性[11]。

2.左搭配词及语义分析

表3为医学英语中 the*of的前20个高频的左搭配词及其频数,根据词义将其分为:(1)表示(数量/状态)变化的词,如increase、decrease、reduce、determine、influence等;(2)表示研究类的词,如examine、estimate、compare、investigate、show等;(3)表示评价的词,如assess、estimate、evaluate、emphasize等。

表3 the*of搭配框前20个高频左搭配词

上述the*of的左搭配限定为实词。通过Antconc对the*of搭配框的L1词检索并排列,发现L1往往是介词。这同Macro的研究一致,他认为the* of中心搭配词表示医疗过程,通常跟在 before、after、with、despite后面;表示存在与否的词,前面介词常为in;表示时间的词,前面常为介词at(70)[6]。在本语料库中,前三个高频L1为in(173次)、of(100次)和on(100次),其他介词有的也出现较高频次,如to(83次)、at(77次)、for (54次),with (48次)。

3.右搭配词及语义分析

表4为医学英语中 the*of的前20个高频的右搭配词及其频数,根据语义将其分为:(1)表示治疗的词,如treatment、care、exercise等;(2)表示药物的词,如SDD(二甲基二硫代氨基甲酸钠)、GABA(氨基丁酸)、cocaine、estrogen(雌性激素)、variance(后常跟化学物质)等;(3)表示疾病的词,如pneumonia、PE(先兆子痫)、disability、childhood(后修饰疾病)等;(4)其他的词,如patient、subject、information等。

表4 医学语料库the*of搭配框前20个高频右搭配词

在此语料中,variance后面常跟化学物质,表示药物使用的不同造成医学实验的结果不同,所以variance该归为表示药物的词,如:

例3.No effects approached significance in the analyses of variances of nortriptyline and lithium levels on final visit.

此外,“the*of childhood”后面常跟disability、mental disability、abuse和 IQ,并且搭配词多为influence 和prevalence,一般主要叙述童年的疾病史在医学上的不良影响,因此也应归为疾病的词。

通过对以上the*of的中间、左、右搭配词的语义归类,可以将医学the*of的语义序列表示为:(数量/状态)变化/研究/评价/(介词)+ the+数量/医疗措施/性质/时间概念+of+治疗/疾病/药物,如:

例4.Some studies show a gradual tapering of the rate of proliferation during late prenatal and early neonatal life,but an increase in the number of binucleate cells.

例5.A minimum of 200 participants was desired for the study,and those who attended the training programs were asked to complete the survey at the beginning of each training event.

(三)医学语篇a*of 语义序列分析

1.中间搭配词及语义分析

表5为医学语料库a*of搭配框前18个高频中间搭配词,根据其语义,将其中间搭配词分类为:(1)表示数量的词,如total、number、variety、list、majority、range、lack、cohort、mean等;(2)表示疾病研究的词,如history、study、diagnosis、measure、record等。

表5 a*of搭配框前18个高频中间搭配词

因history常与病史有关,record多指医学记录,measure是医学检测,所以一并归为与疾病研究有关的词类。

2.左/右搭配词及语义分析

由表6数据可知a*of搭配框左、右的高频搭配词。该搭配框的L1多为介词,前3位高频左搭配词分别为as、in和with。通过进一步检索,当限定左搭配词为实词时,常与下列几类词搭配,并以介词连接:(1)表示研究相关的词,如require、attrition、resuspended、use、detect等;(2)表示状态(变化)词,如generate、decrease、consist、involved、represent、lead to等。

另一方面,右搭配词根据语义可将其分为:(1)表示人的词,如patient、human、women等;(2)表示数值概念的词,如#(表示数字)、time、month、second、minute等;(3)表示医疗行为的词,如measurement、care、effort等;(4)表示疾病的词,如disorder、cancer、disorder、disability、chronic等。

表6 a*of搭配框前10个高频左/右搭配词

由表6可知,a*of搭配框常用来表示“量化”的概念,右搭配词具体数值的词频数最高,这同科技英语的准确性和客观性的语篇特征有关。

通过对以上a*of的中间、左、右搭配词的语义归类,可以将医学a*of的语义序列表示为:状态(变化)/研究行为+(介词)+ a+数量/疾病研究+of +人/医疗行为/数值/疾病,如:

例6.We report on a study of patient preferences for patient centredness in the context of an impending consultation with a doctor in primary care.

例 7.Two random samples,consisting of a total of 1,597children(53.1%white,51.97%female,44.9% 4thgraders)participatedintwoquestionnairesurveys.

(四)医学语篇be*to语义序列分析

1.中间搭配词及语义分析

由表7可知be*to搭配框的中间搭配词都是形容词或动词的过去分词形式。参考Macro的语义分类将其搭配词分为:(1)与概率有关的词,如likely、unlikely、used等;(2)表示关系的词,如related、similar、due、necessary、important等;(3)表示医学实验过程的词,如able、unable、assigned、conducted、required、unable等;(4)表示作者认知的词,如shown、found、considered等。

表7 be*to搭配框前20个高频中间搭配词

医学语料库 be*to中间搭配词多为表示概率、关系、医学实验和作者认知等词类。在中间词为概率意义时,通常用模糊词more/less来修饰以量化概率,使语言更加客观准确,如:

例8.Adult respondents not possessing a disability but living in a household with a disabled child were found to be more likely to rate their self-perceived health as fair to poor compared to adults with a disability having a disabled child.

例9.A criticism of this approach is that postal distribution without re-enforcement of the message from health professionals may be less likely to change behaviour.

2.左/右搭配词及语义分析

由表8可知,be*to 前常接情态动词,如may、would、can、could、might等用以表示语气强弱的立场词。科技语篇给出的观点需要以证据为依据,修饰作者论点的语气词直接表明作者对自己论点的信心程度,这既可以使文章显得更为严谨,也可以帮助读者区分论点、推论和事实[12]。若根据其词义常见的左搭配词可以细分为4类:(1)表示语气的词,如may、would、can、could、might等情态动词;(2)表示人的词,如patients、respondents、participants、group、children等;(3)指代上文的衔接词,如this、that、these、those、it、who等;(4)有关医学研究的词,如tests、analysis、studies等。

医学中常用It作为形式主语,后面常跟be*to的结构,用It作形式主语,可以避免主观的看法,使观点更具说服性。to 后接be*to的句子时,句子的谓语一般为appear/need等动词或者是be*to be*to的双重结构,如:

例10.In fact,the size of the ACL appears to be proportionate to the strength of its antagonist,the quadriceps muscles.

例11.All our statistical criteria were also met for soft tissue malignancies,lung cancer,and penile cancer,but these cancer excesses are unlikely to be related to immunosuppression.

例12.Previous studies have shown smoking before conception to be protective for preeclampsia,but smoking in pregnancy is known to be related to placental abruption and FGR.

根据词义可以将表8的常见右搭配词分为两类,即:(1)表达医学观点的词,如assess、evaluate、identify、ascertain等;(2)表示医学过程的词,如determine、compare、reduce、complete、maintain、test、select等。

通过对be*to的中间、左、右搭配词的语义归类,可以将医学be*to的语义序列表示为:情态动词/人/指代衔接/医学研究+be+概率/关系/医学过程/个人认知+to+医学观点/医学过程。

表8 be*to搭配框前10个高频左/右搭配词

三、结论

基于Hunston的语义序列分析理论,对英语医学语篇常见搭配框 the*of,a*of和be*to的前后搭配词、中间搭配词的分析归类,得到这三类搭配框的如下语义序列:

1.医学语篇the*of的语义序列为:变化/研究/评价+(介词)+ the+数量/医疗措施/性质/时间概念+of+治疗/疾病/药物。

2.医学语篇a*of的语义序列为:状态(变化)/研究行为+(介词)+ a+数量/疾病研究+of +人/医疗行为/数值/疾病。

3.医学语篇be*to的语义序列为:情态动词/人/指代衔接/医学研究+be+概率/关系/医学过程/个人认知+to +医学观点/医学过程。

这三类搭配框语义序列的搭配词多涉及医疗过程,如医学的治疗、诊断、药物使用,以及医学研究的词语,如研究的结果、作用、评价等方面的词。这表明搭配框架的语义是有规律可循的,框架的语义特征是受体裁影响的。同时,语言形式是语类研究的重要组成部分,它能够体现语类的意义特征[13]。对搭配框架的语义序列的学习,有利于英语学习者以不同的语义序列区分不同的语类特征。此外,语言运用具有预制性、惯例性及模块化特征[14],学习并重视这些主题鲜明的搭配框及其语义序列,可以使英语学习者的医学语篇写作更接近母语的语言特征,更贴近医学语篇的体裁特点。

[1]HUNSTON S.Starting with the small words patterns,lexis and semantic sequences[J].International Journal of Corpus Linguistics,2008,13(3):271-295.

[2]HALLIDAYM,MATTHIESSENC.Anintroductiontofunctionalgrammar[M].NewYork:Routledge,2014.

[3]GLEDHILLCJ.Collocationsinsciencewriting[M].Bübingen:GunterNarrVerlag,2000.

[4]RENOUFA,SINCLAIRJMH.CollocationalframeworksinEnglish[M]//AIJMERK,ALTENBERGB.Englishcorpuslinguistics:studiesinhonorofjansvartvik.NewYork:Routledge,2014:128-144.

[5]EEG-OLOFSSONM,ALTENBERGB.DiscontinuousrecurrentwordcombinationsintheLondon-LundCorpus[M]//FRIESU,TOTTIEG,SCHNEIDERP.CreatingandusingEnglishlanguagecorpora:papersfromthefourteenthinternationalconferenceonEnglishlanguageresearchoncomputerizedcorpora.Atlanta:Rodopi,1994:63-78.

[6]MARCOMJL.Collocationalframeworksinmedicalresearchpapers:agenre-basedstudy[J].EnglishforSpecificPurposes,2000,19(1):63-86.

[7]FLETCHERW.KfNgram[M/OL].Annapolis,MD:USNA.[2015-6-30].http://www.kwicfinder.com/kfNgram/kfNgramHelp.html.

[8]ANTHONYL.AntConc:alearnerandclassroomfriendly,multi-platformcorpusanalysistoolkit[M]//ANTHONYL,FUJITAS,HARADAY.ProceedingsofIWLeL2004:aninteractiveworkshoponlanguagee-learning.Tokyo:IWLeL2004ProgramCommittee,2004:7-13.

[9]KJELLMERG.Patternsofcollocability[M]//AARTSJ,MEIJSW.Theoryandpracticeincorpuslinguistics.Amsterdam:Rodopi,1990:163-178.

[10]STUBBSM.Textandcorpusanalysis:computer-assistedstudiesoflanguageandculture[M].Oxford:Blackwell,1996.

[11]NASHW.Thewritingscholar:studiesinacademicdiscourse[M].California:SAGEPublications,1990.

[12]MYERSG.Narrativesofscienceandnatureinpopularizingmoleculargenetics[M]//COULTHARDM.Advancesinwrittentextanalysis.London:Routledge,1994:179-190.

[13]HALLIDAYMA,HASANR.Language,context,andtext:aspectsoflanguageinasocial-semioticperspective[M].Geelong:DeakinUniversityPress,1989.

[14]李文中.中国英语新闻报刊中的词簇[J].中国外语:中英文版,2007(3):38-43.

(责任编辑 马 诚)

Analysis of Semantic Sequence of Common Collocational Frameworksin Medical Discourse

ZHANG Ji-dong,XIA Meng-ru

(College of Foreign Languages,Donghua University,Shanghai 201620,China)

With reference to Semantic Sequence by Hunston,the left,middle and right collocates of common collocational frameworks the *of,a *of and be *to are classified and analyzed based on statistics from Medical Corpus of JDEST.The result shows the meanings of these collocates usually refer to medical treatment and medical study including therapy,diagnosis,drug use,medical research process,effect,evaluation,etc.,which indicates that the semantic sequence follows certain rules and is influenced by genre.This would shed light on the recognition of generic features through different semantic sequence and on the understanding of semantic and discourse characteristics in medical papers for language learners.

medical discourse;semantic sequence;collocational framework;collocations;corpus

2015-09-07

2015-12-08

上海市浦江人才项目(13PJC007)

张继东(1965-),男,教授,博士,研究方向为语料库语言学、英语测试学和英语教学法。E-mail:zhangjidongg@hotmail.com

H313

A

1673-4432(2015)06-0074-07

猜你喜欢

介词语料库语篇
介词和介词短语
新闻语篇中被动化的认知话语分析
《语料库翻译文体学》评介
介词不能这样用
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
从语篇构建与回指解决看语篇话题
语篇特征探析
语篇填空训练题
看图填写介词