APP下载

基于语料库的英语话语发射成分研究

2015-05-03

许昌学院学报 2015年3期
关键词:词类连词语料库

胡 海 珠

(河南师范大学 外国语学院, 河南 新乡 453007)



基于语料库的英语话语发射成分研究

胡 海 珠

(河南师范大学 外国语学院, 河南 新乡 453007)

话语发射成分从不同的角度开始一段话语,是英语口语的重要特征之一,但在英语口语教材中经常被删除。话语发射成分在使用中有自身的规律性,如词长分布、连用顺序、连用时的重心分布等,基于语料库的方法为其研究提供了语料和数据基础。话语发射成分很多情况下是说话者试图达到语意连贯和表达精确的标记,在英语口语教学中不应该被刻意避免。

话语发射成分;语料库;特征;英语口语教学

一、研究简介

该研究的主要对象是目前为我国中学英语教学所忽视的口语话语发射成分。话语发射成分指的是那些用于话语之前、通过语音逗号(声音上短暂的停顿)与后面的话语片断分开、用于开始一段话语的成分,如well, you know, in other words and on the other hand 等。它们在口语中出现得非常频繁,甚至已经成为口语的重要特征之一,起着组织话语结构、完成话语间形式和逻辑关系上的连接、帮助话题的进行和转换等作用。在我们目前的口语教学中,这些成分并没有被充分重视。在很多口语教材中,这些起着重要的交际功能的话语发射成分都被刻意地删除掉了。我们把这些口语教材中被删去的话语发射成分作为研究对象,旨在发现这些成分的总体使用特征,期待对我国目前的英语口语教学有所帮助。

二、相关研究

国内外直接就话语发射成分的研究不很多,但是与之相关的研究成果颇丰,如Quirk[1]和Van Dijk[2]提出的“话题转换标记”(topic shift markers)、Brown和Yule[3]的“话题边界标记”(topic boundary markers)和“填充语”(fillers)、 Laurel J. Brinton[4]的“语用标记词”(pragmatic markers)、Hasselgren[5]的“小词”(Small-words)、Biber et al.[6]的“插入语”等。类似的研究还有“句子连接词”、“语用小品词”、“话语标记词”和“修正标记词”研究等。

研究者一般都是以直觉上的使用频率为参考,给出一个大概的成分列表,或者先通过直觉列出部分成分再结合语料库或具体的语言使用进行验证,如Stenström[7]。而国内的研究多是聚焦于某个或某些特定的成分而展开的,如朱小美 王翠霞[8]和谢楠[9]的well、李成团[10]的you see、徐捷[11]的you know、王琨 胡晓琴[12]和何静秋[13]的all right等研究。这些语用标记词一般被认为是空语义成分,使用自由,很难翻译。

话语发射成分与话语标记词有相互覆盖的部分,但是又不完全等同。话语标记词包括用于话语之前开始一段话语的成分如you know、用于维持话轮的话内模糊音如ehh 和 mhm、单独使用的话语接受标记如yes和yeah、话内插入成分如like和sort of、升调的话后反问成分如eh 和 right,甚至反意疑问部分等。它们被用于话语之首、话语之中或话语之末,而我们所说的话语发射成分仅用于话语之首,可以看作“发话标记成分”。即使在句首,话语标记词也通常是较短的成份,不包括多词成分如the thing is, I tell you what, I was going to say, when you think about it, can I just ask you, as I said just now 等。但在话语发射成分的研究中,它们却是内容之一。

三、研究设计

(一)BNC语料库

语料库是“按照一定的采样标准采集而来的、能够代表一种语言或某语言的一种变体或文类的电子文本集”[14]3。它以“大量精心采集而来的真实文本(authentic text)为研究素材,主要通过概率统计的方法得出结论”[15]。BNC (英国国家语料库)是一个一亿词容量的语料库,包含不同来源的书面语和口语,代表了现代英国英语的使用情况。该库有4,124个文本(100,106,008个词),其中口语部分有863个文本(10,000,000个词),占了总库的百分之十。为了从BNC 语料库中提取口语对话部分,我们先使用了BNC语料库附带的索引软件得到一个所有对话文本的列表,再根据列表将这些对话文本放入单独的文件夹,这样我们就得到了一个BNC 语料库中口语对话部分的子库。

(二)PowerGrap索引软件

该研究使用PowerGREP这一软件进行自动检索。PowerGREP是一个强大的检索软件,允许通过特殊的设定检索文件或文件夹中的任何内容。检索的结果呈现为一个可点击的列表,双击检索结果中任何一项都可以打开对应的文件。查找和替换功能允许使用者预览查找和替换结果,收集功能可以为使用者提供数据信息。查找、替换和收集的结果都可以以执行时的形式储存,以备以后的进一步操作。

BNC语料库的原始文本有标点标记,每个词被自动赋上了词类码,一共有65种词类码。通过观察BNC语料库的词类码,我们发现一词的话语发射成分表现,分别对应副词、并列连词、从属连词、感叹词和模糊音五个词类为五个词类标注,即AV0, ITJ, CJC, CJS 和 UNC。一词话语发射成分的检索主要通过检索以上词类码进行。多词的发射成分的检索首先用PowerGREP 软件通过逗号标点来大量查找,然后手工删除不是发射成分的部分。

四、研究结果

(一)检索结果呈现

1.一词话语发射成分

一词话语发射成分按词类有以下这些:

副词:well, so, now, right, just, then, okay, very, alright, perhaps, probably, still, really, actually, maybe, here

并列连词:and, but, or, nor, plus

从属连词:if, cos, because, when, as, unless, although, before, once, whereas, while, after, until, since, till, whilst

感叹词:yeah, oh, no, yes, mm, ah, ooh, aye, hello, mhm, aha, bye, hey, cor, yep, eh, ha, hi, oi, gosh, hmm, hm, huh

模糊音:er, erm

2.一词话语发射成分的连用

一词话语发射成分经常被连用,典型的高频使用情况如下:

两词并列使用:and then, yes (yeah) but (and), so if, and if, oh well, and (but) er(m), well if, yeah well, oh yes (yeah), oh no, erm and, and so, no but, now if, no no, but then, oh no, er(m) and (but), and and, mm mm, right so, and (but) when

三词并列使用:and then when, yeah but if, and then if, no no no, er(m) and then (if), and then er, well yeah but, yeah and (but) then, and er then (so), and er if, but then again (if), oh yes yes, right so if

四词并列使用:no no no no, and then and then, mm mm mm mm, and er and and , oh dear oh dear, oh no oh no, oh yeah yeah yeah, oh yes oh yes, But if if if, yeah but yeah but, yeah but then if, okay and then if, right okay so if

五词并列使用:no no no no no, oh ya ya ya ya, dear oh dear oh dear, again and again and again, so certainly if if if, so so so yes so

六词并列使用:and and and and and and, mm mm mm mm mm mm, no no no no no cos

3.多词话语发射成分

我们检索了二到十词的多词发射成分,但是结果中却很少有长于六词的成分。以下是相对高频的多词话语发射成分:

两词发射成分:I mean, you know, mind you, I think, thank you, you see, come on, it is (was), in fact, go on, I thought, and that;

三词发射成分:in other words, as I say (said), first of all, the thing is, do you know, tell you what, by the way, this is it, the trouble is, I tell (told) you, I told you, still to come, at the moment, I must admit, I know that, in actual fact, I think that, I was thinking, having said that;

四词发射成分:Thank you very much, I tell you what, on the other hand, at the same time, but the thing is, the only (other) thing is, I would think so, I have to say, can I just say (ask), can I ask you, did I tell you;

五词发射成分:You know what I mean, I was going to say, as far as I know, I know what you mean, if you think about it, when you think about it, I hear what you say, from my point of view, can I just ask you, as a matter of fact

六词发射成分:the fact of the matter is, as many of you will know, if you see what I mean, I was just going to say, I was going to say that

4.一词和多词发射成分的连用

多词话语发射成分经常同一词话语发射成分连用,如 and (but/so/well) I mean, and (but/so/well)I thought (think), but (and/well) you know (see), oh my god, I mean if, well it is, and in fact; well this is it, but (and/well) as I say, but (well) the thing is, and I was thinking, but (now) having said that, yeah but I mean, so in other words, and do you know; well thank you very much, but on the other hand, and the other thing is, and I tell you what, well I was just thinking, well (but) I mean you know; oh I see (know) what you mean, so thank you very much indeed 等。

(二)检索结果分析

1. 词长特征

词长Types(higherfrequentwords)发射成分连用数量(形符)比例(形符)标准频数(10,000)一词发射成分and,well,er,yeah,oh,so,no,but,erm,yes,now,mm,right,just,or,then,ah,ok,ooh,there,here,aye,like,hello,al-right,perhaps,mhm,probably,still,really,actually,maybe ──232,04879.63283.97两词发射成分Imean,youknow,mindyou,Ithink,yousee,itis,infact,itwas,Ithought,myLords,andthatyeahbut,andthen,ohyes,ohno,yesbut,yeahand,andso,nobut,butthen,rightso,andnow,andalso,wellthen,butanyway25,0408.5930.64三词发射成分inotherwords,asIsay,firstofall,doyouknow,thethingis,tellyouwhat,bytheway,thetroubleis,Itellyou,Itoldyou,stilltocome,Imustadmit,inactualfactwellImean,butImean,butyouknow,andyouknow,wellyousee,wellyouknow14,9425.1318.29四词发射成分Itellyouwhat,ontheotherhand,atthesametime,theonlythingis,Ihavetosay,canIjustsaybutasIsay,butthethingis,wellthethingis,andIwasthinking,soinotherwords10,9683.7613.42五词发射成分Iwasgoingtosay,asfarasIknow,ifyouthinkaboutit,whenyouthinkaboutit,frommypointofview,canIjustaskyou,IwasgoingtosayandItellyouwhat,andtheotherthingis,butontheotherhand8,4202.8910.30总数────291,418100356.62

从以上我们可以看出,许多我们预期出现的高频话语发射成分并没有出现,如generally speaking, to be frank,to be honest,in a word,in short,that is to say,what′s more和after all等。

总体来说,这些话语发射成分的使用频率随着它们长度的增加而降低。一词发射成分占了所有话语发射成分的79.63%,说明说话者在口语中多用较简短的成份开始一段话语。

2. 话语发射成分的连用特征

很多的一词话语发射成分被说话者并列使用。它们不同于多词话语发射成分:多词话语发射成分是固定或半固定地被说话者所使用的,一个词的出现总是预示着下一个词的出现;但是一词话语发射成分的并列使用相对灵活,不具有相互预示性。

被连续使用的一词话语发射成分到达四个词的长度时开始表现为简单的重复,如No no no no no, Oh ya ya ya ya, Dear oh dear oh dear。因此我们可以说一词发射成分并列使用时一般最长有四个不同的发射词。四个词类的发射成分连用的情况很少出现,如okay and then if 和 right okay so if,在整个语料库中分别一共出现了两次。从我们的检索结果不难看出,一词的话语发射成分在连用时呈现出一定的词类顺序特征。被说话者重复最多的词类顺序是:感叹词 (oh, well, okay, yes, yeah, no) + 并列连词 (and, but) + 一般副词 (so, then, also, actually) + 从属连词 (if, because, when)。And the retrieval result (see appendix 2-b) shows the following roughly most commonly used order in the co-occurrence, though there are certainly exceptions: They are also compatible with themselves except conjunctions。两个连词不会被说话者并列使用,除了but but之类的重复,但是其它词类内部可以多词并列使用。

一词话语发射成分也经常和多词话语发射成分并列使用。这些发射成分在被说话者使用时表现出一个显著的特征,即这些一词发射成分多是感叹词和并列连词,并且总是被用于多词发射成分之前,如well I mean, but as I say, but the thing is 和and on the other hand。you know actually 之类的并列理论上有可能出现,但是根据检索结果,这样的并列在实际使用中很少出现。模糊声音如er和erm 出现相对自由。它们没有意义,但是却有其语用功能,我们可以称它们为“模糊发话标记”。

3. 话语发射成分连用时的重心分布

一词话语发射成分在并列使用时被说话者重复最多的词类顺序是:感叹词 + 并列连词 + 一般副词 + 从属连词。而在一词发射成分与多词发射成分连用时,一词发射成分(通常为感叹词和并列连词)总是被用在多词发射成分之前。一般我们不说这些话语发射成分有哪些是不必要的或者哪些是更重要的,但是如果我们需要省略这些并列成分中的一些而保留另一些的话,那些离话语主体最远的成分通常会被我们首先省去。这一点我们通过比较不同长度的一词发射成分连用,或比较多词发射成分与一词发射成分并列的情况就可以看出。从这一点上说,话语发射成分在并列使用时总体应该是向心的,即无论是一词话语发射成分连用还是一词、多词发射成分连用,其核心都是落在较后的位置。如果我们说口语中的话语发射成分正在不同程度地语法化,那么它们在并列使用时的顺序,即它们离话语主体的距离,似乎反应了它们不同的语法化程度,离话语主体部分越远,它们的语法化程度就越高。由于口语中语言使用的灵活性,不同成分的语法化程度与它们并列使用时的顺序的关系只是一种总体特征,而不是规则。

(三)口语中话语发射成分使用的案例分析

以下是一段BNC语料库的口语部分中的对话语篇:

A (student): You could assess them on on on that, and just say right I I think you’re a and A or a B on this particular booklet.

B (teacher): Mhm.

A: Because I’ve done it, with you. I mean, that’s no reason. But we shouldn’t be sort of saying, well look let’s not, lets all not do this booklet now.

B: Mm.

A: It’s something that we ourselves should look at.

B: Yeah, I I just wondered because there are some of them that don’t have any relevance to national curriculum and I want to…

A: Why?

B: I just thought maybe, you know, sort of miss them out do level one.

C: Do another type?

B: Do level one and level two, the ones that you you have to do and if there’s any time left at the end of the year do the ones that that you missed out.

C: That are left, aha.

A: Yeah!

B: You know that…

C: Ah

B: You know are, are non-essential.

说话者在讨论做大纲以外习题册的必要性。学生认为有必要做这个册子,期待老师说“Right I I think you’re a and A or a B on this particular booklet”,以此评价他的努力。副词 right 实施着表态功能,反应了老师在评论学生所作的努力时所持的态度或内心状态,即“对你所作的努力我很赞同”。通过一个个人化的发射成分I think,说话者(老师)在告诉听话者(学生)自己的评价是出自自己内心的想法。

I mean 实施话语交互功能,通常预示着说话者要对之前的话语进行更进一步的解释。但是在这里说话者并没有进行所谓的解释,而是进行了意义转折。事实上这里的I mean暗示了说话者的内心矛盾,相当于I know that I’ve done it with you is not a reason。But 是一个连接词,实施语篇功能,意味着话语意义的转折。学生接下来重复老师对他说过的“Well look let’s not, lets all not do this booklet now”。很明显,老师并不认为做这类大纲要求以外的习题册有必要。由于对学生行为的否定涉及学生的面子和心理,老师在提出否定意见时采取了尽量礼貌的否定方式,用Well 一词缓和了自己的否定语气,对于说话者(老师)来说是一个回应标记,而对于听话者(学生)来说则是一个被否定的预示。Look 在这里也是一个回应标记,但是它通常也预示着否定的回答。

学生不希望老师用一句“Well look let’s not, lets all not do this booklet now”来回应自己的努力。对于这种意见,老师以yeah I just wondered开始表达了自己的想法。Yeah 是一个积极回应的标记,但是却紧跟了一个小句I just wondered。这个小句在这里也是一个转折标记。Just 一词有“不很重要”之含意,是一个同时实施表态功能的成分,用来弱化否定对方时的语气。我们注意到wondered 用的是过去时,对于师生角色中的高位角色,老师在表达自己意见时是足够礼貌的。而wonder一词也失去了它的字面意义,因为老师这时并没有什么疑惑。I just wondered这一发射成分在这里暗示说话者内心一种轻微的妥协。因此,老师虽然还是对学生的行为进行了否定,但是这一否定以yeah I just wondered开始也暗示了他在保留自己不认可态度的同时对学生行为部分的肯定。当学生问及原因时,他又回答以I just thought maybe, you know开始。Maybe的模糊意义通常反应出说话者对接下来所表达内容的不确定性,或者表现出我们通常所说的“底气不足”。除此之外,老师用了这个词开始话语也是在提出不同意见时对自己语气的缓和。You know 用于话语发射成分时通常用于唤起听话者的听话注意和会话涉入,同时它也是说话者在犹豫不决时内心进行话语处理的外在语言反应。而sort of与前面使用过的just一样,使紧跟其后的话语显得不那么被强化。接下来的两个you know同样是语言整理过程的外在标记,同时用于增加听话者对紧接话语的认可。事实上,话语发射成分中的很多小句发射成分里经常出现心理性动词,这一点从以上的表格中我们很容易看的出来。这些心理性动词从某个方面反应了说话者的话语投入程度和对说话者注意力的要求。

五、话语发射成分的研究在英语口语教学中的意义

话语发射成分是英语口语的重要特征之一,在很多情况下是说话者试图达到语意连贯和表达精确的标记,是说话者交流思想的重要手段,而不是话语不连贯的标记。本族语者对这些话语发射成分有着很好的掌控能力,能使用这些微小却又强大的成分准确地表达自己的想法。而语言学习者误用或不用这些成分都可能会造成听话者对说话者真正话语意图的理解偏差。在我国的英语口语教学中,这些承担重要话语解释任务的话语发射成分并没有得到足够的重视,多被视为不重要、不必要或者破坏话语连续性的噪音信息,甚至在一些被认为足够真实的日常口语对话中也被刻意地删去了。

英语口语教师应该有意识地在课堂上合理使用这些成分,作为对学生的潜意识输入。当然,这并不是说我们必须单独地讲授这些发射话语的成分,而是说我们应当把它们作为正常的语言现象去对待。而对于学生而言,更不必刻意的避开它们。如果能够对这些成分的话语贡献给予重视,相信英语口语的练习者会大有收益。

[1] Quirk. R. et al. A Comprehensive Grammar of the English Language [M]. London: Longman, 1972.

[2] Van Dijk, T. Text and Context [M]. New York: Longman, 1979.

[3] Brown, G., & Yule, G. Discourse Analysis [M]. Cambridge: Cambridge University Press, 1983.

[4] Brinton, L. J. Pragmatic Markers in English: Grammaticalization and Discourse Functions [M]. Walter de Gruyter & Co. D-10785 Berlin, 1996.

[5] Hasselgren, A. Small Words and Valid Testing [D]. Bergen University, Norway, 1998.

[6] Biber, D., Johansson, S., Leech, G., Conrad, S., & Edward, F. Longman Grammar of Spoken and Written English [M]. Beijing: Foreign Language Teaching and Research Press, 1999.

[7] Aijmer, K. English Discourse Particles: Evidence from a corpus [M]. Amsterdam/Philadelphia: John Benjamins Publishing Company, 2002.

[8] 朱小美 王翠霞. 话语标记语Well的元语用意识分析[J]. 安徽大学学报(哲学社会科学版), 2009 (1): 55-61.

[9] 谢楠. 视听文本中话语标记语的语用功能及其汉译中的信息缺失现象[J]. 外语与外语教学, 2009 (5): 56-59.

[10]李成团. 话语标记语you see的语用功能[J]. 外语教学, 2009 (5): 15-16.

[11]徐捷. 中国英语学习者话语标记语you know习得实证研究[J]. 外语教学理论与实践, 2009 (3): 28-34.

[12]王琨 胡晓琴. 话语标记语Alright在英文口语中的话语结构功能[J]. 云南民族大学学报(哲学社会科学版), 2011 (4): 140-144.

[13]何静秋. all right 在法庭审判话语中的动态顺应分析[J]. 山西财经大学学报, 2012 (2): 58-67.

[14][15]梁茂成等. 语料库应用教程[M]. 北京: 外语教学与研究出版社, 2010.

责任编辑:石长平

A Corpus-based Study of English Utterance Launchers

Hu Haizhu

(Faculty of International Studies, Henan Normal University, Xinxiang Henan 453007)

Utterance Launchers begin an utterance from different perspectives, and are one important feature of oral English. But they are always deleted in oral English textbooks. Utterance Launchers have their own regularities in use, such as those in word length, order and focus distribution in juxtaposition. The corpus-based method provides a corpus and data basis for the study of them. It is found that they are actually markers of the speaker’s efforts to be coherent in meaning and exact in expression, so they cannot be deliberately avoided in oral English teaching.

utterance launchers; corpus; features; oral English teaching

2014-09-28

胡海珠(1979—),女,河南西平人,硕士,讲师,研究方向:应用语言学。

H08

A

1671-9824(2015)03-0071-05

基金支持:河南省哲学社会科学项目(2013BYY024)和河南省哲学社会科学项目(2013CYY025)的部分成果。

猜你喜欢

词类连词语料库
连词that引导的宾语从句
《语料库翻译文体学》评介
用词类活用法扩充词汇量
从成语中学习词类活用
表格大团圆,连词学得全
从唐诗的对偶看汉语的词类和语法
西夏语中的对比连词 djij2
基于JAVAEE的维吾尔中介语语料库开发与实现
漫谈高考考点对词类及句子成分的隐性考查
语篇元功能的语料库支撑范式介入