APP下载

语料库视角下非英语专业学生口语语块能力分析

2014-08-26冯晓菲

教育界·下旬 2014年7期
关键词:语块

冯晓菲

【摘 要】本研究以中国大学生英语口语语料库COLSEC为基础,从语用角度的三维度考察了此非英语专业学生英语口语语块的使用特征。结果表明此层次学生的语块总体语用能力有待提高。

【关键词】语块 口语语料库 语块能力

1 引言

语块在二语习得目前已成为语言学界关注的一大课题。所谓语块,也称词块,指出现频率大、可预制并且可作为整体记忆的连续词语序列或间断词语序列。目前研究范畴包括下: 一是基于理论进行考究(Pawley & Syder, 1983),选择样本的标准主要基于心理性,主观特征明显;二是语料库驱动型,它主要立足于计算机语言和大数据学科的发展(Sinclair,1991) ,研究结果基于对真实语言的概率或频率运算而得出,相对客观。随着WordSmith,AntConc等研究工具的出现,语块的整体提取更加方便,语块研究在语料库领域得到长足发展。本研究将以语料库为切入点,对非英语专业学生的口语能力特征进行分析。

2 研究设计

2.1 研究目的

通过对语料库语料的研究,以发现中国非英语专业学生口语表达时语块使用情况特征。本研究中只关注3~6 词长度并且能使语言有效连贯交际的语块结构,并对其分布情况、结构特征以及语用功能进行分析。

2.2 研究问题

本研究试图解答以下问题:

(1)中国学生在语块使用时的数量分布特征;

(2)中国学生在使用语块时的结构特征;

(3)中国学生语块使用时的语用功能特点。

2.3 语料采集及工具

本研究采用的英语口语语料库是COLSEC(杨惠中、卫乃兴 , 2007),此语料库语料采集于非英语专业口语考试(CET-SET)的材料,语料的话语类型包括师生晤谈,学生讨论以及师生讨论三种。COLSEC的库容为618,648词次。本研究使用专业软件AntConc3.2.4 进行语块提取。

2.4 语块释义

根据卫乃兴( 2007) 的研究,语块分为三种形式的结构,即完整分句,分句成分和不完全词组。

(1)完整分句是指具有相对完整的主谓结构,又分为独立分句,如“Long time no see”,以及从属分句,如“by the way”。

(2)分句成分即包含一些固定和半固定的词组,也可以分成两种: 一是多种分句成分,如“As far as...”等;二是单一分句成分,如“...and so on”等。

(3)不完全词组即前后开放式的词组,如“...a lot of...”等。

3 结果与讨论

3.1语块使用分布特征

采用上述研究方法,并根据语块的长度进行测量。如表1 所示,本次研究共获得的类符数( Types)为1920个 。所有的语块在所选用语料的发生频率,即形符数( Tokens)为61607 次 。统计后发现,在COLSEC口语语料中,三词语块的使用频率最高,尔后随着词数增加,使用次数递减。也就是在实际表达中,中国学生更加偏好长度稍短的语块。

3.2 语块使用结构特征

表2 表明,在三类结构中,分句成分结构的语块占总量的78.22%,完整分句则占19.2,而不完全词组则是使用频率最低,只占到总量的2.58%。在口语交际过程中,中国学生大量使用了分句成分,中国学生对于不完全词组的使用偏少。

3.3 语块语用功能特点

(1)完整分句

完整分句中的独立分句的主要功能包括16 类,分别是寒暄、致谢、认同等。经过分析,COLSEC 中独立分句的安慰语功能和自发性谈话的元问题相对缺失;而“询问语”出现频率很高,如“do you think so”等;认识性标签语“I dont know ”之类使用被频繁使用。以上反映了学生自然会话的策略技能偏低。

从属分句包括评述性分句、间接条件分句和同位语标记语。中国学生频繁使用评述性分句如“you know”和“as far as”等,这些分句具有形式稳定和语义明确的特征。学生频繁甚至过度使用同一类型语块,说明学生语块量掌握有限,导致会话单调乏味甚至不地道。

(2)分句成分

分句成分可以分为多种分句成分和单一分句成分。分句的话语生成可分为:主题跳板和核心命题。主题跳板的语用功能有五大类: 认识性、存现、报道、询问和其他。在COLSEC 中,其中不难发现,中国大学声英语口语语块中明显呈现多用第一人称单数的使用特点,自我视角特征明显。其中使用频率最高的“I think that”(321),“I believe”(182)和“I guess”(89),反映了学生话语特征为过度使用“我想要……”。还发现有“I can give you an example”和”I should say”等中国式英语,而一般母语者不用或少用这类语块。核心命题是句子的重要部分,包括动词以及其补足成分。在COLSEC 中使用频率最高的语块有“earn some money”(392) ,“agree with you”(343) 等 。而母语者一般少用此类语块。

诚然,学生可能围绕测试材料话题导致对语块的选择有趋同性。同时,这些语块的选择更多是学生早期习得外语时语言知识储存的重要部分,所以学生会过度使用。但总的来说分句成分的语用功能没有被学生充分发挥,并产生自我为中心和中英简单对译的问题。

(3)不完全分句

不完全分句的使用凸显中国学生口语缺乏技巧的特点。通过检索,COLSEC 中的不完全分句中,中国学生最善于使用这类结构: as +adv+ as,同时发现中国学生过度使用“a lot of”,在COLSEC 中出现了643次。但发现模糊语的使用中,中国学生明显低于本族语者,尤其像“a little bit ” 在COLSEC 中几乎缺失。而其实英语母语者在会话管理方面表现得形式多样,策略自如,众多模糊限制语如 “to some extent”和“sort of”等使语言表现得缓和有技巧的语块却甚少被中国学生使用.

4 结语

研究表明,中国非英语专业的学生英语口语表达时偏好短语块以及半开式的分句成分语句,但使用时却形式单一,自我中心并且有强烈的汉语对译痕迹,交流时显得生硬而重复。因此在条件允许情况下,教师可以结合语料库进行数据驱动的教学,让学生多接触真实语言,增强语感,以帮助其恰当和准确地表达意义。

本研究中不可避免地存在局限性,本文关注的COLSEC是考试中学生口头表达的录音转写,考试因此必然对学生使用语块的选择产生制约。尽管如此,本文通过结合语料库的分析,将此类学习群体的英语口语问题归纳出来,以为今后英语口语教学提供更多切入点。

【参考文献】

[1]Sinclair J.Corpus concordance collocation[M].Oxford:Oxford University Press,1991.

[2]Pawley A,F H Syder.Two Puzzles for Linguistic Theory:Native-like Selection and Native-like Fluency[M]. JRichards,R Schmit.Language and Communication.London:Longman,1983: 191-203.

[3]杨惠中,卫乃兴.中国学习者英语口语资料库建设与研究[J].上海:上海外语教育出版社,2005

[4]卫乃兴.中国学生英语口语的短语学特征研究——COLSEC 语料库的词块证据分析[J].现代外语,2007 ( 3) :280-291.endprint

【摘 要】本研究以中国大学生英语口语语料库COLSEC为基础,从语用角度的三维度考察了此非英语专业学生英语口语语块的使用特征。结果表明此层次学生的语块总体语用能力有待提高。

【关键词】语块 口语语料库 语块能力

1 引言

语块在二语习得目前已成为语言学界关注的一大课题。所谓语块,也称词块,指出现频率大、可预制并且可作为整体记忆的连续词语序列或间断词语序列。目前研究范畴包括下: 一是基于理论进行考究(Pawley & Syder, 1983),选择样本的标准主要基于心理性,主观特征明显;二是语料库驱动型,它主要立足于计算机语言和大数据学科的发展(Sinclair,1991) ,研究结果基于对真实语言的概率或频率运算而得出,相对客观。随着WordSmith,AntConc等研究工具的出现,语块的整体提取更加方便,语块研究在语料库领域得到长足发展。本研究将以语料库为切入点,对非英语专业学生的口语能力特征进行分析。

2 研究设计

2.1 研究目的

通过对语料库语料的研究,以发现中国非英语专业学生口语表达时语块使用情况特征。本研究中只关注3~6 词长度并且能使语言有效连贯交际的语块结构,并对其分布情况、结构特征以及语用功能进行分析。

2.2 研究问题

本研究试图解答以下问题:

(1)中国学生在语块使用时的数量分布特征;

(2)中国学生在使用语块时的结构特征;

(3)中国学生语块使用时的语用功能特点。

2.3 语料采集及工具

本研究采用的英语口语语料库是COLSEC(杨惠中、卫乃兴 , 2007),此语料库语料采集于非英语专业口语考试(CET-SET)的材料,语料的话语类型包括师生晤谈,学生讨论以及师生讨论三种。COLSEC的库容为618,648词次。本研究使用专业软件AntConc3.2.4 进行语块提取。

2.4 语块释义

根据卫乃兴( 2007) 的研究,语块分为三种形式的结构,即完整分句,分句成分和不完全词组。

(1)完整分句是指具有相对完整的主谓结构,又分为独立分句,如“Long time no see”,以及从属分句,如“by the way”。

(2)分句成分即包含一些固定和半固定的词组,也可以分成两种: 一是多种分句成分,如“As far as...”等;二是单一分句成分,如“...and so on”等。

(3)不完全词组即前后开放式的词组,如“...a lot of...”等。

3 结果与讨论

3.1语块使用分布特征

采用上述研究方法,并根据语块的长度进行测量。如表1 所示,本次研究共获得的类符数( Types)为1920个 。所有的语块在所选用语料的发生频率,即形符数( Tokens)为61607 次 。统计后发现,在COLSEC口语语料中,三词语块的使用频率最高,尔后随着词数增加,使用次数递减。也就是在实际表达中,中国学生更加偏好长度稍短的语块。

3.2 语块使用结构特征

表2 表明,在三类结构中,分句成分结构的语块占总量的78.22%,完整分句则占19.2,而不完全词组则是使用频率最低,只占到总量的2.58%。在口语交际过程中,中国学生大量使用了分句成分,中国学生对于不完全词组的使用偏少。

3.3 语块语用功能特点

(1)完整分句

完整分句中的独立分句的主要功能包括16 类,分别是寒暄、致谢、认同等。经过分析,COLSEC 中独立分句的安慰语功能和自发性谈话的元问题相对缺失;而“询问语”出现频率很高,如“do you think so”等;认识性标签语“I dont know ”之类使用被频繁使用。以上反映了学生自然会话的策略技能偏低。

从属分句包括评述性分句、间接条件分句和同位语标记语。中国学生频繁使用评述性分句如“you know”和“as far as”等,这些分句具有形式稳定和语义明确的特征。学生频繁甚至过度使用同一类型语块,说明学生语块量掌握有限,导致会话单调乏味甚至不地道。

(2)分句成分

分句成分可以分为多种分句成分和单一分句成分。分句的话语生成可分为:主题跳板和核心命题。主题跳板的语用功能有五大类: 认识性、存现、报道、询问和其他。在COLSEC 中,其中不难发现,中国大学声英语口语语块中明显呈现多用第一人称单数的使用特点,自我视角特征明显。其中使用频率最高的“I think that”(321),“I believe”(182)和“I guess”(89),反映了学生话语特征为过度使用“我想要……”。还发现有“I can give you an example”和”I should say”等中国式英语,而一般母语者不用或少用这类语块。核心命题是句子的重要部分,包括动词以及其补足成分。在COLSEC 中使用频率最高的语块有“earn some money”(392) ,“agree with you”(343) 等 。而母语者一般少用此类语块。

诚然,学生可能围绕测试材料话题导致对语块的选择有趋同性。同时,这些语块的选择更多是学生早期习得外语时语言知识储存的重要部分,所以学生会过度使用。但总的来说分句成分的语用功能没有被学生充分发挥,并产生自我为中心和中英简单对译的问题。

(3)不完全分句

不完全分句的使用凸显中国学生口语缺乏技巧的特点。通过检索,COLSEC 中的不完全分句中,中国学生最善于使用这类结构: as +adv+ as,同时发现中国学生过度使用“a lot of”,在COLSEC 中出现了643次。但发现模糊语的使用中,中国学生明显低于本族语者,尤其像“a little bit ” 在COLSEC 中几乎缺失。而其实英语母语者在会话管理方面表现得形式多样,策略自如,众多模糊限制语如 “to some extent”和“sort of”等使语言表现得缓和有技巧的语块却甚少被中国学生使用.

4 结语

研究表明,中国非英语专业的学生英语口语表达时偏好短语块以及半开式的分句成分语句,但使用时却形式单一,自我中心并且有强烈的汉语对译痕迹,交流时显得生硬而重复。因此在条件允许情况下,教师可以结合语料库进行数据驱动的教学,让学生多接触真实语言,增强语感,以帮助其恰当和准确地表达意义。

本研究中不可避免地存在局限性,本文关注的COLSEC是考试中学生口头表达的录音转写,考试因此必然对学生使用语块的选择产生制约。尽管如此,本文通过结合语料库的分析,将此类学习群体的英语口语问题归纳出来,以为今后英语口语教学提供更多切入点。

【参考文献】

[1]Sinclair J.Corpus concordance collocation[M].Oxford:Oxford University Press,1991.

[2]Pawley A,F H Syder.Two Puzzles for Linguistic Theory:Native-like Selection and Native-like Fluency[M]. JRichards,R Schmit.Language and Communication.London:Longman,1983: 191-203.

[3]杨惠中,卫乃兴.中国学习者英语口语资料库建设与研究[J].上海:上海外语教育出版社,2005

[4]卫乃兴.中国学生英语口语的短语学特征研究——COLSEC 语料库的词块证据分析[J].现代外语,2007 ( 3) :280-291.endprint

【摘 要】本研究以中国大学生英语口语语料库COLSEC为基础,从语用角度的三维度考察了此非英语专业学生英语口语语块的使用特征。结果表明此层次学生的语块总体语用能力有待提高。

【关键词】语块 口语语料库 语块能力

1 引言

语块在二语习得目前已成为语言学界关注的一大课题。所谓语块,也称词块,指出现频率大、可预制并且可作为整体记忆的连续词语序列或间断词语序列。目前研究范畴包括下: 一是基于理论进行考究(Pawley & Syder, 1983),选择样本的标准主要基于心理性,主观特征明显;二是语料库驱动型,它主要立足于计算机语言和大数据学科的发展(Sinclair,1991) ,研究结果基于对真实语言的概率或频率运算而得出,相对客观。随着WordSmith,AntConc等研究工具的出现,语块的整体提取更加方便,语块研究在语料库领域得到长足发展。本研究将以语料库为切入点,对非英语专业学生的口语能力特征进行分析。

2 研究设计

2.1 研究目的

通过对语料库语料的研究,以发现中国非英语专业学生口语表达时语块使用情况特征。本研究中只关注3~6 词长度并且能使语言有效连贯交际的语块结构,并对其分布情况、结构特征以及语用功能进行分析。

2.2 研究问题

本研究试图解答以下问题:

(1)中国学生在语块使用时的数量分布特征;

(2)中国学生在使用语块时的结构特征;

(3)中国学生语块使用时的语用功能特点。

2.3 语料采集及工具

本研究采用的英语口语语料库是COLSEC(杨惠中、卫乃兴 , 2007),此语料库语料采集于非英语专业口语考试(CET-SET)的材料,语料的话语类型包括师生晤谈,学生讨论以及师生讨论三种。COLSEC的库容为618,648词次。本研究使用专业软件AntConc3.2.4 进行语块提取。

2.4 语块释义

根据卫乃兴( 2007) 的研究,语块分为三种形式的结构,即完整分句,分句成分和不完全词组。

(1)完整分句是指具有相对完整的主谓结构,又分为独立分句,如“Long time no see”,以及从属分句,如“by the way”。

(2)分句成分即包含一些固定和半固定的词组,也可以分成两种: 一是多种分句成分,如“As far as...”等;二是单一分句成分,如“...and so on”等。

(3)不完全词组即前后开放式的词组,如“...a lot of...”等。

3 结果与讨论

3.1语块使用分布特征

采用上述研究方法,并根据语块的长度进行测量。如表1 所示,本次研究共获得的类符数( Types)为1920个 。所有的语块在所选用语料的发生频率,即形符数( Tokens)为61607 次 。统计后发现,在COLSEC口语语料中,三词语块的使用频率最高,尔后随着词数增加,使用次数递减。也就是在实际表达中,中国学生更加偏好长度稍短的语块。

3.2 语块使用结构特征

表2 表明,在三类结构中,分句成分结构的语块占总量的78.22%,完整分句则占19.2,而不完全词组则是使用频率最低,只占到总量的2.58%。在口语交际过程中,中国学生大量使用了分句成分,中国学生对于不完全词组的使用偏少。

3.3 语块语用功能特点

(1)完整分句

完整分句中的独立分句的主要功能包括16 类,分别是寒暄、致谢、认同等。经过分析,COLSEC 中独立分句的安慰语功能和自发性谈话的元问题相对缺失;而“询问语”出现频率很高,如“do you think so”等;认识性标签语“I dont know ”之类使用被频繁使用。以上反映了学生自然会话的策略技能偏低。

从属分句包括评述性分句、间接条件分句和同位语标记语。中国学生频繁使用评述性分句如“you know”和“as far as”等,这些分句具有形式稳定和语义明确的特征。学生频繁甚至过度使用同一类型语块,说明学生语块量掌握有限,导致会话单调乏味甚至不地道。

(2)分句成分

分句成分可以分为多种分句成分和单一分句成分。分句的话语生成可分为:主题跳板和核心命题。主题跳板的语用功能有五大类: 认识性、存现、报道、询问和其他。在COLSEC 中,其中不难发现,中国大学声英语口语语块中明显呈现多用第一人称单数的使用特点,自我视角特征明显。其中使用频率最高的“I think that”(321),“I believe”(182)和“I guess”(89),反映了学生话语特征为过度使用“我想要……”。还发现有“I can give you an example”和”I should say”等中国式英语,而一般母语者不用或少用这类语块。核心命题是句子的重要部分,包括动词以及其补足成分。在COLSEC 中使用频率最高的语块有“earn some money”(392) ,“agree with you”(343) 等 。而母语者一般少用此类语块。

诚然,学生可能围绕测试材料话题导致对语块的选择有趋同性。同时,这些语块的选择更多是学生早期习得外语时语言知识储存的重要部分,所以学生会过度使用。但总的来说分句成分的语用功能没有被学生充分发挥,并产生自我为中心和中英简单对译的问题。

(3)不完全分句

不完全分句的使用凸显中国学生口语缺乏技巧的特点。通过检索,COLSEC 中的不完全分句中,中国学生最善于使用这类结构: as +adv+ as,同时发现中国学生过度使用“a lot of”,在COLSEC 中出现了643次。但发现模糊语的使用中,中国学生明显低于本族语者,尤其像“a little bit ” 在COLSEC 中几乎缺失。而其实英语母语者在会话管理方面表现得形式多样,策略自如,众多模糊限制语如 “to some extent”和“sort of”等使语言表现得缓和有技巧的语块却甚少被中国学生使用.

4 结语

研究表明,中国非英语专业的学生英语口语表达时偏好短语块以及半开式的分句成分语句,但使用时却形式单一,自我中心并且有强烈的汉语对译痕迹,交流时显得生硬而重复。因此在条件允许情况下,教师可以结合语料库进行数据驱动的教学,让学生多接触真实语言,增强语感,以帮助其恰当和准确地表达意义。

本研究中不可避免地存在局限性,本文关注的COLSEC是考试中学生口头表达的录音转写,考试因此必然对学生使用语块的选择产生制约。尽管如此,本文通过结合语料库的分析,将此类学习群体的英语口语问题归纳出来,以为今后英语口语教学提供更多切入点。

【参考文献】

[1]Sinclair J.Corpus concordance collocation[M].Oxford:Oxford University Press,1991.

[2]Pawley A,F H Syder.Two Puzzles for Linguistic Theory:Native-like Selection and Native-like Fluency[M]. JRichards,R Schmit.Language and Communication.London:Longman,1983: 191-203.

[3]杨惠中,卫乃兴.中国学习者英语口语资料库建设与研究[J].上海:上海外语教育出版社,2005

[4]卫乃兴.中国学生英语口语的短语学特征研究——COLSEC 语料库的词块证据分析[J].现代外语,2007 ( 3) :280-291.endprint

猜你喜欢

语块
科技汉语语块的类型和特征
信息化环境下英语语块教学模式在小学英语教学中的运用
语块教学在高中英语教学中的应用分析
非英语专业学生英语水平与语块识别能力的相关性研究
浅谈预制语块在英语口语中的运用
英语语块在汉英翻译中的积极作用
语块的定义与文体特征
从语块类型看英语专业大学生语块获取能力与听力理解能力的相关性研究
语块的性质及汉语语块系统的层级关系
诠释学视域中的语块研究