新疆少数民族英语语料库建设浅议
2018-11-30于庆玲
【摘要】具有实证研究意义的语料库语言学是近年的研究热点,三语背景的新疆少数民族学生在英语学习方面具有不同于二语学习者的语言输出,因而建立新疆少数民族语料库具有一定的理论和实际意义。本文浅议了新疆少数民族语料库建库意义、建库内容设计以及存在的问难,对新疆少数民族英语学习者语料库建设进行了探索。
【关键词】新疆少数民族;英语;语料库
【作者简介】于庆玲(1988.11-),女,汉族,新疆乌鲁木齐人,新疆医科大学语言文化学院,讲师,文学硕士,研究方向:英語语言学。
语料库语言学是基于大量真实的语言数据,以语料库为基础的语言研究方法,主要通过概率统计的方法得出结论,因而具有实证研究的意义。建立大型笔语语料库并基于语料库开展语言研究是近年国内外语言教学界研究的新趋势。已建立起的种类繁多的英语学习者语料库对二语习得研究起了极大的作用。但是,新疆少数民族学生三语背景下的英语学习不同于内地学生,建立新疆少数民族大学生英语中介语语料库有着重要意义。
在英语教学界,针对新疆维吾尔自治区少数民族学生英语教学,有关语言习得的研究大多数依然是经验型的,仅靠例举少量零散的笔语语料或一次性小规模抽样,得到的是不够系统的、缺乏说服力的定性结果。因此,需要研究者采用更科学的方法深入研究英语学习现状,探索有效的教学方法。目前新疆各本科院校学生英语教学在课程设置、教材选用、教学目标等方面各有不同,少数民族学生的英语习得存在一定问题,因而研究者可通过语料库研究新疆外语教育现状,结合学生实际情况对新疆外语教学进行规划。新疆普通中小学采用维、汉、哈、柯、蒙、锡、俄7种语言进行教学,学生语言背景复杂,不能生搬硬套内地学生的方案。因此建立具有一定规模的少数民族英语学习者笔语语料库并在此基础上开展针对大规模语料的系统性研究就显得十分必要和迫切。
1.建库意义。
(1)丰富中国少数民族学生语言研究理论。国外的英语学习者语料库不能直接被用来研究中国英语学习者的学习特点,同样,国内现有的英语学习者语料库也难以揭示三语背景的新疆少数民族英语学习者的学习特点和存在的问题。语料库研究将语料库和新疆少数民族学生进行衔接,促进了新疆外语教育的研究,形成“一带一路”战略背景下的学术理论。
(2)提供详实的少数民族英语学习研究材料。为研究新疆少数民族大学生英语学习情况提供真实、可靠、丰富的中介语语料,从而推动少数民族英语学习的研究。
(3)提供科学定量的研究方法。对大量的学习者语言进行量化分析,能深化人们对语言学习机制的理解,乃至对语言本身的理解提供依据。语料库词表的建立方便词素、单词、短语、搭配、结构和句式的语言形式检索,用一个相对客观的标准判断和分析语言现象,通过科学定量的方法研究语料库,在英语学习过程中起到旁观者和批判者的角色。
(4)改进英语教学。为深入研究学习者的词汇、语法、语篇、语用、交际能力的发展提供了充分的数据,而且还为研究学习过程、自主性学习以及大纲制定、教材编写、语言测试提供重要的反馈和支持。此外,针对新疆少数民族英语学习者语料库的开发,目的性强,操作灵活,旨在解决给定的语言学习与教学环境中的实际难题:如教材、课堂教学、口语、写作、阅读、听力等,具有更强的针对性和功能性。
(5)填补新疆中介语语料库建设的不足。近年来,随着科学技术水平的发展提高,中介语语料库的建设逐渐成为了热点。而新疆目前在中介语语料库建设方面还处于空缺状态。
(6)“一带一路”战略背景下语言学习需求。新疆维吾尔自治区与周边8国接壤,少数民族文化与“一带一路”背景下的现代化与全球现代化是一体的,在日益频繁的国际交流中,英语作为通用语成为各国交流的语言选择。中亚五国的哈、吉、塔、乌四国语言在新疆有跨境语言的特点,这些语言兼具外国语和新疆少数民族语的双重属性,少数民族学生学习这些语言具有不可比拟的优势,使其在“一带一路”建设过程中成为重要人才储备。然而,他们的英语学习存在较多问题,“一带一路”战略对他们提出了更高的语言要求,因而基于大量语料的客观分析紧密贴合时代需求。
2.建库内容。可建设一个以少数民族本科生为对象的英语笔语中介语语料库并开展统计分析。以新疆大学、石河子大学、新疆师范大学、新疆农业大学、新疆医科大学和新疆财经大学等六所本科高校的在校少数民族大学生,包括民考民、民考汉和双语生为调查对象,语料采集涵盖性别、族别、母语背景、英语学习的时间、所学的主要英语教材等。六所高校为新疆主要本科院校,能够反映该区少数民族学生的英语学习现状。
参照中国学习者英语语料库的建库标准和新疆师范大学熊杰和李嘉东(2009)提出的建库设计,结合新疆医科大学英语教研室建设的“校级少数民族大学生英语中介语语料库”建库经验,可建立新疆高校少数民族大学生英语笔语中介语语料库。根据语料来源的不同,将语料库分为两部分,即“民考汉学生笔语中介语语料库”和“民考民、双语学生笔语中介语语料库”。建立一个为英语的第二语言教学研究、语言测试、教材编写和大纲制定等服务的专用型语料库,其基本特征将是:语料样本多、涵盖不同英语水平、语言背景的语料、信息完备、标注内容全面、标注质量优良、检索方便,能反映学生英语概貌和学生在本科阶段英语学习的过程,可以满足英语教学和研究、教材编写等众多需求。
(1)语料标注规范。兰卡斯特大学计算机语料库研究中心(University Centre for Computer Research on Language)研制并开发的CLAWS4词性赋码器,对英语书面语自动词性赋码的准确率达到了96%—97%,有时达到98%以上。语料库的建立可使用CLAWS4进行词性赋码,选用C5第五代赋码集。
(2)语料检索系统。运用日本早稻田大学LaurenceAnthony 创立的AntCon3.5.0进行数据统计分析。
(3)数据统计分析。
1)统计形符类符比。待语料库建成之后,用检索软件进行类符/形符比统计,计算出标准化类符/形符比。
2)生成单字和N字语词频表。通过词汇频数及其频率来分析少数民族大学英语的使用情况,从而确定教学重点和语言项目的教学次序。
3)生成词簇表。词簇表可以用以研究少数民族大学生的词簇使用和他们的语言水平之间的关系。
4)提取关键词表。语料库建成后,通过目标语料库和中国学习者英语语料库、BNC语料库对比提取关键词表,找出超用词、少用词和常用词。
虽然语料库建设具有重要意义,笔者也对建库内容提出了总体方案,但是少数民族语料库的建设研究依然面临一定的困难。首先是文本电子化的任务重。为了保证千余份文本转化的质量,成员需相对固定,提高录入要求和统一录入标准。其次,在语料收集的过程中,如何避免学习者采取回避策略是研究的难点。尤其是民考民和双语生同学,他们的英语水平较之民考汉学生存在一定的差距,要写出一篇符合规定的作文需要相应的注意力和投入。为了解决这一问题,研究者可提前与各校相关老师沟通,通过课程任课教师对学生的写作情况进行实时监督和反馈,以期收集符合要求的文本。此外,新疆多民族地区外语教育具有地域性、复杂性和多样性的特点。制定适合少数民族学生外语学习的课程标准,提供相应的课程资源都是语料库研究的难点。
参考文献:
[1]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.
[2]梁茂成.微型文本及其在外语教学中的应用[J].外语电化教学, 2009,3.
[3]梁茂成.语料库语言学团队建设与学术交流[J].外语教学与研究, 2012,3.
[4]熊杰,李嘉东.建立维吾尔族民考民大学生英语笔语语料库的设想[J].乌鲁木齐职业大学学报,2009:89-91.