APP下载

国内基于语料库的儿童语言研究综述

2020-09-10刘梦

新教育论坛 2020年7期
关键词:语料库

刘梦

摘要:本文对2002年至2019年这17年间刊发于国内核心期刊的语料库儿童语言方面的研究文献进行分析发现:很多此类研究方法上,材料性研究多于非材料性研究;研究内容上,语料库被广泛应用于教学、翻译、词汇、语义、词典和语法等語言研究领域。本文主要通过回顾语料库和语料库语言学的由来,分析了儿童语料库的应用与研究现状,肯定了儿童语料库语言学在学龄前儿童的语言描述、语言理论发展和语言学研究方法等方面的贡献。特别就语料库语言学研究在语料库标注技术、研究层次、与其它学科的交叉研究和语料库建库等方面出现了平台期这一现状做了阐述。

关键词:语料库;语料库语言学;学龄前儿童语言

1.引言

20世纪80年代以来,全世界对于儿童语言教育都密切的关注,毕竟学习是需要通过语言来进行的语言能力是儿童认识这个世界基本能力,并且在实习的过程当中也可以发展儿童的创造力同感。提高对语言的兴趣,一旦产生了想要学习语言的兴趣时,儿童就会去主动去寻找机会来练习,听和说。并且使自己表达能力越来越完整和准确。这种兴趣不仅仅可以影响儿童入学后再写作与表达和沟通等方面,而且会影响他未来的工作职位,如政治家、外交官员、教师、律师、管理人员和文学艺术创作者等。为了更好地了解儿童语料库研究成果,本人对当目前所收集的大量语料库语言学文献研究进行了系统的总结分析,希望可以为今后有关儿童语料库语言学的发展提供借鉴和参考。

所以在儿童语言研究方面,同样拥有语料库所带来的好处和意义是不可忽视的。如果能把有关于儿童语言的语料转写成电子文本,赋以语言(语音、语法、语义或语用)信息,并通过相对应检索和分析工具,建立起一个儿童口语语料库系统。这样的语料库是可以将大量所收集的文本和语言特征资料按照一定顺序或格式整合起来的,因为每个儿童在不同年龄段的语言特征有一定差异,如果能建立起这样的儿童语言研究的语料库,再想找类似资料就能更加方便更加全面,既省时间又省力。

但是通过对知网等相关所提供的文献,可以得知国内基于儿童语言的语料库建设方面介绍至今还不多见,本文试图对国内外这17年来的儿童口语语料库建设文献,进行介绍和研究分析,希望能为儿童语言的研究带来一些比较充分的总结,也是为口语语料库的建设提供一些借鉴之处。

2.文献数量

本文通过在中国知网(CNKI)中输入关键词“儿童语料库”检索出2002年至 2019年发表于核心期刊精确匹配的相关论文37篇,按时间顺序统计如图1所示:

通过该图可以得知这十八年间,儿童语料库语言学的相关研究是呈逐渐上升趋势的,这些文献可以为后来以“儿童语料库语言学”为主题的研究者给予了一些知识基础。

为了能够更好的进行这次研究,我们将用到的文献利用饼图的形式完美的呈现出来方便大家看。关于儿童语言的研究文献主要是通过五个方向来进行的:其中基础研究占到68.57%,总共有24篇文献。基于基础教育与中等职业教育占14.29%,总共有五篇文献。再就是通过政策方面的研究占8.57%,只有三篇文献。通过职业指导的方向进行研究占5.71%,只有两篇文献。最后是通过高等教育来为基础来进行研究的占2.86%,只有一篇文献。以下是本文对近十八年的国内语料库语言学研究文献按研究方法统计如图2所示:

在中国知网(CNKI)“中国期刊全文数据库”中输入关键词“语料库”检索出近十年语料库语言学材料性研究716篇,非材料性研究583篇,材料性研究多于非材料性研究,符合语料库语言学定量科学研究语言的实质,但是在中国知网(CNKI)“中国期刊全文数据库”中输入关键词“儿童语料库”检索出的相关论文比较少,只有37篇。根据统计数据,十八年期间我国语料库语言学和儿童语言语料库研究方法呈现出四个明显分水岭:2001年的语言学和儿童语言研究大部分以非材料性研究来进行分析,材料性研究为少部分;2002-2006年材料性研究和非材料性研究不分上下,有匹敌之意;2007 -2010年语言学和儿童语言语料库研究则与2001年时相反;2011-2020年的语言学和儿童语言研究主要是通过材料性研究与非材料性研究相结合进行的。

本人就不同研究领域对当前语料库语言学研究进行了分类检索。根据语言学家Biber (2000), Kennedy (2000)和Aijmer (2009)对语料库研究领域的分类方法,并考虑到我国语料库研究目前的实际情况,在此将语料库语言学研究分为词汇、语法、语义等十三个方面。采用“关键词+主题”的搭配检索方式,以“儿童语言语料库”为关键词,以研究领域为主题对期刊全文数据库进一步检索(含非核心期刊论文)结果如图3所示:

上述数据显示:由于研究的关键词为“儿童语料库研究”所以关于语料库就有(13篇);接下来的是:语料库应用于儿童研究(10篇)、语法(2篇)、语义(3篇)、词典(2篇)、词汇研究(7篇)。

本人将这37篇以“儿童语言语料库”为主题进行研究的刊发论文,进一步检索,其检索结果按分类分布如图4 所示:

据上述饼图所示,儿童语料库在中国语言文学、学前教育、外国语言文字、成人教育与特殊教育、文艺理论以及心理学等六个方面迅速发展。各领域在2002-2020年均取得近十八年论文刊发数量的一定值。

3.研究内容(考虑从哪几个方面来介绍“研究内容”,比如研究领域、研究主题、研究方法等,分别论述。)

(1)研究理论和指导

我们大量阅读了当前国内外最新的儿童口语语料库的相关研究报告,一些作者的观点引发我们思考与共鸣。

徐凯俐(2018)最早对汉语幼童语用技能的调查中他是以利用软件工具辅助来进行分析的,且用了语料库研究法,主要介绍了选择语料、文本转写、语料处理与校对的过程。他在研究中利用当前比较热门的app对3至6岁的儿童有声故事言语作为主要研究对象。利用语料库的研究方法,有声读物是通过听的方式来进行阅读的,毕竟现在互联网时代大家使用智能化手机或平板电脑的次数越来越多。所以像这种利用移动电子终端的有声读物市场也渐渐扩大,目前使用有声读物的一部分顾客是儿童,在众多的有声读物当中,故事类的有声读物更受到儿童们的喜爱。但是毕竟像这样的软件良莠不齐,且缺乏了一定的规范和标准性,毕竟3至6岁的儿童语言发展优势比较至关重要的,且这个年龄段也是很关键的,所以他在研究的过程当中认为儿童可以跟随语境变化调节语言表达方式。但是3至6岁的儿童仅仅只是凭借有声读物达到语用技能还不够完善,只能够进行比较简单的语境来进行调节。而且儿童在言语表述中根据不同的环境情况都会造成显著性的差异。只有到了七岁左右,儿童才能够根据画者反应调节话语来进行表达。并且在幼童调节语言表达方式这项技能中,性别因素不发生影响。

专门研究学龄前儿童语言发展的两大基础理论:一是行为主义理论,它主要是强调人类行为的变化是因为条件反射,而社会环境对于学龄前儿童关于语言方面的学习有一定的影响,并且突出了交互概念。另外一种便是认知理论,它主要是认为大脑才是掌握所有言语行为的源泉,只有了解大脑机制才能够理解学龄前儿童是怎么从小开始掌握和学习语言的能力。直到60年代出现了关于学龄前儿童语言能力发展的第三个理论,即皮亚杰的建构主义理论。该理论事实上是将以上两种理论进行相结合,也就是行为主义和认知理论的结合。学龄前儿童在使学习语言的过程当中,不仅会利用到天赋的大脑机制,也会因为所处的社会环境而进行一定的运作。学习本身就是学习者利用自己不断储备的知识和经验来进行构造思想和概念的一个过程,只有通过将这些知识和经验进行构造和组合,再随着年龄的增加、所处的环境所提供的信息越来越多,搭配大脑机制控制,学龄前儿童则会学到更多的东西,其中包括语言。

姜新新(2019)在平行语料库建设日益发展,借助这一工具研究儿童文学翻译的文献屈指可数。本文利用构建主义理论为核心、梳理了相关概念及研究成果指出现阶段研究的问题所在,并且鼓励更多的研究者进行研究这一领域重视儿童语言的发展与教育,使儿童文学翻译市场的关范性得到重视。该文献是专门针对3至6岁儿童的跟踪调查,并且对于这个年龄段的儿童言语特点做出了总结。三岁左右的儿童其实已经懂得利用简单的字面意义和言外之意来表达自己的想法,只是因为年龄太小,达到交际目的的效果不够充分。但在4至5岁之间学龄前儿童会根据实际情况来进行更多方面的言语行为,比如批评反对,让步等来达到自己想要的交际意图。六岁儿童则会出现协商的行为,为了可以达到目的,他们会通过各种言语行为,如陈述或许诺。所以总的来说根据儿童年龄的增长这些言语行为往往通过特定句式表达,其次3、4岁的儿童对于隐喻和否定有一定的直观了解,但仍具有较大的局限性,无法理解在对话过程中抽象隐喻的真实意图,到了学龄前的儿童却可以利用在交际过程中多以陈述句为核心句式,直接语言和间接语言交替运用。

马晓雷、陈颖芳(2016)在《基于共词分析的语料库语言学研究现状分析》中认为儿童语言中的词义泛化是通过扩充词语的编码概念来进行的语用过程。在研究中之所以使用共词分析是因为学龄前儿童通常会选择他们容易得到的词汇,或者针对自己的意图有非常直接关联的词汇。总的来说儿童思维理解和语用能力随着社会经验和阅历的成长而增加。

谢楠和张笛(2017)中提出语料库研究法是儿童语言获得的研究方法之一,而我国的儿童语言语料库暂时不能满足要求,因此更需要建立一个比较系统性的儿童语言口语语料库。利用大学认知科学与语言学能研究基地所主导的语料库建设。包括目的、方案以及语料库的规模都为此文献的研究成果。期望该语料库的建设能为儿童语言研究提供有利的研究工具。

苏晴(2017)在研究中提到近几年来,关于幼儿语料的研究越来越炙热,但利用幼儿语料来致力于语言教育的研究还是少之又少。学前阶段的儿童又处在刚开始沟通发展的关键期,自然情境下的言语活动对幼儿语言能力的习得是其他途径无法达到的。本研究是对幼儿语料研究的丰富,在有效促进幼儿语言发展的研究中更是一种新的突破。本研究主要采取的是儿童语料库的研究方法。通过观察中班幼儿在角色游戏情境下发生的语言,进而将收集到的幼儿口语语料建成幼儿口语语料库,与以往相关研究幼儿在日常活动中的用词情况进行比较来对幼儿口语语料的整体词汇、不同区域的词汇以及幼儿语句进行分析。本研究的研究结果是:儿童通过游戏进行口语语料的特点为口语语料总量掌握不够;名词多被代词替代;动词使用频度较高;形容词使用量偏少;数量词种类多但集中在少数词上;多使用简单句和错序句。针对以上特点,提出的教育建议是教师要创设多种游戏情境的语言交流环境;鼓励幼儿多使用有关物体的名称词;以丰富游戏内容引发幼儿使用更多种类的动词;让幼儿在社会实践体验中积累和运用形容词;引导幼儿在与材料互动中正确使用量词等。

4.国内基于语料库的儿童语言研究的局限性

可以说目前国内关于儿童语料库语言学的研究虽然在各方面都取得了一定的研究成果,并且也建立了不少儿童语料库,但是还存在着一些问题,比如说建设有待提高、研究领域发展不平衡、基于语料库的语言现象研究不够深入等等。

4.1儿童语料库领域的建设有待提高

儿童语料库建设方面主要存在两个问题:首先是现存儿童语料库规模不大,语料内容不丰富;其次即是儿童语料库软件处理技术还不成熟,仍需进一步提高。

根据现已知所建立的儿童语料库的规模都不是特别的大,虽已有百万库容的语料库(如中国英语学习者语料库、英汉双语平行语料库),但是较之国外以亿词计数的语料库(英语国家语料库、美国当代英语语料库),仍需扩大规模。并且我国现有的儿童语料库语料比较单一,没有全面性地整理出各类语料,缺乏丰富性。我们与国外相对比还是比较欠缺,并且关于语言群体方面的语料还没有被系统性的收集和整理。可以发现这个问题目前还比较严峻,但是如果能够得到解决对于我国未来关于语料库的进一步发展和完善都有着一定的优势。

语料库软件处理方法包括语料库语法标注、分词、双语平行语料库的字句对齐以及各种研究需要的检索工具等。对语料库进行详细的语法标注可以为语料库研究提供丰富的信息,有助于语料库语言学研究的进一步发展。虽然现在是网络信息时代,但是由于技术问题目前我国关于语料库语法标准还不能够完全利用机器,很多时候依然需要人工来进行标注,自动化普及不是很高,而人工标注很容易会出现问题并且速度也慢。同时而现有的软件自动分词準确率不高,也需要人工加以纠正。操作复杂、价格昂贵的语料库软件也成为语料库研究的又一个问题。因此,语料库软件处理技术的开发的问题也需要得到解决才行。

4.2研究领域发展不平衡

关于语料库语言学的研究领域非常多,并且涉及到了方方面面,关于儿童语料库方面的研究领域却不多。反观国外关于语料库语言学研究和儿童语料库研究已经逐渐成熟并且所概括的方面也要比我国更多,这就是差距。国外的研究通常会从言语和书面语共同研究,而我国的研究通常是基于书面语来进行的,关于口语方面的语料库并不是很多。但是关于儿童的语料库,口语研究应该是该语言研究的一大重点。毕竟言语首先是出现于口头交流,慢慢才会延续成文字记载,由此可以看出来我国语料库方面的研究领域发展极不平衡。

国外语料库语言学发展已经从对语言现象本身的研究上升至与其他有关领域的跨学科研究,特别是与社会语言学(Beaugrande, 2008 ; Ander¬son, 2008 )、认知语言学(Vukovic, 2007 )、计算机语言学(Orasanet al , 2007 )等学科的交叉研究。同时,在语料库语言研究相对成熟之后,国外诸多学者已开始转向语料库的实用研究,即将语料库应用于专业领域信息检索(Braschler, 2004 ; Miangah & Nez- arat ,2010 )、评估语言作品(Deane & Quinlan ,2010 ; Shams ,2010; Islam & Rajon, 2010 )等这些前沿发展也是我国语料库语言学研究之后将继续的途径。

4.3语言现象研究不够深入

虽然目前国内关于语料库语言学相关研究论文数量和期刊数量比较可观。但是针对儿童语料库的研究数量是比较的少。并且虽然国内语料库语言学的研究数量也不是很多,只是他们通过利用语料库所展现的一个语言现象来进行客观的记录,并没有更深入去分析这种现象所产生的原因,以及会造成未来的影响,更不用说会对这些语言现象进行评价。大部分的文章所研究的都是比较常见的语言现象,而面对少见和罕见的语言现象却几乎没有人去研究。那就更不用說关于儿童语料库方面的分析了。所以我国语料库目前发展的质量并非如同像利用“语料库”为关键词所搜索到的数量那样庞大。关于语料库方面的深入研究还需要进一步加大,并且关于其他方面的语料库研究都需要进行分析和评价,这样才能够挖掘出其中的精髓。

5.结语

经过2002年到2020年这么多年的发展和研究,我国在儿童语料库建设方面虽然取得了相当丰硕的研究成果,但是问题也随之而来,如建立的语料库还太少,语料库涉及的研究领域发展不平衡,很多研究还不够深入等。今后儿童语料库语言学还需要语料库软件开发者和研究者不懈努力来进一步发展,开发出符合互联网时代的语料库处理软件,这样才使研究者地进行更细致、更方便、更深入的研究。

参考文献:

[1]Leech, G. N. The state of the art in corpus linguistics [A ]. In K. Aijmer &B. Altenberg (eds. ). English Cor¬pus Linguistics · Studies in Honor of Jan Svartvik [ C ]. Lon¬don: Longman, 1991.8 - 19.

[2]Aijmer, K. &B. Altenberg. Advances in Corpus Linguistics [M ].北京:世界图书出版公司,2009.

[3]Anderson, W. Corpus Linguistics in the UK: Resources for Sociolinguistic Research [ J ]. Language and Linguistics Compass, 2008,(2):113 - 125.

[4]Beaugrande R. Linguistics, Sociolinguistics, and Corpus Linguistics: Ideal Language versus Real Language [ J ]. Journal of Sociolinguistics, 2008 , (1 ) : 128 - 139.

[5]Braschler, M. &P. Schauble. Using Corpus-Based Ap¬proaches in a System for Multilingual Information Retrieval [j ]. Information Retrieval, 2004, (3 ) :27 -39.

[6]Deane, P. &T. Quinlan. What automated analyses of cor¬pora can tell us about students, writing skills [ J ]. Journal of Writing Research, 2010, (2 ) :151 - 177.

[7]Miangah, T. M. &A. Nezarat. A method for cross-lan¬gua ge retrieval of chunks using monolingual and bilingual corpora [ J ]. International Journal of Computer Applica¬tions, 2010.

[8]Orason, C. et al. Corpora for computational linguistics [J ]. Ilha Do Desterro: A Journal of English Language, Literature in English and Cultural Studies, 2007,52 (1 ): 65 - 102.

[9]Shams, R. et al. A corpus-based evaluation of a domain¬specific text to knowledge mapping prototype [ J ]. Journal of Computers, 2010, (1): 69 - 80.

[10]蒋忠心. 新疆伊犁地区学前儿童学业语言发展研究[D].华东师范大学,2019.

[11]张义宾. 基于汉语儿童语料库的语言障碍诊断系统研究[D].华东师范大学,2019.

[12]徐凯俐. 基于语料库的3-6岁儿童有声故事语言研究[D].上海师范大学,2018.

[13]顾萌萌. 基于语料库的儿童动画片词汇研究[D].上海师范大学,2018.

[14]职路遥. 基于汉语儿童读物编写的汉语语料库建设[D].广东外语外贸大学,2018.

[15]石静. 视觉学习在语言障碍儿童二语习得过程中的作用——以语料库应用为例[J]. 英语教师,2017,17(20): 44-48.

[16]谢楠,张笛. 汉语儿童多模態口语语料库建设研究[J]. 外语电化教学,2017(05):53-60.

[17]苏晴. 中班角色游戏情境下幼儿口语语料的研究[D].鞍山师范学院,2017.

[18]姜新新. 平行语料库在儿童文学翻译研究中的应用[J]. 文教资料, 2019(26).

[19]冉吉意. 基于平行语料库的中国儿童文学语言特征及其英译研究[D].北京外国语大学,2017.

[20]古丽夏·阿克巴尔. 新疆哈萨克族儿童母语语言发展研究[D].陕西师范大学,2016.

[21]马晓雷,陈颖芳. 基于共词分析的语料库语言学研究现状分析(1971-2015)[J]. 语料库语言学,2016,3(01):41 -54+116.

[22]杜昌. 从原型构式看词类在句法结构中的分布[D].上海师范大学,2016.

[23]马滢颖,樊宁. 3-4岁儿童语言性别差异的研究——一项基于语料库的研究[J]. 遵义师范学院学报,2015,17 (05):142-146.

[24]管玮. 汉语自然会话中的转述现象研究[D].浙江大学,2014.

[25]于洋. 基于语料库的3-6岁儿童绘本翻译语言研究[D].吉林大学,2014.

[26]付丹丹. 幼儿日常会话主题和场景研究[D].南京师范大学,2014.

[27]姚寒露. 五岁段汉语幼儿常用词研究[D].南京师范大学,2014.

[28]张廷香. 基于语料库的3-6岁汉语儿童词汇研究[D].山东大学,2010.

[29]臧光亚. 基于语料库的儿童文学翻译语言研究[D].曲阜师范大学,2010.

[30]臧光亚. 基于语料库的英译汉儿童文学语言的欧化现象微探[J]. 语文学刊(外语教育与教学),2009(12):82- 84.

[31]刘颖. 汉语儿童早期语言发展个案研究[D].山东大学,2009.

[32]崔荣辉. 5-6岁儿童语言习得状况的考察与研究[D].山东大学,2009.

注:此文章为2019年大学生创新创业训练计划项目——《重庆市学龄前儿童口语语料库》(201910618006)阶段性成果。

猜你喜欢

语料库
语料库辅助英美文学教学模式初探
可比语料库的建立及翻译教学研究
基于语料库翻译学的广告翻译平行语料库问题研究
护理英语语料库建设探索
如何利用语料库语言学提高英语教学
浅谈语料库分类及用途
近5年语料库应用于外语教学的研究综述
国内外语料库建设研究简述
运用语料库辅助高中英语写作
关于“nothing succeeds without a strong will”的语料库研究