APP下载

小学语文教学语料库的设计与开发

2015-11-05李艳芳

课程教育研究·学法教法研究 2015年22期
关键词:设计与开发语料库小学语文

李艳芳

【摘要】采用建立语料库的方式对提高小学语文教学质量有一定积极意义。但是需要在充分了解建立小学语文教学语料库的目的与大致方向的基础上进行设计与开发,才能够充分保证其完成建设后的作用的发挥。本文以小学语文教学语料库的设计与开发为中心,在完成设计的基础上进行开发,旨在为实际的小学语文教学提供切实可行的理论基础。

【关键词】小学语文;语料库;设计与开发

【中图分类号】G623.2

0.引言

小学语文教学语料库的设计与开发是以电子形式保存的语言材料,借助相关的技术手段,充分以小学语文教学为基石,有效解决在小学语文教学中存在的各种问题,特别是解决语文阅读资源的篇章检索、词语检索和句子检索。

1.小学语文教学语料库的设计

1.1小学语文教学语料库的设计原则

本次建立的小学语文教学语料库是以人教版小学语文教科书为基础,充分以小学生的认知水平与阅读角度建立,在体现出一定的阅读趣味性的基础上充分贴合学生,因此在设计过程中语料库的建立收纳的内容主要以趣味性较强的儿童文学作品为主,例如各种儿歌,顺口溜,童话故事等等。各种材料的收集均体现出以学生为主的设计原则与设计理念[1]。另外在建立语料库时,需要充分结合资料的多样性,因为多样性的文学材料才能够更好的激发学生阅读兴趣[2]。另外,从语料库的容量、形式以及样本处理上都需要充分结合人教版小学语文语料库的教学与研究需求。后期为了能够方便检索,达到最佳的检索效果,需要将每一个收录进语料库的样本当做一条数据记录保存在数据库中,如此一来就十分方便后续的查找,甚至利用一条句子就能够进行全文的检索。

1.2语料库设计的容量

充分结合人教版的教科书,确定语料库中需要包含多少个词汇。由于在设计语料库的过程中不同的设计原则、设计方式其最终的语料库在内容、形式上都会不同。本次在设计的过程中,考虑到人教版小学语文教科书特点,将原始预料全部切分成为长度在2500-6000字次之内的一个片段,并以此作为样本。同时也考虑了实用整个原始文本作为样本的方式,但是考虑到后期的检索方式,因此暂不考虑[3]。考虑到本次语料库的建设主要是以后期的小学语文的拓展阅读提供良好的阅读资源,因此检索得到的结果一定要是一个完整的文本。所以综合性考虑,检索功能中使用关键词的方式,在结合人教版小学语文教科书特点的基础上设计语料库。

1.3语料库设计的形式

分析人教版小学语文教科书中的教学内容,考虑语文教学的特性。由于此次语料库的建设其内容全部都是属于文学一类,而文学类的内容其形式比较多样,而这一点也正好符合了小学语文教学与建立语料库的特点,形式的选择可以将趣味性比较丰富的儿歌、顺口溜、诗歌、童话、谜语、寓言故事等等收录其中。

1.4语料库设计的处理

本次的语料库的样本处理由于仅针对人教版的小学语文教科书,因此采用的是人工标注的形式,将收录的样本按照词性、语法、语义、语用等不同标签进行标注。另外考虑到语料库的检索功能的需求,此次语料库建设过程中采用了两种不同的检索方式,进行样本的处理。一种是将确定收录进语料库的样本划分成为一个一个的句子,然后将每一个句子以数据记录的方式输入进语料库中,利用检索工具使用关键词进行检索。另外一种则是将每一个语料样本作为一个数据记录输入进语料库中,同样利用检索功能使用关键词进行检索,最终目的是得到一个对全文的搜索。

2.小学语文教学语料库的开发

首选理清开发的过程,包含了采集语料、加工语料库、开发语料库的检索功能等。同时配备一定的技术手段,进行开发。

2.1开发第一步——采集语料

(1)可以直接从互联网上下载各种现成的资料,同样利用关键词搜索方式在百度上进行搜索,将需要的各种资料下载下来,作为语料库中的主要内容。

(2)将从互联网上下载的所有资源进行处理,选择合适的文本形式,参考标准的格式本文进行所有资源的整理。

2.2开发第二步——加工语料库

对语料库进行加工实际上就是对语料库内容的加工,而根据语料库中的不同形式的内容其加工主要是针对句子的加工与篇章的加工。

(1)针对句子的加工,主要是利用正则表达式将篇章划分为若干个句子,确定每个句子的长度并将划分好的句子输入进划定的句子数据库中。一般,判断是否为一个句子一般是看句子后面是否有“。”“?”“!”之类的符号,如果是英文中那就是“.”“?”“!”。

(2)针对对一个篇章的加工,为了能够方便检索,需要对每一篇收录的文章进行关键词标注,这种标注可以采用人工标注或者自动标注的形式。两种标注形式都有其利弊[4]。人工标注其得到的结果更加容易理解,但是比较费时费力,另外准确率低于自动标注。而自动标注结果虽然可能不容易理解,但是十分适用于内容含量较大的语料库,十分省时省力,准确率一般会高于人工标注,并且这种标注是来源自真实文本,可信度较高。两者对比分析发现,利用计算机进行语料库的加工会更加有效。

2.3开发第三部——开发语料库的检索功能

(1)句子检索。句子检索可以使用关键词进行检索,利用某个关键词,另外设定跨距来限定关键词的左右语境范围。如果需要得到更多的检索结果需要扩大检索的上下文语境的范围。通过这种方式能够实现对关键词、短语等句子的检索,同时得到的检索结果使用者可以随意的复制与保存。

(2)文章检索。文章的检索则包含了文章的作者、标题、出处甚至是整个文章的全文等等。针对标题、作者等可能重复性较高的可以使用模糊匹配功能,这点以输入法中的模糊音设置有一定的相似性。

3.结语

小学语文教学的语料库的设计目的在于为小学生提供适合不同年级的各种符合其认知水平的儿童文学作品,在丰富的小学语文教材资料的基础上帮助提高小学语文教学质量。这种通过书面语或者口语的样本汇集起来的实际上就是语文语言中的一种。不断的积累与汇集能够反映出小学语文在实际教学与应用中的情况,对我国小学语文教学的发展是很有积极作用的。

【参考文献】

[1]魏顺平,何克抗.小学语文教学语料库的设计与开发[J].中国电化教育,2007,13(06):66-69.

[2]黄梅红.试析小学语文教学语料库的设计与开发[J].现代阅读(教育版),2013,19(10):220.

[3]杨红.学语文教学语料库的设计与开发[J].课外语文(初中),2013,11(02):56.

[4]马晓霞.浅议小学语文教学语料库的设计与开发[J].课程教育研究,2013,51(19):45-46.

猜你喜欢

设计与开发语料库小学语文
《语料库翻译文体学》评介
浅谈高中生物教学中微课程的设计与开发
信息化在《Flash动画制作》课程中的设计与应用研究
优化朗读技巧,提升语文实效
浅谈如何培养学生的阅读兴趣
让多媒体课件为阅读教学助力
拨动情感之弦,让语文课堂绽放精彩
基于WebGL的三维物理模型设计与开发
增强现实技术在移动学习中的应用刍议
基于JAVAEE的维吾尔中介语语料库开发与实现