音乐英语语料库的建设及其教学意义
2019-06-01沈阳音乐学院
■张 婧/沈阳音乐学院
高等音乐院校中英语课程的设置是其教育体系中一门重要的课程。随着国际间音乐交流的日益频繁以及日常学习实践中英语使用频率的增加,要求音乐院校的英语教学不仅仅要完成高校英语教学大纲的基础内容,也要根据音乐院校自身的特点,加大对专业英语即专门音乐用途的英语知识的讲解和灌输,让学生能够真正做到运用英语这个工具来汲取和交流专业信息,以提高自己的专业素养,为自己的专业学习和今后的工作服务。因此,在音乐类专业院校的英语教学中,应该更加突出英语这门语言的专业性和工具性,让英语更好地服务于当下老师和学生在各个专业的学习和研究。
一、语料库语言学及语料库
语料库语言学( corpus linguistics)是上个世纪中后期兴起的一门新兴的语言学分支学科, 它以真实的语言数据为研究对象, 利用各种语料库检索工具对经过加工标注过的语料进行检索和分类, 从调查语言信息的分布频率入手, 以发现以往因条件所限而没有注意到的语言在真实使用中的规律和模式。语料库语言学发展到今天, 种类繁多,根据语料库建设目的和用途的不同, 迄今为止常见的语料库可分为: 通用语料库、专门用途语料库、监控语料库、学习者语料库、类比语料库、平行语料库和教学语料库等。
音乐英语语料库属于专门用途语料库。专门用途语料库和通用语料库相比,使用者可以在专门用途料库中快速、准确、有针对性的搜索到想要的内容。使用者不仅可以凭借语料库平台构建满足研究所需的语料库,也可以使用语料库软件分析语料,检索和提取语言实例及数据。
二、建立音乐英语语料库的必要性
建立专门用途的音乐英语语料库,在专业音乐院校,有以下两点必要性:
首先,“培养国际化专业人艺术人才”是我院培养人才的目标之一,高素质的音乐人才不仅需要在本专业领域中不断提升专业水准,也需要有把国外的优秀作品引入到国内和把我国高水平的传统音乐艺术推向国际舞台的能力。而音乐专业英语语料库的建立,可以为学习者提供更为便利的学习条件,让学习者更能快速地查询到真实准确的语料。
其次,音乐院校学生在进行专业英语学习的难度要更大。一方面由于艺术类学生学习的重心更多地放在专业课上,所以英语基础相对薄弱;另一方面,专业音乐英语词汇往往在专业术语中有着不同于其在基础英语中的含义,所以需要学生对本专业的知识有一定基础后才能够更好地理解和掌握相其对应的英语专业术语的含义。但目前,中国国内已出版的音乐英语方面的专业书籍相对较少。而在互联网上,尽管可以搜索到很多音乐英语相关的文章和词汇,信息较多,但水平参差不齐,对于音乐院校的学生来说,由于自身英语基础较差,时间、精力有限,所以在大量的网页和信息中想要准确地搜索到想要的信息,难度较大。在此背景下,加强对专业音乐英语的研究,对专业音乐英语的词汇和信息的进行系统化地整理,归纳,建立一个专门用途的语料库则显得尤为重要。
三、建立音乐英语语料库的几点构想
语料库的设计是语料库建设中最重要的阶段,它会直接影响到语料库的质量并进一步影响到以后基于语料库的研究工作。在设计阶段, 语料库的建设者必须从语料库的规模、内容、语料样本的选择及对语料进行加工的程度等几个方面加以考虑, 确立语料库的设计原则。
(一)音乐英语语料库的规模
在建设语料库时,其规模并不是越大越好。语料库的无限扩大会出现大量“无用语料”。在建立语料库的过程中,需要不断经过实验数据的证明,找到一个语料适合的百分比,来确定语料库的规模大小。比如,可以设定不同的应用场景,针对需要来在语料库中进行搜索,如果搜索到的信息量很少、不准确或并没有代表性,则说明该语料库中对于该类型的语料准备数量不够,需要继续补充,直到搜索到的语料基本符合搜索条件,这时可以确定该类型的语料数量已基本足够;反之,如果搜索到的语料数量很多,但有一部分是重复语料或无用语料,则需要对语料库中相应语料进行删减和修订。
笔者认为,音乐英语语料库在初期建立时,其语料数量可以为100万条左右。初期的语料库可以为音乐专业英语的教学、翻译及语言研究提供真实可靠的自然语言材料,通过文本检索查询音乐英语在词汇、句法、篇章等各个层面的语言特征,为音乐专业英语在教学、翻译以及学术研究等方面提供强有力的语料支撑。
(二)音乐英语语料库的样本选择
在进行语料库样本的选择时,一方面可以查阅现有的国内外的专业书籍、权威报刊、杂志等资料,选取准确有效的信息,编写到语料库中。同时,也可以利用现有的多样的在线资源,对符合要求的网络中的专业音乐英语信息利及用技术算计技术进行提取。语料库的原始语料的构成和取样一般来说按照明确的语言学原则并采取随机抽样方法进行收集,而不是简单地堆砌语料。在收集时,不仅要考虑到不同的专业、体裁、语域、主题等的抽样比例,还要考虑到语料库的研究目的和具体用途。
从类别上分类,音乐英语语料库的建立可以分为以下几个类别的内容:(1)中国传统音乐英语词汇语料库;(2)外国音乐英语词汇语料库;(3)乐理、音乐史语料库;(4)人名、作品名语料库。中国传统音乐英语词汇的语料库可以为对外推广我国传统音乐文化提供准确的英汉对照词表。乐理、音乐史及人名、作品名语料库的建立不仅在专业的音乐英语教学中方便师生查询资料,更好的为专业学习服务,更有助于师生撰写相关的论文和书籍。
(三)音乐英语语料库的语料处理
语料库的语料加工指语料经过分词、词性标注、句法分析等。由于专业性质较强,且专业分类较细,很难在短时间内对大量的语料进行深加工,所以笔者认为在初建音乐英语语料库时,可以对语料进行分词和词性标注。以后随着语料库在实际中的使用情况,设计者可以对语料库做进一步的加工处理和统计分析。
首先,将准备好的文字语料统一转化为TXT格式。一般原始语料的格式大部分为word, pdf, mobi, html等,其中word, pdf和html格式可以利用很多转换工具转换为TXT格式;mobi格式可利用calibre进行批量转换。由于音乐的专业特点,很多语料的来源为音频形式,所以需要音频进行转写,如利用Sitman PC复读机在计算机上对语音进行反复的播放及转写。
采集原始语料完后,要对资料进行整理加工,主要包括格式处理、标记、检查、统计、自动对齐和自动校对。 由于通过网络、手工录入、扫描识别等方式获得的文本存在不符合规范的符号、格式等,如不加以清理,则会在赋码及检索阶段出错,因此需要先对搜集到的生语料进行清理。可以利用Power GREP或“文本整理器”来实现文本的批量整理、清洁、查询和语言特征提。
其次,对语料进行词性标注。词性赋码通常是在传统语法对词类的划分基础上进行的。 目前词类赋码技术已比较成熟,对英语基本上可以通过计算机系统自动赋码。 标注后的语料包含可以为使用者分析和研究语言提供大量的实证数据。标注版本采用词性赋码,通过TreeTagger自动词性赋码器软件完成。在使用TreeTagger对文本进行赋码时,还可以让程序同时给出原文件中的文本进行词形还原。经过处理、标注过的文本按照类别以文件夹的方式保存在电脑里,待检索使用。
最后,利用AntConc软件对加工后的语料进行检索。该软件是一个开源软件,可以提供Windows,MacOS,和Linux版本。语料库检索的目的是为了导出索引行,以便于使用者批量观察类似的语言现象,找到其使用规律,如搭配的规律、类联接和形式的规律和意义的规律。
四、结语
综上所述,音乐英语语料库的建设,在实践中,不仅会开拓英语教学的新思路,也会为音乐专业的学习和研究开辟新的途径,是教师和学生能够利用的更加现代化的学科工具。鉴于此,音乐英语语料库的建立是非常有必要的。随着多媒体网络技术的不断发展,语料库建设还会不断地完善,对语料库的建设还需要更深入地探索和研究。