基于语料库的IT英语词汇特征及教学研究
2013-08-15蒋丽平
蒋丽平
(广州大学华软软件学院 外语系,广东 广州 510990)
一、IT语料库的数据统计与分析
为了为IT英语教学研究提供可靠的数据支撑,我们建立了671万词的IT英语语料库,对其中的102万词的IT英语语料进行了词性标注,利用Antconc等常用的语料库分析搜索软件对所选的IT英语语料进行了多维的统计和分析,并得出一系列数据结果。
(一)IT英语中句式的统计数据及分析
在IT综合文档语料库中,我们对61448个句子进行了统计,并根据句式对其进行分类,其中57673个陈述句,占句子总量的93.857%;疑问句的数量为3582,占句子总量的5.829%;感叹句的数量为193,占句子总量的0.314%(程世禄,蒋丽平,2012)。从这些数据可以看出,在IT英语的运用中,陈述句的数量最多,占最大比例。这说明IT英语中句式较为单一,这也符合IT专业英语简洁严谨的特点。所以与陈述句相匹配的相应词汇,如名词等也相应水涨船高;而与疑问句、感叹句相对应的疑问词、形容词、副词等相应较少;感叹词在IT英语文献中出现的次数更少,可以忽略不计。
(二)IT英语中虚词的统计数据及分析
虚词是指在句子中不能独立承担句子成分,也没有词形的变化的词,包括冠词、介词、连词、感叹词。
在进行统计的61448个句子中,包括重复的共有1001310个单词,使用词汇量为13355个。对这些词汇的具体频率以及所占比例进行统计分析,其中频率最高的10个虚词的具体情况是:“the”一共出现70496次,占总词汇的7.040%;“to”26037次,占总词汇的2.600%;“a”23471次,占总词汇的2.344%;“of”21736次,占总词汇的2.171%;“and”21294次,占总词汇的2.127%;“is”17370次,占总词汇的1.735%;“in”15986次,占总词汇的1.597%;“for”12005次,占总词汇的1.199%;“that”9783次,占总词汇的0.977%;“use”7867次,占总词汇的0.786%[1]。在所统计的前10位的高频词汇中,冠词、连词和介词占大多数,这说明IT英语具有普通英语的一般特征,要大量地使用普通词汇,尤其是普通词汇中的冠词、介词和连词。
在另一个语料库中,我们对冠词、介词和连词进行了更为细致的数据统计。在我们创建的总量为1027459词次的IT英语语料库中,冠词共出现94820次,覆盖率为9.32%。其中定冠词出现62540次,不定冠词出现32280次。介词在语料库中出现117027次,覆盖率为11.39%。词频表中前10位的介词是:of,出现27715次;in,出现19692次;to,出现13398次;for,出现10029次;with,出现7371次;on,出现7178次;by,出现6910次;from,出现3969次;at,出现3242次;into,出现1480次。连接词分为连接单词、短语、句子的等立连词和各种从句的从属连词。IT语料库中标注的等立连词有and,出现26804次;or,出现7347次;but,出现2376次;both,出现1054次。连词的覆盖率为3.66%。
通过对这些数据进行分析,可见介词、冠词和连词这类虚词在IT英语中所占总量不多,但在运用中使用频率最高。这三类词词义微小,词形简单,方便记忆,使用灵活,功能强大,通常没有具体实义,但在句子的结构中发挥重要作用,尤其在以客观、严谨而著称的IT英语中运用很频繁。这类词虽然拼写简单,但常与常用搭配相联系使用,人们在使用中时常出错,应为IT英语教学所重视。
(三)IT英语中实词的统计数据及分析
在普通英语中,实词在句子中起着表词达意的重要作用,包括名词、形容词、动词、副词及数词等(张华,2008)。实词对于文学表达具有重要意义,词汇数量巨大,名词、形容词、动词等几类实词更是学习英语的主要词汇来源。根据所创建的IT英语语料库分析统计,按英语词性进行分类,九类词的出现频率和覆盖率分别为:名词出现频率为359199次,覆盖率为34.96%;代词55174次,覆盖率为5.37%;数词21782次,覆盖率为2.12%;动词163674次,覆盖率为15.93%;形容词94423次,覆盖率为9.19%;副词44591次,覆盖率为4.34%;冠词104698次,覆盖率为10.19%;介词117952次,覆盖率为11.48%;连接词59181次,覆盖率为5.76%。
从这些数据可以看出,IT英语作为英语的一个分支,仍然具有普通英语的一些特征,其中普通词汇比例比较高。但是IT英语词汇也有其不同于普通英语的特点。从各类词的覆盖率差异可以看出,名词的所占比例远超过其他词类,IT英语作为科技英语的一种,具有科技英语的语体特点,而大量使用名词或名词词组正是科技英语的一大明显特征,这就是所谓的名词化倾向。名词化(nominalization)的词主要用于表示动作或状态,属于抽象名词,一般由动词派生而来,也包括具有动作意义的名词(如use)和由形容词加后缀-ability,-ity,-ness等构成的名词[2]。名词化名词抽象度高,难以记忆,但表义精准,与科学技术逻辑思维或抽象思维属性相符,是科技英语运用中不可或缺的语言手段,成为科技文体的重要特征。
IT英语要客观、准确地记载和陈述信息,所以形容词和副词的使用相对较少、相对简单。据IT英语语料库所反映的数据,形容词共出现93479次,覆盖率为9.09%。其中比较级出现4336次,最高级出现1803次。副词共出现42542次,覆盖率为4.14%。其中比较级出现2142次,最高级出现911次。具有IT特色的形容词有digital,出现1204次;wireless,出现725次;mobile,出现673次;optical,出现390次;compatible,出现288次;accessible,出现195次。但是,IT英语中有大量的分词作定语,而TreeTagger软件对词汇标注时却将之归属于v-ed和v-ing。如increased reliabilit、specialized superconductor等。
在动词方面,系动词在IT英语中出现频率最高,主要是为了精确地解释事物和显示事物的特征;系动词be的8种形式中,is使用最多;在表示相似的系动词和感官动词中,seem和appear使用最多,并能出现在不同的系表结构中;在表示状态变化的系动词中,become和get在IT英语中的分布形成鲜明的对比,主要是受语体特点的影响。
在数词、感叹词方面,IT英语中的数词所占比例不大,覆盖率为2.12%。IT英语中的感叹词少得可以忽略不计。
二、IT英语词汇的教学研究
(一)IT专业英语词汇量的重要性
语言的学习始于对词汇的掌握。著名的语言学家Wilkins提出了英语金字塔实验。金子塔的塔顶是语篇,其次是句子,然后是短语,塔底是词汇。另一实验数据来源于美国语言学家DILLER,他作过一个统计,如果我们认识25个最常见的英文单词,那么平均每页纸上的字我们就会认识三分之一;如果我们认识135个常用词,平均每页纸上的字我们则认识50%;如果认识2500个单词,则为78%;如果5000个单词,则为86%;如果10000个单词,则为92%。他同时认为,外语学习者要想比较顺利地阅读中等难度的文章,10000个词汇量是最基本的条件。
(二)IT英语名词优先
针对IT英语名词词汇数量多、单词长且较难的特点,需要创新教学方法以提高名词学习能力。
1.发散式联想记忆
名词在IT英语中运用最为频繁、覆盖率最高,应当成为教学以及翻译的重点。可以通过发散式联想记忆的方法扩大IT英语名词词汇的积累。如记忆动词、形容词词或者其他词性的词汇时,也应该教会学生注意它的名词变体,这样在记忆一个其他低频词汇的同时,也记住了IT英语中更为常见的名词形式,提高了记忆效率。加强IT英语名词的学习,并以此为基础扩散到副词、形容词等其他属性词的学习,对于IT英语词汇学习可以起到事半功倍的效果。
2.前缀优先
从IT英语词汇语料库数据可以看出,在IT英语名词中,派生词数量非常多。通过派生法构成的词汇在专业英语中占有很大部分,它是在已有词的基础上通过添加前缀或者后缀来构成新单词。这些词缀有名词词缀,如inter-,sub-,in-,tele-,micro-等;形容词词缀,如im-,un-,-able,-al,-ing,-ed等;动词词缀,如re-,under-,de-,-en,con-等。前缀的使用在IT英语词汇中很频繁,如retry—重试及hypertext—超文本等。在IT英语词汇的教学中,应当注重词汇前缀的教授,这样可以培养学生举一反三的能力,有利于提高学生猜测陌生长单词词义的能力,减轻专业词汇的记忆负担,使学习更加轻松。
3.合成词优先
通过对IT英语中的名词进行分类,可以发现合成词数量颇多。合成词是IT英语词汇的一大特点,其组成面广,多数以短划线“-”连接单词构成,或者采用短语构成。合成词有专门的构词法则,不可以随意构造。在IT英语名词教学中,应重视合成词的教学,例如down(下来)+load(装载)=download(下载);pass(通过)+word(单词)=password(密码)。学习构词法,能够了解合成词的构造规律以及方法,帮助学生分析冗长的合成词,并形成合成新词汇的能力。在IT英语中,构词法相当普及,掌握一定的构词方法可以提高记忆效果。
(三)虚词的强化运用
尽管虚词本身没有确切的实际意义,但在句中起着连接、引导、转承、变换、伴随、比较、让步、时序等多种作用,所以对整个句子的含义有着决定性的影响。在IT英语中,虚词虽然词汇总量不多,但在运用中重复率高,这就要求我们强化虚词的教学。而在虚词中,介词的运用最为灵活,也最容易出错,需要我们多加精力进行研究。在教学中,需引导学生注意虚词在句子中的位置、排列特点、前后连接的成分是否对称以及标点符号、动词时态等,从而培养学生良好的语感。
三、结语
在语料库数据的基础上,根据各种不同词性词汇的分频特点,有所侧重地进行教学。对于覆盖率最高的名词,应当创新教学方法,着重进行教学;对于记忆并不困难但反复使用的冠词、介词和连词,应加强练习,巩固公共英语语法基础;对于动词,根据IT英语语体特点,着重进行情态动词以及系动词的教学;对于较少使用的形容词、副词,可以将其转化为名词形式;对于覆盖率很低的数词、感叹词等,应当简略教授。基于数据库科学数据的IT英语词汇教学方法,可以提高IT英语词汇学习效率,提高IT英语语言能力。
[1]程世禄,蒋丽平.IT英语语体的语言特征——基于IT英语语料库的分析[J].广州大学学报,2012(10):54-58.
[2]李丙午.科技英语的名词化结构及其翻译[J].中国科技翻译,2002(1):5-7.