APP下载

通用学术词表的对比研究
——选词、评估和分级标准

2017-01-04游金干何家宁

山东外语教学 2016年6期
关键词:词表选词词频

游金干,何家宁

(1.福建农林大学 金山学院,福建 福州 350002;2.广东外语外贸大学 国际商务英语学院,广东 广州 510420)

通用学术词表的对比研究
——选词、评估和分级标准

游金干1,何家宁2

(1.福建农林大学 金山学院,福建 福州 350002;2.广东外语外贸大学 国际商务英语学院,广东 广州 510420)

本文对三个通用学术词表进行对比分析,探究其在选词标准、评估标准和分级标准上的不足。研究发现:1)以频数、分布和离散度等为选词标准,仍存在统计指标和阀值设定上的疏漏之处;2)以覆盖率为评估标准,无法揭示学术词表遗漏学术词汇,却收录专业词汇和低频词汇等缺陷;3)以词族频数为分级标准存在信度和效度问题。学术词表不但在共有词族上的分级值并不一致,而且同族词汇中含有不同频数和分布特征的词目。通过对词汇分类、学术词汇共核和词频概貌等理论的探讨,本文拟构建更合理的选词、评估和分级标准。

通用学术词表;选词标准;评估标准;分级标准;不足

1.0 引言

通用学术词表①是二语词汇习得和学术英语教学领域的重要课题(Nation,2001;Schm itt,2010),其中最具代表性的有 University Word List(Xue&Nation,1984)、Academ ic Word List (Coxhead,2000)和 Academ ic Vocabulary List(Gardner&Davies,2014),以下分别简称为 UWL、AWL和 AVL。UWL是在前人编制的词表基础上整合而成,共有 836个词族,应用于早期的词频分析软件 Range和词汇水平测试中(Nation,2001)。AWL依托学术英语语料库,采用严谨的频数、分布等选词标准,共有 570个词族,广泛应用于学术英语教学、词汇测试和词典编纂等领域(Coxhead,2011;Lea et al.,2014)。AVL是在1.2亿词的 COCA学术子库基础上,采用细致的选词标准编制而成,收录约 2000个词族(3000个词目),目前应用于在线学习工具(Gardner &Davies,2014)。

尽管学术词表不断更新,但学界对此类词表的选词标准、评估标准和分级标准却鲜有系统化地探讨。首先,当前选词标准的批判分析主要涉及 AWL设定的频数阀值、剔除 GSL普通词汇以及语料库中各学科语料分布不均等问题(Hyland&Tse,2007;Eldridge,2008;Neufeld et al.,2011;Gardner&Davies,2014),而对 UWL和 AVL选词标准的讨论很少,缺乏深入的对照分析。其次,学术词表的评估标准主要是词表的覆盖率,即词表的词族频数在语料库中所占的比例。然而,覆盖率只能粗略地揭示词表的整体特征,未能证实个体词语收录的合理性(Durrant,2014)。最后,学术词表常以频数、分布等指标进行分级排序。分级子表不仅可作为学术词汇教学的参考,还可应用于词汇测试和词汇联想等研究中(Fitzpatrick,2007;Webb&Sasao,2013)。但是,各个学术词表对相同词语的分级排序却有较大出入。吴瑾、王同顺(2007)研究表明,AWL词汇的分级值与其在 JDEST语料库②中的分级值存在明显差异。鉴于此,本文从选词、评估和分级标准对 UWL、AWL和 AVL三个学术词表进行分析,探究主流学术词表的不足之处,以构建合理的选词、评估和分级标准。

2.0 分析框架

通用学术词表是以词汇分类、学术词汇共核(Common Core of Academ ic Vocabulary)和词频概貌(Lexical Frequency Profile)等理论为基础,采用一系列的统计指标为实践方法,确定词表的选词、评估和分级标准。本文的分析框架见图 1,下文将分别探讨选词、评估和分级标准的理论基础和实践方法。

图1 分析框架

学术词表的选词标准是以词汇分类为理论基础。Nation(2001)将学术语篇中的词汇分为四类:普通词汇、专业词汇、学术词汇和低频词汇。普通词汇是指在一般语篇中占有很大比重,实现基本交际功能的高频词汇。普通词汇并无一致的界定,但词表研究常将其与 GSL词表(West,1953)相关联。专业词汇是具有较高辨识度的学科词汇,与语篇的学科和主题紧密相关,包括某些领域中特有的词汇,或者带有专业意义的普通词汇。学术词汇是广泛分布于各科学术语篇,具有学术特征和功能的较高频词汇。低频词汇则是普通词汇、专业词汇和学术词汇之外的,在语言交际中较少使用的词汇。鉴于以上词汇分类,UWL、AWL和 AVL学术词表采用频数、分布和离散度等选词指标,用于筛除普通词汇、专业词汇和低频词汇。

学术词表的评估标准是以学术词汇共核为理论前提。学术词汇共核的假设是:不同学科的学术语篇存在共同的核心词汇,通用学术词表是各个学科的学习者在构建学术语篇时所需的基本词汇资源(Coxhead,2000;Hyland&Tse,2007)。在此前提下,如果学术词表在各个学科的学术语篇中都有较高的覆盖率,而在其他语体中的覆盖率较低,则可以验证学术词表收录了学术核心词汇。因此,UWL、AWL和 AVL学术词表均以词表覆盖率为评估标准,以验证词表的合理性和优越性。

学术词表的分级标准是以词频概貌为理论依据。词频概貌是指在大型的语料库中提取词汇频数,并按词频高低进行频段分级。词频概貌能用于区分不同水平的学习者,高阶学习者比低阶学习者使用更多的低频词汇(Laufer&Nation,1995;Laufer,2013)。因此,词频概貌是词汇分级教学和词汇水平测试的重要依据。学术词表的分级标准大同小异,主要以词族频数为分级标准,UWL和 AWL均分为十级,而 AVL只按词频排序,未进行分级。

3.0 研究设计

3.1研究问题

本研究拟探讨以下问题:1)通用学术词表的选词标准是什么、有何不足、如何改进?2)通用学术词表的评估标准是什么、有何不足、如何改进?3)通用学术词表的分级标准是什么、有何不足、如何改进?

3.2研究步骤与工具

本文使用的词表工具见表 1,研究步骤如下:

表1 词表工具一览表③

1)词表处理:使用 BNC_COCA 25000词族表对三个学术词表中基础词(headword)不一致之处进行统一。例如,compatible词族在 UWL、AWL和 AVL中的基础词分别为 incompatible、incompatible和 compatible。由于 compatible和 incompatible同属 compatible词族,因而将三表的基础词统一为 compatible。

2)词表选词:以 COCA学术库总表为主要数据,分析三个学术词表的选词指标和阀值设定,旨在探讨学术词表在选词标准上的不足。

3)词表评估:分析三个学术词表的重叠情况,以及学术词表中单表词汇的词类特征,旨在探讨学术词表在评估标准上的不足。首先,为了分析学术词表的重叠情况,我们将三者所收的词汇分类为单表、双表和三表词汇,并进行颜色标注和分类汇总。例如,able是 AVL独有的词族,标记为单表词汇;accompany只出现在 UWL和 AWL中,即为双表词汇;abandon是三者共有的词汇,则为三表词汇。

其次,我们确定专业词汇、普通词汇和低频词汇的参考标准,用于分析单表词汇的词类特征。参考标准的选用主要考虑到三个学术词表在选词标准上的差异和不足。专业词汇是参考COCA学术库总表所列专业词汇,并规定分布值应低于 7;学术词汇是采用调整后的 AVL指标,对频数、比例、离散和分布的阀值分别设置为 1200、1.3、0.8和 7,并移除 AVL中的学科指标;普通词汇则参考 GSL词表④;低频词在 COCA学术库中的阀值设为 1200(即标准频数应低于 10次/百万词)。

4)词表分级:分析三表在共有词汇的分级值上的一致性,以及 AVL词目表的频数和分布值的聚类情况,旨在探讨学术词表在分级标准上的不足。UWL、AWL和 AVL的分级标准分别为词族频数和分布值,词族频数以及学术词族频数。为验证各学术词表间分级值的一致性,我们汇总 AVL的词族频数,借鉴 AWL分级方法,将 AVL词族表按词族频数分为十个子表,作为各表分级值的参考点。这是因为 UWL和 AWL均以词族频数为分级标准,而且 AVL词族分级值是基于大型均衡的学术语料库,数据较为可靠。此外,我们还使用 AVL词目表,按词频和分布值进行 K均值聚类分析,用于验证词族分级排序的合理性。

为避免大量数据处理时的人工差错,研究步骤中词表的重叠情况标注、数据提取和分类汇总均通过自编的 VBA代码实现,并进行手工校对。

4.0 数据结果与分析

4.1 学术词表的选词标准分析

三个学术词表的选词思路都是通过量化指标对普通词汇、专业词汇和低频词汇进行筛除。三者采用的选词标准及其不足见表2。

表2 学术词表的选词标准及其不足

为了剔除普通词汇,UWL和 AWL将 GSL词汇排除在外,而 AVL则采用比率指标,规定学术词汇在学术子库中的标准频数应超过总库的 50%(即比率值为 1.5)。UWL和 AWL使用剔除 GSL的方法有欠妥当,因为 GSL较为陈旧,未必符合普通词汇的使用现状(Eldridge,2008)。更重要的是,剔除 GSL词汇势必造成大量的关联派生词也被排除在外,而且普通词汇和学术词汇并无天然的界限。比如,剔除 accept词族直接影响到 acceptance、acceptable和 accepted等学术词的收录。又如,form不仅在学术语篇中的频数比普通语篇要高,而且在学术语篇中可能有不同的词义特征。AVL虽能避免以上不足,但其设定的 1.5阀值是值得推敲的。在 COCA学术库总表中,不少指标值低于1.5但高于1.3的词汇可以作为学术词汇,例如:accompany、investigate和 ultimate这些处于临界值的词汇未收录于 AVL中。机械的阀值设定可能导致部分学术词汇的遗漏,尤其是在普通语篇中高频复现的学术词汇。

为了筛除专业词汇,UWL使用分布指标,但并未设定严格的阀值,甚至收录分布很窄的词汇,如 astronomy。AWL限定了分布阀值,但忽略了词汇在不同学科中的离散程度,仍会收录离散度较高的专业词汇。比如,AWL收录的 simulate在各学科中的频数存在明显差异。AVL则采用分布、离散和学科指标将学术词汇和专业词汇加以区分,但其选取的指标仍有不足。首先,其采用 Julliand&Chang-Rodriguez(1964)的 D值这一离散指标存在敏感度问题。提取 COCA学术库总表中 territory(各科频数值:2682、58、1117、1272、520、485、1205、93、161)和 converse(各科频数值:13、4、19、17、21、24、26、9、10)在九大学科中的频数值,我们发现尽管两者离散值均为 0.90,但前者的离散程度明显高于后者。其次,学科指标会导致在某些学科中频数偏高的学术词汇未能收录于通用学术词表,譬如:expectation的比率、离散度和分布值分别为1.85、0.92和9,除学科指标外其他均达标,但 AVL将其列为教育学科的专业词汇。

为了避免收录低频词汇,AWL将频数阀值设为 100,但 UWL和 AVL未设定严格的频数阀值,这会导致词表收录低频词汇,如 atom和 amorphous。一方面,较低的词频可能影响到其他指标的可靠性;另一方面,将低频词纳入学术词表毫无意义,学习者可以通过查阅词典解决低频词问题。

4.2 学术词表的词汇评估分析

表 3显示 UWL、AWL和 AVL所收词汇的重叠情况,三表共有的词汇达 310个,而单表词汇在各表中所占比重不一。单表词汇分别占各表收词数的 31.8%、10.5%和 69.3%。三者的收词差异表明,三个学术词表可能遗漏部分学术词汇,却收录非学术词汇。

表3 学术词表所收词汇的重叠情况

表4 学术词表中单表词汇的词类特征

三个学术词表中单表词汇的类别构成如表 4所示。UWL中存在大量的专业词汇(如 cylinder)和低频词汇(如 incessant),分别占其单表词汇的 23.7%和 36.5%。AWL中专业词汇(如 automate)和低频词(如 imm igrate)较少,且不收录普通词汇,而 AVL中普通词汇(如 able)和低频词汇(如 insuperable)则占较大比重(30.2%和 40.3%)。三个词表还存在遗漏学术词汇的问题,分别有 43、25和 484个词是未被另两个词表收录,如 evoke、foundation和 measure。这不仅印证了学术词表在选词标准上的不足,也表明词表覆盖率并非有效的评估标准。

尽管上述数据能大致呈现学术词表的缺陷,但有三个事项需要注意:其一,由于同一词族的各个词目存在特征差异,无法按词族进行分析,比如:provide和 provided作为学术词汇,但provider却是医学领域的专业词汇。表 4是基础词的分析数据,而非整个词族;其二,专业词汇、学术词汇、普通词汇和低频词之间仍存在部分重叠之处。最后,三个词表所遗漏的学术词汇数量不止表 4所列的单表词汇数据。对 UWL和 AWL共有的双表词汇(未收录于 AVL)进行分析,发现仍有 35个词达到调整后的 AVL学术词汇标准,如 accompany和 criteria等。

4.3 学术词表的分级排序分析

表5显示 UWL、AWL中词族的分级值与 AVL的分级值差分析。由于三表均分为十级,我们假定值差小于等于 1的为分级差距小的词汇,而差值大于等于 3即为差距较大的词汇⑤。显然,UWL和 AWL只有将近一半的分级值与 AVL接近(50.5%和48.1%),而约有 30%的分级值相差较大。同时,我们还发现,UWL、AWL与 AVL分级值差较小的词多有重叠且多为高频学术词汇,而分级值相差较大的词多无重叠,通常是中低频学术词汇。譬如:UWL、AWL与AVL分级值差较小的词汇都有 achieve和 affect,这些词多为高频词;反之,两者与 AVL分级值差较大的词汇各有不同,UWL中有 allocate和 arbitrary,AWL中则有 analogy和 attain,这些词多为中低频学术词汇。可见,三表的共有词汇在分级值上一致性较差,尤其是是中低频的学术词汇。

表5 学术词表中共有词汇的分级值差⑥

为进一步分析以词族为单位的分级排序的合理性,我们对 AVL词目中的频数和分布值进行 K均值聚类分析。由于数据的量纲不同,频数和分布数据进行标准化处理。聚类分析的最终类别中心点以及各个类别的记录数见表 6。各个聚类的特征描述如下:

表6 AVL词目的频数和分布值的聚类分析

第 1类:分布广的高频词,此类别的特征是频数值为各聚类中最高,分布值较高。在 AVL词目表中,这类特征的词目数最少,仅有 41个。第 2类:分布广的中低频词,这类词汇尽管频数值较低,但分布值却是各类中最高的。AVL词目表中,共有 815个词目属于此类。第 3类:分布窄的中高频词,这类词汇频数值较高,但分布值却较低,共有 213个。第 4类:分布窄的低频词,此类词汇的特征是频数值和分布值都是各类中最低的,但这类词汇数量众多,共 1946个。

通过聚类分析,发现学术词汇的频数值水平和分布值高低并不趋同。UWL采用分布和频数为标准的子表分级方法,在某些情况下是存在矛盾的。进一步分析同族学术词目的聚类情况,结果发现同一词族的词目中有许多属于不同聚类。例如,develop、developed和 underdeveloped是 develop词族下的三个词目,但三者分别属于第1、2和 4类。这证实了以词族为单位的分级子表忽略了不同词目在频数、分布特征上的差异。

5.0 讨论

5.1 选词标准与词汇分类

选词标准分析显示,UWL、AWL和 AVL的选词指标和阀值设定仍有不足。选词指标的主要缺陷在于筛除 GSL词汇的指标和离散度指标。是否有更合适的选词指标还有待进一步验证,如 Paquot(2010)采用的关键值指标(Keyness)和 Gries(2008)提出的 DP离散指标。阀值往往依靠研究者的试验和直觉确定,但机械的阀值设定可能影响词语收录的合理性。阀值设定应相对宽泛,并结合手工甄选,确保收录学习者亟需的学术词汇。

学术词表常以词汇分类为理论基础,通过频数、分布和离散度等统计指标,试图划定学术词汇与其他词汇的界限。事实上,专业词表的选词思路也是如出一撤。例如,Konstantakis (2007)和 Hsu(2011)在编制商务词表时,分别筛除 GSL词汇和 BNC3000高频词汇,将商务词汇和普通词汇严加区分。但是,学术词汇与普通词汇、专业词汇是一个连续体,并非泾渭分明(Paquot,2010)。普通词汇在专业语篇中也能作为学术词汇和专业词汇,学习者未必掌握了普通词汇在专业语篇中的特殊用法。因此,词汇分类理论并非对词类进行严格的界定,选词时不应对词类进行机械的区分。

5.2 评估标准与学术词汇共核

词表评估分析显示,UWL、AWL和 AVL存在遗漏学术词汇,却收录普通词汇、专业词汇和低频词汇等问题。这不但证实了学术词表在选词标准上的不足,也表明了以词表覆盖率为评估标准的缺陷。正如 Durrant(2014)所言,覆盖率只能反映词表的粗略特征,无法揭示学术词表中的个体词语特征。比如,Gardner&Davies(2014)通过对比 AVL570个词族和 AWL的覆盖率,验证 AVL的优越性。然而,AVL收录了许多 AWL所剔除的 GSL高频词汇,这必然提高了 AVL的覆盖率。另外,Hyland&Tse(2007)发现学术词汇存在学科变体特征,在不同学科中的频数和分布存在明显的差异。因此,学术词表的评估标准应当以个体词语特征为基础,采用其他学术语料库,验证学术词表在收词立目上的合理性(如 Kwary,2014)。

三个学术词表的重叠情况在一定程度上可以验证学术词汇共核的观点。近年来,学术词表研究一直存在通用学术词表与专业学术词表的分歧(词汇共核和词汇变体)。有学者断定由于学科间的词汇使用差异,根本无法提取所谓的通用学术词表(Hyland& Tse,2007;Durrant,2014)。但事实上,通用学术词表和专业学术词表分别呈现了学科间的词汇共性和个性,不能因学科间的词汇差异性而否认其词汇相似性(Paquot,2010;Gardner&Davies,2014)。表 3数据显示,三个学术词表共有的词汇是 310个,两表重叠词汇均在 200个以上。三者采用不同的语料数据和选词标准,但所收词汇仍有大量的重叠。可见,词汇共核在各学科之间是存在的,这也是学术词表评估的理论前提。

5.3 分级标准与词频概貌

词表分级分析显示,学术词表的分级排序仍存在信度和效度问题,UWL、AWL和 AVL在共有词汇的分级值上有明显的差异,且同族词汇中含有不同频数和分布特征的词目。一方面,三者采用的语料数据各不相同,导致分级值有所差别。UWL主要依据前人所编词表的数据,AWL语料库的学科类别较少,AVL依托的语料库较为均衡。另一方面,同一词族的各个词目在学术语篇中的频数、分布会有较大差异。同时,许多学习者未必能掌握所有的同族词语,词缀分析能力在很大程度上依赖于学习者的词汇知识水平(Schmitt&Zimmerman,2002;Gardner,2007)。例如,information、inform、informed和 informant同属 inform词族,但语义联系较为松散,学习者可能无法凭借基础词的词义,推断其派生词的含义。因此,合理的分级标准应当以均衡的学术语料库中提取的词目频数为基础。

词汇研究通常假定词频概貌对中高频词汇而言具有稳定性,不受语料库的语体和学科变量影响(Meara,2005;Milton,2009)。但表5数据显示,UWL、AWL和 AVL仅有将近一半(50.5%和48.1%)的共有词汇的分级值较为接近,而且将近30%(29.2%和28.7%)的分级值相差悬殊。可见,词频概貌应用于学术词表研究中具有不稳定性,会受学术词表所收词汇和学术语料库的均衡性影响。其一,词频概貌通常是在大型语料库的词频表基础上按 1000词为一个频段进行设定的(Laufer,2013)。但是,学术词表收词数量较少,如果分级过细,则每个频段所含词数过少,可能影响词频概貌的稳定性。其二,词频概貌的稳定性受语料库的语体和学科特征影响,三个学术词表的语料差异可能直接影响到三者在共有词汇的分级值上的差异。因此,涉及学术词表分级排序的词汇测试等研究还应审慎考证。Nation(1983)和 Schmitt et al.(2001)分别将 UWL和 AWL作为词汇水平测试中学术词汇部分的参考词表。Webb&Sasao(2013)认为,学术词汇测试不能仅以 AWL总表为依据,应使用 AWL的分级子表,编制细致的五级学术词汇量表。考虑到 AWL分级排序的不足,学术词汇的分级测试还有待更完善的学术子表。

6.0 结语

本文从选词标准、评估标准和分级标准入手对比分析三个通用学术词表。研究显示,通用学术词表常采用客观的统计数据,选取具有教学价值的学术词汇。尽管词表不断精细化,但仍存在以下不足:1)就选词标准而言,UWL缺乏系统化的选词标准;AWL欠缺离散指标,而且片面地筛除 GSL词汇;AVL的离散指标和学科指标尚有不足,频数和比率等指标的阀值设定不合理。2)UWL、AWL和 AVL均以覆盖率为评估标准,但覆盖率无法显示词表所收词语的具体特征与不足。三表各有遗漏部分学术词汇,而且 UWL和 AWL收录了专业词汇和低频词汇,而 AVL则收录大量的普通词汇和低频词汇。3)以词族频数为分级标准存在信度和效度问题。三表在共有词汇的分级值上有较大的差距,而且同族词汇中含有不同频数和分布特征的词目。

本文结合词汇分类、学术词汇共核和词频概貌等理论探讨,针对学术词表的不足,提出更合理的选词、评估和分级标准:1)选词标准既需采用系统化的选词指标和阀值设定,还应以学习者的实际需求为导向;可结合学习者语料库和问卷调查等方法,进一步完善选词标准;2)评估标准应以个体词语的统计特征为基础,使用其他学术语料库验证收词的合理性;3)分级标准应以大型均衡的学术语料库中提取的词目频数为依据。

鉴于目前学术词表的不足,以学术词表为基础的词表编制、词汇测试和词典编纂等领域的部分研究还需重新考证。

注释:

①为了行文简洁,“通用学术词表”常简称为“学术词表”。

②JDEST是上海交大科技英语语料库,语料分为文科、理科、工科和医科,共33个细目学科,语体包括学术论文、研究报告、教材等。

③BNC/COCA 25000词表见于新版 Range中配置的词表;COCA学术库总表和 AVL词目表出自 Gardner &Davies(2014);GSL出自West(1953)。

④本文认为筛除GSL词汇的选词标准是不合理的,但为了说明三个学术词表的收词差异,以及词表覆盖率作为评估标准的不足,普通词汇的标准仍参考 GSL词表。

⑤假定的理由:将学术词表所收词语分为高、中、低频三类,那么原先十级制下的分级值相差大致为3,则表明分级值差距明显(即高、中、低频分类的差异)。

⑥三个学术词表共有的词汇达310个,其中有33个在 UWL中无分级值,故 UWL共统计277个分级值。

[1]Coxhead,A.A new academic word list[J].TESOLQuarterly,2000,34(2):213-238.

[2]Coxhead,A.The academic word list 10 years on:Research and teaching implications[J].TESOLQuarterly,2011,45(2):355-362.

[3]Durrant,P.Discipline and level specificity in university students’written vocabulary[J].Applied Linguistics,2014,35(3):328-356.

[4]Eldridge,J.No,there isn’t an“academic vocabulary”,but...:A reader responds to K.Hyland and P.Tse’s“Is there an‘academic vocabulary’?”[J].TESOLQuarterly,2008,42(1):109-113.

[5]Fitzpatrick,T.Word association patterns:Unpacking the assumptions[J].International Journal of Applied Linguistics,2007,17(3):319-331.

[6]Gardner,D.Validating the construct of word in applied corpus-based vocabulary research:A critical survey [J].Applied Linguistics,2007,28(2):241-265.

[7]Gardner,D.&M.Davies.A new academic vocabulary list[J].Applied Linguistics,2014,35(3):305-327.

[8]Gries,S.T.Dispersions and adjusted frequencies in corpora[J].International Journal of Corpus Linguistics,2008,13(4):403-437.

[9]Hsu,W.A businessword list for prospective EFL business postgraduates[J].Asian ESP Journal,2011,7(4):63-99.

[10]Hyland,K.&P.Tse.Is there an“academic vocabulary”?[J].TESOLQuarterly,2007,41(2):235-253.

[11]Julliand,A.&E.Chang-Rodriguez.Frequency Dictionary of Spanish Words[Z].The Hague:Mouton de Gruyter,1964.

[12]Konstantakis,N.Creating a business word list for teaching business English[J].ELIA,2007,7:79-102.

[13]Kwary,D.A.Oxford Learner’s Dictionary of Academic English.2014[J].Lexicography:Journal of ASIALEX,2014,1(2):189-192.

[14]Laufer,B.Lexical frequency profiles[A].In C.A.Chapelle(ed.).The Encyclopedia of Applied Linguistics [C].Oxford:Wiley-Blackwell,2013.

[15]Laufer,B.&P.Nation.Vocabulary size and use:Lexical richness in L2 written production[J].Applied Linguistics,1995,16(3):307-322.

[16]Lea,D.,V.Bull,S.Holloway&R.Duncan.Oxford Learner’s Dictionary of Academic English[Z].Oxford:Oxford University Press,2014.

[17]Meara,P.Lexical frequency profiles:A Monte Carlo analysis[J].Applied Linguistics,2005,26(1):32-47.

[18]Milton,J.Measuring Second Language Vocabulary Acquisition[M].Bristol:Multilingual Matters,2009.

[19]Nation,I.S.P.Testing and teaching vocabulary[J].Guidelines,1983,5:12-25.

[20]Nation,I.S.P.Learning Vocabulary in Another Language[M].New York:Cambridge University Press,2001.

[21]Neufeld,S.,N.Hancioˆglu&J.Eldridge.Beware the range in RANGE,and the academic in AWL[J].System,2011,39(4):533-538.

[22]Paquot,M.Academic Vocabulary in Learner Writing:From Extraction to Analysis[M].London:Continuum,2010.

[23]Schmitt,N.Researching Vocabulary:A Vocabulary Research Manual[M].Hampshire:Palgrave Macmillan,2010.

[24]Schmitt,N.&C.B.Zimmerman.Derivative word forms:What do learners know?[J].TESOLQuarterly,2002,36(2):145-171.

[25]Schmitt,N.,D.Schmitt&C.Clapham.Developing and exploring the behaviour of two new versions of the Vocabulary Levels Test[J].Language Testing,2001,18(1):55-88.

[26]Webb,S.A.&Y.Sasao.New directions in vocabulary testing[J].RELC Journal,2013,44(3):263-277.

[27]West,M.AGeneral Service List of English Words[Z].London:Longman,1953.

[28]Xue,G.&I.S.P.Nation.A university word list[J].Language Learning and Communication,1984,3(2):215-229.

[29]吴瑾,王同顺.Coxhead“学术词汇表”的适用性研究[J].国外外语教学,2007,(2):28-33.

A Comparative Study of General Academ ic Word Lists:Criteria ofWord Selection,List Evaluation and Rank Ordering

YOU Jin-gan,HE Jia-ning
(1.Jinshan College,Fujian Agriculture and Forestry University,Fuzhou 350002,China;2.Schoolof English for International Business,Guangdong University of Foreign Studies,Guangzhou 510420,China)

This paper com pares three genera l academ ic word lists(GAWLs)to discover their de fects in the criteria of word selection,listevaluation and rank ordering.The findings are that1)the criteria ofword selection involve the frequency,range and dispersion of vocabulary,but there is room for im provement in the statisticalmeasures and threshold settings;2)coverage is commonly used as the criteria of listevaluation,which,however,fails to reveal the fact thatGAWLs om it some academ ic words,and include technicalwords and low-frequency words;3)word fam ilies in GAWLs are rank-ordered by frequency,but this practice is flawed in that the ranks are inconsistentamong GAWLs,and members of the same word fam ily may differ considerably in the distribution pattern.Meanwhile,we discuss theoretical issues such as vocabulary classification,Common Core of Academ ic Vocabulary and Lexical Frequency Profile,in order to develop more reasonable criteria ofword selection,list evaluation and rank ordering.

generalacadem ic word list;criteria ofword selection;criteria of listevaluation;criteria of rank ordering;lim itations

H319

A

1002-2643(2016)06-0050-09

10.16482/j.sdwy37-1026.2016-06-007

2016-05-31

本文为国家社会科学基金项目“商务英语学习词典研编”(11BYY055)、福建省中青年教师教育科研社科项目“基于语料库的商务英语词表研制”(JAS150836)的部分成果。

1.游金干(1986-),男,福建福清人,讲师。研究方向:语料库语言学、二语词汇习得。

2.何家宁(1965-),男,广西崇左人,教授。研究方向:词典学。

猜你喜欢

词表选词词频
基于词频分析法的社区公园归属感营建要素研究
选词写故事
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
选词填空好方法
读一读,选词填空
叙词表与其他词表的互操作标准
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色
参考答案