APP下载

基于云模型的外语词汇量评估

2013-03-23陶利民

关键词:云滴测试人员定性

陶利民

(杭州师范大学杭州国际服务工程学院,浙江杭州310012)

外语学习中的一个重要部分就是词汇学习.词汇量的大小直接影响到学习者语言输入和输出的质量,也影响其语用和语言交际的能力[1].同时,词汇量对于教学目标的确定、教材编写、教学组织和考试要求具有宏观指导意义,也是教学诊断和教学评估的重要指标.因此,词汇教学成为了外语教学中的一个重要方面,若这一环节不能很好地完成,也就很难完成教学目标.对外语学习者所掌握词汇进行测试评估,是衡量词汇教学效果的一种重要手段.传统的词汇量测试方法主要有词频法和词典法,就是在词汇表中随机抽取若干词汇作为测试样本.其中,词频法是以词汇频率为依据进行词汇抽样,词典法则是以一本词典为调查对象等距离抽样.抽取好测试样本后,采用多项选择法、翻译法、是非判断法、填空法或释义法评测外语学习者对样本词汇掌握程度;再根据样本词汇测试结果按比例计算总体词汇量,最终给出被测人员词汇量大小的估计值,可用式(1)[2]表示:

由于测试结果会受到测试人员的稳定性、心理素质等多种因素的影响,传统的测试方法显得粗糙简单,不够深刻全面,本文将采用基于云模型的定性评价方法来评估外语学习者的词汇量水平[3].

李德毅院士在传统模糊集合理论及概率论基础上提出了云模型[4],借助模糊数学中隶属度函数的思想,建立了一种定性定量不确定性转换模型.云是用语言值表示的某个定性概念与其数值表示之间的不确定性转换模型,用来反映自然语言中概念的不确定性.云模型能统一表达定性概念的模糊性及随机性,并将二者有机集成到一起,构成定性和定量相互间的映射,作为知识表示的基础,从而实现了不确定语言值与定量数值之间的一种自然转换.

1 基本概念

定义1(云) 设U是一个用精确数值表示的定量论域空间U={x},T是与U相联系的语言值.若U中的定量值x是定性概念T的一次随机实现,x对于T所表达的定性概念的隶属度μT(x)是一个具有稳定倾向的随机数,隶属度在论域上的分布称之为隶属云,简称云(Cloud).每一个x称为一个云滴[5].

μT(x)在[0,1]区间上取值,云是从论域U到区间[0,1]的映射,即:

μT(x):U→[0,1],∀x∈Ux→μT(x).

在进行词汇量测试评估的背景下,U表示测试结果,如2 000;T表示词汇量掌握程度,如初级;μ表示某一测试结果对于某一程度的隶属度.

定义2(词汇量云) 词汇量云(Vocabulary Cloud)是一种特殊形式的云模型,它将测试人员所掌握词汇量用云模型的方式反映出来.可将词汇量云定性表示成:VC=Cloud(Ex,En,He).其中,Ex,En,He是反映词汇量云的3个数字特征[6]:Ex是词汇量期望,是最能代表词汇量概念的点,表明测试人员所掌握的基本词汇量.En是词汇量熵,反映了测试人员掌握词汇量达到某种程度所具有的不确定性.一方面En反映了能够代表这个词汇量概念的云滴所具有的离散程度,另一方面也反映了对词汇量概念是一种亦此亦彼的度量.He是词汇量超熵,反映了词汇量熵的不确定性,由熵的随机性和模糊性共同决定.

若要用云模型表示“词汇量约2 000”这一定性概念,则可将期望Ex的值定为2 000,设En和He的值分别为150,20.图1就是利用正向云发生器算法(算法2)生成的语言值“词汇量约2 000”的隶属云.

云模型具有3En规则,就是对于某一个定性概念或者知识,其相应的云对象大部分位于[Ex-3En,Ex+3En]之内,位于[Ex-3En,Ex+3En]之外的云滴元素只是小概率事件,通常都可忽略.图1中就体现了这一规则.

图1 语言值“词汇量2 000左右”的隶属云Fig.1 Membership cloud of“vocabulary around 2 000”

2 评估步骤

利用云模型进行词汇量测试评估,主要经过以下步骤:

1)抽样测试.对测试人员进行n次词汇抽样测试,产生一系列的测试结果定量值:x1,x2,…,xn.

2)生成词汇量云.将测试结果xi作为n个云滴,利用逆向云发生器算法[4,7](算法1),生成词汇量云VC的3个数字特征(Ex,En,He).

算法1 逆向云发生器算法

输入:n个云滴xi.

输出:(Ex,En,He).

算法步骤:

①根据xi计算数据的样本均值,一阶样本中心距,样本方差S2=;

②Ex=

3)综合词汇量云.若对同一测试人员作了不同级别(设有N个级别)词汇的测试,那么每一个级别会形成一个词汇量云,共有N个词汇量云,VCi(Exi,Eni,Hei),i=1,2,…,N.此时,需要利用式(2)将不同级别的词汇量云综合起来得到测试人员词汇量的综合评估云(Comprehensive Assessment Cloud)CAC(Ex,En,He).

4)结果分析.结合综合评估云CAC(Ex,En,He),利用正向云发生器算法[8-9](算法2),对测试人员的词汇量进行定性分析.

算法2 正向云发生器算法

输入:表示定性概念的3个数字特征(Ex,En,He),云滴数量N.

输出:N个云滴x及其确定度μ,即(drop(x1,μT(x1)),drop(x2,μT(x2)),…,drop(xN,μT(xN))).

算法步骤:

①生成以En为期望值,He为方差的一个正态随机数En′i=NORM(En,He);

②生成以Ex为期望值,En′i为方差的一个正态随机数xi=NORM(Ex,En′i);

③计算μT(xi)=;

④令带有确定度μT(xi)的xi成为数域中的一个云滴;

⑤重复①~⑤,直至产生N个云滴止.

当然,也可以利用算法2对各个级别的测试结果作定性分析.

3 实例分析

日本语能力测试(JLPT:The Japanese-Language Proficiency Test)是由日本国际交流基金会及日本国际教育支援协会于1984年建立的一套较为完整的考试评价体系,共分为5个级别(N1、N2、N3、N4、N5),所要求的词汇量分别为12 000、7 000、3 600、1 800、900.本文以N2级所要求的词汇量作为测试样本,将其分为2 000个初级词汇、2 000个中级词汇、3 000个高级词汇.测试时词汇量样本的大小影响测试结果,词汇量样本越大测试结果越准确.考虑到测试人员的心理,取各级别词汇的10%作为测试样本[10-11].为了计算需要,进行15组测试,根据测试人员的测试结果,利用式(1)可以估算出测试人员所掌握的词汇量.表1列出的是A,B两位测试人员每组词汇的实际测试结果.可将每组词汇测试结果看作是一个云滴,因此每个级别的词汇测试可产生15个云滴.

表1 被测人员每组词汇实际测试结果Tab.1 Vocabulary actual test results of tested personnel

将表1中每个级别的测试结果当作云滴,作为逆向云发生器算法(算法1)的输入,就能计算出每个被测人员的初级、中级和高级3个级别分级词汇量云的特征参数(Ex,En,He),由此得到被测人员的各级词汇量的定性评价结果.结合云模型的3个特征参数的含义及实际应用情况,可利用这3个参数来反映影响被测人员测试结果的不同因素,其中,期望Ex最能体现被测人员的词汇量水平,熵En反映了被测人员的稳定性,超熵He反映心理素质,如表2所示.

表2 分级词汇量评估结果特征参数Tab.2 Characteristic parameters of graded vocabulary assessment results

根据表2中分级词汇量云的特征参数,利用正向云发生器算法(算法2)可以得到被测人员A,B的分级词汇量评估结果的云图(图2~图3).从图中可以直观地看出:被测人员A分级词汇量水平整体上比B高,但A测试结果较离散,稳定性不如B.相较而言,B的测试结果较集中,发挥也比较稳定.

图2 被测人员A分级词汇量云图Fig.2 Graded vocabulary cloud of tested personnel A

图3 被测人员B分级词汇量云图Fig.3 Graded vocabulary cloud of tested personnel B

分级词汇量评估结果见表2.利用式(2)将其综合,得到被测人员的整体词汇量水平,如表3所示.

根据表3结果,利用正向云发生器算法(算法2)可以得到被测人员的整体词汇量评估云图,如图4所示.从图中可直观地看出:被测人员A的词汇量较大但是发挥不够稳定,比较而言,B的词汇量中等,但是发挥较为稳定.

表3 整体词汇量评估结果特征参数Tab.3 Characteristic parameters of overall vocabulary assessment results

图4 被测人员的整体词汇量水平云图Fig.4 Whole vocabulary level cloud of tested personnel

4 结束语

云模型能揭示自然语言中概念的两种不确定性即模糊性和随机性的内在关联性,并把两者完全集成在一起,实现定性语言值与定量数值之间的转换.与传统的定性评价方法相比较,基于云模型的定性评价方法实用性强,而且评价结果直观、全面深刻,更加符合实际情况.另外,此方法也具有可行性和有效性,用之来评估外语学习者的词汇量,具有实用意义.

[1]钱旭菁.词汇量测试研究初探[J].世界汉语教学,2002,62(4):53-62.

[2]杨大平,刘桓中.英语词汇量自测与学习策略研究[J].山东外语教学,2002,91(6):49-51.

[3]李广琴.词汇量对第二语言习得的影响和词汇习得策略研究[J].西安外国语学院学报,2006,14(1):9-10.

[4]李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34.

[5]杜湘瑜,尹全军,黄柯棣,等.基于云模型的定性定量转换方法及其应用[J].系统工程与电子技术,2008,30(4):772-776.

[6]李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20.

[7]沈进昌,杜树新,罗祎,等.基于云模型的模糊综合评价方法及应用[J].模糊系统与数学,2012,26(6):115-123.

[8]吕辉军,王晔,李德毅,等.逆向云在定性评价中的应用[J].计算机学报,2003,26(8):1009-1014.

[9]王洪利.基于云模型的不确定性变量半定量化研究[J].统计与决策,2012,362(14):4-6.

[10]郁梅.大学生英语词汇量问题研究的回顾与思考[J].金陵科技学院学报:社会科学版,2006,20(2):100-103.

[11]周颂波,顾晔,郭亚莉.词汇量测试述评[J].外语界,2008,124(1):90-95.

猜你喜欢

云滴测试人员定性
移动应用众包测试人员信誉度复合计算模型研究
分裂平衡问题的Levitin-Polyak适定性
福建九仙山一次佛光的云滴粒子尺度分析*
你不知道的雷雨知识
当归和欧当归的定性与定量鉴别
高校分析测试中心测试队伍建设方案初探
浅析软件测试中的心理学应用
云微物理特性及云滴有效半径参数化:一次降水层状云的飞机观测资料结果
云滴谱离散度对气溶胶间接效应影响的研究进展
共同认识不明确的“碰瓷”行为的定性