APP下载

汉语双字词常模特征跨词性对比研究

2019-03-14宋丹贵李德高

关键词:词频词义分值

宋丹贵 李德高

(1.浙江大学 外国语言文化与国际交流学院, 浙江 杭州 310058; 2.曲阜师范大学 翻译学院, 山东 日照 276826)

一、 引 言

关于词的常模特征,学界不仅对英语和法语等语言进行了大量研究[1-2],而且对汉语单字词、双字词和多字词的常模特征也分别进行过一些研究[3-4]。研究发现,简体汉字的具体性和意象性之间显著正相关,熟悉性和频率之间显著正相关[5];繁体汉字词义数和频率之间显著正相关[6]。甚至有学者专门考察过名词、动词或形容词的常模特征[7-8]。但是迄今为止,还没有人对汉语不同词性词的常模性特征进行过比较研究。本文拟对现代汉语3 290个常见名词、动词和形容词的常模特征进行比较研究,考察不同词性词的常模特征。

常模研究涉及词的多个特征。词频、词义数、熟悉性、习得年龄、意象性和具体性是汉语字词常模研究中经常考察的指标,其中词频和词义数为客观指标,分值往往通过相应词典直接获取。但是,考虑到心理学研究和其他相关研究,汉语词语常模研究还应包括笔画数、主观词频、主观词义数、可分解性、情感经验度、感官经验度和语义透明度等。笔画数影响汉字的识别加工[9],有助于体现词的视觉复杂性程度;通过量表评定可获得词的主观词频[10];主观词义数是人们对词的含义数量的主观认识,也是认知实验任务中可操纵变量之一[6];可分解性是认知实验任务中的可操纵变量[11],也是反映言语结构复杂性的重要指标[4];情感经验度和感官经验度分别指词能唤起人们的情感经验[12]和具体感知觉经验[13]的程度,两者经常被用作常模特征指标[2,13];语义透明度是指词可以从字面上理解其含义的程度[3],是认知实验任务中经常操纵的变量之一[1]。

现代汉语中,词义和词性特征之间是相互关联的。即在上述13个常模特征(词频、熟悉性、词义数、习得年龄、意象性、具体性、笔画数、主观词频、主观词义数、可分解性、情感经验度、感官经验度和语义透明度)上,名词、动词和形容词之间应存在显著性差异。现代汉语常用词中,双字词占约70%以上的比例[14]。因此,本研究首先确定3 000多个双字词,然后通过系列问卷调查获取其常模特征分值,并进一步对三种词性词在常模特征上的差异性进行比较,为汉语词汇研究提供新的参考。

二、 方 法

首先,把同时出现在《现代汉语频率词典》[15]和《HSK中国汉语水平考试词汇大纲:汉语8 000词词典》[16]中的4 197个双字词和没有出现在《现代汉语词频词典》但出现在《HSK汉语能力测试词汇大纲》前两个级别中的183个双字词确定为初选词。把这些初选词随机分为63组,制成63份词汇联想问卷。问卷指令是“请在每个词的右边,写出看到该词后首先想到的另外一个词”。每份问卷打印50份,随机发放给3 150位在校大学生。把受试应答中累计出现至少两次的刺激词确定为二次选词。再从二次选词中选定在《现代汉语规范词典》[17]中只标示为名词、动词或形容词者,获得3 296个目标词(1 719个名词、1 116个动词和461个形容词)。

然后,从《语境多样性副标题词频库》[18]获得每个词的词频,并分别从《现代汉语多义词词典》[19]和《新华字典》(http://zidian.cibiao.com)获得每个词的词义数和笔画数。同时,把这3 296个目标词随机分为44组,在习得年龄、可分解性、具体性、情感经验度、熟悉性、意象性、感官经验度、语义透明度和主观词频共9个指标上分别制作44个7点量表,量表指令如表1所示。同时,在主观词义数方面制作29个3点量表。把这425个量表打印17份,随机发放给来自7所高校的7 225位大学生。最终,每个目标词在每个特征方面获得17个分值,所有问卷调查的信度系数均高于0.960。同时,我们对3 296个目标词进行词汇判断任务考察,删去被试反应平均准确率低于50%的词,此类词共6个,其中名词、动词、形容词各2个。因此,最终3 290个现代汉语常见双字词入选研究的关键材料。

表1 问卷调查指令

续表1

三、 结果与讨论

(一) 单因素方差分析

各常模特征分值结果如表2所示。考虑到词频和词义数偏度较大,本文对这两个指标的分值分别进行了对数转换。

表2 3 290个双字词各常模特征描述性统计结果

续表2

以词性为变量,对每个指标分值进行单因素方差分析(见表3)表明,名词的主观词义数最少,可分解性分值最低,笔画数最少,意象性分值最高。以往研究也表明,名词的意象性程度高于动词[20]和形容词[21]。在具体性和语义透明度方面,名词的分值比动词和形容词都高,动词比形容词的分值高。名词是三种词性词中具体性最高和语义透明度最高者。然而在情感经验度方面,名词的分值却是三种词性词中最低的。动词与形容词在主观词义数、可分解性、笔画数、意象性方面均没有显著性差异。动词是三种词性词中词频分值最高、感官经验度分值最低和习得年龄最大者。在感官经验度、词频和习得年龄方面,名词与形容词之间没有显著性差异。形容词是三种词性词中熟悉性分值最高、主观词频分值最高、情感经验度分值最高、具体性分值最低和语义透明度分值最低者,名词和动词在熟悉性和主观词频上没有显著性差异。

表3 三种词性词的各常模指标差异比较

注:*、**、***分别表示在0.05、0.01、0.001水平上显著,下同。

(二) 相关分析

对三种词性词的13个特征分值分别进行皮尔森相关分析(见表4)表明,不论名词、动词还是形容词,词频和熟悉性均与主观词频正相关,均与习得年龄负相关。即词频高的双字词通常更为人熟悉,日常生活中更为常用,人们习得的时间也更早。习得年龄与具体性、熟悉性、感官经验度、主观词频、语义透明度负相关。这说明,习得较早的双字词通常其含义更加具体,人们更加熟悉,更易唤醒人们的感官经验,在生活中使用得也更加频繁,其语义透明度也更高。与Li等对成语的研究结果[4]一致,熟悉性与习得年龄负相关,与主观词频正相关,即越是熟悉的双字词,其习得年龄越早,主观词频也越高。具体性和语义透明度正相关,说明双字词的具体性越高,语义透明度也就越高。情感经验度与熟悉性、感官经验度、主观词频正相关,因此,越是容易唤起情感经验的双字词,使用者对它们就越熟悉,它们就越容易唤起使用者的感官经验,在日常生活中越经常使用。感官经验度与语义透明度和具体性正相关,即越是容易唤起感官经验的双字词往往具有越高的语义透明度和具体性。

表4 三种词性词的各常模指标相关系数矩阵

虽然对动词和形容词来说,习得年龄与可分解性、意象性或主观词义数之间的相关性没有达到显著性水平,但对名词来说,习得年龄与主观词义数正相关,与可分解性和意象性均负相关。也就是说,在习得年龄分别与可分解性、意象性和主观词义数的相关关系上,动词和形容词相似,而且两者均不同于名词的情况。此外,以往研究表明,意象性与具体性[5,7,22]和感官经验度[2,13]正相关,但本研究中,这两种相关在名词和形容词上得到证实,在动词上并没有得到证实。

(三) 因子分析

对三种词性词的常模特征分别进行(主成分)因子分析,结果如表5所示。表中因子1—4 大致上可分别命名为频率、语义、视觉复杂性和词义数。虽然三种词性词的常模特征均可归为四个公共因子,但从各因子所主要代表的变量情况看,不同词性词之间既有相同之处又有不同之处。相同的是,词频、主观词频和熟悉性归在因子1频率上,感官经验度、具体性和语义透明度归在因子2语义上,笔画数和可分解性归在视觉复杂度上。然而,其他五个指标的因子所属情况,不同词性词之间有些差异。对名词来说,四个因子在解释各变量间差异方面的贡献率分别为18.91%、18.65%、9.48%和8.68%,而且与对汉语单字词[5]及意大利语名词[7]的研究结果相同,频率的贡献率最大。这四个因子在解释各变量间差异方面的贡献率对动词来说分别为18.69%、15.58%、9.82%和9.09%,对形容词来说分别为17.79%、17.10%、10.04%和9.12%。

表5 因子分析结果

笔画数和可分解性主要反映了双字词的视觉复杂性。这是因为组成双字词的两个汉字的相对位置非常重要[23]。例如,“黄金”和“金黄”就是两个含义不同的词,“阿姨”和“姨阿”分别一个是词,一个是非法组合。因此,初学者往往对双字词中汉字的相对位置容易混淆[24]。此外,对动词和形容词来说,意象性也与笔画数和可分解性紧密关联,但对名词来说,意象性似乎已经抽象成了词义数这样的特征。

习得越早的词的频率越高。这一点适合动词和形容词,然而却不太适合名词。因为对动词和形容词来说,习得年龄与词的频率特征紧密关联,但对名词来说,习得年龄与语义特征紧密关联。对动词和形容词来说,情感经验度与感官经验度、具体性、语义透明度紧密关联,它们体现了词的语义特征。但对名词来说,情感经验度与词频、主观词频、熟悉性紧密关联,也就是说,在日常生活中越常用、越为人们熟悉的名词在词汇识别中越易唤醒人们的情感经验。

以上对3 290个双字名词、动词和形容词在13个常模特征方面的统计分析表明,动词和形容词之间的相似性高于它们分别和名词之间的相似性程度。同时,词的可分解性主要体现在三种词性词的视觉复杂性;习得年龄、情感经验度、意象性和主观词义数似乎最能把名词和另外两种词性区分开来。研究的部分结果印证了印欧语相关结论,也有部分结果属首次发现。因此,双字词常模特征及其与词性关系的这些现象对深入开展汉语词语认知研究有重要参考价值。

猜你喜欢

词频词义分值
“诛”的词义演变及其在古籍中的释义
芍梅化阴汤对干燥综合征患者生活质量的影响
基于词频比的改进Jaccard系数文本相似度计算
如何学习掌握古代汉语词义*——何九盈先生《古汉语词义丛谈》评介
西夏语“头项”词义考
根据认知语义学浅谈英语单词记忆法
悄悄告诉你:统计这样考
谁是科创板创值全能冠军
词汇习得中的词频效应研究
词频,一部隐秘的历史