语义透明度和构词频率对汉语动词多词素词识别的影响
2015-04-22王娟张积家许锦宇
王娟 张积家 许锦宇
摘要 采用重复启动范式,通过两个实验,考察语义透明度和词素构词频率对动词多词素词识别的影响。结果发现:(1)语义透明度影响多词素动词的识别,识别高语义透明度的动词快于识别低语义透明度的动词。(2)词素的构词频率影响低语义透明度动词的识别,不影响高语义透明度动词的识别。对低语义透明动词,词素的构词频率低的动词的反应时显著短于词素的构词频率高的动词。研究结果支持汉语多词素词的多层次双系统选择加工模型。
关键词 动词多词素词,语义透明度,构词频率。多层次双系统选择加工模型。
分类号 B842.5
1 前言
词素是构成词的最小的语音语义结合体。多词素词由两个或两个以上的词素构成。多词素词认知是心理语言学研究的热点。主要有三种观点:(1)词素分解存储模型,认为多词素词以词素分解的形式存储在心理词典中,在整词通达前,词素表征先获得激活。(2)整词存储模型,认为多词素词以整词形式存储在心理词典中,每一个词都有独立的词条。词汇识别由刺激输入直接激活相应的整词表征来完成。(3)混合表征模型,认为在心理词典中既存在词素表征,也存在整词表征,词汇识别是词素表征与整词表征激活的相互作用。对中文多词素词的研究,也形成三种观点,分别是分解存储模型(王春茂,彭聃龄,1999)、多层聚类表征模型(Zhou&Marslen,1994,1995)和内外联接模型(彭聃龄,丁国胜,王春茂,Marcus Taft,朱晓平,1999)。多词素词除具有整词表征和词素表征以外,还具有表象表征。Paivio(1991)提出,人脑中存在言语和表象两个加工系统。言语系统加工抽象的语言信息,表象系统加工具体的客体和事件。在编码、存储、转换和提取中,言语系统与表象系统既相互独立又相互作用。结合双重编码理论,研究者提出多层次双系统选择加工模型,认为在心理词典中存在表象表征和语言表征,语言表征又包括整词表征和词素表征,二者与表象表征处于同一层次。语言系统的组织遵循激活扩散和兴奋、抑制的原则。在视觉输入与语义表征之间存在选择过滤层,负责早期的刺激选择。选择通过能量分配进行,获得较多能量的刺激通过过滤层到达语义层。过滤层的能量分配方案遵循知觉的特征分析原则,在一般情况下,词素分配的能量高于整词。故词素具有优先激活的趋势。词素不仅可以激活其语义表征,也可激活其表象表征。识别语义透明词,词素表征先激活,通过扩散整合成整词表征:识别语义不透明词,不能经由词素表征扩散到整词表征,选择过滤层要重新调整能量分配方案,减少整词通道的阻抑,加大词素通道的阻抑,使整词通道获得更多能量,从而激活整词表征(陈曦,张积家,2005;陈曦,张积家,舒华,2006)。
多词素词认知研究多采用名词,也有研究者考察多词素形容词的加工(张积家,贾春娟,2008)。动词是汉语词汇的大类,约占词汇总量的20.52%,仅次于名词(苏新春,杨尔弘,2006)。在语言的词类系统中,动词是最复杂的子层级系统。因此,考察动词多词素词的认知具有重要意义。语义透明度是复合词的特有属性(臧传丽等,2012),动词同样具有语义透明度:有些动词的语义可以经由词素提供词义线索,不仅词素与整词语义一致,词素亦多为动作动词,有鲜明的动作表象,如“拍打”,它们为语义透明动词:有些动词的词素与整词的语义无明显相关,整词语义不能经由整合词素语义获得,词素亦缺乏鲜明的动作表象。如“关照”,它们为语义不透明动词。动词多词素词的识别是否具有语义透明度效应?语义透明度效应的发生是否还会受到其他因素的影响?词素的职能是构词,汉语词素的构词能力极强。在学习文字时,学习者会凭借直觉计算语言输入的分布特征,包括语言形式单独出现的频率,也包括它与其他语言形式共现的频率。不同的共现频率影响汉字学习,这主要取决于汉字的构词能力。构词频率是描述汉字构词能力的指标。词素的构词频率是否影响汉语多词素动词的加工?词素的构词频率与透明度如何共同影响动词多词素词的识别?通过对上述问题的考察,能够解决动词多词素词加工的特征问题,这拓宽了多词素词研究的领域,同时也有助于更全面地认识多词素词的存储和表征模型,为多词素词表征和加工模型的完善提供证据。
2 实验1 语义透明度对动词多词素词识别的影响
2.1方法
2.1.1被试
本科生58名,男27名,女31名,平均年龄21.4岁,视力或矫正视力正常。
2.1.2设计
2(语义透明度:高,低)×2(启动类型:首字启动,整词启动)×2(SOA:100ms,200ms)混合实验设计。语义透明度为被试内变量,为避免产生练习效应,启动类型和SOA为被试间变量。
2.1.3材料
分为首字启动组和整词启动组。首字启动是指由多词素动词的第一个字作为启动词,动词为目标词(如“投-投票”);整词启动是由多词素动词为启动词。动词的第一个字为目标词(如“关照-关”)。材料包括高语义透明度词、低语义透明度词和基线3种,每种条件有12个真词。从《现代汉语词典》(2005年修订)选取材料。参照语义透明度的操作定义(王春茂,彭聃龄,2000),评定词素与整词的语义相关。30名本科生使用7点量表评定词素与整词意义的相关,若词素与整词意义相关非常高,评定为7,若词素与整词意义相关非常低,评定为1。评定词汇的熟悉度。若对词汇极熟悉,评定为7,若极不熟悉,评定为1。将高、低语义透明动词的词频、首字字频、尾字字频、整词笔画数、首字笔画数、尾字笔画数、语义透明度和熟悉度进行配对t检验。结果表明,两组材料仅在平均语义透明度上差异显著,在其余指标上差异均不显著,见表1。选取12个非动词词素的双字词作为基线,在词频、笔画数等指标上与实验材料匹配。对每组实验材料,将双字动词拆成单字重新搭配,生成与真词数量相等的假词,有36个。在整词启动条件下,启动词与首字启动条件下的36个目标词的真词相同,每个启动词分别启动一个真字和一个假字。真字为启动词的首字,假字采用Truetype造字程序完成,笔画数和结构类型与真字相似。为首字启动和整词启动分别准备了6组练习材料,以使被试熟悉实验程序。
根据已有研究(陈曦等,2006),选取100ms和200ms作为启动词和目标词呈现的时间间隔。每种SOA条件随机分配给两个被试组,每组29名被试。在29名被试中,随机选取14人和15人完成首字启动和整词启动的实验。
2.1.4仪器
采用E-Prime系统编程。奔腾4计算机。
2.1.5程序
正式实验时,首先在屏幕中央呈现红色注视点“+”500ms,然后在同一位置上呈现启动词,间隔相应SOA后再呈现目标词,要求被试又快又准地判断刺激是否为真词/字,如果是真词/字,按下F键,如果是假词/字,按下J键。被试按键后,刺激自动消失,间隔1000ms后进入下一次试验。实验材料随机呈现。计算机自动记录被试的反应时和错误率。计时单位为ms,误差为±1ms。为了让被试熟悉实验任务,在正式实验前进行了练习。
2.2结果与分析
统计被试的反应时与错误率,被试单个材料反应时小于300ms,大于2000ms视为极端反应,不计入统计结果。4名被试删除了超过一半的极端数据,遂将被试删除。反应时分析时删除错误反应的数据和M±3SD之外的数据。被试的错误率很低,不足3%,所以不作分析。结果见表2。
方差分析结果表明,语义透明度的主效应显著,F1(1,48)=8.76,F2(1,22)=5.67,ps<0.05。高语义透明度动词的反应时(M=555.5ms)显著短于低语义透明度动词(M=592.8ms):启动类型的主效应显著,F1(1,48)=33.50,F2(1,22)=12.53,ps<0.05,首字启动的启动量(M=-17.5ms)显著小于整词启动的启动量(M=14ms):SOA的主效应显著,F1(1,48)=4.07,F2(1,22)=2.35,ps<0.05,SOA=200ms时反应时(M=549ms)显著短于SOA=100ms时(M=599ms);SOA和启动条件的交互作用不显著,F1(1,48)=0.17,F2(1,22)=1.36,ps>0.05。语义透明度与SOA的交互作用均不显著,F1(1,48)=0.02,F2(1,22)=0.28,ps>0.05:语义透明度与启动条件的交互作用不显著,F1(1,48)=0.07,F2(1,22)=0.36,ps>0.05。语义透明度、SOA与启动条件的交互作用不显著。F1(1,48)=0.65,F2(1,22)=0.49,ps>0.05。
实验1表明,语义透明度影响多词素动词的加工,高语义透明度动词的识别显著快。整词启动的效果优于词素启动。SOA亦影响多词素动词的加工,SOA越长,识别反应时就越短。
3 实验2 语义透明度和构词频率对多词素动词识别的影响
3.1方法
3.1.1被试
本科生29名,男12名,女17名,平均年龄22.4岁,视力或矫正视力正常。
3.1.2设计
2(语义透明度:高,低)×2(启动类型:首字启动,整词启动)×2(构词频率:高,低)混合实验设计。语义透明度、构词频率为被试内变量,启动类型为被试间变量。
3.1.3材料
共4类,分别是高语义透明度/高构词频率、高语义透明度/低构词频率、低语义透明度/高构词频率、低语义透明度/低构词频率的多词素动词,每组12个词。从《现代汉语词典》(2005年修订版)选出192个动词词素,计算以其为核心词素的词语数量,发现这些动词词素的构词分布大致可以30为界限,故将30作为分界线,构词数<30为构词频率低的词素,构词数≥30为构词频率高的词素。
30名本科生对语义透明度等指标进行评定,若词素与整词的意义相关非常高评定为7。若词素与整词的意义相关非常低评定为1。对语义透明度及词频、笔画数等指标进行单因素方差分析,发现除平均语义透明度和平均构词频率的主效应显著外,其余指标的主效应均不显著。多重比较表明,高语义透明动词与低语义透明动词的平均语义透明度差异显著,p<0.05;在高语义透明动词中,构词频率高与构词频率低的动词的平均语义透明度差异不显著,p>0.05;在低语义透明动词中,构词频率高与构词频率低的动词的平均语义透明度差异亦不显著,p>0.05。构词频率高与构词频率低的动词的平均构词频率差异显著,p<0.05;在高构词频率动词中,高语义透明和低语义透明的动词的平均构词频率无显著差异,p>0.05;在低构词频率动词中,高语义透明和低语义透明的动词的平均构词频率无显著差异,p>0.05。另外选取12个非动词词素的多词素词作为基线,在词频、笔画数等指标上均与实验材料匹配。对每组实验材料,将双字动词拆成单字重新搭配,生成与真词数量相同的假词,共60个。假词的首字与对应的启动字相同。假字根据动词首字或无关词首字进行结构、笔画的匹配获得。练习材料同实验1。实验材料分为首字启动条件和整词启动条件,随机选取14和15名被试完成。
3.1.4仪器和程序
同实验1。
3.2结果与分析
1名被试在超过半数刺激上的反应时超过2000ms,其数据被删除。反应时分析时删去错误反应和M±3SD之外的数据。结果见表4。
方差分析表明,语义透明度的主效应不显著,F1(1,27)=1.18,F2(1,20)=0.97,ps>0.05;构词频率的主效应不显著,F1(1,27)=2.36,F2(1,20)=1.86,ps>0.05;启动类型的主效应显著,F1(1,27)=14.88,F2(1,20)=6.95,ps<0.05。整词启动的反应时(M=500ms)显著快于首字启动的反应时(M=590ms)。语义透明度与启动类型的交互作用不显著,F1(1,27)=0.27,F2(1,20)=0.14,ps>0.05;语义透明度和构词频率的交互作用显著,F1(1,27)=4.39,F2(1,20)=4.83,ps<0.05。简单效应分析表明,对低语义透明度动词,构词频率低的动词的反应时(M=534ms)显著短于构词频率高的动词(M=563ms),0<0.05;对高语义透明度动词,构词频率高的动词与构词频率低的动词的反应时差异不显著,p>0.05。构词频率与启动条件的交互作用不显著,F1(1,27)=0.36,F2(1,20)=0.21,ps>0.05;语义透明度、构词频率与启动条件的交互作用不显著,F1(1,27)=0.13,F2(1,20)=0.09,ps>0.05。
4 讨论
4.1语义透明度影响汉语多词素动词加工
已有研究较为一致地发现了语义透明度对汉语多词素词汇识别的影响。王春茂和彭聃龄(1999,2000)采用词素重复启动法发现,在合成词加工中存在着语义透明度效应,语义透明词的启动量显著大于语义不透明词的启动量,表明语义透明词的词素和整词之间是一种兴奋性的连接,词素促进整词的加工;对语义不透明词,词素和整词之间是一种抑制性的连接,词素抑制整词的加工。高兵和高峰强(2005)要求被试判断组成刺激的两个字能否组成一个词,发现语义透明词的识别显著快于语义不透明词。王文斌(2001)把汉语并列式双字词分成语义透明词和语义不透明词,要求被试对汉字能否构成一个合成词进行判断,发现语义透明词的加工快,语义不透明词的加工慢。综合来看,汉语多词素词的词汇通达均会受到语义透明度的影响。
实验1发现,在多词素动词加工中亦存在语义透明度效应,高语义透明词的识别快于低语义透明词,启动词促进了对高语义透明词的识别,抑制了对低语义透明词的识别。这一结果可以结合多层次双系统选择加工模型和汉字词认知的“两个网络系统”理论来解释。“两个网络系统”理论认为,汉字词认知涉及词汇网络系统和语义网络系统。词汇网络系统表征词形和词音,语义网络系统表征词的语义。在两个网络系统之间。存在着以义符为中介的联结。在词汇识别之前,来自词汇网络中的义符的激活可以直接进入语义网络。激活词的语义,从而有利于汉字词的语义提取(张积家,彭聃龄,1993)。而汉字的字形与字义关系密切,常用义符标记完成动作的器官和动作使用的工具,容易通达汉字的动作器官和动作工具的语义(张积家,陈新葵。2005),并唤起相关动作的表象。根据双重编码理论,在心理表征中同时存在语义表征和表象表征,在语义表征中整词表征和词素表征共存。高语义透明动词的整词语义经由词素语义整合获得。因此,词素的语义表征和表象特征的激活能够为整词语义的获得提供线索,如“争”能为“争吵”的通达提供线索,因而整词的语义通达就快:对低语义透明动词。整词语义不能经由词素语义的整合获得,因而词素的语义特征不能为整词语义的获得提供直接而明确的线索,反而会激活与整词语义无关的语义特征,如“关”可能会预期激活“关闭”的语义,当目标词“关照”出现时,“关闭”的预期语义则会阻碍“关照”的识别,因而难以激活整词的语义表征。此时,选择过滤层就会重新调整能量分配方案,加大对词素通道的阻抑。使整词通道获得了更多能量,这样,识别低语义透明动词的速度就慢了。
4.2多词素动词加工的时间进程
实验1发现,SOA为100ms时,在首字启动下,高语义透明动词的识别速度显著快于低语义透明动词,而在整词启动下,两者的差异不显著:SOA为200ms时,在首字启动下,识别语义透明度不同的两类动词的反应时无显著差异:在整词启动下,高语义透明动词的识别快于低语义透明动词。这表明,在知觉的早期阶段,词素语义激活占优势,整词语义的激活受到抑制,随着加工时间延长,词素与整词获得的能量呈现出此消彼长的趋势。即在SOA=100ms时,首字启动激活了词素表征,词素激活占据了优势;在SOA=200ms时,整词启动激活的整词表征开始占了优势,获得了更多的能量,更快地通达了语义表征。
4.3构词频率对多词素动词加工的影响
实验2操纵语义透明度和构词频率,发现了有趣的结果:在高语义透明度条件下,词素的构词频率不影响多词素动词的识别:在低语义透明度条件下,对词素构词频率低的动词的反应时显著快于对词素构词频率高的动词。这表明,词素激活同时受到语义透明度和构词频率的影响。无论是高语义透明动词还是低语义透明动词,被试都会利用已有的语言经验进行早期选择。对高语义透明动词。语义表征的获得往往经由词素表征的整合获得,在这一过程中,表象表征会激活,而语义透明度对表象表征敏感,因而将在这一过程中发挥主要作用,词素构词频率的作用将不会彰显。对低语义透明动词,语义表征的获得难以通过词素表征整合而成,被试借助经验进行过滤分析时,首字的构词频率将会起作用。构词频率是一种累积特征,反映词素构词能力的强弱。词素的构词频率高,在心理词典内存在多个相似词条,被试需要一一检索。提取速度就慢:词素的构词频率低,在心理词典中与之相似的词条就少,检索速度就快,提取速度亦快,因而在低语义透明条件下,识别构词频率低的动词就比识别构词频率高的动词快。总之,本研究验证了多层次双系统选择加工模型在多词素动词识别中的适用性,并将构词频率作为影响因素纳入模型。词素的构词频率与语义透明度相互作用的时间进程还有待于进一步的研究。
5 结论
本研究得出如下结论:(1)在汉语多词素动词加工中存在语义透明度效应,识别高语义透明动词快于识别低语义透明动词。(2)词素的构同频率影响低语义透明多词素动词的加工。(3)动词词素具有表象表征,表象表征的激活影响多词素动词的识别。