留学生词汇韵律与语块意识习得分析
2019-11-19张文莉李思宁
张文莉,李思宁
(燕山大学文法学院,河北秦皇岛066004)
一、引言
汉语作为二语学习者是本族语非汉语而且以汉语作为目的语的学习者,它不区别汉语学习环境和多种语言的习得次序。但是,汉语与学习者母语差异、目的语环境和学习时长等都会影响二语学习者的汉语水平。因此,汉外语言对比、语言环境、篇误分析、中介语以及认知能力等都是研究汉语二语学习者的重要方面。汉语输出结果反映了学习者用汉语对大脑中意象概念加工组合能力。陆俭明曾对感知客观事物到用言辞表达客观事物作过六个层面的假设,即由感知客观世界形成意象,进一步抽象形成意象图式,然后投射到人类语言形成语义框架,该框架投射到具体语言形成该语言的构式,填入词形成句子[1]。曹剑芬曾讨论概念和思维在构成词句中的作用和二语习得与思维的联系[2],我们把二语学习者从意象图式投射到汉语语义框架的阶段称为汉语认知加工,而汉语语义框架到汉语构式输出称为汉语认知加工机制。汉语输出反映二语学习者在汉语认知域中意象图式形成汉语表达的能力。
本研究的汉语作为二语学习者是指在汉语目的语环境下的学习者,忽略学习者汉语是第二语言或者第三语言的情况,主要是从语言材料处理与输出结果考察学习者汉语能力,探究对汉语意象概念的加工输出情况。实践上,从韵律切分角度观察学习者材料处理和输出。韵律包括语音的音长、重音、声调、语调和音渡等,汉语韵律层级一般包括韵律词、韵律短语和语调短语三级,通常一个韵律词至少由一个音步组成[3]。和对汉语母语者韵律研究不同,二语学习者韵律切分并不完全等同于汉语母语者的韵律单位,其切分结果反映出学习者中介语发展特征。其韵律词汇是汉语学习者在连续语言中动态停顿形成的,是对汉语认知概念加工的结果,因此,它可能包括汉语韵律层级中的一级或多级。
韵律切分能力高低是考察留学生词汇习得、阅读能力和汉语认知加工过程等不可回避的内容,从韵律切分角度,考察学习者的韵律单元与切分能力,有益于汉语词汇教学、阅读教学及培养学习者汉语认知加工能力。韵律切分以韵律单元作为衡量标准,由母语为汉语者认定切分能力和韵律单元的准确性。具体表现为:(1)韵律单元可以是有意义的成分,也可以是无意义的成分,两者都是用汉语加工的结果,该结果不反映认知能力高低或者认知对错,而是反映用汉语进行认知加工输出能力。(2)韵律单元是否构成相对完整的意义作为韵律切分能力高低。因为词是最小的可以独立运用的语言单位,代表着一个相对完整的认知概念,如果小于词或者把词作了错误的切分,则认为没有形成恰当的汉语认知概念及表达。如果韵律单元包含较多的词且具有相对完整的意义,那么其汉语认知的抽象加工能力更强。(3)汉语二语学习者韵律切分单元从小于词、等于一个词或者多词组合等为标尺,作为词汇习得和汉语认知加工能力的衡量工具。(4)从分词标记有无是否造成不同的韵律切分单元,衡量每个受试者汉语词汇习得与汉语认知加工是否稳定。
二、研究材料、对象和方法
研究材料为国家规划教材《发展汉语》一部分课程内容。该材料共4段,660个汉字,21个句子。平均句长为30个字,细分为57个小句,每个小句包含2至10个不等的词。调查问卷分为无标记语料和有标记语料。无标记原始语料保留了逗号、句号和问号,去掉了对句子划分没有影响的单引号和双引号。使用教育部语言文字应用研究所计算语言学研究室的分词与标注软件生成有标记语料,该有标记语料仅保留分词标记,去除词语属性。意在分析“有无分词标记对韵律切分的影响”“韵律切分与语法范畴的关系”“韵律切分与汉语水平关系”“词汇概念对留学生韵律单元切分的影响”等问题。
受试对象是燕山大学的留学生,汉语水平为初级二和中级一。按照HSK标准,中级一受试对象的成绩都在四级水平及以上,在本国学习一年及以上的汉语;初级二的受试对象还没有通过四级考试或正准备参加四级考试的留学生,在本国或在中国已经学习了近6个月的汉语。受试对象来源于俄罗斯、印度、吉尔吉斯斯坦、白俄罗斯和韩国等国家。
调查过程分为词汇讲解前与讲解后两个环节。在每个环节中,受试者先读无标记语料,然后再读有标记语料,教师记录受试者韵律切分单位,同时记录受试者语音,以便后期进一步核实与分析。运用计算机辅助手段处理调查结果和分析,把受试者韵律切分情况与无标记语料、有标记语料进行对比,统计分析受试者韵律在不同等级和不同意象概念的分布特征;与词汇比较,探讨词汇与韵律单位、语块间关系,从语言理论解释词汇教学模式,并从数据上支撑词汇教学。
三、留学生韵律单位和词汇之间总体关系
以词为单位,把测试样本分成394个单音节、双音节或多音节词,从受试者对有标记与无标记材料进行韵律切分结果,发现留学生对两种文本的韵律区分情况。留学生韵律单元与词汇数值关系如下:
表1 留学生韵律单元与词汇数值关系
整体上,韵律单元数值小于词汇数值(394),有无标记的韵律单元数量基本相当,但是有标记韵律单元数量略少于无标记韵律单元数量。可见,分词标记不但没有影响学生阅读,反而有益于更大范围的韵律单元形成,同时,有无标记对于韵律单元的形成以及数量没有显著影响。受试者“词汇与韵律单元均值”较为接近,也说明有无标记或提示,对留学生概念认知加工的作用并不明显。但是,两种“词汇与韵律单元均值”都说明留学生韵律单元单位大于汉语词汇单位。以上情况说明留学生在习得基本词汇,或在没有完全掌握基本词汇,进而形成目的语下的概念意象图式情况下,会根据已有的目的语知识对词汇进行映射加工,构建出多于词汇意义且超过自己已有构式水平的语言表达形式,这种有意识的韵律切分虽然不一定是完整的语义表达,但是,二语学习者已经有意识地在认知域范围内运用目的语中的概念框架加工相应的语言单位(韵律单元)。如受试者,中级6和中级3,韵律单元均值都超过或者非常接近于2个词。留学生“词汇与韵律单元尾”几乎完全一致,也说明:留学生在获得基本的词汇概念时,会不自觉地运用意象图式构建认知框架,表现出与语音不同的韵律划分单元。如受试者(初级1)有切分标记韵律单元和词汇与韵律单元尾相同项分别为243和241,这两例有差异的韵律单元是“#自己/#配#不上/她/”“她/完#全/#”③,第一项中,受试1将“配不上”分开,“配”作为单独的韵律单元,而将“不上她”构成另一个韵律单元,说明受试初级1还不了解动词的复合趋向补语,而且“不上她”的语义输出也不明确;第二项中,将“完全”概念分开,“她完”构成一个韵律单元,“全”作为一个韵律单元,而在无标记语料中,第二项“完全”韵律切分正确,说明受试者“完全”语义概念加工的稳定性不足。纵向来看,随着汉语水平的提高,无论是切分标记有无,汉语学习者韵律单元的数量均呈递减趋势。汉语水平与韵律单元之间呈反比关系,正与汉语水平越高者对目的语认知意象和认知加工能力越强相应,通过对词汇组合的高度概括和认知框架的结合,加工成更大的语义概念进而投射到具体汉语目的语语法结构上。除了初级1,其他韵律单元包含词汇的均值都在2个左右,反映出留学生运用韵律单元的整体水平相对较为稳定。
四、两个及以上词汇的韵律单元分布
从韵律单元与词汇数值关系,我们能发现留学生韵律单元的稳定性与随机性。如果一名受试者的韵律单元包括两个以上的词汇数量较多且相对集中,就可认为,该留学生韵律单元运用能力较强;而如果数据较为分散、不具有一定数量的稳定值且差异较大,我们有理由怀疑,该留学生运用了回避原则或者只是偶然现象,还没有形成较为清晰的目的语意象图式和认知加工机制。因此,分析两个以上词汇与韵律单元非常有意义。把汉语词类切分的结果与留学生韵律单元进行比较,包含两个及以上词汇的韵律单元数据如下(见表2):
表2 包含两个及以上词汇的韵律单元
数据显示:受试对象在包含多词的韵律单元总量上较为接近,都在120个左右。从韵律单元包含词汇多少来看,每个受试表现出不同程度差异。首先,初级1与中级2韵律单元相差两个,但是,初级1主要是两个词汇的韵律单元,而中级2三个词汇和四个词汇的韵律单元比初级1多十二个,所以中级2的汉语水平和构式能力明显比初级1突出。初级2与中级1相差两个,但是,初级2以两个词汇的韵律切分单元为主,中级1三个及以上词汇组合加工能力强于初级2。从三个以上韵律单元来看,中级1目的语下的意象图式与汉语认知框架能力是被试对象中最优秀的。具体来看,初级2六个词汇的韵律单元是“你/为什么/要/放/盐/呢”,中级 1 是“每次/她/都/对/服务员/说”,相比较中级1,初级2的韵律单元更加口语化,中级1的句子更似陈述式。我们再来看初级2对中级1句子的韵律切分:在有分词标记的情况下为“每次/#她/都/#对/服务员/说/”。 在无分词标记的情况下为“每次#她#都#对服务员说”。中级1对初级2句子的韵律切分为:在有分词标记的情况下为“你/#为什么/要/#放/盐/呢/?”在无分词标记的情况下为“你#为什么要#放盐呢?”可见,无论是否有切分标记,中级1都表现出稳定性,对该句子的两个加工过程形成较为一致的意象图式投射,而初级2在两个文本中表现出不同的韵律切分,说明其概念意象的形成还处于中间过渡时期,不稳定性较为明显。两名留学生对六字词汇的韵律处理,正说明对汉语目的语的认知加工能力与语块组合能力的差异[1]。
上述分析,让我们看到数值背后所表现出的因词汇组合与加工能力不同而表现出受试者汉语认知加工机制的差异。从概率分析上,通过判断每个受试韵律单元与均值之间的离散程度,说明每个受试者韵律单元加工词汇的广度和稳定性,以及不同受试者韵律单元切分与组合能力。把所有韵律单元做方差分析得到如下数据:
表3 韵律单元的词汇分布及方差
上述数据可视化处理,得到留学生韵律单元的均值和总体特征、每个受试对象离散程度、韵律单元使用的稳定性和包含词汇多少。如图1:
图1 韵律单元分布与词汇关系
图1表明:除初级1超过40外,其他被试对象均值都在30-40之间,这些受试者的韵律单元具有整体水平上的一致性。作为汉语学习者,初级1的词汇再加工能力低于其他被试,其汉语语义框架的语言加工能力相对低于其他同学,使得其韵律单元与词汇表现出更多的一致,因此,培养初级1汉语语义加工和准确输出能力将更为重要。汉语词汇习得是词汇教学的初始阶段,虽然初级1的汉语词汇并不少,但是,由于没有形成一定的汉语认知意象与汉语构式,不能对所见词汇进行加工进而形成更大概念的韵律单元,所以,词汇教学的高级阶段是如何对汉语词汇进行认知加工与组合输出,这是衡量留学生汉语水平的关键,被试3、被试5、被试7和被试8的韵律单元均值较低,这四者对词汇组合与认知加工的能力更强,其汉语水平相对于其他被试更好,其汉语目的语的意象图式更多些。
由此可见,词汇量并不等于留学生韵律单元的多少,随着汉语水平的提高,留学生目的语的韵律切分也将更加稳定。在初级水平,虽然词汇量可能超越中级水平学习者,但由于汉语认知加工机制不稳定,造成韵律单元的多样性,所以,在词汇教学中,根据留学生的水平,应适当增加适合目的语认知框架与意象概念形成的构式语法或语义组合教学策略。而建构主义基础上的教学策略与教学方法,可以作为有益的尝试[4]。
五、有无分词标记的个案对比分析
对比同一受试者对有无标记文本划分的韵律单元,一方面,可以观察分词标记对留学生韵律切分的影响程度,哪些学生更易受其他标记影响;一方面,两种文本共有韵律单元可以反映出留学生韵律单元认知加工的一致性。一般情况下,共有韵律单元越多越能体现出认知加工的共性,有可能运用了共同的认知框架,进行认知概念及语义的加工,进而输出各种概念的语言构式。但是该数据无法证明认知加工能力强和目的语的意象图式的丰富性,要对文本中共有韵律单元作进一步的细化分析才能证明认知能力的强弱。有分词标记有而无分词标记无和无分词标记有而有分词标记无的韵律单元,说明对于两种材料,同一受试者韵律单元包括的词汇数量多少不同,进而产生不同的韵律单元,该类不同划分说明认知加工的差异:有的是包容关系,有的是交叉关系,有的是有意义的语块,甚至是小句,而有的是无意义的切分。对留学生个人来说,每一个韵律单元都是汉语认知能力与目的语输出能力的体现。两种文本韵律单元数值如下:
表4 韵律单元在有无分词标记文本中的分布
数据显示:中级4和中级5分别有140和143韵律单元,而初级1“两文本共有韵律单元”有123个韵律单元,但是初级1韵律单元总量为295,所以,其数值与中级4、中级5的意义不同。因其共有韵律单元数量相当,初级2、中级2、中级3和中级6可归为一组。中级1与其他受试数据分布特征差异较大,既有分词标记的影响因素,又有语块构成方式多样性的因素。例如:
(1)她呢,尽管很吃惊,然而出于礼貌,还是答应了。
(2)她#呢,尽管很吃惊,然而#出于#礼貌,还是#答应了。(无分词标记语料韵律切分)
(3) 她/呢/,尽管/#很/吃惊/,然而/出于/礼貌/,还是/#答应/了/。(有分词标记语料韵律切分)
句子(2)和(3)的韵律切分结果只是语块的大小之别,从“她”“呢”到“她呢”、“尽管”“很吃惊”到“尽管很吃惊”、“然而”“出于”“礼貌”到“然而出于礼貌”,每种韵律切分都符合汉语语义内容,且不受分词标记的影响,将汉语语义框架或投射到词,或投射到小句,反映出受试者中级1能根据自己的汉语认知能力,自如且准确地在词和句法层面进行汉语认知加工输出。
总体来看,根据受试者具有相同或相似认知框架产生相当的韵律单元,可以看出上述受试者已经形成一定数量且较为稳定的意象图式与汉语认知加工能力。中级4与中级5各自两种文本重合率较高,说明两名受试者目的语认知加工与语义组合能力较为稳定,同时,在具有大致相当的韵律单元总量下,各自两种文本内部关于韵律单元的划分存在分歧,这种分歧表现在无分词标记的韵律单元与有分词标记的韵律单元的差集上(中级4∶54,54;中级5∶38,45),除了因分词标记影响词汇加工的韵律单元外,更可能是由深层次的概念处理与认知框架的不确定性造成的。这种不确定性,并不能简单的区分初级与中级,还需要分析具体的语言构式,找出这些相异韵律单元的构式,进行有针对性的词汇或语法教学,促使留学生形成目的的意象加工模式。
六、两种文本相同韵律单元的构成分析
相同的韵律单元只是反映总体上的认知加工能力,而从这些韵律单元的内部构成,可以更清楚地发现每个留学生认知加工的词汇类型和认知加工机制水平。首先,从词汇数量所构成的韵律单元上分析,是考察留学生汉语认知加工的一种途径,它反映留学生词汇加工能力与汉语语块表达能力[1],一般情况下,韵律单元含有的词汇越多,留学生的汉语表达与加工能力越强。相反,留学生认知加工能力就弱。
表5 在有无分词标记文本中的韵律单元与词汇关系
如上表所示,无论有无标记,受试者相同切分占到了一半,有的达到了七成。整体上看,有无标记对留学生韵律单元的形成没有太大影响,而中级1却与其他被试不同,其重复项低于一半,造成差异的原因有两种:(1)由于受试者韵律切分的不稳定性或随意性造成词与词之间随意切分。(2)受试者采用不同汉语认知加工方式投射到不同的汉语构式上,结合前面分析,中级1受试的原因属于后者。其次,把中级1与其他受试者相同韵律单元对比,其他受试者韵律单元主要包含一个词汇或两个词汇,特别是初级1,虽然两文本中相同的韵律单元较多,但基本上都是一级韵律单元相同,即无论是有无标记,初级1都是以一个单词作为一个韵律单位,其他受试者都保持相对稳定的均衡度,而中级1一级韵律单元较少,同时存在三、四、五个词组成的韵律单元,而且,在所有被试中,由三个词组成韵律单元的概率最高,说明中级1的汉语认知的加工机制能力较强,而且对汉语语义加工显示出更大的灵活性,这种灵活性是对目的语意象图式的多种理解为基础,在此基础上通过汉语中不同的构式显现出认知意义。
七、留学生对特殊标记材料的处理
为考察留学生意象概念与认知加工和词汇的关系,以及词汇切分标记对留学生认知表达是否有影响,考察一些特殊的句子和词的切分,可以发现留学生表现出的整体特征。例如对有停顿现象的韵律切分如下:
(1)他结结巴巴地说:麻、麻、麻烦您拿点儿盐过来。
(2)小声说:我、我喝咖啡习惯放点儿盐。
上述两句,几位受试者其韵律切分都是“麻烦您”,而不是依词汇的区别在“麻烦”与“您”之间作韵律切分,也没有因为前面两次的停顿,而在每三个“麻”字上作出时间上的停留。这说明所有受试者对“麻烦”一词有全面的掌握,而且对由麻烦构成“V+N”的意象加工机制有着较为准确的认识,作为具有完整意义的韵律单元,已具有语块的特征。第二句中,受试者的切分主要有“我喝/咖啡”与“我喝咖啡”两种类型,其中,汉语水平较高者基本上以后者为主,而上述分析中初级汉语水平者,也是以“我喝”为组合韵律单元。说明留学生已经能很好掌握以话语者自述为中心的述谓结构,即留学生容易加工以自我为话语陈述出发点的意象概念。
综上所述,初级水平的汉语学习者,韵律单元的切分与词汇构成基本相当,而相对较高水平的汉语学习者韵律单元突破词汇单位,出现多个词汇组合作为韵律单元的情况。切分标记对初级水平汉语学习者影响较大,随着汉语水平的提高,切分标记并不能决定韵律单元的切分单位;意象图式形成前后,其切分有明显变化,韵律单元的切分更加语块化,其韵律单元表现出一个相对完整的概念,也就是说,对于相对高水平的汉语学习者来说,虽然词不能决定韵律单元的切分,但是,对学习者构成恰当的目的语意象图式有积极作用,留学生词汇教学仍然需要用词汇与语法的类推机制,形成更大的韵律单元,从而切分出完整意象的语块。
注释:
① 指在有切分标材料中韵律单元尾与词汇划分相同,但韵律单元的首与该词汇不一定相同,即存在两个及以上的词汇作为一个韵律单元。
② 前数值指无切分标记韵律单元与词汇的均值,后数值为有切分标记韵律单元与词汇总数的均值。
③ “#”号表示受试者韵律切分结果,“/”号为分词结果。
④ 这里指包括两个词汇及以上的韵律单元数量。
⑤ 此三个字段都是去除重复韵律单元后数据。如“说”在无标记文本中三次单独切分,只计1次。再如中级1在两个文本中共有84个韵律单元相同,因韵律切分结果相同,去重后只计69个韵律单元。
⑥ 此三个字段的数据都是去除重复韵律词的结果,如“说”字在无标注文本中三次单独切分,我们只计作一个。如被试3在两个文本中共有84个韵律词相同,因韵律切分结果相同,去重后,只有69个韵律词。