APP下载

存现宾语话语指称性分析

2015-05-28钟小勇

语言研究 2015年4期
关键词:频数语料均值

钟小勇

(杭州师范大学 国际教育学院,杭州311121;浙江大学 汉语史研究中心,杭州310028)

语言中的存现结构典型地用于将一个新的重要实体作为主题引入篇章(许余龙2004:147;高玮2014等)。据许余龙(2004:147)统计,由存现结构引入的实体,在其后的篇章中平均提及22.4次,而由非存现结构引入的实体,在其后的篇章中平均只提及2.8次。陈平(2009)则指出,“有”字存现句并非一定表现高话语主题实体,陈文统计,“有”字存现句中,79%(11/14)的光杆名词实体是主题无指的。

许余龙(2004)的“重要实体”和陈平(2009)的“高话语主题实体”,其实是实体的话语指称性问题①文献中与话语指称性相类似的概念还有“语用指称性”(pragmatic referentiality,Wright & Givón 1987等)、“话语主题指称性”(discourse thematic referentiality,陈平2009)、“可操作性”(manipulability,Hopper & Thompson 1993),等等;与之相对的概念有“语义指称性”(semantic referentiality)、“客体指称性”(objective referentiality,Payne 1997:264),等等。本文采用“话语指称性-语义指称性”这对术语。,话语指称性跟实体在话语主题组织中的重要性有关。虽然许文和陈文考察的对象并非完全一致(许文考察的是存现句;陈文考察“有”字存现句),判定话语指称性的方法也不完全相同(许文是篇章平均提及次数;陈文是各主题百分比差异),但两者明显存在“分歧”。存现宾语话语指称性到底如何?这是一个值得探讨的问题。

以往研究偏重于探讨存现宾语话语指称性如何,而很少探讨与之有关的因素,如陈平(2009)虽然统计出“有”字存现宾语主题性不同(低主题:41%,28/69;中主题:7%,5/69;高主题:52%,36/69),但未探讨为什么同是“有”字存现宾语,其主题性却存在差异。为此,本文将重点探讨跟存现宾语话语指称性有关的因素。

此外,以往研究一般采用了定量统计的方法,但语料往往偏少,如许余龙(2004)只统计了41个存现宾语,陈平(2009)也只统计了69个“有”字存现宾语。语料偏少无疑会影响结论的科学性,本文将在较大量语料的基础上进行统计分析。

一 研究思路

(一)话语指称性的判定。判定话语指称性的方法有很多,如直觉判断、心理测算、统计篇章频数、测算话题保持性或实体持续性等(Wright & Givón 1987;孙朝奋1988/1994:139-158;陈平2009;许余龙2004等)。本文以持续性来标示话语指称性,因而采用测算实体持续性的方法,即测算实体首次引入话语后,在其后十个小句内该实体再次出现的次数,该次数就是该实体的持续值,数值的大小体现话语指称性的高低差别。理论上说,实体的持续值可以是0、1、2、3……(一般不超过10),Wright & Givón(1987)、Givón(2001:458)将实体的持续值归为两类:一类是低持续的(TP 0-2),一类是高持续的(TP>2),本文遵照这种处理。

(二)跟持续性有关的因素的分析。笔者曾对3733个由光杆形式和数量结构首次引入话语的实体进行统计分析,显示生命度(有生命、无生命)、语义指称性(有指、无指)、数(单数、复数)、编码形式(光杆形式、数量结构)和句法功能(主要是主语和宾语)等五个因素跟持续性有关,它们的正向特征(有生命、有指、单数、数量结构、主语)与高持续、负向特征(无生命、无指、复数、光杆形式、宾语等)与低持续显著相关。而且,正向特征的持续值均显著高于负向特征的持续值(均为p<.001)。

如果考察对象或范围变化了,这五个因素是否仍跟持续性有关?因而,有必要结合具体现象一一加以验证。一般地,如果两个变量x、y分别与一个因素的正、负向特征A1、A2相关,则x的持续值将高于y的值,而且相关性差异越大,持续值差异越大,反之亦然。如果可以统计出x、y的持续值差异,又可检验其与A1、A2的相关性,则可根据x、y持续值差异以及它们与A1、A2的相关性之间是否存在上述关系,推断x、y持续值差异是否跟A有关:

1)a 如果x与A1、y与A2相关,而且x>y,则x、y持续值差异跟A有关

b 如果x与A2、y与A1相关,而且x>y,则x、y持续值差异跟A无关

这就为探讨跟持续值差异有关的因素提供了可操作的思路,既可对已知因素进行验证,也可对新的因素加以探讨。

(三)研究方法。基于语料的定量统计方法是话语指称性研究的常规方法和主要方法(参看Wright &Givón1987;孙朝奋1994/1988;陈平2009;许余龙2004等)。本文也将采取这种方法,主要有:(1)卡方检验,主要用于相关性检验和分类变量的差异检验;(2)Mann-WhitneyU检验,主要用于持续值差异检验,两者均取显著性水平ɑ=0.05。为节省篇幅,统计结果只显示显著度(p)和效应量(φ)。统计时将利用PASW SPSS18.0进行操作,这样更客观、高效。

比较才能凸显差异,本文将确立三个“最小比较对”:存现宾语高持续和低持续、存在宾语和隐现宾语、存现宾语和无定主语。本文将探讨这三个比较对的持续值差异,并探讨与之有关的因素。

(四)语料。本文将从叙事性、通俗性、口语性较强的三部童话中选取语料:(1)《孙敬修演讲故事大全童话故事卷》(甘肃人民出版社1984年);(2)宋红阳选编《中国童话精选》(吉林出版集团有限责任公司2009年);(3)《童话百篇》(网络)。三部童话中共有601例存现宾语,这是本文统计的基本语料。

由于研究对象和目的的不同,特别是为了构成“最小比较对”,本文统计的语料也稍有不同:(1)为与非存现宾语(3248例)比较(第三部分),选取485例存现宾语,两者来源一致;(2)为与无定主语比较(第六部分),选取413例存现宾语,两者都是数量结构。

二 存现宾语与高持续

关于存现宾语的话语指称性,以往主要关注的是存现宾语与高话语指称的关系,本文也着意于此,用高持续来标示高话语指称。笔者认为应从两个角度分析:(1)单视角分析,一是分析存现宾语是否是高持续的,二是分析高持续的是否是存现宾语;(2)多视角分析,同时分析存现宾语与高持续、非存现宾语与低持续的关系。首先看几个例子①“i”标示实体,不同字母标示不同实体。“i”后的数字表示十个小句内该实体再次出现的次数。“……”表示省略,句中出现,省略的是对话、心里活动等非叙述性话语,句末出现,省略的是十个小句后的内容。“//”是段落之间的标记。:

2)她的脸上现出兴奋的表情i,她要带孩子们去见见这个鸭族中德高望重的博士,让孩子们都向博士学习,做受人尊敬的人。在她身后跟着一行小鸭子,他们长得那么可爱,只有一只例外,他长得很丑,浑身干巴巴的,脸上也皱皱瘪瘪的,可骨头架子挺大……(童话百篇《一只丑小鸭的悲剧》)

3)山后边儿住着一只大灰狼i,他i1听说来了三只小猪,i2可高兴了……//大灰狼i3先来到草房子前边儿,i4大声叫……小黑猪一听是大灰狼i5的声音,他哪儿敢给他i6开门呢?不管大灰狼i7怎么叫,他也不开门。大灰狼i8使劲儿一撞,草房就倒了……(孙敬修童话《小猪盖房子》)

例2)“兴奋的表情”持续值是0,为低持续的;例3)“一只大灰狼”持续值是8,为高持续的。

表1是存现宾语与非存现宾语持续性相关信息:

表1

下面从单视角的角度分析。首先看存现宾语是否是高持续。由表1可知,存现宾语共485例,其中高持续的193例,占39.8%,低持续的292例,占60.2%。统计显示,低持续的显著多于高持续的(p<.001)。而且,低持续的实际频数(292)显著多于预期频数(242.5)(p=.034<.05),为典型的;高持续的实际频数(193)显著少于预期频数(242.5)(p=.017<.05),为非典型的,这显示存现宾语并非一定是高持续的,甚至可以说,存现宾语主要是低持续的。

其次看高持续是否是存现宾语。由表1可知,高持续的575例,其中存现宾语193例,占33.6%;非存现宾语382例,占66.4%。统计显示,非存现宾语显著多于存现宾语(p<.001),且非存现宾语实际频数(382)显著多于预期频数(287.5)(p<.001),为典型的;存现宾语实际频数(193)显著少于预期频数(287.5)(p<.001),为非典型的,这显示,高持续的并非一定是存现宾语,甚至可以说,高持续的主要是非存现宾语。

下面从多视角的角度分析,统计显示,存现宾语与高持续、非存现宾语与低持续显著相关(p<.001,φ=.261)。而且,存现宾语高持续实际频数(193)显著多于预期频数(74.7)(p<.001),因此,存现宾语主要是高持续的。从另一个角度看,高持续与存现宾语、低持续与非存现宾语显著相关(p<.001,φ=.261),高持续为存现宾语的实际频数(193)也显著多于预期频数(74.7)(p<.001),因此,高持续主要是存现宾语。

统计还显示,存现宾语的平均持续值是2.5340,为高持续的。

因此,关于存现宾语与高持续的关系,笔者认为可以表述如下:

4)a 存现宾语并非一定是高持续的,高持续的并非一定是存现宾语(单视角)

b 存现宾语与高持续显著相关,存现宾语主要是高持续的,高持续的主要是存现宾语(多视角)

c 存现宾语是高持续的(从平均持续值看)

因此可见,角度不同,存现宾语与高持续构成不同关系。据此,上文许余龙(2004)和陈平(2009)的观点并不存在分歧,两者只是角度不同而已:许文着眼于平均篇章频数,类似于例4)c,而陈文着眼于“有”字存现宾语各主题比例差异,类似于例4)a。

三 存现宾语持续性差异分析

由表1可知,存现宾语各个持续值均有用例,而且存在显著差异(p<.001),存现宾语高持续和低持续的也存在显著差异(p<.001)。为什么同是存现宾语,持续值却存在差异呢?这是下文要重点探讨的问题。再举两个例子:

5)忽然看见前面迎面跑过来一匹大黑马i,马i1上骑着一个黑脸大将军,手里举着一杆黑缨大扎枪,身上穿着一件乌黑的龙鳞甲。这个黑大将一看见小猎人就哈哈大笑,吓得小猎人差点儿从马上掉下来。//眼看两匹马就要遇到一块儿了,小猎人想……想到这儿,小猎人赶紧从腰里把小片儿刀拔出来,往起一举……(孙敬修童话《小猎人》)

6)又跑来一匹黑马i,黑马i1长得膘肥体壮,i2英姿飒爽。//老虎又问……//大象摇摇头说……//黑马i3长嘶一声,i4“吧嗒吧嗒”跑走了。//过了些时候,又来了一头骆驼,骆驼神情安详,十分沉稳。//老虎以为骆驼就是人……(童话精选《老虎与人较量》)

例5)“一匹大黑马”持续值是1,为低持续的;例6)“一匹黑马”持续值是4,为高持续的。

语料中,存现宾语高持续的201例,占33.4%,低持续的400例,占66.6%。高持续的持续值(均值是5.5423)显著高于低持续的持续值(均值是0.5500)(p<.001)。存现宾语高持续和低持续持续值差异跟哪些因素有关呢?

下面按照前文思路,验证是否跟生命度等因素有关,由于存现宾语都是有指的,是宾语,而且光杆形式不易确定数,下面重点探讨是否跟生命度和编码形式有关。

首先看是否跟生命度有关。语料中,存现宾语高持续有生命的158例,占78.6%,无生命的43例,占21.4%;低持续有生命的63例,占15.8%,无生命的337例,占84.2%。统计显示,高持续与有生命的、低持续与无生命的显著相关(p<.001,φ=.615)。由于存现宾语有生命的持续值(均值是4.5113)显著高于无生命的持续值(均值是0.8868)(p<.001),根据例1)a,我们认为存现宾语高持续和低持续持续值差异跟生命度有关,根据效应量,两者高度相关。

其次看是否跟编码形式有关。语料中,存现宾语高持续数量结构181例,占90.0%,光杆形式20例,占10.0%;低持续数量结构235例,占58.7%,光杆形式165例,占41.3%。统计显示,高持续与数量结构、低持续与光杆形式显著相关(p<.001,φ=.320)。由于存现宾语数量结构持续值(均值是2.8221)显著高于光杆形式持续值(均值是0.8649)(p<.001),根据例1)a,我们认为存现宾语高持续和低持续持续值差异跟编码形式有关,根据效应量,两者中度相关。

总之,存现宾语高持续和低持续持续值存在显著差异,这跟生命度、编码形式有关,跟语义指称性、句法功能无关。

四 存在宾语和隐现宾语持续值差异分析

存现句可分为存在句和隐现句,相应地,存现宾语可分为存在宾语和隐现宾语。如:

7)从前,有一只狐狸i,i1嘴特别馋,谁家要是做了好吃的,它i2准会跑去饱吃一顿。i3吃了人东西,i4还四处说人家坏话。而且它i5很懒,i6从来不做吃的招待别人。//一天,狐狸i7睡了一天懒觉,i8醒了,i9睁睁惺忪的睡眼……(童话精选《小熊请客》)

8)忽然,小猴子发现东边来了一只狐狸i,忙喊道……//小兔子指指西边说……//小鸭子指着南边说……//他们三个拉着箭猪准备向北边逃走,可是抬头一看,一头凶猛的狮子也正向这里走来。小猴子抓耳挠腮,小兔子直摇耳朵,小鸭子拍拍翅膀,急得一点办法也没有……(童话百篇《带箭的朋友》)

例7)“一只狐狸”是存在宾语,持续值是9,为高持续的;例8)“一只狐狸”是隐现宾语,持续值是0,为低持续的。

语料中,存在宾语395例,占65.7%;隐现宾语206例,占34.3%,统计显示,存在宾语显著多于隐现宾语(p<.001),而且,存在宾语持续值(均值是2.3949)显著高于隐现宾语持续值(均值是1.8835)(p=.047<.05)。

存在宾语和隐现宾语持续值差异跟哪些因素有关呢?

首先看是否跟生命度有关。语料中,存在宾语有生命的154例,占39.0%,无生命的241例,占61.0%;隐现宾语有生命的67例,占32.5%,无生命的139例,占67.5%。统计显示,存在宾语或隐现宾语与有生命的或无生命的不显著相关(p=.119>.05)。不过,存在宾语为有生命的比例(39.0%)高于隐现宾语为有生命的比例(32.5%),由于存现宾语有生命的持续值(均值是4.5113)显著高于无生命的持续值(均值是0.8868)(p<.001),根据例1)a,我们认为存在宾语和隐现宾语持续值差异跟生命度有关。

下面看是否跟编码形式有关。语料中,存在宾语光杆形式133例,占33.7%,数量结构262例,占66.3%;隐现宾语光杆形式52例,占25.2%,数量结构154例,占74.8%,统计显示,存在宾语与光杆形式、隐现宾语与数量结构显著相关(p=.034<.05,φ=.087)。由于存现宾语数量结构的持续值(均值是2.8221)显著高于光杆形式的持续值(均值是0.8649)(p<.001),根据例1)b,我们认为存在宾语和隐现宾语持续值差异跟编码形式无关。

总之,存在宾语和隐现宾语持续值存在显著差异,这跟生命度有关,跟语义指称性、句法功能和编码形式无关。

五 存现宾语和无定主语持续值差异分析

很多文献都探讨了存现句和无定主语句的一致性,如内田庆市(1993:357-358)认为,汉语的无定名词主语句与日语的现象句、汉语的存现句有很多共同点,实际上是“另外一种存现句”。许余龙(2004:165)也认为无定主语句的篇章功能相当于存现句。陈平(2003)则认为下例划线成分是存现用法:

9)一架飞机从我们头上飞了过去。

存现宾语和无定主语在持续值上是否存在差异呢?先看两个例子:

10)猴山上有一只小猴i,他i1机灵活泼,可大家都不喜欢他i2,因为他i3最爱取笑别人。//一天,小猴i4正在荡秋千,瞎了一只眼的猴子走过来,想和他i5一块儿玩。小猴i6大声嚷道……//他i7把秋千荡得更高了。i8一边荡,i9一边编起歌儿唱……(童话百篇《荡秋千的小猴》)

11)一只小猴子i正在树上打秋千玩儿,i1一看小白兔和狐狸没命地跑,i2赶紧从树上爬下来,i3问他们……//狐狸说……//猴子i4也不知道“咕咚”是什么,i5心想,狐狸吓得这个样儿,“咕咚”一定是很厉害的东西,i6二话没说,i7也跟着跑起来……(孙敬修童话《“咕咚”》)

例10)“一只小猴”是存现宾语,持续值是9,为高持续的;例11)“一只小猴子”是无定主语,持续值是7,为高持续的。

由于无定主语是数量结构,所以本节探讨的是数量结构存现宾语。语料中,存现宾语413例,占61.3%,无定主语261例,占38.7%,统计显示,存现宾语持续值(均值是2.8354)和无定主语持续值(均值是2.6475)不存在显著差异(p=.879>.05),因此,从持续值的角度看,存现宾语和无定主语具有一致性。

由于存现宾语和无定主语都是有指的,而且都是数量结构,所以两者持续值差异跟语义指称性、编码形式无关。据统计,主语持续值(均值是1.5475)显著高于宾语持续值(均值是1.0281)(p<.001),因而,两者持续值差异也跟句法功能无关。下面看是否跟生命度和数有关。

首先看是否跟生命度有关。语料中,存现宾语有生命的184例,占44.6%,无生命的229例,占55.4%;无定主语有生命的200例,占76.6%,无生命的61例,占23.4%;统计显示,存现宾语与无生命的、无定主语与有生命的显著相关(p<.001,φ=-.318)。由于有生命的持续值(均值是4.0182)显著高于无生命的持续值(均值是1.1000)(p<.001),根据例1)b,存现宾语和无定主语持续值差异跟生命度无关。

下面看是否跟数有关。语料中,存现宾语单数303例,占73.4%,复数110例,占26.6%;无定主语单数221例,占84.7%,复数40例,占15.3%。统计显示,存现宾语与复数、无定主语与单数显著相关(p=.001<.05,φ=-.132),由于单数的持续值(均值是2.8836)显著高于复数的持续值(均值是2.3400)(p=.017<.05),根据例1)b,存现宾语和无定主语持续值差异跟数无关。

总之,存现宾语和无定主语持续值不存在显著差异,这跟生命度、语义指称性、数、编码形式和句法功能无关。

六 题中实体与持续值差异分析

前面分析了存现宾语高持续和低持续、存在宾语和隐现宾语、存现宾语和无定主语这三个比较对持续值差异跟生命度等五个因素的关系,显示三个比较对持续值差异跟这些因素的关系表现很不一致,可以说没有一个因素跟三个比较对持续值差异均有关。

笔者觉得,是否为“题中实体”跟三对实体持续值差异有关。简单地说,“题中实体”就是首次引入的实体是题目中的实体,如:

12)还有一把锤子i。//锤子i1顶着一个大脑袋,油光锃亮。由于主人经常使用它i2,i3因此总被放在最上面。//渐渐地,锤子i4骄傲起来,i5认为没有自己i6做不了的事情,i7轻视不起眼的钉子,i8讥笑大嘴的锯子。别人和它i9打招呼,它i10也不理……(童话精选《锤子的故事》)

此例“一把锤子”就是题目《锤子的故事》中的“锤子”,持续值是10,为高持续的。

下面分别看三个比较对持续值差异跟题中实体的关系。

首先看存现宾语高持续和低持续持续值差异是否跟题中实体有关。语料中,高持续题中实体68例,占33.8%,非题中实体133例,占66.2%;低持续题中实体19例,占4.8%,非题中实体381例,占95.2%。统计显示,高持续与题中实体、低持续与非题中实体显著相关(p<.001,φ=.390)。由于题中实体的持续值(均值是5.2184)显著高于非题中实体的持续值(均值是1.7121)(p<.001),根据例1)a,我们认为,存现宾语高持续和低持续持续值差异跟题中实体有关。

下面看存在宾语和隐现宾语持续值差异是否跟题中实体有关。语料中,存在宾语题中实体67例,占17.0%,非题中实体328例,占83.0%;隐现宾语题中实体20例,占9.7%,非题中实体186例,占90.3%。统计显示,存在宾语与题中实体、隐现宾语与非题中实体显著相关(p=.016<.05,φ=.098)。由于题中实体的持续值(均值是5.2184)显著高于非题中实体的持续值(均值是1.7121)(p<.001),根据例1)a,存在宾语和隐现宾语持续值差异跟题中实体有关。由此可看出,存在宾语比隐现宾语更常引入题中实体。

最后看存现宾语和无定主语持续值差异是否跟题中实体有关。语料中,存现宾语题中实体76例,占18.4%,非题中实体337例,占81.6%;无定主语题中实体43例,占16.5%,非题中实体218例,占83.5%。统计显示,无定主语或存现宾语与题中实体或非题中实体不显著相关(p=.523>.05)。但存现宾语题中实体的比例(18.4%)高于无定主语题中实体的比例(16.5%),由于题中实体的持续值(均值是5.1681)显著高于非题中实体的持续值(均值是2.2468)(p<.001),根据例1)a,存现宾语和无定主语持续值差异跟题中实体有关。由此可看出,存现宾语比无定主语更常引入题中实体。

总之,存现宾语高持续和低持续、存在宾语和隐现宾语、存现宾语和无定主语这三个比较对持续值差异均跟题中实体有关。

学界对存现宾语话语指称性存在分歧,主要跟研究的角度不同有关。本文以持续性为话语指称性的指标,采用基于较大量语料的定量统计方法,并综合多种角度,分析显示存现宾语与高持续之间具有复杂的关系:(1)从单视角看,存现宾语并非一定是高持续的,高持续的并非一定是存现宾语;(2)从多视角看,存现宾语与高持续显著相关,存现宾语主要是高持续的,高持续的主要是存现宾语;(3)从平均持续值看,存现宾语是高持续的。

本文还重点探讨了三个最小比较对的持续值差异及其有关的因素,概括为表2:

表2

由表2看出,是否为题中实体跟三个比较对持续值差异均有关。由此也看出,不同实体持续值可能存在差异,与之有关的因素也可能不同,具体现象需具体分析。

高玮 2014 先行语引入句式中的偏误分析,《世界汉语教学》第3期。

内田庆市 1993 汉语的“无定名词主语句”——另外一种“存现句”,见:大河内康宪主编《日本近现代汉语研究论文选》,北京语言学院出版社。

许余龙 2004 《篇章回指的功能语用探索——一项基于汉语民间故事和报刊语料的研究》,上海外语教育出版社。

Chen, Ping(陈平) 2003 Indefinite determiner introducing definite referent: A special use of yi ‘one’ +classifier in Chinese,Lingua113: 1169-1184.

Chen, Ping(陈平) 2009 Aspects of referentiality,Journal of Pragmatics41: 1657-1674.

Givón, Talmy 2001Syntax, vol.I-II.Amsterdam: John Benjamins Publishing Company.

Hopper, Paul & Thompson, Sandra A.1993 Language universals, discourse pragmatics and semantics,Language Sciences15 (4): 357-376.

Payne, Thomas 1997Describing Morphosyntax:A Guide for Field Linguists.Cambridge: Cambridge University Press.

Sun, Chaofen(孙朝奋) 1988 The discourse function of numeral classifiers in Mandarin Chinese,Journal of Chinese Linguistics16(2): 298-323.又见:戴浩一、薛凤生主编《功能主义与汉语语法》,北京语言学院出版社1994年。

Wright, Sue Ellen.& Givón, Talmy 1987 The pragmatics of indefinite reference: Quantified text-based studies,Studies in Language11(1): 1-33.

猜你喜欢

频数语料均值
面向低资源神经机器翻译的回译方法
可比语料库构建与可比度计算研究综述
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
频数与频率:“统计学”的两个重要指标
浅谈均值不等式的应用
均值不等式的小应用
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
频数和频率