光杆形式的话语指称性分析
2015-05-25钟小勇
钟小勇
(杭州师范大学国际教育学院,杭州 311121)
1.引言
这里所说的“光杆形式”相当于文献中的“光杆普通名词”(bare noun,陈平 1987、2009)、“光杆名词短语”(bare NP,刘丹青 2002、许余龙 2005)、“不带数量词的名词短语”(孙朝奋 1988/1994)、“零标记的无定名词”('zero'-marked indefinite noun,W right&Givón 1987)等。
本文探讨光杆形式的话语指称性,话语指称性是指称性的重要视角之一,跟所指在话语主题组织中的重要性有关(陈平 2009、2015;Givón 1984;W right&Givón 1987等),它正成为理论和实证探讨的有趣话题(陈平2009等)。文献中类似的术语还有 “语用指称性 ”(pragmatic referentiality,Givón 1984;W right&Givón 1987等)、“话语主题指称性”(discourse thematic referentiality,陈平 2009)、“可操作性”(manipulability,Hopper&Thompson 1993)、主题重要性(thematic importance,孙朝奋 1988/1994)等等;与之相对的概念有“语义指称性”(semantic referentiality)、“客 体 指 称 性 ”( objective refererentiality),等等。
本文采用“话语指称性-语义指称性”这对术语。引用文献时,本文仍遵照原文献术语。
一般认为光杆形式是话语无指或话语指称低的,如陈平(2009)认为光杆名词是低主题,更准确地说是话语无指的优选标记。据陈平(2009:1668)统计,无指名词85%(204/239)都是光杆形式,而光杆名词71%(204/287)是话语无指的。据孙朝奋(1988/1994:155)提供的数据,次价82%(89/108)是不带数量词的,而不带数量词的名词短语87.3%(89/102)是次价的。据Wright&Givón(1987)提供的数据,次要主题93.9%(62/66)是零标记的无定名词,而零标记的无定形式95.4%(62/65)是次要主题。后两文更显示出光杆形式与话语指称低成分的关系。许余龙(2015:129)从篇章平均提及次数的角度来探讨,据许文统计,由光杆名词短语引入篇章的实体,在其后的篇章中平均提及的次数仅为2.8次,而由无定名词引入篇章的实体,在其后的篇章中平均提及15.8次。
但以往研究主要偏重于探讨光杆形式话语指称性如何,而很少关注光杆形式话语指称性内部差异,更少探讨与之有关的因素。不少文献提供的数据显示,光杆形式不仅仅是话语指称低的,它也可以是话语指称高的,同样,话语指称高的也可以是光杆形式,光杆形式话语指称性差异跟哪些因素有关呢?本文将对此做些探讨。
而且,以往研究统计的语料数量偏少,如W right&Givón(1987)只统计了55个“零-标记”无定名词;陈平(2009)也只统计了287个光杆名词。
本文将在较大规模语料的基础上进行探讨,以1854例光杆形式为对象进行探讨。
2.研究思路
2.1 话语指称性的判定
判定话语指称性的方法有很多(Wr i gh t&Givón 1987;孙 朝 奋 1988/1994:139-158;陈 平2009;许余龙 2004等)。本文以持续性来标示话语指称性,因而采用测算实体持续性的方法,即测算实体首次引入话语后,在其后十个小句内该实体再次出现的次数,该次数就是该实体的持续值,数值的大小体现话语指称性的高低差别。理论上说,实体的持续值可以是0、1、2、3……(一般不超过10),W right&Givón(1987)、Givón(2001:458)将实体的持续值归为两类:一类是低持续的(TP 0-2),一类是高持续的(TP>2),本文遵照这种处理。
2.2 跟持续性有关的因素
笔者曾对3733个由光杆形式和数量结构首次引入话语的实体进行统计分析,显示生命度、语义指称性、数、编码形式和句法功能等因素的正向水平(有生命、有指、单数、数量结构、主语)的持续值高于负向水平(无生命、无指、复数、光杆形式、宾语等)持续值,因此,笔者认为这些实体的持续性跟生命度等有关,更进一步,笔者将生命度等因素看作跟其他实体持续性可能有关的因素,并加以验证。
如果探讨跟同类实体持续性差异有关的因素,可以通过点二系列相关(point-biser ial cor relation)统计得出;如果探讨跟不同类实体(包括同类实体的不同类)持续性差异有关的因素,则需结合多种统计检验推断得出。一般地,有两个变量x、y,如果x为某一因素(A)正向水平(A1)的比例[表示为“x(A1)”,其余类推]高于y为正向水平的比例[相应地,y为负向水平(A2)的比例高于x为负向水平的比例],则x的持续值将高于y的持续值,而且比例差异越大,持续值差异也越大,这样可根据x、y持续值差异以及它们为A1的比例差异之间的关系,来推断x、y持续值差异是否跟A有关:
(1)ⅰ.如果x(A1)高于y(A1),而x持续值高于y持续值,则x、y持续性差异跟A有关
ⅱ.如果x(A1)低于y(A1),而x持续值高于y持续值,则x、y持续性差异跟A无关
x(A1)或y(A1)差异可通过卡方检验统得出,x、y持续值差异可通过Mann-Whitney U检验得出。如果x、y持续值差异与多个因素有关,则可根据效应量来间接判定多个因素的相关度层级。
2.3 研究方法
本文将采用基于语料的定量统计方法,主要有:(1)卡方检验,用于相关性检验和分类变量的差异检验;(2)Mann-Whi tneyU检验,主要用于持续性差异检验,两者均取显著性水平ɑ=0.05。统计时将利用PASW SPSS18.0进行操作,这样更客观、高效。
2.4 语料
本文语料选自叙事性、通俗性、口语性较强的三部童话:(1)《孙敬修演讲故事大全·童话故事卷》(甘肃人民出版社 1984年);(2)宋红阳选编《中国童话精选》(吉林出版集团有限责任公司 2009年);(3)《童话百篇》(网络)。其中选了1854例光杆形式先行语,为了比较,还选了1879例数量结构先行语,这是这三部童话中所有的数量结构先行语。
3.低持续与光杆形式
学界几乎都认为光杆形式是话语指称性低的,下面探讨低持续与光杆形式的关系。笔者认为应从两个角度分析:(1)单视角分析,一是分析光杆形式是否是低持续的,二是分析低持续的是否是光杆形式;(2)多视角分析,同时分析光杆形式与低持续、数量结构与高持续的关系。
先看几例:
(2)小熊i过生日了。熊爸爸给他i1买了一双蓝色的运动鞋,i2一双白色的凉鞋,i3一双红色的靴子。//小熊i4好开心啊,i5在草地上骨碌骨碌翻起跟头来。//一天,熊爸爸带小熊i6到游乐场去玩。小熊i7找出那双蓝色的运动鞋。可是,他i8穿来穿去,i9怎么也穿不进去。//小熊i10看看躺在地上的运动鞋……(童话百篇《熊爸爸买鞋》)
(3)石墨上全是黄澄澄的豆子i。//……老鼠反驳说。//驴子顾不上和老鼠争辩,上前舔了一口豆子i0.5,咀嚼起来。呀!豆子i1真是又香又甜!驴子忍不住,一口一口将磨上的豆子i2全吃光了。//这时,门“咣当”一声开了,主人进来收豆粉,见豆子i3全被驴子吃光了……(童话精选《驴子和老鼠》,84页)
(4)清清的溪水顺着石头缝往前流,唱着丁咚丁咚的歌i。//凶狠的大剪刀二话不说,扑上去就剪。“咔嚓咔嚓咔嚓……”一连剪了一百下,也没把小溪流剪断“。咔嚓咔嚓咔嚓……”再剪一千下,还没把小溪流剪断。最后,大剪刀使出浑身的力气,又剪了一万下!//大剪刀终于累死了!它一头栽倒在丁咚丁咚的溪水边……(童话百篇《剪刀大侠》)
例(2)光杆形式“小熊”的持续值是10,为高持续的。例(3)光杆形式“黄澄澄的豆子”的持续值是3,也为高持续的。例(4)光杆形式“丁咚丁咚的歌”的持续值是0。
下面是光杆形式和数量结构持续值有关信息:df=1,p=.002<.05),因此,光杆形式主要是低持续的,低持续的也主要是光杆形式。
?
下面从单视角的角度分析。首先看光杆形式是否是低持续。由表1可知,光杆形式共1854例,其中高持续的110例,占5.9%,低持续的1744例,占94.1%。统计显示,低持续的显著多于高持续的(x2=1440.106,df=1,p<.001)。而且,低持续的实际频数(1744)显著高于预期频数(927.0)(x2=249.902,d f=1,p<.001),为典型的;高持续的实际频数(110)显著低于预期频数(927.0)(x2=643.673,df=1,p<.001),为非典型的,这显示光杆形式主要是低持续的。
其次看低持续是否是光杆形式。由表1可知,低持续的3158例,其中光杆形式1744例,占55.2%,数量结构1414例,占44.8%;统计显示,光杆形式显著多于数量结构(x2=34.484,df=1,p<.001),且光杆形式实际频数(1744)显著高于预期频数(1579)(x2=8.193,df=1,p=.004<.05),为典型的;数量结构实际频数(1414)显著低于预期频数(1579)(x2=9.096,df=1,p=.003<.05),为非典型的,这显示,低持续的主要是光杆形式。
下面从多视角的角度分析,统计显示,编码形式与持续性显著相关(x2=253.502,df=1,p<.001,φ=.261),光杆形式主要是低持续的,数量结构主要是高持续的。统计还显示,光杆形式低持续实际频数(1744)显著高于预期频数(1568.4)(x2=9.353,
因此,无论是从单视角还是多视角的角度,低持续的主要是光杆形式,光杆形式主要是低持续的。
统计还显示,光杆形式的平均持续值是0.4817,为低持续的。
总之,从各个角度看,光杆形式主要是低持续的,低持续的主要是光杆形式。这进一步印证了前人研究。
4.光杆形式持续性差异分析
由表1可知,光杆形式持续值从0到10均有用例,统计也显示,光杆形式持续值存在显著差异,光杆形式持续值显著跟哪些因素有关呢?点二系列相关统计(point-biserial cor relation)显示:(ⅰ)光杆形式持续值与生命度显著相关(r=-.434,p<.001),为中度相关,有生命的持续值显著高于无生命的持续值(p<.001);(ⅱ)光杆形式持续值与语义指称性显著相关(r=-.089,p<.001),为弱相关,有指的持续值显著高于无指的持续值(p<.001);(ⅲ)光杆形式持续值与句法功能显著相关(r=-.205,p<.001),为低度相关,主语的持续值显著高于宾语的持续值(p<.001)。由相关系数可知,光杆形式持续值与三种因素构成如下相关度层级:
(5)生命度>句法功能>语义指称性
下面进一步将光杆形式持续值分为低持续(TP>2)和高持续(TP0-2)两类,看它们与生命度、语义指称性和句法功能之间的相关性。
首先看光杆形式持续性与生命度。语料中,低持续有生命的197例,无生命的1547例,高持续有生命的72例,无生命的38例。统计显示,持续性与生命度 显 著 相 关( x2=244.683,df=1,p<.001,φ=-.087),高持续为有生命的比例(65.5%)显著高于低持续为有生命的比例(11.3%)。据此可推断,光杆形式持续性差异跟生命度有关。
下面看光杆形式持续性与语义指称性。语料中,低持续有指的1419例,无指的325例,高持续有指的105例,无指的5例。统计显示,持续性与语义指称性显著相关(x2=14.040,df=1,p<.001,φ=-.087),高持续为有指的比例(95.5%)显著高于低持续为有指的比例(81.4%),据此可推断,光杆形式持续性差异跟语义指称性有关。
最后看光杆形式持续性与句法功能。语料中,低持续主语384例,宾语988例,高持续主语55例,宾语38例。统计显示,持续性与句法功能显著相关(x2=40.273,df=1,p<.001,φ=-.166),高持续主语的比例(59.1%)显著高于低持续主语的比例(28.0%),据此可推断,光杆形式持续性差异跟句法功能有关。
总之,光杆形式持续性跟生命度、语义指称性、句法功能显著相关,根据效应量,三者构成如下相关度层级:
(6)生命度>句法功能>语义指称性
这与(5)完全一致。
总之,光杆形式持续性存在显著差异,跟生命度、语义指称性和句法功能均显著相关。三者构成如下相关度层级:生命度>句法功能>语义指称性。
5.有关因素与留学生先行语偏误分析
高玮(2014a、b)探讨了留学生数量结构先行语的偏误及其成因。高文分析显示,留学生许多光杆名词先行语都应使用数量结构,其中的重要理据是:数量词语的使用与汉语的主题重要性之间有直接相关性,“一个主题上比较重要的名词性短语倾向于由数量结构引进话语,由数量词引进的话语在随后的呼吁中再现率很高。”(高玮 2014a:15);而且,数量结构具有“前景设置”功能,可以使其后的名词性成分前景化,凸显其在话语中的显著性。主题重要性、显著性其实就是高话语指称性,从持续性角度来说,就是高持续性。
高文从编码形式与话语指称性的关系的角度探讨留学生先行语偏误,角度新颖,也较合理,但不够深入。首先,数量结构和高话语指称性的关系比较复杂,两者并非一一对应关系,其次,话语指称性不仅仅跟跟编码形式有关,还跟其他因素有关。如对3733例先行语(光杆形式1854例,数量结构1879例)进行点二系列相关统计,显示持续值跟生命度等多个因素有关,这些因素还构成如下相关度序列:
(7)生命度(r=-.534)>编码形式(r=-.294)>语义指称性(r=-.183)>句法功能(r=-.108)
由此可见,持续值与生命度相关度最高,其次才是编码形式。语料统计显示,有生命光杆形式持续值(均值:1.8104)显著高于无生命数量结构持续值(均值:0.7112)(p<.001)。因此,只关注编码形式显然是不全面的。
不仅如此,这些因素还构成不同组配,不同组配持续性也存在差异,形成非常复杂的现象。如语料中,[有生数量有指宾语]组配[如“(飞来)一只小鸟”]持续值(均值:3.9565)显著高于[有生光杆有指主语]组配[如“小鸟(飞来了)”]持续值(均值:2.7103)(p<.001);而[有生光杆无指主语]组配[如“鸟(也看不见了)”]持续值(均值:0.8696)显著高于[有生数量无指宾语]组配[如“(没有看见)一只鸟”]持续值(均值:0.0429)(p<.001)。因此,只有综合考虑各个因素,特别是从有关因素组配的角度才能较科学地进行先行语偏误分析。
根据高玮(2014b:429),无定名词主语句一般以时间为线索,引入一个新出现的事件,数量结构作为不定指标记是必不可少的。据此,例(8a)中的“很长的杆”是偏误,正确的说法应是“一根很长的杆”,即例(8b):
(8)a.有一天,在她的商店门口+很长的杆挡住了门,使别人进不去,可是里面有老板……(高玮2014b:429,例17)
b.有一天,在她的商店门口+一根很长的杆挡住了门……(高玮2014b:429,例17)
c.有一天,在她的商店门口+有人挡住了门,这个人……
从因素组配的角度看,例(8a)“很长的杆”属于[无生光杆有指主语]组配,例(8b)的“一根很长的杆”属于[无生数量有指主语]组配。笔者语料中,[无生数量有指主语]组配持续值(均值:0.7683)显著高于[无生光杆有指主语]组配持续值(0.3056)(p<.001),从这个角度分析,高文分析是合理的。
下面比较(8b)、(8c),如果仅仅考虑编码形式,显然会以为(8b)好于(8c),因为前者是数量结构,后者是光杆形式。从因素组配角度看,例(8c)的“人”是[有生光杆有指宾语]组配,语料统计显示,[有生光杆有指宾语]组配的持续值(4.4154)显著高于[无生数量有指主语]组配的持续值(0.7683)(p<.001),据此,应是例(8c)好于例(8b)。笔者认为,例(8c)“人”持续值显著高于例(8b)“一根很长的杆”主要原因是,前者是有生命的,后者是无生命的。这进一步证明,分析留学生先行语偏误仅仅考虑编码形式是不充分的。
6.结语
光杆形式是引入实体的重要形式,它是低持续的。光杆形式持续值存在显著差异跟生命度、语义指称性和句法功能均显著相关,而且三者构成如下相关度层级:生命度>句法功能>语义指称性。光杆形式持续值显著低于数量结构持续值,这跟生命度、语义指称性有关,而跟句法功能无关。持续性跟许多因素有关,而且不同因素构成不同匹配,探讨留学生先行语偏误不能仅仅考虑编码形式,而应考虑各因素的匹配。
陈平.2015.语言学的一个核心概念“指称”问题研究[J].当代修辞学,(3).
高玮.2014a.从语篇角度看先行语中数量结构的偏误及其成因[J].语言教学与研究,(3).
高玮.2014b.先行语引入句式中的偏误分析[J].世界汉语教学,(3).
许余龙.2005.从回指确认的角度看汉语叙述体篇章中的主题标示[J].当代语言学,(2).
Chen,Ping(陈平).2009.Aspects of referential ity[J],Journal of Pragmatics 41:1657-1674.
Givón,T.,2001.Syntax,vol.I-II.Amsterdam:John Benjamins Publishing Company.
Hopper,Paul,Thompson,Sandra A.1993.Language universal s,discourse pragmat ics,and semant ics.Language Sciences 15,4:357-376.
Sun,Chaofen(孙朝奋).1988.The discourse function of numeral classi f iers in Mandarin Chinese.Journal of Chinese Linguistics 16,2:298-323.又见戴浩一、薛凤生主编.功能主义与汉语语法[C].北京语言学院出版社,1994:139-158.
Wright,S.,Givón,T.1987.The pragmatics of indef inite reference:quanti f ied text-based studies.Studies in Language 11:1-33.