APP下载

生命范畴下的汉语话题链研究*

2019-05-27

关键词:语料语义实体

汪 威

(南开大学 文学院,天津 300071)

一、引 言

“生命度”这一术语源自生物学领域,生物学研究将生命度等级二分为“有生的(animate)”和“无生的(inanimate)”两大类。语言学以生物学的研究为基础,对生命范畴进行考察,旨在找到生命度等级概念在各个语言中的对应表现。生命范畴及其相关术语进入语言学的历史并不久远,可以说语言学界对生命范畴的研究还处于起步阶段。起初,国内的一些学者主要从语法范畴或语法、语义范畴的角度对其进行描述、分析,主要的研究成果如:马庆株[注]马庆株.自主动词和非自主动词[J].中国语言学报,1988,(3).从“[+动物]/[-动物]”这一语义特征出发论述了自主动词和非自主动词的划分标准;张伯江[注]张伯江.词类活用的功能解释[J].中国语文,1994,(5).认为生命度这一因素对名词活用的自由度有着重要的影响;张国宪、周国光[注]张国宪,周国光.索取动词的配价研究[J].汉语学习,1997,(2).指出三价索取动词的主体、邻体和客体的生命度呈由高到低的递降趋势;王珏[注]王珏.生命范畴概说[J].华东师范大学学报(哲学社会科学版),2003,(1).系统地分析了有生词语与无生词语的语义结构;等等。后来,又有学者尝试从语用的角度出发,将生命度概念引入汉语篇章研究,探求它对篇章构成及表达方式的影响。许余龙等[注]许余龙,孙珊珊,段嫚娟.名词短语可及性与篇章回指——以汉语主语属格为例[J].现代外语,2013,(1).在对汉语叙事体语料进行分析的基础上,考察了可及性及生命度对篇章回指的影响;钟小勇[注]钟小勇.量词与数量结构的话语指称性分析[J].汉语学习,2015,(3).认为汉语数量结构的持续性与生命度有关;钟小勇[注]钟小勇.存现宾语话语指称性分析[J].语言研究,2015,(4).论证了存现宾语内部持续值与生命度之间的关系。可见,生命范畴作为一个参项,与语言研究的方方面面都有着重要的联系。

本文借鉴前人的研究成果,从语用角度出发,将生命范畴与汉语话题链的研究相结合,探究充当话题的名词实体的生命度等级差异对其篇章功能的影响,以期进一步了解话题链的内部结构和外部功能。

二、研究思路

(一)本文关于话题链的判定

话题链(topic chain)这一术语最早是由澳大利亚语言学家Dixon[注]Dixon,R.M.W.The Dyirbal Language of North Queensland[M].Cambridge:Cambridge University Press,1972:71.提出的,由曹逢甫[注]Tsao,Fengfu.A Functional Study of Topic in Chinese:The First Step toward Discourse Analysis[M].Taipei:Student Book Co.,1979:37~38.将其引入汉语研究。在汉语篇章领域,学者们对话题链的界定可谓众说纷纭,其中曹逢甫[注]Tsao,Fengfu.A Functional Study of Topic in Chinese:The First Step toward Discourse Analysis[M].Taipei:Student Book Co.,1979:37~38.、Li&Thompson[注]Li,Charles N.& Sandra A.Thompson.Mandarin Chinese:A Functional Reference Grammar[M].Berkeley:University of California Press,1981:659.和屈承熹[注]屈承熹.汉语篇章语法[M].潘文国等译.北京:北京语言大学出版社,2006:252.的观点颇具代表性。以上3位学者的共同之处在于都承认话题链中的各小句享有共同的话题,不过关于话题在话题链中的位置和表现形式却各持己见。曹逢甫认为话题应该出现于链首,但却没有对其后小句中的话题形式作出要求;Li&Thompson也认为话题应在链首显现,并且后面小句中的话题都应采用零形式回指;屈承熹则认为话题不一定非要位于链首,但是明确指出话题链中的各小句须以零回指的形式连接。此外,王静[注]王静.现代汉语静态话题链的句法组织原则[J].语言教学与研究,2004,(2);王静.现代汉语动态话题链的组织规律[J].语言教学与研究,2006,(2).认为,话题链在语篇中有两种存在方式:独立话题链和非独立话题链。以下是王静文中的例子:

1)a这位革命先驱i,坐在太师椅上,i身穿长袍,i手握书卷;b他j似乎在想兴国

安邦的策略,j又似乎在描绘九百六十万平方公里神州大地的宏伟蓝图。(引自王静2004)

王静认为,上面这个例子含有两个话题链,分别标以a、b。话题链a语义上不完整,给人的感觉是话没说完;而话题链b则不同,它在语义上是完整的,语法上也是可以独立的,并且话题链就此结束。王静将a那样的话题链称为非独立话题链,而将b那样的话题链称为独立话题链。

综合上述各家的观点,结合具体的研究情况,本文将话题链定义为:由多个小句(至少两个小句)组成,且共同享有一个显性话题[注]本研究中的话题是一个名词性成分,是谈论的起点和对象。、语义自足的独立语段[注]由于本文主要对话题链中话题的持续值进行考察,为了避免语义不完整所造成的话题中断,因此所选取的话题链均为语义自足的独立语段,即王静(2004,2006)所定义的独立话题链。。该显性话题位于第一个小句的句首,但在其后的小句中皆隐性出现(即以ZA/零回指的形式出现)。具体实例[注]下文对文章所用语料的出处会做具体说明。如下:

2)一会儿,月亮i像“金黄的大气球”从东边的地平线上冉冉升起,i慢慢地升高了,i挂在大树稍上。(选自《小学生分类作文一本全》第212页)

(二)与本研究相关的因素

孙坤认为:“话题对各评述小句的管辖和各评述小句自身有效的组合,让话题链形成一个有机整体。”[注]孙坤.汉语话题链范畴、结构与篇章功能[J].语言教学与研究,2015,(5).话题链作为一个篇章单位,主要依靠话题的语义投射能力和评述部分的衔接表达能力来形成连贯的语段。本研究主要通过计算话题持续值和话题链标记度来判定话题篇章功能的强弱。

1.话题持续值

汉语属于主题突出型语言,话题在话题链的形成中具有重要的作用。在话题链内部,话题的重要功能就是形成衔接机制,为所辖句子确定语域、提供背景和语义相关性的索引。关于表示或量化实体在话语中的重要性,学者们主要采用如下几种方法:(1)直觉判断(intuitive judgement);(2)心理测算(psychometric measures);(3)统计篇章频率(text frequency);(4)测算话题保持(topic persistence,简称TP)。[注]Wright,S.& Givón,T.The Pragmatics of Indefinite Reference:Quantified Text-based Studies[J].Studies in Language,1987,(11);Sun,Chaofen.The Discourse Function of Numeral Classifiers in Mandarin Chinese[J].Journal of Chinese Linguistics,1988,(2);Chen,Ping.Aspects of Referentiality[J].Journal of Pragmatics,2009,(41).其中,话题持续值是可靠而简易的指标,它是指实体首次引入话语后的再次提及情况,一般以十个小句内再次提及的次数为测算结果。本文借鉴这一研究方法,以话题链中话题的持续值来标示其在话语组织中的重要性,并以此来判别话题篇章功能的强弱。我们在前人研究的基础上,结合话题链自身的结构特点,将话题链中的话题持续值的测算方法定义如下[注]一般而言,话题链中用于零回指的评述小句一般不超过10个,所以本文对具体数值的上限不做特殊规定。:即测算名词实体首次引入话题链后,其后所带有的零回指的评述小句的数量,该数值就是充当话题的名词实体的持续值。下面我们用具体实例来进一步说明:

3)爷爷i把小胶皮粘在爆破的地方后,i又把车胎放在水盆中一点一点移动,i看着

一点儿气也不漏了,i才把车胎又重新安上。(选自《小学生分类作文一本全》第44页)

例3)这个话题链共有4个评述小句,而在名词实体“爷爷”首次引入话题链后,后面对其进行评述的零回指的小句的数量是3,因此该话题链的话题持续值为3。

2.话题链标记度

话题链中评述部分的自身组合能力是话题语义关联的保证,话题可以通过这种语义关联实现表达上的连贯。曹逢甫从话题链的内部着手,将其区分为无标记话题链(plain topic chains)和有标记话题链(marked topic chains)。[注]曹逢甫.汉语的句子与子句结构[M].王静译.北京:北京语言大学出版社,2005:259~260.有标记话题链是指那些用连词“所以”“虽然”等连接起来的话题链;而无标记话题链是指只有话题而不用连接词语连接的话题链。如:

4)他i昨天头痛,i在家休息。

5)他i昨天头痛,所以i在家休息。

例4)是无标记话题链,而例5)是有标记话题链,因为两个评述小句之间用了连接词语“所以”来连接。无标记话题链是依靠话题的零回指形式来实现的;而有标记话题链是依靠话题的零回指和连接词语共同实现的,即连接词语附着于话题的零形式之上,推动话题的延伸与拓展。在有标记话题链中,话题在连接词语的帮助下提高了衔接功能,从而增强了自身的语义投射能力。可以说,连接词语作为语篇内的显性衔接机制,既可以辅助话题实现连贯的表达,也可以推动话题达成更为复杂的交际目的。据此,我们在不同类别的名词实体充当话题的话题链内部,计算其有标记话题链的使用频度,以此来判别该类话题篇章功能强弱。为了方便称说,本文将“有标记话题链的使用频度”命名为“话题链标记度”,具体的测算方法如下[注]以下公式中的话题链标记度、有标记话题链数、话题链总数均是就由某一类名词实体所充当话题的话题链而言的,其计算范围适用于下文所区分的表人话题链、动物话题链、植物话题链和无生话题链。:

话题链标记度=有标记话题链数/话题链总数×100%

另外,本文参照刘月华、潘文娱等对汉语连接词语的介绍[注]刘月华,潘文娱,故桦.实用现代汉语语法[M].北京:商务印书馆,2001:312~314.,将其分为并列连词和偏正连词两大类,其范围概括如下:

并列连词:和、跟、与、及、既、以及、而、而且、或、或者、还是、要么、不但、何况、况且、尚且、宁可、

与其、而况、以致、从而、于是

转折连词:因为、因此、因而、所以、既然、无论、不论、不管、只有、只要、除非、要是、倘若、假如、如果、但是、可是、不过、然而、虽然、尽管、即使、就是、哪怕、固然、省得、免得

凡是话题链中出现以上所列出的某个或某些连接词语,本文均称之为“有标记话题链”;反之则为“无标记话题链”。

(三)研究方法和语料来源

本文采用基于语料的定量统计方法,探究名词实体的生命度等级差异对话题持续值和话题链标记度的影响,以此来判别各类话题篇章功能的强弱。

王静认为,话题链本身结构比较复杂,一般说来,语料篇幅越长,越容易出现语篇类别混杂的现象,也就相应地增加了分析的难度。[注]王静.语篇与话题链关系初探[J].世界汉语教学,2006,(2).因此,为在研究的初级阶段降低难度、突出矛盾,文章使用的语料[注]文中的例1)、例4)、例5)除外。均来自小学生优秀作文网站——“皮皮作文网”[注]http://www.ppzuowen.com.、《小学生分类作文1000篇》(延边大学出版社,2014)、《小学生分类作文一本全》(延边大学出版社,2016)。我们分别选取了以人、动物、植物、景观为话题的文章各600篇,每篇字数均在300~500之间,共搜集了符合本研究标准的话题链982个。

三、生命度等级差异对汉语话题链的影响

(一)生命范畴下的话题链类别

生命度是生命范畴在语言中的体现,它将生命范畴量化成可见的等级序列,从而使生命范畴的研究更为具体、深入。作为对生命度的最初描写,Comrie给出了一个由高到低的生命度等级序列:人>动物>无生命物。[注]伯纳德·科姆里.语言共性和语言类型[M].沈家煊,罗天华译.北京:北京大学出版社,2010:215.在该序列中,离参照点越远,名词实体的生命度等级越低。不过,这个公式所传达的仅仅是自然语言的共性倾向而已,而不是对一切人类语言有效的普遍法则,因为有的语言还会对上述的生命度等级作出更细的区分。关于汉语的生命度等级,王珏归纳如下:第一人称>第二人称>第三人称>专有名词>称谓名词>人>动物>微生物>植物>无生物。[注]王珏.汉语生命范畴初论[M].上海:华东师范大学出版社,2004:66.在这一序列中,越靠近左边的名词,其生命度等级越高。

本文依据话题链中充当话题的名词实体自身的生命特征,结合具体的语料,首先将所谈论的对象分为有生、无生两大类,然后分别从生长繁殖、自控性(施动性)、思维文化三个方面的语义特征对有生话题[注]按一般辞书的释义,有生物可以分为三大类:即广义的动物(包括人和动物)、植物、微生物。由于由微生物充当话题的话题链在本文所选用的语料中几乎不存在,因此我们对此不作分类。进行区分,具体情况见表1:

表1 生命范畴区分表

根据表1的分类,我们将由人类、动物、植物、无生物[注]本文所说的无生物是指客观世界中存在的具体实物,不包括抽象的概念。充当话题的话题链分别称为“表人话题链”“动物话题链”“植物话题链”和“无生话题链”。 Comrie认为:“生命度等级不可能归结为任何单一的参项,只包括原来意义上的生命度本身,实际上生命度等级反映了人类在好几个参项之间一种自然的交互作用,这些参项包括严格意义上的生命度,但还包括定指度(也许是其他各个参项中最容易跟生命度解脱关系的参项),以及提高一个实体的个性化程度的各种手段——例如给它分配一个专有名词,从而使它更有可能成为交谈的话题。”[注]伯纳德·科姆里.语言共性和语言类型[M].沈家煊,罗天华译.北京:北京大学出版社,2010:232.为了避免其他参项对话题链中话题的生命度产生影响,本文所选取的均是以名词实体的光杆形式[注]此处所说的“名词实体的光杆形式”相当于陈平(2009)所提及的“光杆普通名词”;Chen,Ping.Aspects of Referentiality[J].Journal of Pragmatics,2009,(41).充当话题的话题链,具体实例如下:

表人话题链:

6)妈妈i跟往常一样,i一边抚摸我的手,i一边坐在床头给我穿衣服。(选自《小学生分类作文一本全》第32页)

动物话题链:

7)天鹅i游动的时候,i不像鸭子那么摇头摆尾,而i像万吨轮似的稳稳“航行”,i绝不溅起水花,i只在身后留下一圈圈美丽而平静的涟漪。(选自《小学生分类作文一本全》第238页)

植物话题链:

8)宝石花i开出五角星似的小白花束,i花蕊带点黄色,i花瓣尖上缀有几点红斑。(选自《小学生分类作文一本全》第298页)

无生话题链:

9)太阳i离开了地平线,i缓缓向上浮动,i闪着万道金光,i使人不敢直视。(选自《小学生分类作文一本全》第210页)

(二)生命度等级差异对话题持续值的影响

本文从2400篇(以人、动物、植物、景观为话题的文章各600篇)小学生描写类作文中共选取由光杆普通名词充当话题的话题链982个,其中包括表人话题链340个、动物话题链236个、植物话题链195个、无生话题链211个。我们将计算各类话题链的话题平均持续值,其计算方法如下:

话题平均持续值=话题持续值之和/话题链总数。

统计情况见下表2:

表2 各类话题平均持续值

表2数据显示,各类话题链的话题平均持续值是不同的:其中表人话题平均持续值最高,其数值为2.36;动物话题次之,其数值为2.25;接下来是植物话题和无生话题,其数值分别为1.73和1.63。Givón将实体的持续值归结为两大类:一类是高持续的(TP>2);一类是低持续的(TP 0~2)。[注]Givón,T.Syntax(Vol.I-II)[M].Amsterdam:John Benjamins Publishing Company,2001:458.按照这种标准划分,那么表人话题和动物话题的平均持续值属于高持续的,而植物话题和无生物话题的平均持续值属于低持续的。此外,持续值高的两类话题的数值之间差异并不显著;同理,持续值低的两类话题的数值之间差异也不显著。然而,高持续话题(表人话题与动物话题)和低持续话题(植物话题与无生话题)的持续值之间的差异却较为明显。

我们不妨回到话题本身的语义特征来解释造成这种差异的原因。名词和动词是实词系统中最重要的两大类:在句法层面上,二者形成主谓或述宾关系;在语义层面上,二者的组合也要符合逻辑表达要求。马庆株曾提出汉语动词的“自主”范畴,并按照[±自主]这一语义特征,将动词分为“自主动词”与“非自主动词”。[注]马庆株.自主动词和非自主动词[J].中国语言学报,1988,(3).按照马庆株的分类,自主动词最重要的语义特征就是由动作发出者“主观决定”“自由支配”;而非自主动词往往表示那些动作发出者不能自由支配的动作行为、变化或属性。显而易见,生命度高、自控性高的名词实体既可以与自主动词搭配,也可以与非自主动词搭配。例如:“爷爷、猫、乌龟”这样的话题,既可以与“走、跳、望、吃”等自主动词搭配;也可以与“跌、落、发抖、显得”等非自主动词搭配。然而,生命度低、自控性低的名词实体往往只能选择非自主动词作为其表述的载体,如“普陀山”、“梅花”这样的话题通常与“呈现、散发、属于、位于”等这样描述属性、特征的非自主动词搭配。概括地说,生命度越高的名词实体,其自控性就越高;自控性越高的名词实体,对动词的选择范围就越大,其篇章表现力就越强,话题延续的可能性就越大。由此可见,名词实体的“自控性”这一语义特征对话题持续值的高低有着重要影响,这也恰恰能够解释前文所提到的持续值高的话题(表人话题与动物话题)和持续值低的话题(植物话题与无生话题)之间数值差异显著的现象:前者具备“自控性”这一语义特征;而后者却不具备该特征。

根据上述分析,我们可以将各类话题的篇章功能从强到弱描述为:表人话题>动物话题>植物话题>无生话题

(三)生命度等级差异对话题链标记度的影响

下面,我们分别对各类话题链中有标记话题链的使用情况进行统计,统计结果见下表3:

表3 各类话题链标记度

表3数据显示,各类话题链的标记度是不同的,其数值分别为:表人话题链(54.71%)、动物话题链(47.88%)、植物话题链(45.13%)、无生话题链(26.07%),其从高到低的排列顺序与各类话题链的话题平均持续值的排列顺序是基本一致的。

前文中我们曾论述:生命度越高的话题,对其表述载体的选择范围就越大,其篇章功能就越强。也就是说,生命度越高的名词实体,越具备形成复杂语段的能力。根据人类语言的数量象似性原则,较复杂的事件、行为通常会用较复杂的形式去编码。从本质上说,“象似性”(iconicity)就是指交际功能与编码形式之间的某种一致性。王寅认为:“数量象似性的认知基础是:语符量一多,就会引起人们更多注意,心智加工也较为复杂,此时自然就传递了较多信息”。[注]王寅.象似性原则的语用分析[J].现代外语,2003,(1).在言语交际过程中,量大的信息,说话人觉得重要的信息,则表达它们的句法成分就相应增多,句法结构也相对复杂。语言符号数量增加,其所传达的信息量也就相应增加。生命度高的名词实体在篇章中的表现力强,往往包含的信息量也大,于是便倾向于使用连接词语帮助其编码复杂的交际内容和达成高层次的交际目的。

通过以上分析,我们仍可以将各类话题的篇章功能描述为:表人话题>动物话题>植物话题>无生话题。这与我们之前的结论是一致的。

(四)各类话题平均持续值与话题链标记度的对比分析

表2和表3的数据显示,各类话题链的话题平均持续值与话题链标记度从高到低的排列顺序是基本一致的。但是,仔细观察,我们仍然可以发现两个因素内部存在着差异。下面我们将两个表格中的数据进行汇总,具体情况见下表4:

表4 各类话题平均持续值与话题链标记度的对比分析

表4数据显示,就话题平均持续值而言,持续值高的名词实体(表人话题和动物话题)与持续值低的名词实体(植物话题和无生话题)之间的差异显著;然而,就话题链标记度而言,差异的显著性却体现在“有生话题”(表人话题、动物话题、植物话题)和“无生话题”之间。在生命度等级相同的情况下,为什么两个因素之间的差异显著性分界不一样呢?主要矛盾体现在由植物充当话题的话题链上,其话题持续值属于低持续的,但其话题链标记度却与由动物充当话题的话题链的标记度差距不大。

通过对语料的细致观察,我们发现这一矛盾根源于话题在篇章中的表现手法。在实际的篇章表达中,动物、植物、无生物这三类话题经常会用到拟人的修辞方式。拟人,顾名思义,就是把“物”当作“人”来写,赋予“物”以人的言行或思想。拟人化的写法可以使文章更加生动、形象、具体,这种修辞手法在小学生描写类篇章中较为常见。根据我们对语料的进一步统计,在这三类话题链中,拟人修辞手法的运用比率为:动物话题链(18.81%)、植物话题链(35%)、无生话题链(10.42%)。其中植物话题链的拟人修辞方式运用比率最高,因为作者常常将植物本身的特征与人的品性联系在一起。因此,对植物话题链而言,其话题在拟人的表达手法下具备了达成更为复杂的交际目的的功能。较复杂的事件、行为通常会用较复杂的形式去编码,因此植物话题链的标记度也就相对增高。不过,“拟人”只是就某个具体情况而进行的比拟,拟人化了的植物话题对表述动词的选择范围仍不可能像表人话题那样宽泛,所以其话题持续值仍然属于低持续的。

四、结 语

本文从话题链中充当话题的名词实体自身的生命特征入手,分别从话题持续值、话题链标记度两个方面,对生命度等级不同的名词实体的篇章功能进行考察。研究结果显示,生命度等级差异确实会对话题链中话题的篇章功能产生影响。生命度等级越高的名词实体,其充当话题时的篇章功能越强,集中体现在话题对评述小句的管辖能力和话题的篇章表现力两个方面。我们认为,在生命范畴下,话题链中各类话题的篇章功能可以从强到弱依次描述为:表人话题>动物话题>植物话题>无生话题。此外,话题持续值的高低会受到名词实体“自控性”这一语义特征的影响。

当然,本研究的结论只是基于语料统计而表现出来的一种强烈趋势,是一种原则性的规律,而不是规则性的规律,这意味着在具体情况下,各类话题篇章功能的排序都具有一定的灵活性。另外,本文主要是基于小学生描写类作文进行分析的,语料规模也不是很大,因此,这些结论是否符合其他体裁的篇章还有待进一步研究。

猜你喜欢

语料语义实体
基于归一化点向互信息的低资源平行语料过滤方法*
语言与语义
前海自贸区:金融服务实体
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
“吃+NP”的语义生成机制研究
《苗防备览》中的湘西语料