APP下载

汉语方言中的话题连续性测量

2019-09-20宋佳丽

文学教育 2019年25期
关键词:连续性语料代词

宋佳丽

本文共分为三个部分,第一部分是对话题连续性及相关理论、概念的简介,主要焦点放在话题连续性的测量方法上;第二部分以汉语口语为例,进行话题连续性测量,并尝试对汉语方言进行话题连续性测量的可行度考察;第三部分是对汉语方言话题连续性测量结果的分析与总结。

一.话题连续性及测量方式

(一)相关概念介绍

关于“话题”这一概念,中外学者多有论述,本文则主要采用Givón(1983)的观点,即:语法上的“主语”,对应会话功能上的“话题”。

在讨论话题连续性问题伊始,有必要对话题连续性在会话中的地位做个了解。Givón认为,基于“段落串”的微观传统,词语只有在组成小句后才能携带信息,而众多小句又组成“主题段落”——这与会话直接相关,可透过其开始讨论会话的连续性。会话连续性中又分为主题连续性、动作连续性和话题连续性三个部分,其中主题连续性是基础,三者的蕴含序列可以表示为:主题>动作>话题。本文的讨论焦点是话题连续性,它与主题段落密切相连:一个话题是最易成为连续性标记的,同时,参与者和主题的联系最为紧密,参与者最可能被编码为首要话题或者说语法上的主语。

在主题段落中,假设主题段落里的小句表述的是同一个话题时,那么可以根据其在段落中的位置将话题分成三个类型:

1.链首话题:新的话题,一般是一个非连续的话题。

2.链中话题:连续性话题,但非最大持久性。

3.链尾话题:连续性话题,又是非持久性话题。

Givón对于测量话题连续性的方式,主要是从可及性、可识别性来考察的,且测量是基于文本而非对话者。因为文本提供两类关联的信息:其一,言者采用纯语言或语法化的手段去编码话题;其二,话题的位置,取决于主题段落的结构、上一次提到的距离、其他话题的聚集、下一次提及的距离等。具体的话题连续性测量方式有以下三种:

回数法:该方法是测量同一个话题在当前和上一次出现之间的空位,空位的测量单位指左边的小句数量。因此1个小句时是最小价值,即最大连续性。Givón将空位的上限定在20个小句,当话题不出现在这个范围内,那么20的价值就是无意识的并且是非连续的。这意味着,不定指的指称话题是通过定指化实现最大价值。当然,语域中的表现手法不一定要显性的,很多也可能通过零形回指提供话题。

歧义法;当前语域中的其他指称可能会对话题的可及性、可识别性产生颠覆性影响。为了最小化指称间距的明显联系,把“当前语域”限定在左边的1-5个小句内,最常见的情况是3个小句。这样的设定是有一定的基础的:如果一个话题已经占有主要的位置,并且在其后的3 个小句的表达内能清楚的辨别,那么其他潜在干扰性的话题便不会对话题的识别产生干扰。承前,若是在相关距离内没有发现干扰性的指称,那么歧义值就是1。若是不止一个干扰性的指称,那么歧义值就是2。在其他一些研究中,歧义值一般也不超过3。

衰减法;前面两种测量方法,考虑到的是前文,且都与听者相关。第三种方式则与后文有关,是从言者角度出发。其假设如下:越重要的话题会越频繁地出现在语域中。此处,测量的就是右边的小句数量。最小的价值在0,即后文立马提及,同时这一方法不存在最大价值。

(二)测量实例:以英语口语为例

Givón在提出测量话题连续性的相关理论后,分别对多种语言进行测量,本文着重回顾英语口语的实例检验。为了更好地了解测试过程的各项指标,以及对测试结果的分析,需要事先说明如下几种话题标记结构:

1.零形回指:下分并列零形和附属零形。

2.代词:仅考虑第三人称(单、复数都包括)。

3.定指NP’s[DEF]:包括专名、带定冠词的名词和受修饰的名词。

4.所有格定指NP[DEF-P]:大多数用所有格代词“My”进行标记。

5.定指NP’s 后加停顿[DEF-PAUSE]:因为有了停顿,所以经常将其标记为高度非连续性话题。

6.重复的定指NP’s[DEF-REP]:话题重复也是高度非连续性话题一个标记。

7.左移位LD。

8.右移位RD。

9.指示代词[DEM]:常用“that”表示,一般用于指称刚刚提及的大的语意单位,而非小句层面的话题-参与者。

通过上述的理论方法,对英语口语语料进行数据分析后,Givón得出如下结论:零形回指是最限定的指称手段,其次是代词和定指NP。英语中定指NP、左右移位的指称距离和其他语言遵循同样的等级,即最高的指称距离要么是犹豫停顿、重复停顿,要么是定指NP的移位。定指NP比单纯的定指持久性要高。定指左移位的高持久性和高指称距离,使其出现在链首用于引进新话题。

简而言之,对英语口语话题连续性的测量结果可概括为三点:

其一,话题连续性和其标记手段是紧密相连的。可以将二者的关系表述成下列层级序列:

零形回指>非重读代词>重读代词>完全DEF-NP>受修饰的DEF-N

左边的连续性最高,从左往右呈递减趋势。

其二,动词前的话题标记着低连续性,动词后的则标记高连续性,等级如下:

述题-话题>话题-述题

在严格的词序语言中(如:英语),RD 使话题具有高连续性,同时发现RD比中性词序更加连续,LD比其更不连续。等级如下:

RD>中性词序>LD

其三,话题重复和犹豫停顿作为最不连续性的两个话题标记手段,在英语口语中得到了很好的验证。其底层序列如下:

述题>述题-话题>话题-述题>话题

这一序列是根据“重要信息优先”原则排列的,左边的是最重要的,右边则不那么重要。

二.汉语方言的话题连续性测量

按照Givón测量英语口语话题连续性的思路,笔者不禁思考,汉语的话题连续性可以进行测量吗?上述三种测量方法是否同样适用于汉语包括汉语方言?不同汉语方言测量所得结果有何差异?带着这些问题,笔者检索过往研究,发现采用过该种方法测量少数民族语的有《下坎侗语口头叙事语篇的话题连续性研究》;用于测量汉语的研究有诸如《〈左传〉话题的连续性研究》,该文语料属古代汉语,与现代汉语口语差异较大。总体而言,对汉语特别是汉语方言进行话题连续性测量的研究尚不多见。

基于该背景,为了检测Givón的方法是否同样适用于汉语及汉语方言的话题标记结构,笔者统一选取台湾采集转写的Chafe《梨子的故事》的口语语料[1],分别对不同的汉语方言的话题连续性进行测量。

(一)北方话

首先,为了直观考察Givón的测量方式是否适应于汉语,笔者选取了现代北方方言的语料作为代表进行分析。在实际操作中关于话题所属单位如何进行选择,该问题对于英语等印欧语言是非常容易解决的,因为小句是非常重要的一个测量单位。然而,在缺乏形态变化的汉语中,如何准确合理地切分小句虽然还尚有争议。目前主要的三种代表性观点:(1)陈平、宋柔的“标点符号说”;(2)徐赳赳的“兼顾停顿和功能的一个主谓结构说”;(3)殷国光的“自成一读的、述谓中心说”,根据三种方法进行语料处理,基本都能划分出篇章回指研究中的大多数小句。故此,再结合刑福义的“小句中心说”,我们认为在汉语中以“小句”为单位同样能进行语篇话题研究。

北方话“梨子的故事”语料中,统计所有用于回指的话题标记手段,我们可以发现一个非常有意思的现象,即在本文使用的口语语篇共30 个小句中,定指NP’s(13次)和人称代词(13次)两种手段的使用频率最高,零形回指(11次)和单一名词(11次)的使用频率稍低。与Givón在英语中所测量出的连续性优先序列结论不同,即:零形回指>非重读代词>重读代词>完全DEF-NP>受修饰的DEF-N(下文简称该种类型为“英语型”)。因本文选取语料有限且篇幅较短,暂无法很好区别四种类型的具体优先次序,结合前人研究来看,汉语口语中表话题连续性的序列为DEF-N>人称代词>单一名词>零形回指相对恰当(下文简称该种类型为“北方话型”)。在我们的统计结果中,最为突出的一点便是零形回指的位置,在英语里,这是最具连续性的一类标记,但汉语中该手段承担的功能却让位于单一名词。

再看回指距离,以语料中出现频率最高的话题“芭乐”(11次)为例子,其中直接用名词“芭乐”回指的有6次,用DEF-N回指的有4次,使用零形回指的仅有1次。而在这11次回指“芭乐”的过程中,回指距离少于1个小句,即下文立即提及的情况有5次,隔了超过两个小句再次提及的有3次,也就是说“芭乐”这一话题的连续性非常之高,且使用单一名词回指手段的频率也是最高。与之相比,出现频率很低的话题“帽子”(2次),回指距离是1 个小句,两次提及分别用的是“那个帽子”和“帽子”,而非代词或零形式。

从上述的测试中可以看出,理论上,Givón归纳的话题连续性测量方法同样适用于汉语,但在不同的语言中测量出的结果不一定相同,有时甚至会截然相反。汉语作为一种复杂的语言,其内部又有众多区别显著的方言,那么在不同汉语方言中的话题连续性测量是否与汉语标准语相一致?话题标记在不同的方言中会呈现出怎样的差异呢?

(二)其他汉语方言

为了尝试回答上述问题,笔者分别对闽语、粤语、吴语、湘语、赣语、客家话的同主题语料进行统计,本文只取网站上提供的第一则语料。首先,采用回数法进行统计时,用于回指的话题标记手段,在不同的方言中呈现出了不同的优先序列。具体如下:

闽语:零形回指(30)>人称代词(19)>DEF-N(14)>单一名词(3)

粤语:零形回指(33)>单一名词>(31)人称代词(28)>DEF-N(19)

客家话:DEF-N(11)>人称代词=单一名词(10)>零形回指(9)

湘语:DEF-N(25)>零形回指(18)>人称代词(17)>单一名词(11)

吴语:DEF-N(36)>人称代词(30)>零形回指(18)>单一名词(14)

赣语:DEF-N(18)>人称代词=零形回指(9)>单一名词(8)

从整体上直观来看,汉语方言在表现话题连续性上主要呈现出两种类型,即闽语、粤语较为接近英语型,其他方言较为接近北方话型。零形回指是一个显著的类型划分标记,具体到以主要话题“梨子”[2],我们比较来看,北方话型中以吴语为例,其中回指出现频率最高的话题“生梨”(11次)时,用DEF-N回指的有9次,直接用名词“生梨”回指的有4次,使用零形回指的有7次。英语型则以闽语为例,其中回指“梨子”(12次)时,直接采用名词回指和DEF-N回指各有1次,而使用零形回指的频率高达10次。

下面,我们再用衰减法进行回指距离上的测量并对数据加以统计。当统计不同方言这最高频话题≤1 个小句,以及最高频话题>1个小句的次数时,呈现出的局面为,北方话5:3,闽语6:6,粤语19:5,客家话6:3,湘语6:5,吴语14:6,赣语9:0.在汉语方言中回指“梨子”的过程中,回指距离少于1个小句,即下文立即提及的情况频率高于隔了超过两个小句再次提及。除了闽语的两种概率一样,这很有可能是由于语料较少造成的情况。换言之,“梨子”这一主要话题的连续性非常之高,且在各方言中都呈现出高度的一致性。

三.小结

通过上文对汉语各主要方言的话题连续性测量尝试,笔者认为Givón的方法对汉语方言的话题连续性测量同样具有可行性。同时,我们也看到不同的语言或方言呈现出不同的话题连续性优先序列。下面尝试就测量的结果作一些说明和解释。

其一,闽方言、粤方言语料中零形回指的使用频率非常之高,在各方言中较为突出。以闽语语料为例说明,一方面是句子主语经常省略,尤其是当陈述一个连续画面或片段时,例如[3]

此处的省略的主语是“一个囝仔”,只出现在这一对象出场时;宾语偶有省略。另一方面是主要叙述对象的表达方式常常是用“一/迄篮”来代指“一/迄(那)篮梨仔”,即“一/迄+量词”结构用于回指在闽语中相当常见。在这一点上,我们赞同刘丹青(2017)的看法,由于汉语词类库藏中的量词是显赫范畴,指示代词的功能常由“指示词+量词”组合完成。汉语方言指示词的主要类型以指示代词兼指示形容词为一端,以基本指示词只能修饰量词另一端,体现了量词显赫型语言的特点。

其二,汉语包括汉语方言中单一名词能在话题连续性序列占有一席之地,主要原因在于对比印欧语系中名词或与冠词、指示代词等连用,或采用复数形式,无法单独使用,形式上有要求。汉语则不然,名词使用在形态上并无太多束缚。另外,在汉语方言中话题连续性序列兼具两种类型,其一是英语型,即一般认同的语篇回指规律,形式越轻,回指频度也相对较高;另一种就是北方话型,名词性话题成分的回指频度远高于代词性回指成分,DEF-N 回指手段居于序列顶端,这也印证了乐耀(2007)总结的汉语语篇中回指规律,即在名词或名词短语话题成分回指中,形式越轻,回指的频度越高;代词话题成分回指中,反而是形式越重,回指的频度越高。

其三,再回指距离方面,不同语言或方言呈现出共通性,即话题连续性高的对象总能迅速被回指,在本文统计的语料中,赣语语料在这点上表现得最为突出。同时,我们也观察到部分方言语料中,回指距离小于等于一句和大于一句的次数相当,这种差异性很可能出在叙述者身上,不同的叙述习惯导致主题的不连贯。譬如闽语,叙述者将叙述重点放在了人物“小男孩”身上而非“梨子”,所以“梨子”的回指距离测量结果与预计有差异,但“小男孩”的回指距离测量结果就符合结论。

其四,人称代词处于话题连续性序列的前端,无论是英语型还是北方话型都是如此,对于回指人物的策略各方言的一致性较高,也可从侧面看出不同方言丰富的人称代词,例如:粤方言的“佢”,客家话的“佢等”、“佢爸”,吴语的“伊”,赣语的“渠”等。

上述是笔者对汉语方言话题连续性问题的一个小结,本文仅是一次结合方言语料和话题研究的简单尝试,由于测量、统计的语料数据并不算多,对测量结果的解释也有待加强,希冀在未来能有更加深入的研究和突破。

注 释

[1]《梨子的故事》语料来源:http://www.pearstories.org/mandarin/mandarinc.htm

[2]不同方言对影片中“梨子”这一物体的具体指称不同,诸如“梨”、“生梨”、“芭乐”等,但代表的都是同一对象。

[3]语料格式直接采用源语料的形式,不做修改,零形回指为笔者后续添补。

猜你喜欢

连续性语料代词
非连续性文本之图文转化题阅读摭谈
海量标注语料库智能构建系统的设计与实现
浅谈视频语料在对外汉语教学中的运用
可比语料库构建与可比度计算研究综述
浅谈连续函数的四则运算的连续性
小学中段非连续性文本阅读教学初探
这样将代词考分收入囊中
连续性
英语代词用法练习
英语教学中真实语料的运用