“联系项平衡假设”的语料库验证
2018-07-30余泽超
余泽超
(浙江师范大学 外国语学院,浙江 金华 321004)*
一、引 言
以Dik所提“联系项居中原则”[1]为依据,国内学界(如刘丹青,储泽祥等,张建)将汉语复句的关联词标记模式(即分布位置)概括为以下优先等级:居中单用 > 成对使用(框式)> 前置单用;[2-4]典型例子如:“但是/所以/而且2”>“虽然1+但是2/因为1+所以2/不但1+而且2”>“虽然/因为/不但1”。①余泽超以包含框式关联词的汉语零形下指句(+P/N式)为依据,提出不同于Dik的“联系项平衡假设”,认为下指句内的小句主题兼有连句功能,主题与联词的互动结果为相互依赖、虚实互补,即:主题出现时,同句联词可省去;主题空缺时,同句联词需保留。对照“联系项居中原则”及其对应的优先等级,我们将零形下指句的联系项分布特征,概括为:
(1)“联系项平衡假设”:
关联词优先等级为:前置单用/成对使用(框式)>居中单用。
例(2)中三句,在建设本文所用语料库过程中提取,关联词分布特征分别属于前置单用、成对使用(框式)、居中单用;指代关系分别是:+P、+P+、++P。鉴于除例(3)外所有语例均出自《骆驼祥子》,我们在例句中省去语料出处与编码,同时省略表示指代关系与小句顺序的下标;括号内的关联词由本文添加。
本文以自建下指语料库对我们的“联系项平衡假设”进行验证。下文先介绍语料库建构、语料检索与统计过程,然后具体呈现量化结果与实例分析。
二、语料库建构及语料统计
本文所用语料库以我们前期建立的下指语料库为基础:我们的原始语料库,用EXCELL录制了1 100组英汉叙事语篇平行语料,其中汉—英部分的源语语料由《骆驼祥子》和《子夜》构成,分别有466和178个句对。语料标记与分类的两大项目是:指代关系与关联特征,指代关系以、P、N组合表示,关联特征以联系词与下标显示。语料输入与标注,均用手工完成。[5]
本文拟采用原始语料库的《骆驼祥子》分库而不用《子夜》分库,理由如下:在《子夜》分库中,例(3)类带框式关联词的语料合计只有8句,数量不及《骆驼祥子》的十分之一。另外,在(3b)中,虽然“也”“就”两个联词都有与代词互动、构成联系项平衡的作用。但是,两者分列明示主题N前后,分别与主题构成下指与回指关系,互动结构式可拆分为“不+也不+N3/4”“N+就4/4”,②也就是说,这里的“就4/4”字不是本文讨论的重点。
从容量为466句组的《骆驼祥子》分库中,我们检索并提取含有框式关联词的语句,合计113例,再对框式关联词的分布进行归类、统计,最后做成一个独立的“联系项互动语料库”。
框式关联词的分类问题比较复杂,需要补充说明。我们以邢福义为参照,将下指句按语义关系分为先后、因果、转折三大类:1)先后类包括顺承、递进(表1前6栏)。“从一/自从一/只要一+就”与“(一)直到+(这)才”,时间本义与强调功能相似,也归入先后类;2)因果类包括因果、假设、条件(7—12栏);3)转折类只有一个单类(最后一栏)。[6]时间“先后”与逻辑的“因果”,虽然语义上还有重叠,但是外形不难甄别:前者以“一+就/便”为典型,后者以“因为+所以”为代表。关联词的分布特征,按前置单用、居中单用、成对使用/框式分为三类,单用与成对使用不重复计数。部分关联词有复合使用的情况:表1第三栏及第一栏中的“刚一+就”,都以“一+就”为基础,其中“只要一+就”看作“一+就”与“只要+就”(另有单用/列一例)的复合;倒数第二栏否定关联“既没+(便)没”是“既+便”与“没+没”的复合;第七、第九栏的“也就”“也还”也是合用。
因为总量不大,统计并不复杂。
三、结果与讨论
关联词分布的统计结果,见表1。我们从总体趋势与具体实例两方面来呈现关联词与主题的互动结果。
先看总体趋势。1)从表1左列看,共有12小类(type)关联词;后三列合计频数(token)为113。按比例看,前置单用、居中单用、成对使用/框式的频比为40∶26∶47。前后两项合计87例,明显大于居中频数(26);2)在成对使用/框式的47例中,凡是前置、居中两栏为零值的,表明无法拆分使用,可看作“强制框式”。这样的“强制式”共15例,占框式总数近1/3,以复合关联为主,包括“从一/自从一/只要一+就”“越+(就)越”“既没+(便)没”等;3)从三大类比例看,以先后与因果为主(各占66与29例),转折类18例。先后类中以“一+就/便”居多(表1前三栏):合计44例,占表1总数近四成。转折类中有“轻转折”③关联词12例,因为不带对应前框词看作“强制居中”;4)逆向分布算作居中的有7例,占居中分布的一半,因为不便省略也看作“强制居中”;5)如果不看强制式,那么前置单用、成对使用、居中单用的比数为40∶32∶7。换言之,关联词优先等级表现为:前置单用 > 成对使用(框式)> 居中单用,完全符合上文(1)所述“联系项平衡假设”。
综合表1联系项特征,可见:成对使用的(47例)属于显性平衡,前置单用的(40例)因主题、关联词互动取得平衡,合计频数(87)是居中单用(26例)的三倍有余。统计结果完全符合上节“平衡假设”。
接下来,我们分类细看一些例句。
先后类。例(4)的前三句,是“一+就/便”类典型例句。(4d)是个复合式:“一+就”“只要+就”复合的结果是省去一个后框词“就2”。框式关联“一+就/便”主要用于连接短时相继、顺向承接的真实事件;其象似性理据[7]既可从四成多的频比看清,又可从后框词(“就2”)的省略得到验证:(4a)的结构式为“一1+P(就)2”,是表1前置单用列和全表频数最高的句式,合计频数27,明显高出对应的框式频数(11)。
表1 下指句关联词分布特征表
加号后数字(合7例)在“前置单用”一列中放在括号内,表示逻辑上前置的关联词实际在后句出现,即属于逆向分布,算作“居中单用”。
例(5)两句的结构比较复杂。从主题结构看,(5a)前置三个零形小句(P),在开头两句的“虚”空位置,分别填补一个单音联词(“既”“又”)与末句主题(P)呼应,显然有利平衡全句。细看语义关系,第二、第三小句之间还有一对更隐蔽的关联“这样的→居然”,衔接功能与英语“so...that...”相当。从逻辑关系看,前三小句层层递进,与末尾P句构成因果关系。这样的功能分析,显然不能简单依赖句法的“等立/并列”关系。(5b)句的主题结构为PP,内含一个非人称主题(“这些事”),句法、语义关系更为复杂。这是个“释因句”:“因为2”逆向/居中分布。从认知加工的角度看,逆向关联因违反象似原则更难理解,关联词也就更难省略。综合句中所有联系项——包括从句中“并非+而是”,(5b)同样符合平衡原则。
因果类。成对使用关联的,以“即使+也”“既+便”两类条件句为主,因果句、假设句各占一例。以下是假设关系的一组例句,联系项总体分布比较匀称:
(6a)是语料库中唯一用了框式关联的假设句,理由似与前后框跨度(有插入语小句相隔)有关;(6b)单用前置“假若1”,未用后框关联“便2”,这与周刚及董秀英所说假设句需要合用关联词[8-9]的结论不太一致;(6c)相对复杂:主题结构为“P”,两个假设关联虽然放在末句“他”前,相对前面的小句却是倒置,所以标作“假若/设若2”,属“强制居中”。
3)转折类。与前两类不同,转折类关联词以居中单用为主,共14例,占居中总数的大半;又以强制居中的“轻转类”为主(12例)。与框式“重转类”不同,轻转类关联词不带对应的前框词(另加“?”表示)。例(7)前两句与后句差异明显:前框关联的隐、现与句间跨度密切相关、符合语言的象似性原则。单看关联词,“轻转类”的明显特征为居中分布(“可是2”);结合主题而看,互动的结果还是平衡分布。
最后,我们看一下诸如(5b)(6c)(7c)之类含四个以上小句的多重复句。因为语义关系更复杂,多重复句一般需要更多的关联标记(平行结构是个例外),以(8)为例:
(8a)与(7c)相似,由七个小句合成,也包含平行结构。除去平行部分,以上“大长句”的关联词比例明显高出只含两三个小句的“小短句”;(8b)中的关联词还与否定标记构成互动关系:我们把“既没1+他没有2”拆分为“既1+(便2)”+“没1+(就)没2”。换言之,借用居中代词“他2”,(8b)省去了两个后置联词(便2、就2)。事实上,(8b)分号之后也是个下指式,同样省略一个后置词“就2”,可写作“要打算—的话1+(就2)”。
综上,量化结果与具体例证,都证实了上文(1)所述下指句“联系项平衡假设”。从形—义匹配关系看,平均分布、平衡用力符合语言象似性、经济性原则,是下指句小句主题与关联词互动的理想结果。
四、结 语
本文以自建语料库的统计结果与实例分析,初步证实了我们在前文中所提的汉语零形下指的“联系项平衡假设”。需要补充说明的是,鉴于以往研究主要以包含两个小句的简单下指句(+P/N)为对象,后续研究需要继续考察包含多个零形式以及下指连带回指的复杂下指句(如上文(7c)(8)等),以便进一步验证以下指句为据的“联系项平衡假设”、深化主题—关联词互动研究。此外,后续还需要探讨例(9)类句子为何缺省明示关联、需要比较该类句子与带有关联的下指句有何区别。
总之,作为特殊的复句/合句/“流水句”,下指句研究的深化、细化似乎还有很长的路要走。
注释:
①下标表示关联词/小句相对位置,照学界常规,我们的前期研究以含两个小句的简单复句为典型语料。关联词不限于连词,下文又以“联词”简称。
②3/4、4/4分别表示:在合计四个小句中的全句/大句中,分别位列第三、第四句。
③“轻转折”的对立体是“重转折”,“轻”“重”分别指转折语义的“弱”与“强”。