面向汉语信息处理的“二标四句式”复句句法语义判定
2017-05-09吴锋文
吴锋文
(四川外国语大学中文系,重庆 400031)
一、 引言
汉语复句信息处理,是计算语言学的重要议题,也是中文信息处理领域的一项基础性课题。当前中文信息处理正面临“句处理”攻坚阶段[1],要取得“句处理”的重大进展,复句的句法语义判定问题必须受到重视[2]。
计算机对汉语复句进行自动句法分析,其核心任务是对分句间的层次结构和语义关系进行判定,这种判定工作是以分句的确认和关系词语的识别作为基础的。据吴锋文(2011),有标复句可划分为充盈态和非充盈态两类,标记充盈态模式与复句实例的层次关系之间存在“一对一”的映射关系,其复句实例可以采用基于规则方法来识别;标记非充盈态模式与复句实例间不存在“一对一”的映射关系,因而非充盈态有标复句层次关系的确定需要引入分句间的语义分析[3]。目前面向机器语义理解还很薄弱,而“在句法分析中加入语义信息,将句法语义综合分析”则成为自动句法分析领域的共识[4]。因此,计算机要能够进行汉语“句处理”,充分挖掘可供计算机理解的形式化句法语义知识已成共识。
根据邢福义(2001)、姚双云(2008)归纳,复句在大规模文本中所占比重达35%~60%,而二重复句、三重复句又是最常见的复句类型[5],因而加强对由四个分句构成的复句(四句式复句)的句法语义关系的判定研究极有意义。故本文将面向机器“句处理”的研究对象限在“二标四句式”复句,着重探讨“二标四句式”复句的层次划分和语义关系。例如:
(1)①道歉的魅力,不是来自花言巧语,②而是来自真诚,③来自心灵的沟通和感情的交流,④来自为纠正过失而采取的实实在在的行动。(《人民日报》1997-11-3)
(2)①他若被困在别的地方,②也许还有人会去救他,③但他被困在少林寺,④天下只怕没有一个人能救得了他。(古龙《多情剑客无情剑》)
例(1)~(2)是非充盈态有标复句,句中仅有的关系词不能明确地标示分句间的层次结构或语义关系。如例(1)“不是”“而是”尽管构成搭配,但分句③④连续无标,故“而是”的语义辖域是分句②,还是分句②和③④,计算机无法以标记对“不是……而是”给出准确判定,且无标分句③④和分句②之间是什么语义关系,也无法判定。
基于上述背景,加强对“二标四句式”复句的句法语义关系的研究,是中文信息处理领域“句处理”的客观需求,有助于汉语复句的自动理解与生成,不仅对计算机处理汉语多重复句具有先验性的作用,甚至对汉语篇章理解也有启示意义[6]。
二、“二标四句式”复句的知识表示及其分类
“二标四句式”复句是汉语有标复句的一个子类,是指由四个分句构成的、有且仅有两个分句各出现一个复句关系词语的有标复句。如上例(1-2)所示。本文采用邢福义(2002)复句理论体系[7],将汉语复句分为广义因果、广义并列以及广义转折三大类,分句间的逻辑语义关系设立因果(yg)、推断(td)、假设(js)、条件(tj)、目的(md)、并列(bl)[8]、连贯(lg)、递进(dj)、选择(xz)、转折(zz)、让转(rz)、假转(jz)等12个语义类别。为行文表述方便,本文给出如下约定:
(a)复句CS的分句构成函数记为Numb(CS),则四句式复句的Numb(CS)取值为4。
(b)复句CS中分句集表示为{Ci| i代表分句位序,i∈N且1≤i≤Numb(CS)}。
(c)若分句Ci的关系标记缺省,则表示为kb。
(d)任一复句关系词RW表示为三元组〈R,i,s〉,Ri的搭配位置(配位)表示为Pos(Ri),Ri的关系类别表示为Sem(Ri),则有Pos(Ri)∈{f(前)、b(后)},Sem(Ri)∈{yg、js、td、tj、md、bl、dj、xz、lg、zz、rz、jz}。
(e)若分句Ci、Ci+1为相邻分句,则二元有序对(Ci,Ci+1)表示Ci、Ci+1存在语义关联,形成小句关联体Clause Union(简记为CU)。
(f)相邻小句关联体CU1、CU2的语义规约原则:若CU1、CU2结构平行,则CU1、CU2规约为并列关系,即Sem(CU1,CU2)=bl;否则,规约为因果关系,即Sem(CU1,CU2)=yg。
本文首先采用中科院张华平、刘群开发的ICTClAS分词系统对大量四句式复句语料进行关系词自动标注,然后对标注结果进行人工校对,结合复句关系词语的配位、语义类别以及分句序位,总结抽取出四句式复句的14种“二标四句式”标记联结序列。如下表1。
表1 “二标四句式”复句的标记联结模式
对表1里的“二标四句式”复句标记序列模式进行配位信息、语义类别及句序制约分析,我们发现有些标记序列模式实例化后凭借所显现的两个关系词语就能确定该复句的层次构造及其相应的逻辑语义关系,这类“二标四句式”标记序列是一种标记充盈态模式,其相应的复句实例是充盈态有标复句。以标记序列模式M1、M2为例,请看下例:
(3)①如果我看得上他,②可以跟他一根竹竿走天涯;③如果看不上,④亿万富翁也不嫁。(安顿《绝对私隐》)
(4)①她想呐喊,②可是她没力气,③她想冲进去,④可是她不能动。(古龙《多情剑客无情剑》)
例(3)分句①③有假设标记“如果”,例(4)分句②④出现转折标记“可是”。其相应的句法分析树如图1、图2所示。因为标记“如果”“可是”重复出现且句序结构平行,故例(3-4)为并列复句。
图1 例(3)分析结果
图2 例(4)分析结果
从复句关系词语对相应复句格式句法语义关系的标示能力强弱角度考察,上表1中的14种标记序列模式可分为两类:
(Ⅰ) 标记充盈态模式:M1、M2、M3、M5、M6、M7、M11共7种。这些标记序列模式实例化后形成充盈态有标复句,如上例(3)~(4)。
(Ⅱ) 标记非充盈态模式:M4、M8、M9、M10、M12、M13、M14共7种。这些标记序列模式实例化后形成非充盈态有标复句,如上例(1)~(2)。
本文研究发现,上表1所述14种“二标四句式”复句的标记序列所能形成的复句层次结构有六种类型。如下表2。
表2 “二标四句式”复句的结构类型及分句组合顺序
上述知识表示及其分类目标在于,对给定的任一“二标四句式”复句实例,能够将其划归为表1里某种标记序列模式,并采用“复句关系标记为主,分句关联特征为辅”的研究思路,以期确定该序列模式与相应复句实例层次构造间的句法语义关系。
三、 充盈态“二标四句式”复句的句法语义关系判定
关联词语是复句中标示分句关系的重要构件,它不仅影响着分句的语义,也影响着复句层次关系的识别[9]。如前所述,在充盈态标记序列和复句层次关系之间存在一种“一一对应”的映射关系,可以唯一确定充盈态复句的层次构造和语义关系[10]。本文拟利用这种映射关系,挖掘不同序位关联标记的特征,制订一系列句法语义规则,采用规则方法来判定充盈态“二标四句式”复句的句法语义关系。下面将具体阐述表1七种标记充盈态模式的复句的层次关系判定问题。
规则1:若任一复句CS的Numb(CS)=4,分句C1、C3复现关系标记Rif且Pos(Rif)=f,而分句C2、C4无标,则复句层次构造为([C1,C2],[C3,C4]),小句关联体(C1,C2)、(C3,C4)的关系均由Sem(Rif)确定,复句关系类别为并列。例如:
(5)①如果你爱一个人,②让他去纽约;③如果你恨一个人,④让他去纽约。(曹桂林《北京人在纽约》)
例(5)分句①③出现标记“如果”,标示分句①②是假设关系,分句③④是假设关系,分句①②与③④之间结构平行,规约为并列关系。
规则2:若任一复句CS的Numb(CS)=4,分句C1、C3无标,分句C2、C4复现关系标记Rib且Pos(Rib)=b,则复句层次构造为([C1,C2],[C3,C4]),小句关联体(C1,C2)、(C3,C4)的关系均由Sem(Rib)确定,复句关系类别为并列。例如:
(6)①她想呐喊,②可是她没力气,③她想冲进去,④可是她不能动。(古龙《多情剑客无情剑》)
例(6)分句②④出现标记“可是”,标示分句①②是转折关系,分句③④是转折关系,分句①②与③④之间结构平行,规约为并列关系。
规则3:若任一复句CS的Numb(CS)=4,分句C1、C4无标,C2、C3分别出现标记Rib、Rjf,且Pos(Rib)=b,Pos(Rjf)=f,Sem(Rib)≠Sem(Rjf),则复句层次构造为([C1,C2],[C3,C4]),小句关联体(C1,C2)的关系由Sem(Rib)确定,(C3,C4)的关系由Sem(Rjf)确定,复句关系类别为因果。例如:
(7)①那个青衣独臂人武功高不可测,②而且是个怪物,③如果不是我想出这法子,④你怎么能把我从他手里救出来?(古龙《七星龙王》)
例(7)分句②出现标记“而且”,标示分句①②是递进关系,分句③出现标记“如果”,标示分句③④是假设关系,分句①②与分句③④之间规约为因果关系。
规则4:若任一复句CS的Numb(CS)=4,分句C1、C3分别出现标记Rif、Rib,且Pos(Rif)=f,Pos(Rib)=b,Sem(Rif)=Sem(Rib),分句C2、C4无标,则复句层次构造为([C1,C2],[C3,C4]),小句关联体(C1,C2)、(C3,C4)的关系均规约为并列,复句关系由Sem(Rif、Rib)确定。例如:
(8)①若有人认为你这样做得不对,②认为你是个心狠手辣的女人,③那么这人一定是个伪君子,④是个大混蛋。(古龙《九月鹰飞》)
例(8)分句①③的标记“若-那么”形成搭配,分句②④无标,因分句①②复现谓语“认为”,③④复现谓语“是”,故(①,②)、(③,④)均规约为并列关系,“若-那么”标示分句①②与分句③④之间为假设关系。
规则5:若任一复句CS的Numb(CS)=4,分句C1、C4无标,C2、C3分别出现标记Rif、Rib,且Pos(Rif)=f,Pos(Rib)=b,Sem(Rif)=Sem(Rib),则复句层次构造为(C1,[C2,(C3,C4)]),小句关联体(C3,C4)的关系规约为并列,(C2,[C3,C4])的关系由Sem(Rif、Rib)确定,复句关系类别为因果。例如:
(9)①活也有很多种方式,②你若真的为我好,③就该让我好好活下去,④堂堂正正地活下去。(古龙《多情剑客无情剑》)
例(9)分句②③的标记“若-就”形成搭配,分句①④无标,因分句③④复现谓语“活下去”,故(③,④)规约为并列关系,然后分句②与(③,④)规约,“若-就”标示假设关系,最后分句①与②③④规约为因果关系。
规则6:若任一复句CS的Numb(CS)=4,分句C1、C3无标,C2、C4分别出现标记Rif、Rib,且Pos(Rif)=f,Pos(Rib)=b,Sem(Rif)=Sem(Rib),则复句层次构造为(C1,[(C2,C3),C4]),小句关联体(C2,C3)的关系规约为并列,([C2,C3],C4)的关系由Sem(Rif、Rib)确定,复句关系类别为因果。例如:
(10)①上官金虹一直在等着机会,②只要老人的神志稍有松懈,③手腕稍不稳定,④他立刻便要出手。(古龙《多情剑客无情剑》)
例(10)分句②④标记“只要-便”形成搭配,分句①③无标,因分句②③复现副词“稍”,故(②,③)规约为并列关系,然后(②,③)与分句④规约,“只要-便”标示假设关系,最后分句①与([②,③],④)规约为因果关系。
规则7:若任一复句CS的Numb(CS)=4,分句C1、C3出现标记Rif、Rjf,且Pos(Rif)=f,Pos(Rjf)=f,Sem(Rif)≠Sem(Rjf),分句C2、C4无标,则复句层次构造为([C1,C2],[C3,C4]),小句关联体(C1,C2)的关系由Sem(Rif)确定,(C3,C4)的关系由Sem(Rjf)确定,复句关系类别为因果。例如:
(11)①她若要咱们的命,②必定会在旁边瞧着咱们死的,③如今既然走了,④想必是算定咱们必有救星。(古龙《武林外史》)
例(11)分句①出现标记“若”,标示(①,②)为假设关系,分句③出现标记“既然”,标示(③,④)为推断性因果关系,然后(①,②)与(③,④)之间规约为因果关系。
四、 非充盈态“二标四句式”复句的句法语义关系判定
非充盈态标记序列实例化后形成的有标复句是非充盈态有标复句。这种复句尽管也有关系标记显现,但关系标记不足以确定分句间的句法语义关联,使得一些无标分句层次归属不明,因而还需要结合分句间的句法语义关联特征进行无标分句层次消歧。
根据舒江波(2010)、吴锋文(2011)的观点,影响分句语义关联的特征表现在主语指称一致性和谓语语义相关性两方面[11]。主语指称一致性有主语指称完全一致和部分一致两种情形,而谓语语义相关性主要有三种类型:谓语部分特定词汇复现、谓核语义范畴相同以及谓语句法结构相似等。例如:
(12)①这两人都是不世的奇才,②但是萧大师却将自己最得意的刺击之术传给了第三个弟子,③而且将泪痕剑也传给了他。(古龙《英雄无泪》)
(13)①你本来已非他不嫁,②叶开本来也已非你不娶,③但这时却忽然出现了个叫上官小仙的女人。(古龙《九月鹰飞》)
(14)①她知道现在无论说什么,②做什么,③都愚蠢极了。(古龙《多情剑客无情剑》)
例(12)分句②③谓核动词“传给”复现,是特定词汇复现;例(13)分句①②谓核“嫁”“娶”是类义关系,语义范畴相同;例(14)分句①“说什么”和分句②“做什么”同属谓词结构“V什么”,谓语结构相似。
正是上述分句间主、谓语方面出现某种关联特征,使得分句间的语义关联形成,从而为分句的句法关联提供了语义基础,使得这些分句在结构上聚合为一个层次。因而,分句语义关联度判定,为非充盈态有标复句的层次消歧提供了思路。
下面将引入分句间的语义关联特征给无标分句层次归属消歧,并讨论表1里M4、M8、M10、M12-M14等7种非充盈态“二标四句式”复句的句法语义判定问题。
4.1 模式4:Rif-Rib-kb-kb
“Rif-Rib-kb-kb”是指分句Ci、Ci+1出现搭配标记对Rif、Rib,且Ci+2、Ci+3无标的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则8:若分句C2、C3、C4复现某种关联特征,则C2、C3、C4优先结合为(C2,C3,C4),关系规约为并列,然后分句C1与(C2,C3,C4)形成复句,层次构造为(C1,[C2,C3,C4]),复句关系由Sem(Rif、Rib)确定。例如:
(15)①道歉的魅力,不是来自花言巧语,②而是来自真诚,③来自心灵的沟通和感情的交流,④来自为纠正过失而采取的实实在在的行动。(《人民日报》1997-11-3)
例(15)中③④无标,和分句②均复现谓语“来自”,故②③④形成并列小句关联体。
规则9:若分句C3、C4出现某种关联特征,则C3、C4优先结合为(C3,C4),关系规约为并列,C1、C2优先结合为(C1,C2),关系由Sem(Rif、Rib)确定,然后(C1,C2)、(C3,C4)形成复句,层次构造为([C1,C2],[C3,C4]),关系规约为因果。例如:
(16)①他们既已准备本王前去受降,②必定更无准备,③本王正可乘此良机进击,④正好杀得他们片甲不留。(古龙《武林外史》)
例(16)分句③④无标,谓语部分复现副词“正”,故③④形成并列小句关联体。
4.2 模式8:Rif-kb-kb-Rib
“Rif-kb-kb-Rib”是指分句Ci、Ci+3出现搭配标记对Rif、Rib,且Ci+1、Ci+2无标的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则10:若分句C1、C2、C3出现某种关联特征,则C1、C2、C3优先结合为(C1,C2,C3),关系规约为并列,然后(C1,C2,C3)与C4形成复句,层次构造为([C1,C2,C3],C4),复句关系由Sem(Rif、Rib)确定。例如:
(17)①如果基层信访工作人员能够耐心热情一点,②把信访工作能够做得细致周到一点,③对来访群众的利益诉求能够及时处理落实,④那么许多越级上访事件是可以避免的。
例(17)②③无标,和分句①均复现能愿动词“能够”,故①②③形成并列小句关联体。
规则11:若分句C2、C3复现某种关联特征,则C2、C3优先结合为(C2,C3),关系规约为并列,然后分句C1与(C2,C3)结合为(C1,[C2,C3]),关系规约为并列,最后(C1,[C2,C3])与C4形成复句,层次构造为([C1,(C2,C3)],C4),关系由Sem(Rif、Rib)确定。例如:
(18)①她笑得虽然花枝招展,②说不出的娇媚,③说不出的动听,④但笑声中那份轻蔑之意,却委实叫人难堪。(古龙《武林外史》)
例(18)②③无标,但谓语部分复现“说不出+AP”结构,故②③形成并列小句关联体。
4.3 模式9:kb-kb-Rif-Rib
“kb-kb-Rif-Rib”是指分句Ci、Ci+1无标,分句Ci+2、Ci+3出现搭配标记对Rif、Rib的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则12:若分句C1、C2复现某种关联特征,则C1、C2优先结合为(C1,C2),关系规约为并列,分句C3、C4优先结合为(C3,C4),关系由Sem(Rif、Rib)确定,然后(C1,C2)、(C3,C4)形成复句,层次构造为([C1,C2],[C3,C4]),关系规约为因果。例如:
(19)①她渴望能投入沈浪怀中,②渴望能与沈浪紧紧拥抱在一起,③即使她将在这拥抱中粉身碎骨,④她也在所不惜。(古龙《武林外史》)
例(19)①②无标,谓语部分复现“渴望能+VP”结构,故①②形成并列小句关联体。
规则13:若分句C1、C2没有复现某种关联特征,但C1的主语和C2、C3的主语指称是一种整体与部分的关系,则分句C3、C4优先结合为(C3,C4),关系由Sem(Rif、Rib)确定,然后C2与(C3,C4)结合为(C2,[C3,C4]),关系规约为并列,最后C1与(C2,[C3,C4])形成复句,层次构造为(C1,[C2,(C3,C4)]),关系规约为并列。例如:
(20)①他们已被折磨得不成人形,②朱七七显然地憔悴了,③熊猫儿虽想怒骂,④却连说话都已没有力气。(古龙《武林外史》)
例(20)分句③④“虽-却”标志(③,④)为让转关系,分句①的主语“他们”与分句②③的主语“朱七七”、“熊猫儿”形成一种总分关系,故分句②与③④规约为并列关系。
4.4 模式10:Rif-kb-Rjb-kb
“Rif-kb-Rjb-kb”是指分句Ci、Ci+2各出现标记Rif、Rjb且x(Rif)=f、x(Rjb)=b,而Ci+1、Ci+3无标的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则14:若分句C3中Rjb为让转标,则C1、C2优先结合为(C1,C2),关系由Sem(Rif)确定,C3、C4优先结合为(C3,C4),关系规约为因果,然后(C1,C2)、(C3,C4)形成复句,层次构造为([C1,C2],[C3,C4]),关系由Sem(Rjb)确定。例如:
(21)①他若被困在别的地方,②也许还有人会去救他,③但他被困在少林寺,④天下只怕没有一个人能救得了他。(古龙《多情剑客无情剑》)
规则15:若分句C3中Rjb不是让转标,且分句C2、C3复现某种关联特征,则C1、C3优先结合为(C2,C3),关系由Sem(Rjb)确定,然后C1与(C2,C3)结合为(C1,[C2,C3]),关系由Sem(Rif)确定,最后(C1,[C2,C3])与分句C4形成复句,层次构造为([C1,(C2,C3)]C4),关系规约为因果。例如:
(22)①若不是他,②我根本不会落在那白飞飞手中,③更不会落在快活王手中,④我根本不必感激他。(古龙《武林外史》)
例(22)分句②③的谓语部分复现“不会落在+NP”结构,故分句②③优先结合为(②,③),“更”标示递进关系,然后分句①与(②,③)结合,“若”标示假设关系。
4.5 模式12:kb-kb-Rib-Rjb
“kb-kb-Rib-Rjb”是指分句Ci、Ci+1无标,Ci+2、Ci+3分别出现标记Rib、Rjb且x(Rib)=b、x(Rjb)=b的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则16:若分句C1、C2复现某种关联特征,C3、C4也复现某种关联特征,则C1、C2优先结合为(C1,C2),关系规约为并列,C3、C4优先结合为(C3,C4),关系由Sem(Rjb)确定,然后(C1,C2)、(C3,C4)形成复句,层次构造为([C1,C2],[C3,C4]),关系由Sem(Rib)的类别确定。例如:
(23)①马车里堆着好几坛酒,②这酒是那少年买的,③所以他一碗又一碗地喝着,④而且喝得很快。(古龙《多情剑客无情剑》)
例(23)分句①“好几坛酒”和分句②“这酒”属于宾主同指的情形,分句③④谓核复现“喝”,故分句①②、③④分别规约为并列小句关联体。
规则17:若分句C1、C2复现某种关联特征,且分句C3的标记Rjb为让转标记,则C1、C2优先结合为(C1,C2),关系规约为并列,C3、C4优先结合为(C3,C4),关系由Sem(Rjb)确定,然后(C1,C2)、(C3,C4)形成复句,层次构造为([C1,C2],[C3,C4]),关系规约为让转。例如:
(24)①年老孑然一身的他渴望家的温情,②渴望能与子女见面团聚,③但他们父子毕竟分离得太久,④因而他的子女一时难以接受这个不称职的父亲。(江西卫视《金牌调解》台词)
例(24)分句①②谓语复现“渴望+NP”结构,故①②规约为并列小句关联体;分句③④的主语“他们父子”“他的子女”指称一致,故结合为(③,④),“因而”标示因果关系。
4.6 模式13:kb-Rib-Rjb-kb
“kb-Rib-Rjb-kb”是指分句Ci、Ci+3无标,Ci+1、Ci+2分别出现标记Rib、Rjb且x(Rib)=b、x(Rjb)=b的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则18:若分句C2中Rjb为让转标,且C3、C4复现某种关联特征,则C3、C4优先结合为(C3,C4),关系规约为并列,然后C2与(C3,C4)结合为(C2,[C3,C4]),关系由Sem(Rjb)确定,最后C1与(C2,[C3,C4])形成复句,层次构造为(C1,[C2,(C3,C4)]),关系规约为让转。例如:
(25)①有一些人怀念他们的过去,②但过去的东西永远不会再来了,③因此他们感到将来的渺茫,④从不把希望寄托在将来。(陶铸《崇高的理想》)
规则19:若分句C2中Rjb不是让转标,且C1与C2、C3与C4分别复现某种关联特征,则C1、C2结合为(C1,C2),关系由Sem(Rib)确定,C3、C4结合为(C3,C4),关系规约为并列,然后(C1,C2)、(C3,C4)形成复句,层次构造为([C1,C2],[C3,C4]),关系由Sem(Rjb)确定。例如:
(26)①闰土给我讲海边瓜田的趣事,②并且教我雪天捕鸟的方法,③因而我对闰土的乡村生活满怀向往,④盼望着能有一天到海边瓜田抓獾。(《少年闰土》改写)
例(26)分句①②谓语结构相似,故①②规约为(①,②),“并且”标示并列关系,分句③④的谓核“满怀向往”和“盼望着”语义范畴相同,故③④规约为并列小句关联体。
4.7 模式14:kb-Rif-Rjb-kb
“kb-Rif-Rjb-kb”是指分句Ci、Ci+3无标,Ci+1、Ci+2分别出现标记Rif、Rjb且x(Rif)=f、Sem(Rif)=yg、x(Rjb)=b的复句标记隐现模式。此模式实例化后确定其层次关系需分两种情况:
规则20:若分句C2、C3复现某种关联特征,则C2、C3优先结合为(C2,C3),关系由Sem(Rjb)确定,然后(C2,C3)与C4结合为([C2,C3],C4),关系规约为并列,最后C1与([C2,C3],C4)形成复句,层次构造为(C1,[(C2,C3),C4]),关系规约为因果。例如:
(27)①我非常喜欢年轻人,②因为年轻人他们蛮开放,③而且不会保守,④他们代表了我们的未来。(《中国日报》2003-12-11)
例(27)分句②③谓核“开放”与“保守”语义范畴类同,故分句②③结合为(②,③),“而且”标示递进关系,然后(②,③)与分句④结合为([②,③],④),关系规约为并列。
规则21:若分句C3、C4复现某种关联特征,则C3、C4优先结合为(C3,C4),关系规约为并列,然后C2与(C3,C4)优先结合为(C2,[C3,C4]),关系由Sem(Rjb)确定,最后C1与(C2,[C3,C4])形成复句,层次构造为(C1,[C2,(C3,C4)]),关系规约为因果。例如:
(28)①我们必须大力反腐,②因为贪腐败坏了社会风气,③并且损害了党和政府的形象,④损害了国家和人民的利益。(人民网理论频道2014-6-3)
例(28)分句③④谓语部分复现“损害了”,故分句③④结合为(③,④),然后分句②与(③,④)谓语部分都是“V了”结构,故结合为(②,[③,④]),规约为并列关系。
*本文系国家社科基金青年项目“面向信息处理的汉语复句句法语义关系判定研究”【14CYY035】、教育部人文社科重点研究基地重大项目“基于小句中枢理论的有标复句层次关系自动识别研究”【16JJD740013】。
注释:
[1] 陆俭明:《关于句处理中所要考虑的语义问题》,《语言研究》2001年第1期,第1~12页。
[2] 吴锋文:《汉语复句信息处理二十年》,《中文信息学报》2015年第1期,第13~18页。
[3] 吴锋文:《基于关系标记的汉语复句分类研究》,《汉语学报》2011年第3期,第63~73页。
[4] 杨开城:《一种基于句法语义特征的汉语句法分析器》,《中文信息学报》2000年第3期,第46~53页。
[5] 邢福义:《汉语复句研究》,北京:商务印书馆,2001年,第543~544页;姚双云:《复句关系标记的搭配研究》,武汉:华中师范大学出版社,2008年,第19~20页。
[6] 刘云:《复句自动分析的目标和意义》,《宁夏大学学报》(人文社科版)2009年第3期,第40~44页。
[7] 有关复句三分理论的介绍可参见邢福义:《汉语复句研究》,北京:商务印书馆,2001年,第38~47页。
[8] 并列复句包括平列、对照、解注三个子类,本文所涉例句对“并列”语义关系的标注不作子类区分。有关并列复句参见邢福义:《汉语语法学》,长春:东北师范大学出版社,1996年,第351~354页。
[9] 胡金柱、吴锋文:《汉语复句关系词库的建设及其利用》,《语言科学》2010年第2期,第133~142页。
[10] 吴锋文:《基于关系标记的汉语复句分类研究》,《汉语学报》2011年第3期,第63~73页。
[11] 胡金柱、舒江波、罗进军:《汉语复句中分句的语义关联特征》,《语言文字应用》2010年第4期,第121~130页;吴锋文:《基于主谓语知识挖掘的分句语义关联研究》,《语言文字应用》2011年第4期,第132~142页。