汉语非典型宾语的语料库研究
2020-09-24陈蓓
陈 蓓
(华中师范大学 文学院、湖北省汉语国际推广工作研究基地, 湖北 武汉 430079)
引言
汉语中的非典型宾语是动词宾语的一个特殊类别,陈蓓(2017)①沿用Barrier & Li(2012)②的名称“非典型宾语”(non-canonical objects),针对现代汉语中的非典型宾语做了进一步界定,即语义上,非典型宾语不是动词的必有成分,表现为处所、工具、来源、方式等语义角色,但是句法上,非典型宾语占据表层宾语位置,是动词的论元。
如下例所示:
(1)a. 吃食堂
b. 吃老本
c. 写毛笔
d. 排戏票
上例中,宾语“食堂”、“老本”、“毛笔”、“戏票”等分别承担了处所、来源、工具、原因等语义角色,这些宾语有一个共同特点,即都是由和动词相关的可选择性(optional)语义角色承担,是动词的非典型宾语。要注意的是,不能仅从语义角色来对非典型宾语进行判断,汉语中有一些动词的宾语由工具、方式、处所等语义角色充当,但它们是动词的必有论元,不应看作非典型宾语,比如“飞北京”等。
学者们较早关注到了非典型宾语的现象③,围绕非典型宾语的语义、句法、成因等展开研究。其中,Lin, Tzong-Hong(2001)④,孙天琦(2010)⑤等都认为非典型宾语具有能产性。陶红印(2000)在研究动词“吃”的论元结构的基础上提出了“动态论元结构假说”,认为随着语言的实际运用,动词的论元结构会不断变化,而动词的高频性则是论元演变的前提之一⑥。
本文选取了《动词用法词典》(孟琮等1990)⑦中的1337个动词,通过大型语料库“中文词汇特性速描系统”(Chinese Word Sketch)考察了这些动词所带的非典型宾语,在定量分析和定性分析的基础上,概括能带非典型宾语的具体动词、动词的数量、类别以及非典型宾语的次类。在此基础上,主要讨论和解决以下三个问题:1.非典型宾语是否具有能产性特征?是否所有的动词都能带非典型宾语?2.动词的高频是否是带非典型宾语的必要条件?3.非典型宾语有哪些类型,其特征是什么?
一、子语料库构建
(一)检索工具及语料库
1.检索工具
Word sketch engine是一个在线语料库检索工具,由Kilgarriff(2004)等研制,该系统汇集了语料库中的语言信息,在描述词汇信息,抽取语法关系、分析整理语料、生成词汇速描等方面有显著的优势⑧。例如,其中的词汇速描功能(word sketches)可以自动分析并总结各类词语的语法搭配关系,若以动词为检索词,则可以自动计算并统计出该动词在做谓语时与名词的具体搭配情况,比如频率、显著性及相关例句等。这些功能对于描述词汇特征和近义词对比等提供了更便捷的检索手段,同时也避免了过去单纯依靠关键词(KWIC)检索而需要逐行排查找出搭配项的方法所带来的不便。
在研究动宾结构时我们需要进一步精确地计算动词与宾语搭配的显著度,以往主要采用T值和MI值(mutual information)两种方法。但Kilgarriff和Rundell(2002)⑨指出,这两种方法虽然有一定作用但也存在缺陷,一方面是提取出的干扰信息比较明显,比如在T值检验中常用词汇数值往往过高,而MI值计算结果中低频词的数值过高,同时这两种方法都不便于直接考察词语的搭配信息,需要进行人工判断和提取。Sketch engine则改进了词汇搭配显著性(salience)的算法,认为显著性是互信息MI值与频数对数(log frequency)的乘积。这一改进对于发现高频词语的搭配及统计搭配强度有重要意义。
2.中文词汇特性速描系统
本文的语料库研究基于中文词汇特性速描系统⑩展开。中文词汇特性速描系统(The Chinese Word Sketch,以下简称CWS)是一个结合了巨量语料库的语法知识产生系统(Huang et al. 2005),它涵盖约十三亿余字的新闻语料,这些语料全部都依词断开,并标示词类。该词汇系统就是利用Word Sketch Engine来进行检索,除了提供一般的关键词及语境查询,还具有词汇速描功能,这些功能对于研究动宾结构有重要作用,不仅能提供动词的相关搭配信息,还能显示动词与宾语的共现频率及显著性等。例如,要查询动词“打”,在系统中输入该词,得到的信息如图1所示:
图1 动词“打”的词汇特性速描
上图显示了语料库中动词“打”的语法搭配关系,比如:动词“打”前的主语(“武松”、“中国队”等)和修饰语(“猛”、“隔山”等),“打”带的宾语(“零工”、“预防针”等)等。每个语法关系由一个表格显示,每个搭配表都包括搭配词以及与动词“打”共现的频率和搭配显著性数据,比如动词“打”的宾语中,频次最高的是“零工”(345次),其搭配显著性也最高,为72.45,而宾语“高尔夫球”虽然共现频率最高(992次),但显著性并不是最高。所有的宾语都按照显著性由高到低排列,每个搭配词的频率处都有一个超链接,显示该组动宾搭配在语料库中的上下文,这样更方便人工处理语料,深入分析动宾搭配尤其是动词和非典型宾语搭配的具体语境。
(二)非典型宾语子语料库
1.非典型宾语的提取
本文的研究基于大型语料库对1337个动词的非典型动宾结构进行了全面考察,深入探究了动词和非典型宾语的搭配情况,主要步骤如下:
第一步,通过语料库检索确定非典型宾语。本文选择《汉语动词用法词典》中的1337个动词,在中文词汇特性速描系统中逐一考察每个动词的宾语,通过人工分析,找出所有的非典型宾语。第二步,对非典型宾语进行分类研究。归纳非典型宾语的语义角色类别,概括各小类非典型宾语的数量、语义及句法特征,比较各类别的异同,进一步考察相关动词的特点。
2.带非典型宾语的动词
我们利用CWS检索之前先分析1337个动词的义项,以《现代汉语词典》(第7版)中的释义为依据,只选取词典标注为动词的义项。
接下来,通过CWS检索出能和每个动词搭配的所有宾语,结合上下文由人工挑选出非典型宾语。例如对动词“吃”的义项进行分析后,从语料库中提取出与之搭配的宾语并进一步筛选,就得到一个可以和动词“吃”搭配的非典型宾语的集合,从中可以看出,动词“吃”在语料库中共有34个非典型宾语,显著性最高的三个宾语分别是“大锅饭”、“皇粮”和“老本”,动词“吃”出现的总频次为64618次,带宾语的总频次为40340次,带非典型宾语的总频次为1140次,其带非典型宾语的总频次与带宾语的总频次之比为2.8%,带非典型宾语的总频次与动词“吃”出现的总频次之比为1.8%,由此可见动词“吃”带非典型宾语的比例极小。
按照上述步骤逐一分析了1337个动词的义项,并分别归纳这些动词的非典型宾语后发现,能带非典型宾语的动词一共有74个,如表1所示。基于语料调查分析的结果,进一步整理概括了包括动词、非典型宾语、类别、语义、频次、显著性、例句等相关信息的非典型宾语子语料库。
表1 能带非典型宾语的动词
3.非典型宾语子语料库分析
通过对非典型宾语子语料库的研究可以得出一些基本特点:
第一,不是所有的动词都能带非典型宾语。在考察的1337个动词中,能带非典型宾语的动词数量很少,仅有74个,占所考察动词总数的5.53%。可见,动词带非典型宾语的现象并非涉及所有动词。
第二,能带非典型宾语的74个动词全部是单音节动词。本文考察的1337个动词包括789个多音节动词,548个单音节动词,经过语料分析可知带非典型宾语的全部都是单音节动词。邢福义(1991),谢晓明(2004),孙天琦(2010),廖光蓉(2018)都指出了这一特点,本文进一步基于语料库给出了详实的数据支撑。
总体来看,单音节动词动性强,带宾语能力也相对较强。李临定(1990)指出单音节动词以表示具体动作的动词为主,如:动词“听、咽”等表示身体某部分动作,动词“埋、写”等表示凭借某种工具进行的某种动作。张云秋(2004)在对比了“V单+N单/双”和“V双+N单/双”两种结构的基础上,认为就带宾能力来说,单音节动作动词要比双音节动作动词的带宾能力强,同时动性程度高的动词基本上都是及物性程度高的动词,其带宾能力也要强一些。非典型宾语子语料库显示,从动词带宾语的频次与动词总频次的比率等分布来看,78%的动词其动宾结构组合频次与动词出现的总频次之比都达到了40%,这也说明了大多数能带非典型宾语的动词也有着很强的带宾语的能力。
第三,动词带非典型宾语的比例很小而且数量有限。虽然部分学者认为非典型宾语具有能产性,但根据本文的语料库考察发现,非典型宾语的数量很有限,大多数动词带非典型宾语的数量仅相当于带宾语数量的10%左右。同时,非典型宾语的类推大多数都受到限制,有的动词比如“吃”、“唱”、“跑”等虽然带非典型宾语的数量相对较多,但只是在一定范围内的列举,其类推性不强。
第四,部分频率较低的动词也能带非典型宾语。陶红印(2000)指出高频动词常常具有特殊的句法表现,如果“论元成分扩大到非典型受事成分、受事成分吸收其它类型的论元成分等,其前提条件之一是,动词在实际语言运用中一定属于高频率类的。高频率即使不是论元演变的唯一因素的话,也应该是最重要的因素之一”。根据子语料库中的动词频次统计,能带非典型宾语的动词有一部分是高频动词,频率是动词非典型宾语用法的一个重要因素,如频率在60000以上的动词“点”、“打”、“走”、“吃”等,但是有一些频率不太高(1000以下)的动词也能带非典型宾语,如“刷”、“扎”、“绣”等。
虽然不是所有能带非典型宾语的动词都是高频动词,但是语料显示动词的频率直接影响动词能带非典型宾语的类型,即频率越高,其带非典型宾语的类型也越丰富。比如高频动词“打”能带六种语义类型的非典型宾语,分别是材料、工具、方式、处所、原因、角色宾语,“吃”、“跑”能带四类非典型宾语,“唱”、“泡”、“踢”、“写”能带三类非典型宾语,这些都是高频动词。而其他动词都只能带一到两类非典型宾语。
二、非典型宾语的特征分析
本节基于非典型宾语子语料库,进一步分析和总结非典型宾语的数量、类型及与动词的语义关系,并以非典型宾语的论旨角色为主线,考察各类非典型宾语的语义及句法特征。
(一)非典型宾语的论旨角色
论旨角色,也叫题元角色(Theta-Roles或θ-Roles),表示述语与相关的名词短语之间的语义关系。由于述语和名词短语之间语义关系的复杂性,目前学界对于题元角色的数量和类型并无完全统一的看法,对于非典型宾语的论旨角色的分类亦是如此。本文基于Radford(1988)及袁毓林(2003)对动词论旨角色的分析,把汉语非典型宾语的论旨角色概括为材料、工具、方式、处所、来源、原因、角色、时间等八类,分别是:
工具(Instrument),即动作、行为所凭借的工具。如“吃大碗”中的“大碗”。
材料(Material),即动作、行为所消耗的材料。如“刷油漆”中的“油漆”。
方式(Manner),即动作、行为所采取的方式、方法。如“唱美声”中的“美声”。
处所(Location),即动作、行为发生的处所。如“吃食堂”中的“食堂”。
来源(Source),即动作、行为的来源。如“吃老本”中的“老本”。
原因(Reason),即动作、行为产生的原因。如“跑销路”中的“销路”。
时间(Time),即动作、行为发生的时间。如“休礼拜天”中的“礼拜天”等。
角色(Role),即表示动作行为凭依的角色。如“唱花脸”中的“花脸”。
(二)非典型宾语结构的测试
基于Her(1997)对动宾结构的测试,本节以下列项目为测试条件,对每一个类别的非典型宾语结构进行考察:
①非典型宾语:
a.与典型宾语共现;
b.用介词引导充当动词状语;
c.修饰语:数量词、指示代词“这”“那”;
d.移位:话题化、关系化、把字句、被字句。
②带非典型宾语的动词
a.修饰语:描摹动作情状的词语;
b.带时体成分“着”、“了”和“过”;
c.重叠式:“VV”、“V一V”或“V了V”。
③话语功能:用“什么”提问。
根据以上测试条件,以处所宾语“吃食堂”为例逐一进行考察:
(2)a.*吃食堂饭*吃饭食堂
b.在食堂吃饭
c.*吃过三个食堂
d.*吃豪华的食堂
e.吃这/那个食堂
f.*食堂吃(了)
g.*他吃的食堂很新
h.*他把食堂吃了
i.*食堂被他吃了
j.*很开心地吃食堂
k.*吃着食堂|*吃了食堂|吃过食堂
l.吃吃食堂|*吃一吃食堂|*吃了吃食堂
m.问:吃什么?答:*吃食堂
由上例可知,处所宾语“吃食堂”的测试结果表现为:不能与典型宾语“饭”共现;能在介词“在”的引导下移到动词前充当状语;不能受数量词修饰;能受指示代词“这”“那”修饰;不能话题化、关系化,也不能变换为“把”字句及“被”字句;动词不能受描摹动作情状的词语修饰;动词可以带时体成分“过”,不能带“着”和“了”;能变成“VV”重叠式,不能变成“V一V”、“V了V”等重叠式;不能直接用“什么”提问。
(三)非典型宾语的语义及句法特征
对各类别的非典型宾语进行测试,可得到下表:
表2 非典型宾语各小类测试结果
表2从十二个方面总结了对各类型非典型宾语的特征考察,从表2中各项的对比可以看出非典型宾语有如下特点:
1.共现制约
即所有的非典型宾语都不能和典型宾语共现。Barrie & Li(2012)进一步指出典型宾语和非典型宾语呈现出互补分布(complementary distribution)的现象,即两个成分从不同时出现在同样的环境中。需要注意的是,非典型宾语虽然不能与典型宾语共现,但也不能代替典型宾语的用法。例如,从表层结构看,非典型宾语占据了原典型宾语动词后的位置,但是一般却不能按照对典型宾语提问的方式对非典型宾语进行提问,如:
(3)a. 问:中午喝什么?
答:喝饮料/白酒/啤酒
b. 问:中午喝什么?
答:*喝小杯
2.介词引导
所有的非典型宾语都能变换成介词引导的形式,即这些动词后的非典型宾语都能加上介词直接出现在动词后或者移位到动词前作状语修饰动词短语。通过语义分析可知,动词搭配非典型宾语结构比常规动宾搭配的意义更加丰富,有些动词加非典型宾语组合的意义并不完全等同于动宾短语进行句式变换后的意义。比如“吃食堂”可以按照常规理解成“在食堂吃”或者“吃食堂提供的饭菜”,即从食堂买了饭菜打包带走也属于“吃食堂”。
3.动性减弱
根据上文的分析得知能带非典型宾语的74个动词都是动作性较强的单音节动词,但这些动词和非典型宾语组合后其动性减弱,具体表现为:
第一,绝大多数非典型宾语都不能带时体成分“着”、“了”和“过”,包括工具宾语、处所宾语、方式宾语、来源宾语和目的宾语。并不是所有的动词都能带时体成分,这跟动词的语义特点有关,比如,在时体成分中,“着”表示动作的持续,对动词的动性有一定的要求。一般来说,能添加所有时体成分的动词都是时间性很强的动词,动词在满足语义条件的基础上可以有选择性地添加“着”、“了”和“过”等时体成分。上述几类带非典型宾语的动词带时体成分都很受限制,但是对比可知,这些动词带典型宾语时一般都能带上“着”、“了”、“过”等时体成分,如下例所示:
(4)a. 浇着花|浇了花|浇过花
b. 打着电话|打了电话| 打过电话
第二,动词在一定条件下能够重叠,比如当动词表示的动作可以反复进行而且动作者主观上可以控制时,该动词一般能够重叠,而非动作动词、能愿动词、心理动词、存现动词、趋向动词等一般不能重叠。本文选用常见的“VV”、“V一V”、“V了V”作为考察框架,可以看出带材料宾语、方式宾语、工具宾语、角色宾语和部分原因宾语的动词能够重叠,而带其他类型宾语的动词重叠时会比较受限,同样对比可知,这些动词在和典型受事宾语搭配时一般都能够重叠,对比(5a)和(5b):
(5)a.唱唱歌写写字
b.*唱唱现场 *写写黑板
例(5)中,动词“唱”、“写”等和典型宾语组合成“唱歌”、“写字”等短语时动词都能重叠,但是带上诸如方式“现场”、处所“黑板”等非典型宾语时动词都不能重叠,虽然这些动词符合动词重叠的基本要求。此外,这部分动词重叠时仅能进入“VV”式,不能进入“V一V”、“V了V”格式。
第三,动词只有带材料宾语时才能受描摹动作情状的词语修饰。一般来说,能受描摹动作情状词语修饰的动词都是具备较强动性的具体动作动词,而动性较弱的动词则不能受描摹动作情状的词语修饰。然而,大部分带非典型宾语的动词在带典型宾语时是能够受描摹动作情状的词语修饰的,对比(6a)和(6b):
(6)a. *开心地吃补贴
b. 开心地吃饭
4.材料宾语的特殊性
从表2可知,材料宾语在诸多方面表现出了和其他类非典型宾语不一样的特征。
第一,只有材料宾语能够直接话题化。徐烈炯(2003)指出话题句的成立必须满足述题的句法条件以及话题本身的语义、语用条件,而一个成分要充当话题,至少要满足两个条件之一:第一个条件是这个成分表定指或类指,即具有有定性,可以指某个人或物(定指),也可以指某类人或物(类指);第二个条件是该成分表示对比、强调。本文所考察的非典型宾语各个小类,除了材料宾语,其他非典型宾语都不满足话题化的条件,不能直接话题化,但是如果创设一定的条件,非典型宾语也能成为话题,比如:
(7)5号技术挺全面的,前锋,他也能打,后卫,他也能打。
上例中,虽然和动词“打”搭配的非典型宾语“前锋”和“后卫”都不具有有定性,但是它们并列出现在句中有对比的特征,突出了“前锋”和“后卫”两个角色,根据徐烈炯、刘丹青(2007)的分析,满足充当对比话题的条件,具有[+突出]和[+对比]的特性,所以句子能够成立。
第二,只有材料宾语能够关系化。表达一个命题的句子经过关系化(relativilization)可以形成一个以“降级的述谓结构”为修饰语的定中结构,也就是关系从句结构。非典型宾语各小类的关系化存在明显差异,只有材料宾语能够通过关系化标记“的”形成定中结构,如“他抹的白灰很匀称”。
第三,只有材料宾语能变换为“把”字句和“被”字句。根据王惠(1992)和屈承熹(1999)的研究,基于“施事的有效程度”和“受事的受作用程度”两个确定及物性强弱的标准,在各类结构中,“把”字句和“被”字句是及物性程度最高的结构,它们对名词的受事性有较高的要求,典型受事宾语句一般都能变换成“把”字句。根据表2的分析结果可知,只有材料宾语能变换为“把”字句和“被”字句,说明相对于其他非典型宾语而言,动词加材料宾语构成的结构有着较强的及物性,而进一步考察语义可知,作为动词宾语的材料宾语有“经受影响”的意思。
由此可知,材料宾语是非典型宾语中一个比较特殊的小类,除了材料宾语表现出的部分特殊性,所有非典型宾语的句法表现都比较类似。要注意的是,材料宾语也不同于典型的受事宾语,因为并不是所有的材料成分都可以自然地作为动词的宾语出现在动词后,比如“用牙膏刷牙”一般情况下就不能说成“刷牙膏”,这与动词的语义特点及人们的认知有很大的关系。
总的来看,非典型宾语和典型宾语在句法表现上有较大差别,通过进一步的语料分析也发现,非典型宾语绝大多数都是以“光杆名词”的形式出现,很少有体标记或者其他修饰性成分。
结语
本文基于大型语料库析取了1337个动词带非典型宾语的情况,构建了非典型宾语子语料库,基于语义及句法分析,发现了一些主要特征:1.非典型宾语并不具有能产性;2.能带非典型宾语的动词数量少且全部是单音节动词;3.不仅高频动词能带非典型宾语,部分频率不太高的动词也能带非典型宾语,但高频动词带非典型宾语的类别更多;4.非典型宾语可以分为工具、处所、材料、方式、目的、角色、来源和时间等八个小类,各小类的句法表现并不均衡,材料、工具、方式、处所等类型更易与动词搭配,其中材料宾语表现较为特殊;5.非典型宾语具有共现制约、介词引导、动性减弱等特点。非典型宾语的这些特性与非典型宾语的生成机制密切关系,值得进一步深入探究。
注释
①陈蓓:《现代汉语非典型宾语的界定》,《华中学术》2017年第3期。
④Tzong-Hong Lin, Light Verb Syntax and the Theory of Phrase Structure, PhD Dissertation, University of California, Irvine,2001.
⑤孙天琦:《现代汉语非核心论元允准模式及机制研究》,北京大学博士学位论文,2010年,第12页。
⑦孟琮等:《汉语动词用法词典》,北京:商务印书馆,1999年。
⑧Adam Kilgarriff, Pavel Rychl, Pavel Smrž and David Tugwell, “The Sketch Engine,”ProcecdingsofEURALEX, Lorient, France, July,2004.
⑨Adam Kilgarriff and M. Rundell, “Lexical Profiling Software and Its Lexicographic Application:A Case Study,” EURALEX, Copenhagen, August,2002.
⑩参见http://wordsketch.ling.sinica.edu.tw/.