基于语体角度的多义动词带宾短语的倾向性分布考察*
2020-11-25魏红,杨颖
魏 红, 杨 颖
(云南师范大学 传媒学院,云南 昆明 650550)
一、问题的提出
汉语学界一直以来都非常重视动宾问题的研究,取得了丰硕的成果。吕叔湘等明确指出:“怎么研究动词?可以就动词本身研究动词,但更重要的是研究句子里边的动词和有关成分,主要是名词性成分的关系。”(1)吕叔湘,等.语法法研究入门[M].北京:商务印书馆,1999:435~436.就已发表的成果来看,相当多的讨论句法分析、特殊句式的研究中都涉及动词的句法语义属性、动词所带宾语的结构类型和语义类型。多义词的大量存在构成了汉语词汇的一大特点,动词的多义性更为突出。多义动词各个义项跟与之共现的名词性成分之间也就相应具有句法、语义以及语用的选择。
动词对于宾语的选择搭配涉及语言概率和频率方面的理论研究。一般来说,词语共现的概率是不均衡的,有的词语共现概率大,有的共现概率低。母语语料库中共现概率高的搭配就是高频搭配,也是母语使用者经常使用的搭配。沈家煊提出有标记和无标记项的6条标准,其中两条分别是分布标准和频率标准。他认为“像汉语这样缺乏形态的语言,分布标准和频率标准就显得格外重要”。(2)沈家煊.不对称和标记论[M].南昌:江西教育出版社,1999/2005:32~219.文秋芳探讨了国外语言学届关于语言的概率属性及其对二语习得的影响和启示的研究。(3)文秋芳.微变化研究法与二语习得研究[J].外语教学与研究,2003,(2).Ellis提出了以频率为中心的二语习得理论。桂诗春介绍了作为相反潮流的概率语言学、语料库语言学、计算语言学、心理语言学的最新发展,主张我国的语言学应发扬注重语言数据的历史传统,使用概率方法,通过发展语料库语言学,建立现代汉语和古代汉语的大型语料库,研究汉语处理的认知心理模型。(4)桂诗春.以概率为基础的语言研究[J].外语教学与研究,2004,(1).
关于语体的概念,从不同的研究视角有不同的理解。王德春指出,“由于人类社会生活的复杂性,在不同的社会活动领域内进行交际时,由于不同的交际环境,就各自形成了一系列运用语言材料的特点,这就是语体”。有关现代汉语语体分类,因为分类的原则和标准不同,具体分类也就各异。(5)王德春.论语体[J].语言教学与研究,1980,(2).张弓认为现代汉语语体有口头语体、书面语体,书面语体中又有文艺语体、科学语体、政论语体、公文语体等。(6)张弓.现代汉语同义词的几个问题[J].河北大学学报(哲学社会科学版),1964,(2);黄伯荣,廖序东.现代汉语[M].北京:高等教育出版社,2008:83~84,307~316.黄伯荣和廖序东认为“根据交际目的不同,语体可分为公文语体、科技语体、政论语体、文艺语体”。(7)吴礼权.现代汉语修辞学[M].上海:复旦大学出版社:2017:387~390.吴礼权从修辞学研究角度把语体分为口语体和书卷体两类,其中书卷体有文艺语体、科学语体以及事务语体。可以看出,不论依据什么标准分类,谈话语体、公文语体、科技语体、新闻语体、文艺语体等都属于语体涉及的主要类型。
文学语体语料与科技语体语料在语言风格、语言内容、语言形式以及语言功能方面具有明显的语体差异,这些差异跟高频动宾短语的呈现之间是否具有一定的联系。本文考察语料语体的差异是否对多义动词及其名词性宾语成分的选择带来一定倾向性影响。根据研究需要,我们以多义动词“听”作为考察对象,选择北京语言大学BCC汉语语料库作为语料来源,在BCC语料库中的文学语体和科技语体中进行考察动词“听”对于光杆名词性宾语的倾向性选择搭配,主要从其高频动宾短语的出现频次、义项分布及其带宾的宾语类型3个方面进行考察。
二、基于语料库统计的语体影响分析方法
我们在判定语体对于动宾短语呈现的影响时,以所考察的多义动词作为关键词,进行整词搜索出相关词条,按照词条使用频次由高到低的顺序,采用逐条分析和人工标注的方式选择出所需的动宾短语语料进行整理,最后使用统计学的相关方法,对语料库中的句子材料进行数据统计。统计时,我们选取出现频次排序在前50的高频动宾短语作为考察对象。高频动宾短语在不同语体语料库中出现的倾向性分析主要从以下3个方面进行把握:
一是在等量的文学和科技语体库中考察高频动宾短语的出现情况及其出现的频次数量。有的短语同时出现在文学语体和科技语体,我们按照短语所在语体的出现频次高低进行排序,分别计算出文学和科技语体中的总频次和平均频次,对于同一个短语再计算出在两类语体中出现频次的频次差;有的短语只在文学语体或是科技语体中出现,同一类语体中的短语我们按照出现频次由高到低排序。
二是根据高频动宾短语在语体中的呈现情况,依据概率论统计的相关理论,进一步分析短语的语体特征的倾向性。如果一个短语同时出现在文学和科技两类语体中,说明它对这两类语体都具有选择的倾向性,相对来说这个短语的语体选择性特征就弱;如果一个短语仅在其中一类语体中出现,我们认为该短语对于这一类语体具有选择的倾向性,符合该类语体的主要特征。因此,我们可以说同时出现在两类语体的动宾短语比仅出现在一类语体中的动宾短语相应的语体特征要弱,只出现在其中一类语体的动宾短语相对比出现在两类语体的动宾短语的语体特征要强。短语语体特征从最显著到不显著有一个序列:
一种语体中出现>两种语体中出现>……>多种语体中出现
换句话说,在一类语体中出现的短语语体特征比在两类语体中出现的短语语体特征要强。如果是多语体的比较,以此类推,在两类语体中出现的短语语体特征比在3类语体中出现的短语语体特征要强,一个短语同时出现在多种语体中,其语体倾向性特征最不显著。
对于同时在两类语体中出现或仅出现在其中一类语体中的动宾短语来说,其语体特征也呈现出一个由显著到不显著的序列:
高出现频次>低出现频次
三是通过以上语体特征强弱的对比分析,我们可以找出语体特征最强的代表性动宾短语,在此基础上进一步分析这些短语所反映出来的语体特征要素,从而验证语体因素对于动宾短语多样性的影响情况。
三、语体因素对于“听N”(8)“听N”指动词“听”带光杆名词性宾语的动宾短语。本文将动词所带名词性宾语前面没有任何修饰成分的宾语类型成为光杆名词性宾语。“听1N”指义项1带光杆名词性宾语的动宾短语。“听2N”以此类推。动宾短语呈现情况的影响分析
(一)文学和科技语体中的“听N”高频动宾短语考察
我们对同时出现在两类语体中频次排序前50的“听N”动宾短语进行分类统计,其高频动宾短语及频次统计如表1所示。
表1 “听N”同时出现在两类语体中的高频动宾短语及频次统计单位:次
根据以上统计我们可以总结出两个方面的特点:
第一,“听N”在文学和科技两类语体中同时出现的高频动宾短语有24个,文学和科技语体的差异对这些短语在两类语料中的出现影响不大,这24个动宾短语对于语料语体的选择性倾向不明显。可以说,24个动宾短语的文学和科技语体区别性特征不是很强。24个高频动宾短语在文学语体中的总频次是12712次,平均频次为530次,科技语体中是4748次,平均频次为198次,文学语体中的使用频次明显比科技语体中的高,总体上这些短语的文学语体特征比科技语体特征要强。
第二,对于具体的短语来说,等量的文学和科技语体语料中出现的频次,有的相差很大,有的相差不大。因此就同一个短语来说对于语体的选择是有一定的倾向性。根据语言频率的相关理论,我们可以依据短语出现频率的高低来判定其对语体选择的倾向性,以此观测到语体因素对于短语出现频率的影响大小。例如,短语“听声音”在文学语体中的使用频次为2630次,在科技语体中的使用频次是69次,频次差为2561,在24个短语的频次差中最高。可以说,“听声音”对文学语体的选择倾向性比对科技语体的选择倾向性要大,语体因素对该短语的出现影响较大。
(二)文学语体中的“听N”高频短语考察
两类语料中出现频次排序前50的“听N”高频短语中,有的短语只出现在了文学语体语料中,其高频短语及频次情况统计如表2所示。
表2 “听N”只在文学语体中出现的高频短语及频次统计单位:次
就“听N”出现在文学语体中的26个高频短语看,总频次为6028次,平均频次为232次。频次最高的是短语“听风”,其次是“听口气”,最低的是短语“听圣旨”。总体上这些动宾短语的文学语体特征都比较突出。频次最好的短语“听风”集中出现在武打类小说中,指一种“暗器听风”之类的功夫,还有就是指“听风赏月”的行为等。用例如下:
1)于是,选了沙丘上背风的一面斜坡,懒懒地躺了下来,用一种散漫的心情,我在初夏的海边听风 、听浪、听那远远的唱着歌的木麻黄。
——写给幸福 A:席慕蓉 Y:1985
2)突听“刷”“刷”两声,衣抉飘风,似有两个人窜了进来。公孙相听风 辨位,长剑一挥,刺了过去。
——珍珠令 A:东方玉 Y:1993
短语“听口气”大多出自小说作品中对话中的用句,意思是从说话的语气猜测对方的意图或想法。频次较低的几个短语,如听笑话、听谣言、听圣旨等短语的语义跟文学作品的故事性、情景性比较贴近,同样表现出较强的文学语体特征。其他短语如听动静、听风声、听枪声、听情报、听鼓声等的语义,常常出现在在文学作品中的一些情景,听良言、听话、听传言、听忠言、听假话、听实话等短语跟文学作品中人物故事叙述联系紧密。总体上,文学语体中出现的高频短语对于文学语体的选择性最强,文学语体特征的倾向性也最强。
(三)科技语体中的“听N”高频短语考察
两类语料中出现频次排序前50的“听N”高频动宾短语中,有的短语只出现在了科技语体语料中,其高频动宾短语及频次情况统计如表3.3所示。
表3 “听N”只在科技语体中出现的高频动宾短语及频次统计单位:次
就“听N”出现在科技语体中的26个高频短语来看,短语总频次为8629次,平均频次为331次。频次最高的是短语“听证”,频次高达7510次,其他短语频次总体上都不高,大部分短语频次都在50次以下。无论是频次高的短语还是频次低的短语,总体上仅在科技语体中出现的短语跟相关社会活动或事务联系比较紧密。短语“听证”频次高达7510次,用例如下:
3)在这一原则支配下,听证成为司法审判活动的必经程序,称之为“司法听证”。后来听证逐渐被立法活动所采纳,形成了“立法听证”。
——科技文献
4)是接受高考命题专家的观点,还是遵从国家的宪法和法律,会使教师陷入两难境地。我们不妨也搞一个高考命题“听证”。
——科技文献
科技文献的语体中的高频动宾短语出现了大量的需要经过“听证”的社会事务,体现民主、参与等活动,如听意见、听民意、听呼声;跟学术活动、课堂教学等活动情景有关的短语占了不少内容,如听讲座、听短文、听磁带、听句子等;还有一些跟文艺节目或演出有关的短语,如听节目、听歌曲、听乐曲、听京剧等。
四、“听N”在不同语体中的义项及其宾语呈现情况
(一)文学和科技语体中的高频动宾短语义项及其宾语考察
动词“听”有两个义项,听1可以带受事、工具、处所宾语,听2可以带受事宾语。50个高频动词同时出现在两类语体中的“听N”短语一共有24个,其宾语类型数量情况统计如表4所示。
表4 文学和科技语体中“听N”短语的宾语类型(9)本文有关动词义项数及其带宾的宾语类型的划分均以孟琮、郑怀徳、孟庆海等编著的《汉语动词用法词典》.为准。 北京:商务印书馆,2012.及数量统计
从以上统计可以看出:“听”的两个义项都出现,3类宾语类型出现了两类。其中“听1N”的比例达到79.2%,远远高出“听2N”比例,充分体现出“听1”常用义在文学和科技语体中的高频使用率。总体上,“听N”带受事宾语比例为83.3%,受事宾语是“听N”短语在文学和科技语体中的高频宾语类型。“听1N”所带受事宾语的动宾短语有15个,“听2N”带受事宾语的高频短语有5个,分别是“听天命”“听命令”“听好话”“听天书”“听口令”,“听1N”带工具宾语的高频短语有4个短语,分别是“听电话”“听琴”“听收音机”“听电台”。可以说,就前50个高频动宾短语来说,这24个同时在文学和科技语料中出现,文学和科技语体的差异并没有影响其出现,换句话说,语体因素对这些高频动宾短语的出现影响不太大,但是对其出现的频次有影响。
(二)文学语体中的高频动宾短语义项及其宾语考察
50个高频动词出现在文学语体中的“听N”短语一共有26个义项,其宾语类型数量情况统计如表5所示。
表5 文学语体中“听N”短语的宾语类型及数量统计
前50个动宾短语在文学语体中出现的26个,“听1”和“听2”两个义项都出现了,“听1N[+受事]”的比例为57.7%,“听2N[+受事]”的比例为42.3%,可以说“听1”和“听2”带受事宾语的用例倾向于在文学语体中出现,受事宾语是文学语体中的“听N”的高频宾语类型;“听”所带宾语的3类宾语类型只出现了受事宾语,处所和工具宾语没有出现,文学语体对“听”带工具和处所宾语的选择性具有影响,相关用例不是其高频短语范畴。
(三)科技语体中的高频动宾短语义项及其宾语考察
高频动词出现在科技语体中的“听N”短语一共有26个的义项,其宾语类型及其数量情况统计如表6所示。
表6 科技语体中“听N”短语的宾语类型及数量统计
从以上统计可以看出,仅在科技语体中出现的“听N”高频动宾短语中,两个义项所带的光杆宾语用例都出现,其中,“听1N”的短语数量占了96.2%,可见“听1”常用义在科技语体中使用频率非常高。“听2N[+受事]”的短语在科技语体中仅出现了2个用例,分别是:听意见、听民意;受事、处所以及工具3类宾语中受事宾语数量最多,其占总的宾语数量的69.2%,受事宾语也是科技语体中的高频宾语类型;“听”带工具宾语高频短语有7个,分别是“听磁带”“听音响”“听MP3”“听耳机”“听录音机”“听录音带”“听唱片”,可以说这7个短语是“听N”在科技语体中比较常见的非受事宾语短语;“听”带处所宾语的用例是“听海”,用例如下:
5)海洋旅游是具有相当吸引力的,听海 、玩海越来越受到现代都市人青睐,而作为一个海洋大省,江苏海洋旅游还是一片待开发的处女地。
——科技文献
6)特别值得提出的是,人们开始倾心于以海水沙滩为主体的自然海湾泳场,听海 、看海、玩海越来越受到现代都市人的青睐。
——科技文献
五、结 论
在以往学界关注动词语义与动宾语义关系的句法限定和选择性基础上,通过考察动词“听N”在文学和科技语料中义项和宾语类型的呈现情况,研究发现在文学和科技两类语体语料中,多义动词“听”对带光杆名词性宾语的选择体现出不同的倾向性,这种倾向性主要体现在“听1”和“听2”两个义项及其带宾短语的分布差异上。语料语体不同,不仅同一个义项带宾的短语数量和出现频次不同,其带同一类宾语的宾语数量及其分布情况也不同。影响动词“听”带宾短语呈现的因素应该是多样的,除了多义动词本身的差异外,我们认为语料语体的差异性特征与多义动词及其带宾短语的呈现之间具有一定的影响关系和作用。与此同时,通过考察文学和科技语体中出现的高频动宾短语,帮助我们进一步把握文学和科技语体两类语料在动宾短语分布上的共性和差异特征。