离合词在不同语体中的分布特征考察
2021-03-04陈慧
[摘 要]文章试图通过自建封闭式语料库对16个核心离合词在不同语体中的分布情况、离合频度进行定量分析,并进一步分析离合词中的离散特征。经统计分析,我们发现这16个核心离合词在文艺语体中分布率最高,其次是政论语体,再是事务语体,分布率最低的是科技语体。在文艺语体中,离合词中的离散形式最多,主要是因文艺语体的语言注重情感性、形象性、多样性,且主观性程度强。离合词中离散形式的主要特征表现为:中间插入单一语法成分、中间插入复合语法成分以及重叠前一成分。
[关键词]离合词;语体;语料库;离散特征
[中图分类号]H13 [文献标志码]A [文章编号]2095-0292(2021)06-0119-06
[收稿日期]2021-08-16
[作者简介]陈慧,厦门大学中文系博士研究生,常熟理工学院副教授,研究方向:计算语言学与语言教育。
一、引言
语体是人们在各种社会活动领域,针对不同对象、不同环境,使用语言进行交际时所形成的常用词汇、句式结构、修辞手段等一系列运用语言的特点。李宗熙指出语体在定义和分类方面一直存在很多分歧,至今还没有专门讨论这一问题。[1](P176-196)冯胜利提出“正式与非正式(书面体/口语体)”“典雅与便俗(文雅体/白话体)”两对基本范畴。[2](P400-412)陶红印详细论述了以语体为中心的语法研究意义,认为“口语和书面语的区别是一个必要步骤但还比较粗线条,任何单一的标准把语体(及文体)作穷尽的分类都是不现实的,分类的标准在很大程度上应取决于分类的目的和语料的实际情况”。[3](P15-24)一般而言,人们将语体分为口头语体和书面语体两类,其中口头语体包括谈话语体和演讲语体,书面语体又分为事务语体、科技语体,政论语体、文艺语体四类。
二、研究现状
离合词就是指现代汉语中既能“合”又能“离”的词,是一种特殊的语法现象。自1957年陆志韦在《汉语的构词法》一书中首次提出“离合词”的概念以来[4],有关离合词的现象引起了众多学者的关注,如,刘泽先(1953)[5](P13-14)、王力(1954)[6]、吕淑湘(1979)[7]、张静(1987)[8]等学者主要从本体研究角度出发对离合词的定义、语法性质、界定标准、离析动因等方面进行研究;王素梅(1999)[9](P62-66) 、丁勇(2002 )[10](P148-151)、吴海燕(2004)[11](P98-100) 、王海峰(2008)[12]等学者主要从语义特征和语用价值角度对离合词进行研究;李炳生(1996)[13](P65-66)、韩明(2003)[14](P57-60)、王海峰(1999)[15](P301-305) 、任海波等(2005)[16](P75-87)等学者主要研究对外汉语教学及信息处理中的离合词问题。学者们虽对离合词的研究在广度和深度上都有所成就,但是很少有学者基于大规模语料的基础上对离合词进行定量分析。正如陶红印所说的,对不同语体中的句子格式应结合具体的实际语料进行统计意义上的讨论。[3] 王海峰认为离合词中“合”为常态,而“离”为异态,离合词离析是一种异态现象。[12] 任海波等学者以小说语料为主考察并统计分析离合词在使用时的合与离频度,并对离合词主要的离散形式进行语法分析。[16](P75-87) 王海峰通过CCL语料库统计分析离合词在北京自然口语、小说、戏剧、散文、学术著作、新闻报道、法律文本等不同语体中的分布情况,得出离合词离析现象在口语化的文学作品中出现得最多,同时语体的庄重程度对离合词的离析隐现至关重要。[17](P81-89) 臧娇娇等学者基于BCC中综合频道语料分析离合词的离析形式并设计离合词离析规则的自动识别算法。[18](P75-93) 陈禹等学者通过统计分析互联网门户网站新闻及BCC语料库中报刊子库中离合同指的语义性质及功能动因,发现离合同指更适合表达事件。[19](P119-131) 本研究主要基于语料库基础上对文学、事务、政论、科技这四种不同书面语体中核心离合词的分布情况进行统计分析,目的在于通过定量分析的方法来进一步了解离合词在不同书面语体中的分布状况、离合频度及离散特征。
三、离合词的确定及语料来源
王海峰于2007年通过北京大学语料库对《HSK词汇与汉字等级大纲》(北京语言大学出版社,1992)中的207个离合词进行详尽统计考察得出离析频率高、使用范围广、代表性强的16个核心离合词。这些核心离合词分别是:叹气、睡觉、结婚、帮忙、吃惊、听话、当面、把关、吃亏、洗澡、吃苦、上当、鞠躬、出名。[20](P84-91) 本研究主要是采用王海峰所提炼出来的16个核心离合词,来考察离合词在四种不同书面语体中的分布状况、離合频度及离散特征。
本研究所采用的书面语体语料共计208万字,事务语体、政论语体、科技语体及文艺语体各52万字。事务语体的语料来自于中国公文网站上国家及地方上的各种公文;政论语体的语料来自于《邓小平文选》 ;科技语体的语料来自于杨治良《实验心理学》及马忠普《企业环境管理》;文艺语体的语料选自沈从文的小说集《鸭子集》、《蜜柑》、《龙朱》、《一个女剧员的生活》;散文集《湘行散记》、《人生五味瓶》、《人生的梦幻》;张爱玲的散文;鲁迅《呐喊》、《彷徨》以及赵树理的《小二黑结婚》。
四、离合词在不同书面语体中的分布差异
我们对包含这四种语体的208万字语料进行详细地考察,穷尽式提取语料中出现的16个核心离合词,并对提取出来的这些核心离合词的离析特征进行细致的分析。考察发现,离合词在不同语体中分布的数量存在较大的差异,具体数据见表1。
通过表1、图1显示,我们得知离合词在不同语体中的分布情况。所考察的16个核心离合词在文艺语体中出现次数最多,共出现了308次;其次是政论语体,出现了118次;再是事务语体,共出现17次;而在科技语体中离合词的出现次数最少,共出现7次。
由此我们得知,离合词在不同语体中的分布情况大体表现为:在文艺语体中出现率最高,其次是政论语体,再是事务语体,出现率最少的是科技语体。
究其原因,主要是根据不同语体自身的语言风格和特点有关。文艺语体包括了散文语体、诗歌语体、小说语体及戏剧语体,是以艺术形象反映社会生活需要而运用全民语言所形成的言语体式。文艺语体的语言中往往体现着作者(说话人)的主观情感,它追求在情感上感染读者,追求能形象地反映现实,其语言的主要特点表现为形象性、多样性及独特性。政论语体直接为政治服务,其宣传鼓动作用极强,因而又称宣传鼓动语体,是适应社会政治生活领域的交际需要或向群众进行宣传鼓动或向斗争对象展开抨击进攻的需要而形成的全民语言体式,其语言特点主要表现为严密的逻辑性及生动的形象性。事务语体是国家机关、社会团体及社会成员在处理行政事务工作中所使用的一种书面语体,其语言特征主要表现为简明、准确、庄重。科技语体主要用来总结描述事物规律的一种语体,其语言特征主要表现为简约性、准确性、明晰性和规范性。因此,通过对比分析这四种语体的语言风格及特点,可得出离合词分布数量由高到低依次是文艺语体、政论语体、事务语体、科技语体。
五、离合词在不同书面语体中的离合频度统计分析
离合词的离合频度统计包括两个方面:离散频度和合成频度。离散频度是指一个离合词处于离散状态下的用例数在该离合词例句中所占的比例;合成频度则指非离散状态下的用例数与该离合词总例句数的比例。依据这种算法可以得出,16个核心离合词在不同语体中的离合频度分布情况,统计结果如表2、表3、表4及表5所示。
由表2得知,16个核心离合词在文艺语体中的离合频度基本情况。在所考察的文艺语体语料中,有308个例句中含有离合词,其中,含离散形式的离合词有90句,占29.22%;含有合成形式的离合词有218句,占70.78%,这说明在文艺语体中离合词存在着很多离散形式。图2显示,“结婚、睡觉、生气、出名、当面、见面”这些离合词以合成形式出现的频率很高,都在80%以上。离合词出现离散形式最高的是“听话”,占比78.13%;其次是“吃苦”,离散形式的占比为60%;再是“叹气”,离散形式占比52.94%;“帮忙”离散形式占35.71%;“吃惊”离散形式占33.33%;“洗澡”离散形式占33.33%,说明这些离合词经常以离散的形式出现在文本中。而离散率为0的离合词有“把关、上当、鞠躬”,在这些文艺语体语料中,16个核心离合词中有只有3个离合词没有出现离散形式,说明在文艺语体中离合词经常使用其离散形式。
由表3得知,16个核心离合词在52万字政论语体中的离合频度基本情况。在所考察的政论语体语料中,有118个例句中含有离合词,其中,含离散形式的离合词有48句,占40.68%;含有合成形式的离合词有70句,占59.32%,这说明在政论语体中离合词经常使用离散形式。首先,离合词“听话”都以离散形式出现,离散比例为100%;其次是“吃苦”,其离散比例占52.38%;离散形式占比在50%以上的离合词有“睡觉、帮忙、吃亏、吃苦、出名”,这说明在政论语体中,离合词“听话、吃苦、睡觉、帮忙、吃亏、吃苦、出名”经常以离散形式出现。离散率为0的离合词有“叹气、结婚、吃惊、当面、把关、洗澡、生气、上当、鞠躬”,说明16个核心离合词中就有9个离合词的离散率为0,即9个离合词没有出现离散形式。与文艺语体相比,这说明政论语体比文艺语体的语言更正式、更规范些,其离合词的离散形式必然就会少些。有些离合词既没有离合形式也没有合成形式,如“叹气、结婚”在政论语体中出现率为0,这也许受语料的选择或规模的影响。
由表4得知,16个核心离合词在52万字事务语体中的离合频度基本情况。在所考察的事务语体语料中,有17个例句中含有离合词,其中,含离散形式的离合词有8句,占47.06%;含有合成形式的离合词有9句,占52.94%,这说明在事务语体中离合词合成形式与离散形式的分布状相差无几。16个核心离合词中只有4个离合词出现在所考察的事务语体中,这说明在事务语体中离合词的出现率低。其中,“当面、吃苦、生气”都是以合成形式出现的;只有“把关”既有离散形式又有合成形式,离散形式占比为61.54%,合成形式占比为38.64%,这说明“把关”在事务语体中常以离散形式出现。
由表5得知,16个核心离合词在52万科技语体中的离合频度基本情况。在所考察的科技语体语料中,有17个例句中含有离合词,其中,含离散形式的离合词有8句,占47.06%;含有合成形式的离合词有9句,占52.94%,这说明在事务语体中离合词合成形式与离散形式的占比相当。16个核心离合词中只有5个离合词出现,且出现的次数都很少,“吃惊、把关”出现两次,“见面、听话、生气”都只出现一次。其中,以离散形式出现的离合词有“见面、听话、把关”;以合成形式出现的离合词有“吃惊、生气”。这说明在科技语体中,离合词不管是离散形式还是合成形式,其出现的频率都很低。
通过对比表2、表3、表4及表5中的数据可得知,首先,在不同语体中,离合词的具体分布有很大差异。离合词在文艺语体中的分布量最大,其次是政论语体,再是事务语体及科技语体。在文艺语体和政论语体中,以离散形式出现的离合词占比最多的是“听话”,然后依次是“吃苦”、“帮忙”、“吃亏”;而“把关”、“鞠躬、“上当”则都是以合成形式出现,这说明在文艺和政论语体中,这几个离合词多以合成形式出现。然而,在科技和事务语体中,离合词“把关”却常以离散形式出现。其次,在不同语体中,离合词的离合频度有很大的差异。文艺语体和政论语体中,离合词的离散形式占比大,但在事务语体和科技语体中,离合词的合成形式和离散形式占比却相当。最后,文艺语体中出现离合词的离散形式数量最多,其次是政论语体,而在科技语体中只有“见面”、“听话、“把关”出现离合形式;事务语体中只有“把关”这个词有离散形式。其原因主要归结为:文艺语体的语言主要传达作者的情感,文章中作者所使用的語言口语化比较常见,语言的主观性程度较高,而事务语体和科技语体都是注重叙述客观事实,不注重主观情感,所使用的语言应简洁、准确、规范,所以很少出现离合词的离散形式。
六、离合词中的离散特征分析
通过对所统计到的离合词离散形式的例句分析,可以总结出离合词离散形式有以下特征:
(一)离合词中间插入单一语法成分
1.离合词中插入助词成分,如“过、了、着、完、的”等。例如:
(1)结了婚不久我们搬家搬到一所民初式样的老洋房里去,本是自己的产业,我就是在那房子里生的。(张爱玲散文《私语》)
(2)这就是我在应当读书时节没有机会受教育所吃的亏。(沈从文小说集《老实人》)
2.离合词中插入量词成分,如“一、个、些、一个、许多、一些”等。例如:
(3)老栓又吃一惊,睁眼看时,几个人从他面前过去了。(鲁迅《呐喊》)
(4)今天见个面,我讲几句话。《邓小平文选》
3.离合词中插入谓词分成,如“大、很大”等。例如:
(5)这样,即使环境恶劣,我们也能作有秩序的退却,而不致吃大亏。《邓小平文选》
4.离合词中插入代词成分,如“此、什么、他(她)、这”等。例如:
(6)我的一位前辈先生N,正走到我的寓里来谈闲天,一听这话,便很不高兴的对我说。(鲁迅《呐喊》)
(7)连长听此话,颜色变得越发难看了。(沈从文小说集《老实人》)
5.离合词中插入名词的成分,例如:
(8)严把产地环境安全关。(选自中国公文网站)
(9)到后还是五叔用“你不听姨婆话就不同你往碾房……”为条件,他才忙跑到姨婆身边去。(沈从文小说集《鸭子集》)
6.离合词中插入趋向动词“起、上”等形式,例如:
(10)当然我们还是要做工作,不能因为怕患急性病就睡起觉来,要稳步地做,摸准情况前进。《邓小平文选》
(二) 离合词中间插入复合语法成分。
1.离合词中插入“助词+代词+谓词+助词”成分,例如:
(11)但八儿听了这种松劲的话,眼睛可急红了。锅子中,有声无力的叹气正还在继续。(沈从文小说集《鸭子集》)
2.离合词中插入“(助词)+名词+助词”的成分,例如:
(12)他再三辩白他写这本书的目的并不是吃了女人的亏借以出气,但是他后来又承认是有点出气的作用,因为:“一个刚和太太吵过嘴的男子,上床之前读这本书,可以得到安慰。”(张爱玲散文《谈女人》)
(13)如果让转不过来的人掌权,这些人能听党的话吗?《邓小平文选》
3.离合词中插入“助词+量词+谓词”的成分,例如:
(14)过淮河,天老爷帮了一个大忙,能够徒涉。《邓小平文选》
4.离合词中插入“助词+副词+谓词+助词”的成分,例如:
(15)我们南进时就是缺乏准备,所以吃了很大的亏。《邓小平文选》
5.离合词中插入“助词+量词”的成分,例如:
(16)“道翁,道翁,你不要这么嚷。”四铭吃了一惊,慌张的说。(鲁迅《彷徨》)
6.离合词中插入“量词+谓词+名词+助词”的成分,例如:
(17)我们先是默默地相视,逐渐商量起来,终于决定将现有的钱竭力节省,一面登“小广告”去寻求钞写和教读,一面写信给《自由之友》的总编辑,说明我目下的遭遇,请他收用我的译本,给我帮一点艰辛时候的忙。(鲁迅《彷徨》)
7.离合词中插入“副词+助词”成分,例如:
(18)当然,也有不少的同志睡不着觉,有的不只两天睡不着觉。睡不着觉就是好现象,这就可以通通气。《邓小平文选》
8.离合词中插入“代词+量词”成分,例如:
(19)还有闰土,他每到我家来时,总问起你,很想见你一回面。我已经将你到家的大约日期通知他,他也许就要来了。(鲁迅《呐喊》)
(三)离合词的离散形式中重叠前一成分。例如:
(20)如果有什么事情,我完全可以在旁边帮帮忙,但是绝不要正式再搞个什么头衔了。《邓小平文选》
总之,离合词中离散形式各种各样,通过上述对离合词离散形式分析,我们可以得出其特征有中间插入单一语法成分、中间插入复合语法成分以及重叠前一成分。
七、结论
我们借助208万字的语料来分析16个核心离合词在不同书面语体中的分布情况、离合频度以及离散特征。通过统计分析,我们发现这16个离合词在文艺语体中分布最多,其次是政论语体,再是事务语体及科技语体。究其原因,主要与各个语体的语言风格及特征有关。文艺语体的语言往往具有多样性、形象性、主观程度强,所以使用离合词的离散形式最多;而科技与事务语体的语言注重客观性、庄重性、规范性,所以很少使用离合词的离散形式。同时,通过对离合词的离散形式进行分析,得出离合词的离散特征有中间插入单一语法成分、中间插入复合语法成分以及重叠前一成分的特征。通过上述分析,我们不仅可以了解离合词在不同书面语体中的分布情况,而且还可以进一步掌握离合词的离散特征,这将有助于我们更深入地学习并掌握离合词。本文由于语料规模及语料选择有限,这在一定程度上影响了离合词的统计分析,希望在今后的研究中能扩大语料规模及范围,多维度地探究离合词在不同语体中的使用特征。
[参 考 文 献]
[1]李宗熙.关于语体的定义问题[J].复旦学报:社会科学版,2005(3).
[2]冯胜利.论语体的机制及其语法属性[J].中国语文,2010(5).
[3]陶红印.试论语体分类的语法学意义[J].当代语言学,1999(3).
[4]陆志韦.汉语的构词法[M].北京:科学出版社,1957.
[5]刘泽先.用连写来规定词儿[J].中国语文, 1953(3).
[6]王力.中国语法理论[M].北京:中华书局,1955.
[7]吕叔湘.汉语语法分析问题[M].北京:商务印书馆,1979.
[8]张静.汉语语法问题[M].北京:中国社会科学出版社,1987.
[9]王素梅.论双音节离合词的结构、扩展及用法[J].沈阳师范学院学报:社会科学版,1999(4).
[10]丁勇.汉语动宾型离合词的语用分析[J].语言研究特刊,2002.
[11]吴海燕.浅谈离合词带补语的特点及其应用[J].莱阳农学院学报:社会科学版,2004(1).
[12]王海峰.现代汉语离合词离析形式功能研究[D].北京语言大学博士学位论文,2008.
[13]李炳生.词汇教学中应注意的一类词——离合词[J].语言与翻译,1996(3).
[14]韩明.论对外汉语教学中的离合词[J].温州师范学院学报:哲学社会科学版,2003(4).
[15]王海峰,李生,赵铁军.汉英机器翻译中汉语离合词的处理策略[J].情报学报,1999(8).
[16]任海波,王刚.基于语料库的现代汉语离合词形式分析[J].语言科学,2005(6).
[17]王海峰. 现代汉语离合词离析现象语体分布特征考察[J]. 语言文字应用,2009(3).
[18]臧娇娇,荀恩东.基于BCC的离合词离析形式自动识别研究[J].中文信息学报,2017(1).
[19]陈禹,任函.汉语新闻语篇离合同指及其統计分析[J]. 语言文字应用,2020(2).
[20]王海峰,王铁利. 建立在语料库基础上的汉语本体研究与对外汉语教学——以现代汉语离合词研究为例[J].汉字文化,2009(2).
[责任编辑 薄 刚]