近义情态动词行为特征的量化研究——以“该”“应该”和“应当”为例
2022-06-23吴淑琼
冉 喻,吴淑琼
(1.四川外国语大学 英语学院,重庆 400031;2.四川外国语大学 外国语文研究中心,重庆 400031)
一、引言
汉语中的“该”“应该”和“应当”属于必要类情态动词(丁声树1961;朱德熙1982;马庆株1988)。三个情态动词在有些句子中可以互换,且不改变句意,如例(1)。但在有些情况下三个词又不能互换。比如,例(2)中只能用“该”,而不能用“应该”或“应当”;例(3)中可用“应该”和“应当”,“该”则不合适;例(4)中只能用“应该”,而不能替换为“应当”或“该”。
(1)我该/应该/应当怎么办?
(2)如果你再不回家,老王该/*应该/*应当说你了。
(3)应该/应当/*该说,科学史学科在推进素质教育方面有着特殊的作用。
(4)按说以第一名出线问题应该/*应当/*该不大。
由此可见,三个情态动词的语义既有重叠之处,也存在细微差异。虽然已有不少学者对这三个近义情态动词的使用差异进行过考察(如彭利贞、刘翼斌2007;郭昭军、尹美子2008;郭昭军2011;伍甜甜2021 等),但大多数研究采用的是内省思辨法,且聚焦于对其中一个词或两个词的描写和分析。
近年来,多元统计方法在国际认知语言学界已得到广泛应用(张炜炜、刘念2016:71)。基于语料库的行为特征分析法(corpus-based behavioral profile analysis)首先通过对词语的形态、句法、语义和语用等特征进行标注,获取语言多层面特征的量化数据,然后运用多元统计方法进行分析,揭示词语的语义结构和用法特征,这一方法为词汇语义研究提供了新的路径(吴淑琼、刘迪麟2020;吴淑琼等2021)。目前,已有少数学者运用基于语料库的行为特征分析法考察近义情态动词。比如,Deshors(2015)运用基于语料库的行为特征分析法对比分析了中国英语学习者和法国英语学习者在书面语和口语中使用may 和can 的差异;Tagliamonte(2017)基于语料库,运用多元混合效应逻辑回归和条件决策树分析了影响will 和be going to 选择的因素;孟庆楠和罗卫华(2020)基于美国英语历时语料库COHA(Corpus of Historical American English),采用条件推断决策树探究了影响英语边缘情态动词构式need(to) V变体选择的因素以及该构式的历时演变路径。以上研究均聚焦于英语情态动词,目前将基于语料库的行为特征分析法应用于汉语情态动词分析的研究尚比较少见。鉴于此,本研究尝试采用基于语料库的行为特征分析法,运用聚类分析(cluster analysis)和对应分析(correspondence analysis)考察汉语近义情态动词“该”“应该”和“应当”的语义结构和用法特征。
二、相关文献回顾
以往已有不少学者对情态动词“该”“应该”和“应当”的语义进行过分析。比如,张海媚(2017)考察了“该”的语义演变过程;方立和范莉(2005)、彭利贞和刘翼斌(2007)、贾泽林(2020)、陆志军和石定栩(2021)等分析了“应该”的意义浮现与句法环境的互动关系。除了对单个情态动词的研究外,学者们也展开过一些两两对比分析。比如,姚文彪(2017)从搭配、情态和语体方面对比了“应该”和“应当”的异同,揭示了二者在动词组配能力、语法范畴互动、语体分布以及主观性程度等方面的不同;李命定(2018)探讨了“该”和“应该”在语义、句法搭配等方面存在的差异。除了两两对比分析外,也有少数学者对比考察了这三个词的用法特征。比如,郭昭军和尹美子(2008)对现代汉语中的必要类情态动词进行了分类,认为“该”“应该”和“应当”均可用于书面语和口语,且具有不定量和独立性等特征,但该研究并未深入探讨三个词之间的差异;伍甜甜(2021)全面考察了“该”“应该”“应当”“应”和“当”在句法、语义和语体分布上的差异,但该研究为描述性研究,其结论还有待通过大规模数据进行验证。
综上所述,以往对“该”“应该”和“应当”的研究主要采用定性描述的方法,而基于大规模语料并结合量化统计方法的相关研究较少。鉴于此,本研究拟采用基于语料库的行为特征分析法,对“该”“应该”和“应当”进行更加精细的描写和分析,并用可视化的方法呈现三者之间的相似性和差异性,以期帮助学习者更好地掌握该组近义情态动词的基本用法。
三、研究方法
本研究的语料来自北京大学现代汉语语料库。首先,我们在语料库中分别检索和下载了“该”“应该”和“应当”的所有语例。鉴于“应该”和“应当”只能用作情态动词,而“该”还可以用作代词(如“该学生”中的“该”表示“这个”)和实义动词(如“该你了”中的“该”表示“轮到”;“我该她20 块钱”中的“该”表示“欠”),我们手动删除了不相关的语例,从剩下的语料中随机筛选了三个目标词各1000条语例作为本研究的语料。
然后,我们对语料进行分析,确定目标词的属性特征,并进行标注。这些属性特征被称作标识码(ID tags)(Atkins 1987),标识码又被分为不同的层级(ID tag levels)。本研究中标识码的选取主要依据情态动词的句法特征和语义特征。
情态动词的后接成分非常丰富。通过对语料的分析并结合前人的研究成果(Liesenfeld et al.2020),我们将情态动词的后接成分分为以下几类:光杆动词①光杆动词有广义和狭义之分。广义的光杆动词指“前后可有状语、补语等句法成分”的动词,狭义的光杆动词指“没有任何附加成分的动词”(张豫峰1996:52)。本研究采用狭义的概念。(如“该打的打”)、动词短语(如“应该接受义务教育”)、动词省略(如“这是应该的”)、形容词/形容词短语(如“那该多好”)、小句(如“该你们做的你们做”)、代词(如“你不应该这样”)和成语(如“我们应该引以为戒”)。光杆动词又被细分为言说类、动作/移动类和其他动词。由于小句、代词和成语作为后接成分出现的频率极低,我们将其统一归为其他成分,不做展开讨论。
汉语情态动词与后接成分在句子中的位置比较灵活,通常位于谓语位置,也可位于主语位置(如“该打的打”)、宾语位置(如“这是应该引以为戒的”)、状语位置(如“你该不会是在撒谎吧”)和定语位置(如“本该值班的张玉红却没来”)。需要说明的是,“应该”和“应当”可以与动词“说”形成固定结构“应该说”和“应当说”,其句法位置比较灵活,我们将此类情况标为其他位置。
汉语情态动词还可被副词修饰(郭昭军2011)。根据胡裕树(1981)对副词的分类并结合对语料的具体分析,我们确定了副词修饰语的如下标识码层级:范围副词(如“全”“都”等)、程度副词(如“更”“很”“太”等)、时间/频率副词(如“早”“已”“又”“再”等)、语气副词(如“大概”“也许”“难道”“究竟”等)和无副词修饰。
主语类型分为名词/名词短语、代词、动词短语、“的”字结构、零主语和其他类主语。其中,名词/名词短语的语义又被细分为以下几类:抽象概念/观点/现象、社会规约/合同条款、组织/国家/团体、商业/金融、学术/教育、动作/事件/活动、地点/时间、物质实体/身体部位、人/动物和其他类名词。代词又被细分为指示代词、疑问代词和人称代词(第一人称、第二人称和第三人称)。
另外,句子的极性(肯定、否定)、语态(主动语态、被动语态)、体标记(有“了”、无“了”)和句类(陈述句、疑问句、感叹句、祈使句)等语言特征也被纳入标注变量中。在汉语中,“我觉得”“我认为”等立场标记语表达言者的态度和立场,具有较强的主观性(郭昭军2004;徐晶凝2012)。Cappelle & Sutter(2010:98)指出,判断情态动词主观性强弱较为客观的标准是看情态动词是否与表示言者态度的标记词共现,若两者共现,则情态动词的主观性较强;反之,则较弱。据此,本研究设置了立场标记语这一标识码来判断“该”“应该”和“应当”的主观性程度。
就情态动词的语义表征而言,目前学界普遍接受的是情态语义的三分法,即将情态分为认识情态、道义情态和动力情态(彭利贞2007)。“该”“应该”和“应当”都可以表达认识情态和道义情态,因此我们将情态动词语义的标识码层级确定为认识情态和道义情态。另外,本研究根据戴耀晶(1997:9)对情状特征的定义和分类,将“该”“应该”和“应当”的后接成分所表现出的语义特征分为动态(表示言说、动作/移动类的词,如“打”“说”“交谈”等)和静态(表示存在、思维、认知类的词,如“是”“属于”“知道”“想”等)。综上,我们共确定了11 个标识码,其具体层级如表1 所示。
表1 标识码和标识码层级
所有标注工作由本研究的两位作者共同完成。为确保数据的准确性,我们交换标注的数据进行校对,并对有分歧之处进行讨论。我们将标注好的数据汇总成一个频数统计表,并将其转换成相对共现频率表,示例如表2 所示。
表2 “该”“应该”和“应当”的相对共现频率(示例)
最后,我们将数据导入R 语言中,运用聚类分析来探究“该”“应该”和“应当”的语义在总体上的相似性,并运用对应分析来揭示变量之间、目标词和变量之间的关联性。
四、结果和讨论
(一)“该”“应该”和“应当”语义分布的相似性
由图1 可知,“该”“应该”和“应当”聚为两大类,形成两个节点。从图1 中我们可获得以下信息:一是三个词之间的相似性。从纵向来看,“应该”和“应当”先聚类,“该”与“应该”和“应当”的聚类节点再构成第二聚类,这说明“应该”和“应当”的相似性较高,语义较为接近。二是聚类之间的关系。从横向来看,“该”与“应该”和“应当”所处的聚类距离较远,这表明其与“应该”和“应当”的相似性较低,内部语义结构差异较大。
图1 “该”“应该”和“应当”的聚类分析树形图
(二)“该”“应该”和“应当”语义分布的差异性
对应分析将“该”“应该”和“应当”与各个用法特征之间的共现频率转化为二维欧几里得空间中点与点间的相对距离。距离的远近说明数据点之间关联性的强弱。词与词之间的距离越近,说明二者的共有特征越多,语义也更为相似。词与用法特征之间的距离越近,说明该词与该用法特征的共现频率相比其他词要高。位于坐标轴原点处的标识码层级是三个词共同具有的用法特征。由图2可知,“应该”和“应当”均位于左侧象限,距离较近,而“该”位于右侧象限,距离二者较远,这说明“应该”和“应当”在用法特征上更为相似,而“该”的用法特征与二者差异较大。下面将具体分析三个近义情态动词的用法特征。
图2 “该”“应该”和“应当”的对应分析二维图
1.情态动词的后接成分
由图2 可知,不同类型的后接成分与“该”“应该”和“应当”的距离有所差别,这说明三者与各类后接成分的共现频率是不同的。就后接成分光杆动词而言,“应该”倾向于与言说类光杆动词共现,如例(5)。值得注意的是,“应该”和“应当”都能和动词“说”形成固定结构,其句法位置比较灵活,表达言者的主观看法,如例(6)—(7)。
(5)应该说,我的女儿很幸运。
(6)这十年人民生活水平有较大提高,应该说我们上了一个台阶。
(7)在这位火炭般热情的知识分子身上闪烁着的,应当说是友谊医院泌尿科医德的光辉!
“应该说”和“应当说”已经经过词汇化形成固定结构,表示“对命题合适性和确切性的主观评价”(董秀芳2003:48)。我们通过语料分析发现,“应该说”的使用频率比“应当说”高得多,这可能是因为“应当”更倾向于表达道义情态,且语义带有强制性意味,在表达主观推测时相对受限。
就后接成分光杆动词而言,“该”倾向于与动作/移动类光杆动词共现,用以强调动作或行为发生的合理性,如例(8)中“该打就打”表达出言者对做这件事果断的态度。而“应当”基本不接光杆动词,其后多为动词短语,如例(9)中“应当”后的动词为“查处”,两者之间还有介词短语补充说明了查处对象的范围,这使得语言表达更为精确。
(8)该打就打。
(9)税务机关除按照《实施细则》第六十四条的规定处理外,还应当对纳税人、扣缴义务人以及有关单位或者个人依法查处。
根据图2,“应该”与动词省略同处于左上象限,距离相对较近,这说明在“应该”后的动词更容易被省略。
(10)我们觉得这是很应该的。
例(10)中的“应该”表达道义情态,出现在焦点分裂句“是……的”中作为被强调的对象,其义务性程度被提升。相较而言,“应当”很少被强调,我们认为这是“应当”本身的义务性较强所导致的。
由图2 可知,“该”与形容词/形容词短语同处于右侧象限,距离相对较近,这说明“该”与其共现频率相对较高。
(11)如果能在这里培养研究文化的博后该多好!
例(11)中的“该”表达认识情态,构成“该+多+形容词”感叹句,表达言者的愿望,具有较强的主观性。
2.句类和句法位置
如图2 显示,“该”“应该”和“应当”在与句类的共现频率上具有差异。“应该”和“应当”与陈述句距离相对较近,而“该”与疑问句和感叹句距离相对较近,这说明“应该”和“应当”与陈述句的共现频率相对较高,而“该”与疑问句和感叹句的共现频率相对较高②本研究在设置变量时囊括了陈述句、疑问句、感叹句和祈使句四种句类。但在我们随机抽样的语料中,“该”“应该”和“应当”都没有出现在祈使句中的语例,因此图2 中没有呈现祈使句这个标识码层级,这里也没有分析祈使句。。
(12)要是直航该多好啊!
(13)我该怎么办?
例(12)中的“该”表达认识情态,表达言者的愿望,具有较强的主观性。而例(13)中的“该”表达道义情态,表达言者对听者回应的关注,表现出交互主观性的特点。
一般情况下,“情态动词+后接成分”出现在句子的谓语位置。由图2 可知,定语位置、宾语位置、主语位置和状语位置主要分布于右侧象限,离“该”相对较近,这说明“该”与后接成分的句法位置相对来说更自由。“应该”和“应当”离谓语位置相对较近,这说明二者与后接成分出现在谓语位置的频率相对较高,而出现在定语、宾语等位置会受到限制,我们认为这与“应该”和“应当”的后接成分的长度有关。
3.极性和体标记
在汉语中,否定词的位置影响多义情态动词意义的表达(彭利贞2007)。图2 中,否定的极性特征离“该”相对较近,这说明“该”出现在否定句中的频率相对较高。值得一提的是,当“该”与“不是”或“不会”搭配构成“该不是”或“该不会”时,其表达的是言者的主观推测,如例(14)—(15)。
(14)你这自行车该不是偷来的吧?
(15)先生,您半个小时前刚发过一封和这一样的电报,该不会是搞错了吧?
另外,“该”与体标记“了”的距离比“应该”和“应当”近,这说明其与“了”的共现频率相对较高,表达言者的主观推测,如例(16)。
(16)如其尚存,该有一百五十年的历史了。
4.副词修饰语
根据图2,“应当”与无副词修饰距离相对较近,这说明“应当”相对较少被副词修饰;“应该”与范围副词和程度副词距离相对较近,这说明其与这两类副词的共现频率相对较高。比如,例(17)中“应该”被范围副词“还”修饰,扩大了言者认为句子主语情理上应该完成的命题行为的范围;例(18)中“应该”表达道义情态,表达的是情理上应该做某事,当其被程度副词“更”修饰时,道义性增强。“该”与语气副词和时间/频率副词距离相对较近,这说明“该”与这几类副词的共现频率相对较高。比如,例(19)中语气副词“就”与“该”共现,表达言者希望命题内容成真的情感,具有较强的主观性;例(20)中“该”被时间副词“早”修饰,表达言者认为情理上应该回家探望,但是由于工作却未能实现的无奈。
(17)我们还应该加强自身的防范。
(18)今天,我们是在社会主义市场经济条件下,就更应该讲信誉。
(19)如果单纯为了出成果,他就该留在世界名牌大学。
(20)我早该回家探望一下,只是工作实在放不下。
除此之外,我们在语料中还发现,“应该”和“该”与语气副词“本来”和“本”共现会产生反事实的语义解读,如例(21)和(22)。
(21)在他弥留之际,“爸爸”忏悔说自己本该工作得更努力些,“妈妈”则发誓说自己以后再也不赌钱了。
(22)冠军本来应该属于德国人。
5.句子主语
由图2 可知,“组织/国家/团体”类、“人/动物”类和“社会规约/合同条款”类名词/名词短语主语或“的”字结构主语,与“应当”距离相对较近;“抽象概念/观点/现象”类、“学术/教育”类和“动作/事件/活动”类名词/名词短语主语或动词短语主语,与“应该”距离相对较近;“商业/金融”类和“物质实体/身体部位”类名词/名词短语主语或零主语,与“该”距离相对较近。这说明“应当”倾向于与“组织/国家/团体”类、“人/动物”类和“社会规约/合同条款”类名词/名词短语主语共现,如例(23)—(25),或与“的”字结构主语共现,如例(26),以明示行为的主体;“应该”倾向于与“抽象概念/观点/现象”类、“学术/教育”类和“动作/事件/活动”类名词/名词短语主语或动词短语主语共现,这些表述不具有实施动作的能力,命题内容多表达言者的主观认识和判断,属静态特征,如例(27)—(30);“该”倾向于与“商业/金融”类和“物质实体/身体部位”类名词/名词短语主语共现,如例(31)—(32),或出现在没有施事主语的句子中,表达言者对实施命题行为毫不含糊的态度,如例(33)。此外,疑问代词主语和指示代词主语与“该”距离相对较近,这说明“该”与这两类代词主语的共现频率相对较高,如例(34)—(35)。
(23)婚姻登记机关应当对离婚登记当事人出具的证件、证明材料进行审查并询问相关情况。
(24)每班有一个班长,每个学生都应当为自身的进步老老实实地用功。
(25)第十条 物业管理合同应当明确:(一)管理项目;(二)管理内容;(三)管理费用。
(26)属于国家工作人员的,还应当依法给予行政处分。
(27)印中两国关系应该进一步提升。
(28)一部作品总应该力争有几个文学上成功的典型。
(29)任何军事行动都应该在目标明确的前提下进行。
(30)进入半决赛应该不是难事。
(31)财政该由三司管,三司失职,可以换人。
(32)生产要搞,但办公楼实在该盖一盖了。
(33)该出手时就出手。
(34)谁该去做这件事?
(35)这该是令人鼓舞的。
6.立场标记语
根据图2,有立场标记语与“应该”同处于左上象限,距离相对较近,而与“应当”和“该”距离相对较远(有立场标记语与“该”的距离远于“应当”),这说明立场标记语更倾向于与“应该”搭配,三者中“应该”的主观性最强,“应当”的主观性次之,“该”的主观性最弱。这与前人关于“应该”和“应当”的研究结果不尽一致(如姚文彪2017)。例(36)和(37)中的“我认为”和“我觉得”均为立场标记语,表达言者的态度,因此主观性较强。
(36)我认为,对中国农民英雄的典型的创造,应该越完善越好。
(37)我觉得应该不会有太大影响。
五、结语
本研究采用基于语料库的行为特征分析法,运用聚类分析和对应分析考察了近义情态动词“该”“应该”和“应当”的语义结构和用法特征。总体上看,“应该”和“应当”的语义相似性相对较高,而“该”与“应该”和“应当”的语义有较大差异。具体而言,这三个近义情态动词在后接成分、句类、句法位置、副词修饰语和主语类别等用法特征方面均存在较大差异。情态表达与主观性具有不可分割的关系,量化分析显示这三个情态动词在主观性上有强弱之分。本研究采用量化分析法揭示了三个近义情态动词的语义结构和用法特征的异同,为汉语情态动词研究提供了新的路径。
本研究得到四川外国语大学外国语言文学市级一流学科重点项目“词汇语义的语料库量化研究”(SISUWYJY202102)、四川外国语大学一流学科和重点学科研究生科研创新项目“基于语料库的汉语近义情态动词的多因素研究”(SISU2021XK017)的支持,特此致谢!