转折性话语标记语的话题转换能力与语用功能分析*
2024-01-12程钰涵张跃龙
程钰涵 张跃龙
(1.信阳学院,河南信阳 464000;2.汉口学院,湖北武汉 430212)
一、引言
话语标记语(discourse marker),或语用标记语(pragmatic marker),属于语法的边缘化现象,它们是口语或会话交流中的常见现象,其作用主要是动态的,以语境为基础。[1]转折性话语标记语是转折连词进一步语法化的结果。转折类复句中的突转式复句,在语表形式上,前分句没有预示转折的标志,后分句前头用以“但是”为代表的转折标,例如:
①他有点儿发烧,但是也来上班了。
例①中先说“他有点儿发烧”,听着并不知道后边的话将是顺承还是逆接。用“但是”所表示的转折,是没有转折预示的突然的转折。
转折标包括连词“但是”“可是”“然而”等,可以替换为“但是”的“不过”“只是”“就是”也常常用来表示转折,但转折意味较轻。转折标还包括关联副词“却”。[2]
话语标记语的恰当使用有助于实现有效交际。近年来,学界对于该类现象关注较多,研究成果较丰。对话语标记语的研究已由“句法/语义—语用”为核心的分析逐步转向“语用—认知”研究,以揭示其在话语或语篇中存在的理据。[3]如谢世坚对话语标记语重新定义和分类,认为汉语的话语标记语来源于感叹词、连词、副词、形容词、动词、短语、小句以及指示代词,并由此将话语标记语划分8种。[4]张健军、吴长安分析了“但是”和“却”的转折属性及强度,认为“但是1”“但是2”和“却”的转折属性分别为[+强调性]、[+标记性]和[+对比性],并根据三者转折属性上的差异得出“但是”与“却”转折强度的等级序列为:(但是1+却)>但是1(却)>却/(但是1)却>但是2。[5]张巍具体分析了以“但是”“可是”和“不过”为代表的转折性话语标记在话语组织与连贯衔接、话题或话轮的转换、引起关注等方面的语用功能及其形成机制和认知基础。[6]曾君、陆方喆以“但是”为例,从语用功能角度分析其话语标记功能是反预期标记进一步语法化的结果。[7]陈禹从表轻转“只不过”切入,探讨了轻转现象的语用条件、语用动因与语用演化。[8]
综上所述,前人大多借助部分文学作品语料采用传统的内省式分析方法探讨某个具体转折性话语标记的语用功能,利用计算机技术更为客观的分析该类话语标记语的语用功能,特别是近义话语标记之间的话题转换程度序列鲜有涉及。
有鉴于此,本文基于BCC语料库,主要研究转折性话语标记“但是”“可是”“不过”,运用可视化手段,分析其语义距离的远近与各自在作为转折性话语标记时所表示的话题转换程度的大小之间的关系,以期为后续相关研究提供新的思路和方法。
二、“但是”“可是”“不过”的语义距离分析
(一)Word2vec词向量生成工具
词向量,是计算机中词语的向量化数学表示。最早的词向量表示是使用词独热(One-hot representation)方法,该方法将整个语料库的词汇做成序列表,然后依次遍历每个词汇,将某词汇在序列表中出现的位置标记为“1”,其余位置记为“0”,由此产生0和1组成的高纬向量。这种方法较为简单直接,而且当语料库中词汇量较大时会产生“维度灾难”问题。同时,由于One-hot只是单纯按照词表顺序进行词编码,对于词汇间的语义联系无法体现,存在“语义鸿沟”问题。
认知语言学认为“象似性”是语言的属性之一,沈家煊对“距离象似性”做了如下的解释:“认知或概念上接近的实体,其语言形式在时间和空间上也相接近。”[9]可以进一步理解为,词汇与其所在的上下文构成了一个“象”,当我们得到两个相同或相近的“象”时,无论这个“象”的中心词在字面上是否一致,我们认为它们在语义上是相近或相似的。
基于上述原理,Google公司在2013年完整开源Word2vec词向量模型。该模式实际上有两种不同的方法,即CBOW和Skip-gram两个模型(如图1所示)。
图1 CBOW &Skip-gram模型
图2 “不过”“但是”“可是”语义空间
CBOW模型的输入是某特定词汇的上下文词汇,输出则是这个词本身的词向量,也就是利用上下文对输出目标做出预测。Skip-Gram模型的输入则是某特定词汇的词向量,输出则是该词汇对应的上下文词汇向量。当使用Word2vec方式得到词向量后,将句子所包含词的词向量进行平均,就可以得到句向量。
(二)语义距离分析
语义距离是指在语义空间中,用来度量两个词语、短语或句子之间的语义相似性或差异性的概念。它用于衡量语义上的接近程度或相似程度,可以帮助我们理解和比较不同语义单位之间的关系。语义距离计算步骤如下:
1.将语料库中词项(但是、可是、不过)的前后句作为数据集导出;
2.依次生成前后句的句向量,并计算前后句之间的余弦距离;
3.将整个数据集句子的余弦距离求平均,作为结果输出。
计算结果如表1所示:
表1 “不过”“但是”“可是”语义距离计算结果
计算结果显示,“不过”“但是”“可是”前后句的平均语义距离依次为0.245,0.24,0.238,这表明转折性话语标记“不过”的前后句语义距离最远,即代表该词项的话题转换能力最强。
为进一步观察数据结果,本文将三个词项前后句的高维句向量进行降维,并将之投射至三维空间。其中,前后句的句向量分别用蓝色与绿色圆点表示,具体如下图所示:
从可视化图例中可以看出,“不过”的语义空间最为稀疏,“但是”次之,“可是”的语义空间分布最为紧密,符合上节的计算结果。
综上,基于Word2vec词向量生成工具,对BCC语料库中的相关语料进行计算分析,结果显示,转折性话语标记“不过”“但是”“可是”的语义距离序列表现出不平衡特征:“不过”的语义空间最为稀疏,语义距离最远;“但是”次之;“可是”的语义空间最为紧密,语义距离最近。这种不平衡特征影响着各自的话题转换能力,也即“不过”的话题转换能力最强,“但是”次之,“可是”最弱。
三、“但是”“可是”“不过”的语用功能分析
上文提到,转折性话语标记“但是”“可是”“不过”存在语义距离和语义空间的不平衡性,这种不平衡性影响了各自的话题转换能力。诚然,这种不平衡性也在一定程度上影响着它们的语用功能。
①现在我们观察到的北极星,是小熊星座星,但是《尚书•尧典》所记载的,却是公元前2600年左右的星空。
②高寒缺氧的路途中向伟所经历的艰难险阻是常人难以想象的,但是他兢兢业业地一干就是10年。
③我的腿以前曾被枪弹打穿,虽然不碍走路,但是一遇天气变化就感到痛楚难堪。
上述三例中,均使用“但是”一词作为话题的转换标记。“但是”用在半句话里表示语义的转折。作为具有转折性的话语标记,“但是”的转折意味较强,其所连接的前后两个分句的语义距离较大,甚至是相反或矛盾的。如例①中,前一个分句在说“现在”而后一个分局则是转到了“公元前2600年左右”,前后所说的时间间隔较大;例②为了凸显主人公的坚毅精神,用“但是”加以转折,以长时间的坚守来衬托这种坚毅的精神;例③的后一分句与前一分句所描述的情况基本矛盾,体现出“但是”转折后的情况,前后形成对比。
④我们一直在看神经科的专家门诊,可是一点用也没有。
⑤宣慈说得太过分了,可是依照事实状况来看,又的确是如此。
⑥我晓得你一向公事公办,可是你这次实在是太冲动了些.
上述例句中,均使用“可是”一词作为话题的转换标记。“可是”也表示转折,但其转折意味较“但是”弱,其连接的前后两个分局在语义距离上也不及“但是”远。有时,“可是”能够与“但是”互换,此时两者表达的转折意味是相近的。如例④⑤⑥三句中的“可是”均可换成“但是”。
⑦感性的东西,也许有,不过只能放在次要位置。(微博)
⑧会议终于结束咯,可瑜伽泡汤了,不过今天一切都很顺利。(微博)
⑨至于另外三家,目前还是三缄其口,不过从他们所持的H股和B股可见,摩根士丹利的选股范围集中在钢铁、汽车、航空。(都市快讯 2003-7-12)
⑩记者昨日从一位政府相关部门的负责人处获悉,即将于年底到期的“限价令”明年还将继续,不过具体标准和持续时间还不得而知。(微博)
上述例句中,均使用“不过”一词作为话题的转换标记。“不过”用在后半句的开头,表示转折,对上半句话加以限制或修正。例⑦⑧⑨⑩中,“不过”后面所承接的句子,更能表达出说话人的交际意图。
从上述分析可以看出,“但是”“可是”“不过”三者均可表示对比或转折,但其语用功能在语气轻重、话语重点、话语语体等方面均存在细微差别。“但是”前后承接的分句语义距离较远,“可是”前后承接的分句语义距离较近,“但是”的转折语气较“可是”更重一些,有时两者可以互换使用。使用“但是”作为转折话语标记时,说话人要强调的重点可以在前一分句,也可以在后一分句;“不过”所承接的前后分句的语义距离最远,与前两个标记语有所不同的是,它后面所承接的分句,更能表现出说话人的交际意图,是话题的焦点所在。此外,从上述分析中,我们可以看出,“但是”多用于书面语,而“可是”“不过”常用于口语,因此它们在惯用语体上有所差别。
四、结语
“但是”“可是”“不过”,它们都是表转折的话语标记,但是作为近义词,其语义距离、话题转换能力以及转换语气都是有差别的。我们考察这样的差异性,有利于汉语学习者在适当的语境中恰当地使用这些话语标记,以达到说话人的真实交际目的,形成有效交际。同时也能够为汉语教师在进行相关教学时提供可视化参照,为汉语教材相关语法点的编撰提供借鉴。
与以往现代汉语转折性话语标记研究的内省式研究方法和思路不同,本研究以计算语言学中的Word2Vec算法作为辅助研究工具,采用可视化手段分析现代汉语转折性话语标记,以更加科学客观的方式呈现该类词汇的语义距离及各自话题转换程度轻重,并在此客观计算结果的基础上,做进一步的语用功能分析,为后续相关研究提供新的研究方法和思路。