APP下载

“到底”“究竟”在疑问句中的扩域增熵功能

2023-10-17刘婉晴

关键词:问话信源信息熵

刘婉晴

(闽南师范大学 文学院,福建 漳州 363000)

“到底”“究竟”是现代汉语中使用频率很高的词,自二十世纪九十年代末以来,学界对于二者的义项研究和词类划分始终争议不断。经全景式梳理和分析,可将相关研究分为个案研究和对比研究两大类:个案研究即就“到底”或“究竟”中的一者进行研究,如:张秀松在考察“到底”的主观化表达功能[1]、共时差异[2]、历史形成[3]及其在近代汉语中的后续演变[4]等问题的同时也考察了“到底”句的句法、语义、语用情况[5],马喆对“到底”的去范畴化进行考察[6],冯雪燕梳理了“到底”从空间上的边缘意到表语气的追究意的演变过程[7],宋月蓉专文分析副词“到底”及其篇章功能[8];姚明霞总结语气副词“究竟”的语法特征[9],王军从历时角度梳理“究竟”的发展演变[10],吕萍、戴秀干对“究竟”进行语用方面的考察[11],许秋娟专文研究副词“究竟”[12],张秀松也撰写专文考察“究竟”的去语法化问题[13]。比较研究多集中在“到底”“究竟”在对外汉语教学中产生的偏误分析,如:陈秀明、李莉、李晓萌、聂艺颖等[14-17]。此外,赵舸对“到底”“究竟”的语用条件[18]、语义情况[19]、句法结构[20]及二者在教学中的运用[21]等进行共时比较-;蒋勇和王志军[22]基于信息熵阐释“到底”“究竟”不被是非问句允准的理据。

可见,学界已有研究多将“到底”“究竟”视为语气副词,并对二者在句法、语义上的差别做出分析;也指出二者具有强调意与深究意,但对二者在具体使用中何以凸显疑问、深究义并未给出系统阐释。基于此,从言语交际的信息熵及其认知视角出发,结合交际语境和交际策略等因素综合考量交际主体的情感态度对“到底”“究竟”进行再阐释,具有一定的创新性和研究价值。

一、“到底”“究竟”在问句中的使用偏向

疑问句的主要功能即询问,是对不确定信息表示疑惑时、寻求答案的一种方式。因为言语交际中的会话含义存在规约含义和话语含义之分,疑问句的语义也需考虑这双方面因素。《现代汉语词典》(第六版)中的解释是:“到底”作为副词,“用在问句中,表示追究[23]266”;“究竟”作为副词,“用在问句中,表示深究”[23]693”;《现代汉语八百词》对二者的解释几乎一致[24]。据此,二者在问句中都是对不确定性信息的探寻与追究,实质上暗含了问话人的困惑程度很高,没办法通过一般的推理寻索答案,因此答案的不确定性很高。如①本文语例均标注出处,均引自CCL语料库;若出现无标注出处的,则为现实生活中搜集的实际语例。:

(1)真的,到底“他们”是谁?该怪罪什么人呢?我们谁也回答不清楚。(马识途《夜谭十记·让子弹飞》)

(2)请问,我们究竟上哪儿去呀?(克拉林《庭长夫人》)

例(1)“到底”即追根究底,一般的询问和探寻不能获取答案,必须深入到最底部才能获取答案。因此其实质隐含着问话人的疑惑程度极高,没办法通过眼前的情况作出推断或是在现实中得到证实,为了尽可能在交际中获取答案,只能通过扩大搜索范围、深入可能性的最底端,尽可能穷尽地寻求答案。例(2)“究竟”的意思是穷尽,即穷尽所有可能性、找出结果,也有表示疑问、追根究底的意义。它表达对事物的高度好奇和疑惑,是一个典型的语气副词。问句答案的不确定性越高,答案就越难获取;疑惑程度越高,就越会激人深究,这也是“到底”“究竟”在表达疑惑时的实质语用意义。

“到底”“究竟”在问句中存在两种语义:疑问的意义和深究的意义。在具体的问句条件下,二者的语义也具有一定的偏向性,赵舸明确指出:“同样具有‘追究’义项的‘到底’和‘究竟’,‘到底’主要用于口语,而‘究竟’兼用于书面语和口语;且‘究竟’主要表示‘追究、深究’之义,具有专门性。”[19]52具体来看,“到底”“究竟”在表达疑惑和追究/深究义偏向时也在很大程度上受到使用语境的影响。如:

(3)孟齐焦急地问着:“江辛,她现在到底怎么样了?过得好不好?”她:“我不知道。”(沈亚《红尘摆渡人》)

(4)迁都是大事,到底是凶是吉,还是卜个卦吧。(《中华上下五千年》)

(5)独孤方却沉下了脸,冷冷道:“你怎么知道我们是两个人?你究竟是不是个真的瞎子?”(古龙《陆小凤传奇》)

(6)他摸不准父亲究竟是高兴还是不高兴,是对现状满意还是对从前感到厌倦。(王朔《我是你爸爸》)

例(3)和例(5)都是言说者基于现实的某种情况,发出疑惑,表达对“她怎么样”“是不是瞎子”的高度怀疑,迫切想要了解事情真相,因而“到底”“究竟”均带有极强的疑惑度,这种高度不确定性导致问话人必须追根究底询问、以求得明确答案。但例(4)和例(6)的求信度和深究义显然不及例(3)和例(5),其问话人并非基于现实事件提出疑惑,仅仅是对迁都的“凶吉”、父亲“高兴与否”及其心理状态等事件的揣测和不确定,没有强烈的深究意。可见,“到底”“究竟”既可用来追问已然存在或已经发生的事件,也可用来询问尚未发生的事件。既可以是追根究底地刨问、势必要获取答案;也可以是只引出话题、但无明显的追究态。当然,二者在具体的语体环境和交际目的下,因为追问或深究的目的不同在具体的问句使用中也会呈现出一定的差异:在口语中,当问话人希望提问对象对问题予以回应、获取答案时,倾向于用“到底”来发问,如例(3);而在书面语中,当问话人并不十分在意提问对象是否会对疑惑做出回应或解答时,倾向于用“究竟”来发问,如例(6)。

与之类似的,还有汉语早期白话文中的“端的”等,如:

(7)我且问你:这七人端的是谁?(施耐庵《水浒传》第16回)

(8)端的上面写的是些什么?列位不嫌烦絮,看他逐回道来。(曾朴《孽海花》)

“端的”即“末/顶/底端”,与“到底”“究竟”一样,在疑问句中表示疑惑程度和不确定性。例(7)“端的”与前面例(3)和例(5)一样,都是基于某一客观现实而产生高度疑惑。它预设了这七人身份很难根据事实及线索进行猜测,因而不确定性极高,说话人的疑问语气随之增强,有迫切寻求答案的偏向。例(8)“端的”的追究义显然弱了很多,本身并不具有很强的疑问义,只是为了引出话题,起到提示和激发寻求答案的作用,用来制造悬念,引导读者暂停阅读、启发思考。

细究“到底”“究竟”在表达高度疑惑和追究/深究义时的运用语境,可以发现:具有该语义偏向的“到底”“究竟”都经历了“空间域的广度→疑惑度→不确定度”的语义演变过程,体现为扩大搜索范围、对问题或观点追根究底。它们首先实现的是空间范畴广度上的延展,是典型的扩域表现;进而经由空间域衍伸到疑惑度和不确定度,在问句中具有传疑的功能和扩域的功能。该过程始终伴随着深度的思考、深入的寻索和穷尽性的调查。蒋勇等将这类词称为扩域词,并指出它们具有深究/追究、追究真相的语义和加强语气、追问到底的功能[22]62-63。

Law 等认为汉语中“到底”的意思相当于英语的really(真的)[25],与之相似的,Huang et al 等把“到底”翻译成actually(实际上)和truly(真实地)[26],认为:由“到底”的字面意义可推知问话人想要获得需要的具体信息的意义,即追根究底。但在某些语境下,这些词并没有追究、深究之意,只是表达问话人不知道确定答案而感到困惑的语义。调查发现,英语疑问句中的wh-on earth,exactly,at all 等在一定的语境下,与汉语表示“究竟”“到底”义的用法更为契合。如:

(9)What on earth had Lee done?(李究竟做了什么?)

(10)What exactly do you mean?(你到底什么意思?)

(11)Have you read any of the paper at all? (那文章你到底读一点没?)

可见,“究竟”“到底”在汉语语境下既具有追究、深究之意,同时还表示问话人不知道答案时的疑问语义;而在英语中的“到底”“究竟”多是对语气进行强调,起辅助表达的作用,二者不能同一而论。那汉语中的“到底”“究竟”何以具有增强疑惑程度、突显问话人急于知道答案而追根究底的作用呢?信息论为该问题的阐释和分析给出了新的解读方向和解答思路。

二、“到底”“究竟”在问句中的熵值平衡

言语交际过程即信息传递、交互的过程,发出疑问的过程其实就是寻求新信息、降低不确定性的过程。Shannon 的经典信息论认为,信息与长度、重量一样可以被测量[27]。一个信源发出的符号、传递的信息是随机的,具有不确定性。他以概率论为工具,提出“自信息”概念:自信息是某一事件自身传递的信息量,在事件发生前表示该事件发生的不确定性,在事件发生后表示该事件所提供的信息量。信息量越大,事件发生的概率越大、包含的不确定性越小,那么它的自信息就越小;反之,事件的不确定性越大,自信息越大。该理解大致如下:

收到信源符号获得的信息量= 不确定性减少的量= 收到该信源符号前该事件发生的不确定性- 收到该信源符号后该事件发生的不确定性

陈运指出,熵是信源输出符号后所带来的信息的平均值,是自信息的数学期望(平均值)[28]。它计算的是某一事件多种可能性结果的平均不确定性,事件的概率分布越均匀,事件的不确定性越大,熵就越大。换言之,获取信源符号后,信息量增加、不确定性减少,熵也随着减少,这也意味着获取信源符号后减少的信息熵与增加的信息量应当等值。熵值的理解大致如下:

收到信源符号后信息熵的减少=信息熵的负值的增加= 收到信源符号前所有事件发生的不确定性- 收到信源符号后所有事件发生的不确定性

综上,事件发生的概率越均匀,事件结果的不确定越大,信息熵越大;反之,事件的不确定性越小,信息熵越小。要使信息熵减少就势必要通过获取新的信息扩大信息量、降低对事件的不确定性。若将信源输出的某一随机事件记为x,其出现概率可记为P(x),则自信息I(x)就是该事件发生概率对数的负值,二者构成函数关系I(x)=-log P(x),具体见图1。若将信源输出的所有可能性事件记为X,那么信息熵E(X)①陈运(2009)《信息论与编码》将其记为H(X),并给出其计算式H(X)=E[I(x)]=-ΣP(x) log P(x)。即表示事件概率的平均不确定性,见图2。

图1 概率与自信息的函数图示

图2 概率与信息熵的函数图示

Hamblin[29]、Groenendijk & Stokhkf[30]等一致认为问句的意义即计算其所有潜在答案的意义。前面提到,问句中的扩域词“到底”“究竟”可以表达问话人的较高疑惑度,这实质上暗含了问话人对寻求、获取答案的好奇。Merin[31]、Rooy[32]和Krifka[33]等学者均指出信息熵公式可以用来计算一个问句的所有潜在答案的平均信息量。且看例句:

(12)K的“好友”到底是不是小昭呢?(茅盾《腐蚀》)

(13)冬梅悚然大惊,失声惊呼道:“什么?这么多人影,到底哪个是真身呢?”她那凌厉无匹的一剑落空了。(无极《龙翔记》)

(14)究竟“银胆”是否有毒?南京东玻厂上述做法有何根据?结果需要科学的论证。(《人民日报》)

(15)问题在于究竟“语言”是透过什么因素,能让人理解、运用,则始终没有人能提出满意的理论,更无法加以实现。(朱邦复《智慧之旅》)

据图1 知:P(x)越接近0 时,事件发生的概率越低,信源输出的内容所带来的自信息量越大;当P(x)越接近1 时,事件发生的概率越高,信源解除的不确定性越小,自信息量越小。由于熵是自信息的平均值,结合图2 可知:事件发生的概率分布越均匀,事件发生的不确定性越大,信息熵越大。上述四例事件的发生均具有多种可能性且没有偏向性,因而信息熵大。例(12)的“到底”暗示“K 的好友”身份与小昭的对应关系存在是与不是两种情况,例(14)“究竟”同样预设银胆存在有毒和无毒两种情况,两个答案的概率相同导致答案的不确定性增加、问句的信息熵提升,很难依据当前事实做出判断。例(13)面对多种且没有偏向的可能性结果时获取真相的概率很低,答案的不确定性极高;例(15)要从没有偏向的诸多语言因素中找出一者,发生的几率很低,问句的信息熵很大。

Jaynes 在Shannon 信息论基础上提出最大熵原理,认为:依靠有限的信息推断概率分布达到尽可能客观的求信效果,使得信源的熵最大,避免可能引入的偏差[34]。结合上述例句分析可知:当问句预设存在两种可能性答案时,信息熵在P=0.5时达到最大值E=1。这样的发问增加了两个答案的概率的平衡性,使问句的信息熵得以最大化,增加对答案的不确定性。这与傅祖芸所提出的“等概率分布信源的平均不确定性最大,具有最大熵”[35]异曲同工。在实际的言语交际中,多种信息交互后就存在信息的博弈,局内信息越混乱,不确定性越高,造成的疑惑度也越高。问话人若要获得最大的信息量,就要把问句设计成具有最大熵的问句,尽可能降低可能答案的偏向性,使所有潜在答案为真的概率等值。如:

(16)杨妈,这照片的事,我心里一直犯嘀咕呀,这翠花,究竟是活着,还是死了?(陈建功《皇城根》)

(17)我觉得有些奇怪,温内图到底一个人骑到哪儿去了?(卡尔·麦《藏金潭夺宝》)

综上,信息的本质是获取信息量、消除不确定性。在信源系统存在多个随机事件的情况下,信息熵表示的是每个事件的平均概率、不确定性信息的平均程度。“到底”“究竟”看似是追根究底、寻求答案,实则是对不确定信息的怀疑。面对疑惑,人们出于好奇心与求知欲必然会通过寻求信息、吸取负熵来平衡困惑程度与不确定性;信息的不确定性越强、疑惑程度越高,就越要通过扩大潜在答案的搜索范围来追根究底地进行排查。至此,上述熵论和语例似乎都暗示着扩域词“到底”“究竟”具有加强疑问语气、增大问句信息熵的功能。那么事实是否确实如此?

三、“到底”“究竟”在问句中的增熵功能

根据上述熵值的讨论,可知:交际中的问答过程其实就是交换互熵的过程。前面已经指出“到底”“究竟”经历了“空间域的广度→疑惑度→不确定度”的语义演变过程,在问句中体现为扩大搜索范围、对问题或观点的追根究底,具有深究/追究意。那么,问句中“到底”“究竟”所具有的高疑惑和深究义是扩域词带来的还是问句自身所有的?先看两组例句:

(18)a.你们俩谁丢的垃圾?

b.你们到底俩谁丢的垃圾?

(19)a.谁没有交作业?

b.到底谁没有交作业?

例(18)和例(19)都是一般疑问句,都表达对不确定信息的询问;但明显(b)组的疑问语气更强、(b)组的疑惑度和信息熵也比(a)组更大。两相比较,(a)组和(b)组只存在有无“到底”和“究竟”的差别。据此,可先推测并猜想扩域词“到底”“究竟”具有增加信息熵、加强疑问语气的功能。

首先,结合“到底”“究竟”在问句中的语义看(a)(b)组的发问顺序:(a)组的发问显然不可能出现在(b)组之后。因为在自然语序的提问后,若已获得明确答案、解除疑惑,是不需要再进行追问的;只有当获取信源后、仍无法消除答案的不确定性时,才需要再度求索答案,在反复追问的过程中才可能出现(b)组的发问。这一过程若没有加入“到底”“究竟”这样的扩域词来加强疑问语气、增加疑惑度,只是单纯重复(a)组的发问,就无法突显问话人疑惑程度的加深及其寻求答案的心理加重。可见,(b)组的信息熵大于(a)组的信息熵。

其次,结合问话人的答案预设及其在提问中所获取的信息看(a)(b)组回答与主体先验预设的偏离程度:例(18)暗含该提问存在两个可能性答案,当(a)组问话人可依据先验经验预先推测该事件执行的对象,并且获取的答案多在其先验预设范围之内,无需再追问;而(b)组显然是主体获取的答案较大程度地偏离先验经验的预设范围,问话人无法根据先验经验对两人中“谁丢的垃圾”这一事件做出猜测;为了使答案的求信效益更高,只能扩大搜索范围、对所有答案再度进行排查,于是加入“到底”来平衡可能答案的偏向性。这与图2 所示“当问句有两个可能答案时,在P=0.5 时E 值达到最大”相吻合,也即加入“到底”后使两人执行该事件的概率相同,问句的信息熵最大。Krifka和蒋勇等均对含有两个可能答案的问句的熵值做过对比分析,并得出一致结论:“带扩域词的问句的熵高于不带扩域词的相似问句的熵。”[22]70例(19)与例(18)相似,只不过该事件的可能性数量更多。(a)组答案多在问话人的先验预设范围之内,无需追问;(b)组则是主体获取的答案较大程度地偏离了先验经验预测的答案,只能尽力加入预设前提、引入“究竟”来降低可能性答案的偏向,平衡多个答案间的概率分布。

综上,问句所具有的高疑惑和深究义确是“到底”“究竟”等扩域词所带来的。蒋勇等指出“扩域词只适合追问先验概率极低的事件,不适合用于追问先验概率极高的事件。”[22]72其实不然,扩域词应该也适用于追问先验概率极高的事件,只是二者的答案预设与疑惑焦点存在差异。扩域词的运用突显的是事件的发生出乎意料,即:当问句的答案与问话人的预设产生较大程度的偏离时,问话人因为高度疑惑而再次发问以求证事件发生的信度。面对概率极高的事件,问话人往往会事先预设肯定答案;面对概率极低的事件,问话人则往往先预设了否定答案。尽管二者的求信效度都很高,但其疑惑焦点随着预设的不同而不会:面对先验概率高的事件,问话人是对否定答案的高度疑惑;面对先验概率低的事件,问话人则是对肯定答案存在高度怀疑。例如:

(20)a.(问数学系教授)你究竟学过微积分没?

b.(问普通初中生)你究竟学过微积分没?

(21)a.(问热爱旅行的人)你到底去没去过茶卡盐湖?

b.(问不爱旅行的人)你到底去没去过茶卡盐湖?

例句中(a)组事件发生的概率有很强的偏向性,问话人根据先验经验几乎就能得到肯定回答,对事件发生的疑问程度较低。当问话人获得否定答案时极大地偏离了主体的先验预设,其疑惑程度升高,只能再次询问,于是引入扩域词、以保证问句的求信效益。而(b)组事件发生的概率极低,问话人所预设的答案也倾向于否定回答,在获得肯定答案后疑问程度极大地提高了,为增加求信效益就引入扩域词来扩大搜索范围、增加肯定答案的分布概率,以追寻真实答案。

那么,扩域词“到底”“究竟”在不同类型疑问句中是否都适用?在不同类型的疑问句中,“到底”“究竟”的增熵效果是否又存在差异?先看几个例子:

(22)a.你们到底一共有多少块现大洋?(老舍《茶馆》)

b.她被赖药儿年轻英俊的脸容吸引,同时也被他满头白眉白发震住。“你究竟……多大年纪?”(温瑞安《天威》)

(23)a.这颗红钻到底是还是不还?(芃羽《怪盗游侠》)

b.工商企业之间究竟是对抗,还是依存?(《人民日报》)

(24)a.他到底还来不来,我们还要等到何时?(陈廷一《宋氏家族传》

b.我们的文化传统到哪里去了?我们究竟有没有友情?(巴金《随想录》)

(25)* 这书包到底是你的吗?

* 你究竟拿了小溪的文件吧?

从疑问句的结构特点和基本类型看:例(22)是特指问,例(23)是选择问,例(24)是正反问,例(25)是是非问。可见,“到底”和“究竟”表追究义时一般只用于疑问句中的特指问、选择问和正反问。Huang et al 和张谊生等也一致指出:“到底”“究竟”不能用于是非问句中,尤其是带“吗”的是非问句[36]。严格意义上的是非问句是在陈述句的基础上、添加疑问语气词和疑问语调构成。这样的发问在获得答案前已经具有很强的答案偏向性,即问话人已经预设事件为真的概率极高,事件发生的不确定性极低,这样的发问并不能增加新信息,这与扩域词要尽可能降低答案的倾向性、增加信息熵的功能相矛盾。

言语交际是一个双向的互动过程,疑问句的语用意义就是寻求答案、消除不确定性。问话人与听话人在交际中要根据先验经验和信息量、语境等因素择取最佳的话语方式,保证最大的语力效益。Holmes 指出,话语层面上的言语语力不仅由话段命题内容决定,也由说话人的交际意图决定[37]。说话人与听话人在交际中的位置是持续轮转的,都要考虑问话人的语用策略和听话人的理解、应对策略,在实际的交际中,高信息度的疑问程度低、信息熵低,低信息度的疑问程度高、其信息熵也高。因此要相应地引入扩域词以扩大所有可能性答案的搜索范围,尽可能地平衡所有可能答案的偏向性。如:

(26)我刚刚还在想,到底是不是你?

(27)你究竟买了些什么,去那么久?

上述两个例子去掉扩域词“到底”“究竟”也成立,但问话人出于交际语力的考虑,根据信息量与事件的先验概率选择支付占优原则事先调整了言语表达形式以实现交际语力的最大化。例(26)问话人为降低预设答案的偏向性,引入扩域词“到底”对所有可能性答案进行穷尽性排查来尽可能降低可能性答案的倾向性,通过降低对事件主体的怀疑语气来增加求信效益。例(27)通过引入“究竟”扩大该事件的所有可能性情况,进而增强疑惑语气、减弱责备语气,实现最优交际。

Groenendijk & Stokhof指出,一个问句的意义相当于由它的潜在答案指代的所有可能事件的状态,可将这所有可能视为由若干单元格构成的集合[30]82。当问题被提出后,就要求从这些单元格的集合中搜索答案。对于一个集合内的所有可能事件,问话人依据先验经验对所有可能性答案发生的概率的预测会形成一个梯级,不同梯级中所产生的语力不同。当问话人对可能性答案有较大偏向时,为平衡该语力偏向,就要扩大可能性答案的搜索域、穷尽可能性答案的选项,将答案的偏向性降到最低,通过减少事件发生概率的偏差来找到答案,进而实现交际语力的最大化。根据信息熵理论可知:当所有可能事件的发生概率分布最均匀时,获得的信息量最大,问句的求信效益最大。因而,“到底”“究竟”作为扩域词被引入疑问句中,具有最大限度地平衡可能性答案的倾向性、提升疑惑程度和增加信息熵的功能。

结语

由于交际语境和交际主体的先验经验影响,疑问句中所有可能性答案的不确定度也不尽相同,为了获取最大语力效益,问话人必须考虑听话人的理解及其应对策略,在不断衡量话语信息度的同时调整话语表述形式、平衡答案的倾向性。“到底”“究竟”在汉语疑问句中具有疑问义和深究义,实质上暗含了问话人的高疑惑度。信息熵作为衡量信息价值高低的标准,与自信息、信息概率等紧密关联,在疑问句中发挥着重要作用。在问句的预设前提下无法确定答案时,可通过对窄域信息的否定,将可能性答案扩展至宽域、纳入例外的情况,实现对答案的穷尽性搜索,通过增加信息熵来增强疑问语气和深究语气。

值得关注的是:前文指出“到底”“究竟”在是非问句中不被允许与扩域词的增熵功能有关,这一点在疑问句之外也能得到验证。碍于篇幅和疑问的限定,未能对此类现象展开细述,后续还可做进一步深化。

猜你喜欢

问话信源信息熵
基于信息熵可信度的测试点选择方法研究
基于极化码的分布式多信源信道联合编码
基于信息熵的实验教学量化研究
信源控制电路在功率容量测试系统中的应用
一种基于信息熵的雷达动态自适应选择跟踪方法
怪鸟夺妻杀夫(下)
信源自动切换装置的设计及控制原理
基于信息熵的IITFN多属性决策方法
荣禄在“问话”时担任的不是军机大臣
文本阅读中变“问话”为“对话”浅探