基于大规模语料库的两岸新闻标题同音删略研究
2022-04-27董思聪顾静航黄居仁
董思聪 顾静航 黄居仁
[关键词]同音删略;新闻标题;共同语变体;韵律;变调;使用频率;语料库
[中图分类号]H136 [文献标识码]A [文章编号]1674-8174(2022)01-0018-07
1.引言同音删略(haplology)是指发音相同或相近的相邻语音发生删略的语言现象。从跨语言的角度看,同音删略多发生于功能性成分,而少见于实语素(Neeleman & vandeKoot,2017),因而之前的同音删略研究大多谈论的是形态层面的相关现象。比如,英语短语“theboys‘bikes”(男孩们的自行车)就来自完整形式“theboys‘sbikes”中所有格语素-s的删略(Stemberger,1981)。此外,Stemberger(1981)还指出同音删略不能跨越两个直接成分而发生,如英语句子“McDonald‘s‘sgreat!”
(麦当劳很棒!)就不能删略为“*McDonaldsgreat”,因为在前的所有格语素-s属于主语,而在后的动词语缀-s属于谓语。
汉语中同样存在功能性成分的同音删略。Chao(1968)观察到表完成的“了”和语气词“了”不能毗连共现,如“*已经走了了”必须删略为“已经走了”;同样,名物化标记“的”和定语标记“的”也无法紧挨使用,如“*是那个卖菜的的”一定要删略成“是那个卖菜的”。此外,漢语还存在一类相对特殊的同音删略形式,即名词性复合结构中的同音删略现象,如“重庆市市长”可以删略为“重庆市长”。这时,发生删略的成分是实语素,而且两个同音的语素分属不同的直接成分。Chao(1968)同样注意到此类现象,并称之为套装复合词(telescopedcompounds)。本文将仅就这一类同音删略现象展开论述,即名词性复合结构中同音同义的两个相同语素发生删略的情况。
长期以来,针对这一现象的讨论并不充分。司富珍(2005)、柯航(2006)、郭锐(2017)等著作虽都有所触及,但均未将其作为研究重心深入探究。然而,这类跨层删略现象涉及音系、词法、词义、句法等多个语言层面的互动,大有挖掘价值。近年来,数项著作对该现象进行了多方面的研究。王心言(2018)和Wongetal.(2018)基于台湾“国语”和香港粤语的调查数据,指出复合结构中的同音删略现象受到三项因素制约:使用频率,变调,韵律。具体来说,如果满足下列条件,则倾向于删略:复合结构中第一个直接成分的使用频率高;两个相邻的重复语素不发生会导致其不同音的变调;删略后的形式更符合汉语的韵律结构。反之则倾向于保留完整形式。此外,他们还发现这三项制约条件对同音删略的促进或阻挡作用存在强弱差异,而其强弱的等级排序在不同语言/方言中可能不同,也正是这种不同导致了同音删略不一样的跨语言表现。其中,香港粤语的等级排列是“变调>使用频率>韵律”,也即假设变调导致语流中连续出现的某个语素变得不同音,那么即便该结构满足高频使用或删略后更加符合韵律等条件,也倾向于不删略。比如,粤语“学生会会长”中,第一个“会”发生变调,虽然“学生会”高频使用而且删略后更合韵律,香港粤语母语者也倾向于使用完整形式。与之不同,台湾“国语”的等级排序为“使用频率>变调>韵律”。董思聪、黄居仁(2020)则对大陆普通话进行了调查,发现其制约条件的排序与台湾“国语”和香港粤语都存在差异,为“使用频率>韵律>变调”,并借助优选论对这种强弱差别进行了理论阐释。Dong&Wong(2020)还进一步为复合结构中同音删略所涉及的词典收词和规范问题提出了解决方案。
作为同音删略的一种制约条件,韵律的作用主要体现在复合结构的音节数上。大量学者(如王洪君,2000;Feng,2002;Huangetal.,2002)认为,汉语共同语中最常用、受限最小的标准音步是两个正常音节的音步。相应地,四音节结构会比三音节、五音节的结构更符合韵律。所以,在其他条件相同的情况下,完整形式为四音节的复合结构不倾向于删略,而五音节的则会倾向于删略。此外,韵律对汉语的制约作用,还非常集中地体现在新闻标题这个特殊的语言使用领域。作为一种可以有限度突破常规语言规则的“语言特区”(参看徐杰、覃业位,2015;董思聪、黄居仁,2019;刘颖、罗堃,2019;覃业位,2019),追求紧凑精炼、表意丰富的新闻标题常有不同于主流语言运用领域的表现形式。根据罗堃(2017)的研究,“韵律亲和”是新闻标题中出现非常规语言形式的一个主要原因,即标题常常使用自然谐律的音步结构,尽可能符合基于双音节标准音步的韵律模式。
由此可见,新闻标题中的同音删略现象可能同时受到来自两方面的韵律制约:韵律结构对同音删略的促进和阻挡作用,以及标题这一特殊语言运用领域所具有的“韵律亲和”性质特征。根据已有研究,韵律结构对同音删略的制约强度在不同的共同语变体中并不一致。那么,一个值得探讨的问题就是,同音删略出现在标题中时,韵律的制约强度会不会因为标题“韵律亲和”作用的叠加而呈现出不同于常规语言的等级排序?换句话说,在同音删略的制约条件方面,大陆普通话“使用频率>韵律>变调”以及台湾“国语”“使用频率>变调>韵律”的常规语言等级排列,是否同样适用于标题语言?对该问题的回答,不仅可以深化我们对同音删略机制的认识,也能够为研究标题的特殊语言表现提供新的视角和证据。本文将借助大规模的两岸共同语语料库,考察并讨论同音删略的三项制约条件在新闻标题中的作用情况。
2.语料处理及统计结果
本文的语料来源为Tagged Chinese Giga?word Version 2.0(Huang,2009)。该语料库由汉语共同语的新闻构成,并按照地区来源分为三部分:大陆普通话语料,取自新华社新闻;台湾“国语”语料,取自“中央通讯社”新闻;新加坡华语语料,取自《联合早报》新闻。本文使用的大陆及台湾语料总量约8.1亿词,均经分词处理,并标注词类。
我们首先利用语料库标注从两岸原始语料中提取出各自的新闻标题。在此基础上,我们在计算机中设定筛选条件并加以人工核对,从新闻标题语料中进一步提取出能够发生删略的候选名词性复合结构,即完整形式的套装复合词,如“分社社长”“杂技团团员”等。经统计,我们获取的复合结构在大陆语料中共有43种出现频次,在台湾语料中则有72种出现频次。我们继而从大陆语料的43种频次中随机抽取36种,并将台湾语料的72种频次按高低顺序平均分为36组,以使两岸语料频次总数相当。随后,我们权衡对三项制约条件的考察需求,从每组中抽取1个复合结构,从而分别在两岸语料中获取36个能够代表不同频次、反映不同制约条件的复合结构完整形式。其后,我们进一步在两岸新闻标题语料中分别搜索与其对应的删略形式,并加以人工核对,同时获取删略形式的出现频次。在这一过程中,我们删除了完整形式出现比例最高的一对复合结构,以平衡可能存在部分复合结构十分倾向于删略以致语料中不包含相应完整形式的情况。经过以上步骤,我们分别获得了大陆普通话和台湾“国语”的35对复合结构完整形式和删略形式的出现频次比例。考察项的数量与王心言(2018)和董思聪、黄居仁(2020)等先前研究相仿。最终所得数据如表1所示,其中结果按不删略的比例降序排列。
3.分析及讨论
从整体表现上看,大陆普通话和台湾“国语”新闻标题的同音删略呈现出相当明显的差异。在35对复合结构中,大陆普通话有25对倾向于保留完整形式,而台湾“国语”只有17对。也就是说,大陆普通话倾向于不删略,而台湾“国语”并未体现出显著倾向。这与两岸常规语言中同音删略的表现亦有差异。根据董思聪、黄居仁(2020)对常规语言的分析,大陆地区在是否删略上没有显著的倾向,而台湾地区则略微倾向于不删略。可见,标题这一特殊语言运用领域使得同音删略在大陆地区更加倾向于不发生,而在台湾地区更加倾向于发生。下面我们分别考察使用频率、变调、韵律这三种制约条件发生相互作用时的表现。
3.1使用频率与韵律的相互作用
根据先前研究,复合结构中第一个直接成分的使用频率高低与其删略倾向成正相关;另外,不合韵律模式的完整形式倾向于删略,而符合韵律的完整形式倾向于不删略。因此,在常规语言中,高频的四音节复合结构会形成两种制约条件的冲突:高频会促进删略,而符合韵律的四音节结构会阻碍删略。这时使用频率和韵律的相对强弱则会决定删略的倾向。
我们从表1的复合结构中抽取出若干成系列的考察项用以分析使用频率的制约力。本文對使用频率的量化效仿此前相关研究,采取Google的完全匹配搜索,并在“高级搜索”设置中选定相应的“地区”和“语言”,以确保结果合乎对两岸共同语的考察要求。此次搜索时间为2020年1月23日,搜索结果及相应的删略倾向数据如表2所示。两岸汉语的“院长”组和“国会”组复合结构均属高频,且完整形式基本为四音节,可供对比使用频率与韵律的制约力度。
在大陆普通话中,“法院院长”和“医院院长”均100%保留完整形式,体现出韵律占优。与此类似,“泰国国会”也大比例倾向于不删略。不过,“美国”比“泰国”更为高频,加之在新闻中常简作“美”,因此倾向于使用删略形式“美国会”,体现出使用频率一定的促进作用。所以,从总体上看,大陆普通话中高频的四音节复合结构更倾向于保留完整形式。即便使用频率和韵律均对同音删略存在制约力,不过韵律略强于使用频率。
在台湾“国语”中,所有“X院长”均倾向于保留完整形式,不过删略比例未见与使用频率存在明显关联,比如“法院”频率远高于“地院”,但“法院院长”却更倾向于保留完整形式。而且,相对低频的“中研院院长”由于删略后更合韵律,删略比例也最高。从“X院长”的用例看,韵律强于使用频率。不过,“X国会”复合结构却因为高频而均倾向于删略为不合韵律的三音节结构,而且“美国国会”由于更高的使用频率,也体现出比“泰国国会”更高的删略比例。因此,基于我们的材料综合来看,台湾“国语”中使用频率和韵律的制约力强弱相当。这两项制约条件之间更精细的强度对比,有待更具针对性的研究加以探讨。
3.2使用频率与变调的相互作用
如前所述,如果复合结构的两个直接成分之间存在变调,会导致重复语素的实际读音出现差异,从而阻碍删略;当复合结构的第一个直接成分高频使用时,使用频率的作用则会促进删略。表2中,大陆普通话的“X省长”组和台湾“国语”的“X馆长”组复合结构均属高频,且由于“省”“馆”单字调为上声,存在重复语素之间发生连上变调的可能。此时,使用频率与变调在促进还是阻碍删略上存在冲突。
表2的数据显示,一方面,这两组复合结构都倾向于保留完整形式,表明在整体上变调对删略的阻碍更强。值得一提的是,这些结构不仅高频,其完整形式还均为相对不合韵律的五音节结构。也就是说,变调的阻挡作用,强于频率和韵律这两项促进删略条件的叠加。另一方面,“X省长”组和“X馆长”组的删略比例与其使用频率成正相关,这表明频率依然具备对删略的制约作用。由此可见,变调在两岸汉语的新闻标题中都比使用频率更强,尽管后者也具有一定的制约力。
3.3韵律与变调的相互作用
根据前文所述,如果一个复合结构的完整形式不存在变调,而且删略后更加符合韵律模式,那么韵律和变调的作用会实现叠加从而促进删略。然而,如果完整形式存在变调,但删略后更合韵律,则变调的阻挡作用和韵律的促进作用将发生冲突。我们将考察项中存在变调可能的复合结构整理为表3。其中,完整形式为五音节的结构均存在两种制约条件的冲突。在大陆普通话中,4个此类结构中有3个倾向于不删略;在台湾“国语”中,5个此类结构中也有3个倾向于不删略。由此可见,变调的作用力在两岸汉语中都比韵律强,而在大陆普通话中的优势更大。
此外,表3的数据还进一步凸显出台湾“国语”比大陆普通话更倾向于删略的整体特征。按照制约条件的作用机制,存在变调的四音节完整形式,会受到来自变调和韵律两方面的阻挡,加之前文的分析表明使用频率的制约强度并不高,因此理应较难发生同音删略。比如,表3中大陆普通话的“宪法法院”和台湾“国语”的“联考考生”均倾向于不删略。然而,台湾“国语”中的“劳保保费、健保保费、电影影展”却更多地以删略形式存在。这种突破阻挡作用而发生删略的现象,实际上与新闻标题的特殊性质密切相关。我们将在下一小节进一步分析。
3.4准确性和简约性对同音删略的干预
根据上文对三种制约条件两两冲突时删略倾向的分析,我们能够发现同音删略在新闻标题中的确有着不同于常规语言的表现。在常规语言中,大陆普通话的制约条件呈现“使用频率>韵律>变调”的等级排序,台湾“国语”为“使用频率>变调>韵律”。不过,在新闻标题中,大陆普通话则是“变调>韵律>使用频率”,台湾“国语”为“变调>韵律≈使用频率”。
从以上等级排序的变化来看,新闻标题这一特殊的语言运用领域为同音删略带来的影响主要是,变调在两岸汉语中都成为了最强的制约条件,而使用频率却由常规语言中的最强条件变为最弱条件。相比之下,韵律的制约力度则未体现出明显差异。在大陆普通话中,韵律在常规语言和新闻标题中都位列第二;在台湾“国语”中,韵律在两种环境中都属最弱,不过在标题中是与使用频率同属最弱。因此,我们对同音删略的实证研究可以表明,尽管“韵律亲和”是新闻标题语言突破常规的一个主要原因,但它并不能对同音删略的制约机制构成显著影响。实际上,罗堃(2017)指出“韵律亲和”在音节数上造成的一个重要特点是,四音节和七音节标题的数量较大,其中七音节标题也往往选择[4+3]的韵律形式。所以,韵律对新闻标题的影响可能更多地体现在标题整体的节律模式,而对于同音删略的制约条件等深层语言规律则作用有限。这也再一次证明了“语言特区”中的突破和创新是有规律、有限度的(徐杰、覃业位,2015;董思聪、黄居仁,2019)。
虽然新闻标题中的同音删略并未受到来自韵律的明显叠加影响,但却因为新闻标题语体特点的干预,而有了不同于常規语言的表现。准确性和简约性,是新闻标题的两大关键特点(李洪波,2004)。准确指的是完整、清晰、无偏差地传递信息,以符合新闻的基本准则;简约指的是凝练、明快、不啰嗦地传递信息,用提纲挈领的方式表达文章思想。具体到名词性复合结构方面,完整形式通常能更加准确地表意,避免误会,如“泰国国会”就是指泰国的立法机构,而“泰国会”在某些语境下可能被理解为泰国将会怎么样。但是,删略形式在不影响准确性的前提下,会更加符合简约性的要求,使标题更为精炼。我们认为,两岸汉语在新闻标题用语上对准确性和简约性有着不同的侧重,因此出现了对完整形式和删略形式的不同使用倾向。
具体来说,大陆普通话的新闻标题更侧重于准确性,因此相比于常规语言更加倾向于保留完整形式。相反,台湾“国语”在新闻标题用语上更侧重于简约性,所以与常规语言相比更倾向于使用删略形式。除了在整体数量上大陆普通话存在更多倾向于不删略的用例之外,还有两种极端的情况可以进一步说明上述侧重点的差异。首先,对于第一个直接成分高频使用且不存在变调的五音节复合结构,目前并无可知的制约条件能够阻挡其发生删略,但是大陆普通话中的19个此类结构中只有5个倾向于删略。其次,如3.3节所述,理应较难发生删略的存在变调的四音节复合结构,在台湾“国语”的4个考察项中有3个倾向于删略。实际上,这也与我们在整理语料时的直观感受相一致。例如,在台湾地区的新闻标题中,简缩用法更显常见,如“台北市、高雄市、彰化县”等地名可分别简称为“北市、高市、彰县”,而相应的行政领导人员也能简缩为“北市长、高市长、彰县长”,但此类追求简约的用法在大陆地区是比较少见的。
4.结论
基于大规模的新闻语料,我们抽样分析了两岸新闻标题中同音删略的制约机制。本文的研究结果表明,同音删略在新闻标题这一“语言特区”中体现出了与常规语言不一样的机制。首先,相比于常规语言,大陆普通话更倾向于在新闻标题中保留复合结构的完整形式,而台湾“国语”则更倾向于发生同音删略。这种差异是两岸汉语对新闻标题准确性和简约性的偏重不同造成的:大陆普通话偏重于准确性,台湾“国语”偏重于简约性。其次,同音删略的三种制约条件在新闻标题中的等级排序也异于常规语言,大陆普通话是“变调>韵律>使用频率”,台湾“国语”是“变调>韵律≈使用频率”。不过,韵律的作用等级并未出现语体的差异。这表明新闻标题“韵律亲和”特征的作用范围有限,并没有影响到同音删略深层次的制约机制。