词与短语的模糊界限分析
2018-02-28孙旭东
孙旭东
摘要:词与短语的模糊界限表现为两种现象:某一语言形式不是典型的词或短语,出现了“中间地带”;在发展过程中,语言形式在词与短语间变化,转化期间的跨越界限是模糊的。从结构讲,词(主要是复合词)和短语的概念结构有共同之处,都有核心成分与边缘成分,但也有不同之处。可从概念的三个主要功能入手,分析词和短语在归类、推理和叠加方面的不同表现,来确定某一语言成分的属性。
关键词:模糊界限,词,短语,概念
中图分类号:H0;H083 文献标识码:ADOI:10.3969/j.issn.1673-8578.2018.01.002
Abstract: The vague boundary between word and phrase could be understood in two senses: a given expression is neither a typical word nor a typical phrase and there is a “gap” occurred; during the development of language, mutual transition between words and phrases happen and the crossingborderline is not obvious. Structurally, words, particularly compound words, and phrases share similarity with concept, both with core components and periphery components, and also with different performances. The status of an expression could be defined through the analysis of the three functions of concept: categorization, inference and conceptual combination.
Keywords: vague boundary, word, phrase, concept
引言
作為句法范畴的词、短语、句子三个概念,理论上有其各自明确的界定。朱德熙给词下的定义是:“最小的能够独立使用的有意义的语言成分。”[1]而短语是由两个以上的词组成的,也可称为词组。首先词与词素表述的是同一个语言形式,自由词素可以独立成词出现,当一个词与另一个或多个词结合生成新词,词的组成部分才变为词素,因此词与词的结合体可能是词,也可以是短语。这样就需要判断某一语言形式是词,还是短语。对“商品交易”“汽车交易”这两个语言片段可以给出一个模式表达法:“买卖…的行为”把“…”用不同的物品替代就可以组成新的表达方式,我们认为是一个词组。但是“碳交易”是一个词,还是一个短语?从形态上看,它与“…交易”没什么区别,但是这里的“碳”代表6种需要减排的气体,既不是商品,也没有价值,而且“碳交易”并非存在传统意义的货币与物品的交换关系,是获得二氧化碳排放权的复杂整体过程,“碳交易”应该视为词,而非短语。所以“碳”与“交易”关系不同于“商品”与“交易”的关系,前者更紧密。
我们常常会对此类问题感到困惑。再如:“细胞分类”与任何其他事物分类相似,表示按照标准分别归类,由两个词组成一个短语。该短语中的“分类”与“生物分类”中的“分类”意义相同,都含有“分类”的基本含义:按照事物的相同特性和特点归类。但是“细胞分裂”是一个词,这里的“分裂”与短语“国家分裂”中的“分裂”基本含义不同,前者表示细胞变化的特殊过程,不仅是简单的细胞由一个变为两个,还表示细胞核与细胞质分裂两个阶段,并在分裂的过程中母细胞把遗传物质传递给子细胞。而“国家分裂”中的“分裂”指变成两部分或多部分。
研究科技术语本身似乎与研究词与短语的模糊界限没有直接关系,因为一个术语既可以是一个个体词,也可以是一个短语。但是,确定术语时,要考虑其单义性、搭配稳定性、标记概念的单一性等特点,了解一个科技术语是一个词,还是一个短语,能够更快捷地确定术语的身份,即具有词的属性的多个词项结构,如果符合专业性特点,基本可以确定是一个术语,而确定具有短语特性的多个词项的组合是否为一个术语,就需要花费更多精力认真分析和鉴别。
一从词与短语的可分割性看其模糊界限
自然语言中的词都是由词素构成,短语由词构成。词与短语的模糊边界表现为两种状态:1.似词非词,似短语非短语;2.词与短语之间互相变化,跨越界限模糊。前者在具体语境里使用时,人们能够辨别其身份;后者属于历时模糊,词与短语的身份在语言发展过程中转变。
按照朱德熙对词的定义,词的特点可确定为:可以独立使用的、最小的、有意义的。词与短语在不同的语境里身份发生改变。如“产油”是一个短语,因为“产”和“油”都可以独立使用,可以说:“产更多的油”“产出低含硫油”。“产油”可以被认为是“生产石油”的缩略。而“产油微藻”是一种藻类的名称,我们可以将其解释为:能从中提炼出(产出)生物柴油的微藻,作为一个名称,不可分离使用,是一个独立的词。可见同样一个语言组合,会根据所处的语境不同,身份发生变化,词叠加形成短语,短语变为词的一部分。所以对某一个组合,不能简单地定义为词还是短语,需要考虑其语境。
“产油国”是词还是短语?它既像词,又像短语。对此很难下确切的定义,只能给出一个模糊的描述:生产石油的国家。从该词语的基本含义讲,只要在国土范围内有石油生产出来,就可称之为“产油国”。如果按照这个基本语义理解,“产油国”应该是一个短语,等于“生产石油的国家”。但实际应用时,只有石油产量达到一定规模,我们才认为是“产油国”,这个规模是模糊的、不确定的,不同语境、不同的讲话人会有认识上的偏差,但是不会出现颠覆性的差异。虽然日本石油年产量也有50多万吨,但是没有人认为日本是“产油国”。因此在人们认知中,典型的“产油国”很清晰,如沙特阿拉伯、科威特、挪威等,而非典型的“产油国”就边界非常不确定,但是基本共识是存在的。我们现在考察“产油国”出现的语境:世界五大产油国、非洲主要产油国、海湾产油国减产、世界20个主要产油国排行、最年轻的产油国、阿拉伯产油国、第三世界产油国。从上面的几个例子可以看出,“产油国”总与地域、数量、范围等限定词一起出现,也就是说“产油国”在实际使用时需要被限定。在不加语言限制时,讲话人也有预设限定。如“产油国在行动”,这里的“产油国”可以是特指所有被认定为“产油国”中的一些或全部,讲话人预设了所要谈论的国家。因此,“产油国”在汉语中成为一个词,表示“一组石油生产达到一定规模的国家”,符合能独立使用的、最小的、有相对固定解释的语言单位的条件。之所以增加限定词,主要是避免把“产油国”看作普通泛指的短语。endprint
再如“非典型性肺炎”(简称“非典”)也是一个词,特指2003年发生的特殊肺炎疫情,并非除典型肺炎之外的所有肺炎症状。因此,词必须有明确、特定所指,或者特指一个物质或现象,或者特指一类物质或现象。在此,词术语有共性。
另一种情况是某些表达形式或称术语,开始并非词,经过词化过程由短语变为词。但是变化往往不是突然发生的,跟多数事物的演变一样,是一个逐渐转变的过程,或逐渐认识和接受的过程。从量变到质变的界限往往是模糊的。
张晖讲到“细颗粒物”(fine particles, PM2.5)术语产生的故事[2]。开始并没有官方固定的说法,最后确定为“细颗粒物”,指“悬浮在空气中,直径(空气动力学直径)小于或等于2.5微米的颗粒物”。可想,“细颗粒物”在被认定为PM2.5物质之前,它是一个普通短语,可以用来描述任意细微的颗粒物,并不具备词的特征,也不具备科技术语的属性。确定为表示PM2.5后,就完全具有了词的特征。当然,这个术语是经过官方认定而成为具有术语特性的词,还算不上经历了典型的词化过程。赵爱考察了“金字塔”一词的演变,从《海国图志》收录的“极高之古迹”,变为《辞海》收录为“金字塔”[3]。我们知道《海国图志》完成于1842年,比最早的《辞海》版本早出版94年。现代读者会认为“极高之古迹”是短语,但事实上,该表达方式曾经具有词的特点,特指埃及的金字塔。可以想象,在正式接受“金字塔”这一术语之前,两个术语一定会有重叠使用期,在这个重叠期内,“极高之古迹”就会被部分人认为是短语。
“网球选手”,虽然英语是一个词netman,但是汉语更像由“网球”和“选手”两个词组成的短语。从认知的角度讲,“网球选手”在我们脑子里是否形成了一个完整的概念图像?问题出在“选手”,选手没有典型的图像特点和意象特点,任何一个人都可能是“选手”。它与“士兵”“将军”“运动员”完全不同,这三个词会在人的意识中形成清晰的图像,能起到明确分类的作用。而“选手”虽然在汉语里只能被看作一个词,在英语里找与之相应的词都比较困难,只能勉强理解为“player”,或在语义上接近“运动员”,但是缺少了[职业]这个语义成分。而且,我们完全可以用“打网球的选手”“打网球的头号选手”等替代,中间可以插入任意成分。汉语里没有“打网球的场”表达式。
二从词、短语和概念的内部结构看词与短语的模糊边界
词、短语和概念是两个范畴的东西。词和短语是语言存在的形式之一,属于语言形态学范畴,也是句法研究的内容。而概念是人类认识现实事物和状态过程中,在人的意识中形成的对事物和现象的理解和认识,属于认知科学的范畴。词语与概念有着密切的关系,概念要通过词语来表达,词语的作用是表达概念。词与概念之间的关系如何?词可能表达一个概念,也可能不表达一个概念,如感叹词、虚词不表达概念。概念可以通过词来表达,也可以通过短语、句子,甚至语篇来表达。术语必须表达一个概念,否则就没有存在的必要。
如何把词与概念有机联系起来?我们先考察词与概念的结构特点。如“水资源”由两部分组成:水+资源。内部结构为[水[资源]]。从语法上讲,“资源”是核心成分。就修饰关系而言,“水”限定“资源”。再如“微电网”由三部分组成:微+电+网。内部结构是:[微[电[网]]]。从语法关系讲,“网”是核心成分,“电”限定“网”,“微”限定“电网”。词素之间的理据在此不加细说。就上述两个词,所表达的概念结构如何?首先概念一般先于词出现,有了概念才能想到用什么词语来表达,即使假设的概念也是如此。如:“空想社会主义”(utopian)。概念的出现基于对某个事物和现象的意象[4]352。
索伦恰克(Solonchak)认为:概念由多个成分组成,并反映出不同创立时间、不同产生来源和不同语义的历史层次,每个层次都含有比喻义和实义[4]353。概念含有核心成分和边缘成分,或称主要成分和次要成分,核心成分反映概念的典型特点和典型意象。我们在词与概念之间建立联系。如看到“網”这个词,至少有两个意象在我们脑子里:1. 网状的物体; 2. 网格图形。前者是实际存在,后者是对实际存在的符号表示,与语言符号等同。“网”这个词本身也确实代表这两个基本含义。给“网”附加成分后,形成了新的词:渔网、电力网、物联网。这个共用的词素“网”的含义显然在变化,由具体意义,逐步变得抽象。“物联网”甚至看不到“网”的迹象,只有在意象中与“网”有个模糊的联系。无论“网”是具体的,还是抽象的,在认知理论里,“网”是上述三个概念的核心,其他成分都是边界成分。
我们考察这三个词在词典里的定义,就知道这三个概念是如何用语言解释的:
例1渔网:捕鱼用的网。(《现代汉语词典》第7版)
例2电力网:电力系统的一部分,由变电站和输电线路、配电装置等组成。(《现代汉语词典》第7版)
例3物联网:将物体连接起来的网络被称为“物联网”,进一步说,将各种信息传感设备,如射频设别RFID装置、红外感应器、全球定位系统、激光扫描器等种种装置与互联网联合起来而形成的一个巨大网络。(《英汉信息技术大辞典》)
上述定义在解释“网”时,用了“网”“网络”“联网”。在例1中,“网”还带有其基本含义,所指的物体具有网的基本物理形状。例2中的“网”,网的基本形状变得模糊,似乎仍然有电线的交织,但绝非规则的网状结构。例3中的“网”已经完全失去“网”的几何形状,完全变成了概念上的、无形的“网络”,这里用的语言“网络”“联网”的本质是计算机的互联,并且形成网络的媒介不是线条的组合,而是“物”。三个例词中,“网”的概念越来越远离其原始意象,虽然从概念的结构讲,“网”是三个概念的核心成分,但从语义的层面讲,很难说在例2和例3中,“网”还含有核心词义。因此,词的每个成分的重要性和与此相对应的概念不是完全一致的。但是,无论是词本身,还是词所表达的概念,都有一个词的核心语义和概念的核心成分,构成完整的词和完整的概念。endprint
施略克(Schlücker)等考察了德语中A+N结构的复合词和短语,认为在德语和荷兰语中,短语或合成词中的非核心成分所表示的类别往往比核心成分所表示的类别对新的意义的表达更具影响力。如:“altpapir”(waste paper)比纸张更像废物,因此“废物”更具主导地位,“纸”的含义被基本淹没[5]1539。这与我们上面所讲的例3情况类似。
短语的结构所表达的是两个或两个以上的概念,也就是说两个或两个以上的概念同时出现后,没有形成一个新的概念。如“网格大小”内部结构应该是([网格][大小]),是一个由“网格”和“大小”两个词即两个独立的概念组成的名词短语,之所以称其为两个词,因为每个词都表达了一个概念:1.“网状性的格子”(物体)或“网状性的格子图案”(符号),核心是“格”;2.“面积”,其中“大”为核心,“小”起辅助作用,因为表示尺度的中性“大”,即可表示“大”的值,又可表示“小”的值。之所以说“网格大小”是短语,因为其没有明确所指,“网格”可能大,可能小。
表面上同样结构的“网球场”([[[网[球]][场]]]也是由“网球”和“场”两个词组成的,这个表达给人一个清晰的图像,概念的核心是“场”,“网球”为边界成分。无论是在任何一个地方,网球场的基本形状、大小、设施都应该是相近的。这三个词素的结合,表达了一个完整独立的概念,有明确的所指,是一个词。
不同语言之间,词与短语不是一一对应的,同样一个概念,在一种语言可能用一个词来表达,而在另一种语言而用一个短语来表达。如汉语与英语的词的形态有所不同,物理构成成分也不同。一般来讲英语的词内部结构比汉语词的内部结构简单。举例说明。“生物安全”(biosafety),英语词由一个黏着词素和一个自由词素组成:bio+safety,而汉语由三个自由词素组成:[生+物]+安全。“纳米立方体”(nanocube),英语由两个自由词素组成nano+cube,而汉语由这两个自由词素和一个黏着词素组成:纳米+[立方+体],多了一个词素。“生物信息学”(bioinformatics),英语由两个黏着词素和一个自由词素组成:bio+informatic+s,而汉语由两个自由词素和一个黏着词素组成:生物+信息+学。
从以上三个例子分析,英汉词内部结构有所不同,汉语含有更多自由词素,由此引起的问题是,我们在判断汉语的词串是词还是短语时需要花费更多的精力。自由词素出现的越多,越有可能是短语。语言所表达的概念更具普遍性(universality),而语言形态更具独特性(particularity)。
在编纂词典时,也许是因为词与短语存在的模糊性,有时两者的界限不清,把握不准确,发明了“词条”的说法。词条掩盖了词与短语的界限,成为一个含糊其辞的表达方式。作为工具书,无论收录的是词还是短语,都不影响词典的使用。比如,科技术语词典收录的词条,并没有在意一个术语是词还是短语。当然在选择术语时,如果是一个词标记某一特定专业领域的一种物体、现象、状态、行为、特性、过程等,这个词一定是一个术语,有一个明确的所指;对明显具有短语特性的表达方式,需要鉴别是否有必要列为一条术语。如,我们列出“磁性”和“物质”两个词条,是否有必要再单列“磁性物质”?然而,“磁性地层学”“磁性气体动力学”等表达式是显而易见的术语。
不论从语法的角度讲,还是从语义表达的角度讲,词与短语在语言使用中的表现是不同的,不应该将两者混淆。
虽然结构主义者(constructionist)认为复合词与短语的句法结构是相同的,但是这只是从词与短语的结构成分之间的理据而做的解释,如果考虑与所表达的概念的关系,显然词与短语的结构就不同了。
三从概念功能看词与短语的模糊边界
概念的功能有三个,归类功能、推理功能和概念叠加功能。所罗门(Solomon)认为,归类功能使新旧知识联系起来,使用以前的知识,解释新的事物。新的事物也能对概念起到更新作用[6]99。比如我们有“二極管”,在已有知识“发光”的基础上,组成新的概念“发光二极管”,以此,随着技术的进步,又产生了“有机发光二极管”“有源矩阵有机发光二极管”等,新的概念都基于旧的知识而产生,如“有源”“矩阵”“有机”“发光”“二极”都是原有知识。也就是说,即使科技再发展,也不会在语言中出现一个与旧的知识毫无关系、无法推敲的新名词。问题是,这些旧概念的累加是形成了一个新的概念,还是维持多个旧概念的独立存在?这就是词与短语的区别所在。如:“二极管型号”没有形成一个新的概念,因为“二极管型号”没有发挥归类功能,即“二极管型号”并非型号的一种,“二极管”和“型号”仍然是两个独立分离的概念,合成的语言形式是短语,而非词。因此,具有归类功能的语言组合是词,不具有归类功能的语言组合是短语。术语当然也应该具有归类功能。
概念的另一种功能是推理功能,它通过理解类别特性来预推行为。推理功能本质上也归结于归类功能。如果把某种物质归类为“绝缘体”,我们就不怕其导电,或可以用这种材料制造阻电产品。因此这样的理解会影响我们的行为,起作用的因素就是概念归类的属性,也就是所指物体的特性。“绝缘体”这个词本身的含义也可解释为:不发生接触的物体,引申为:不导电的物体。而由“流体”我们可以推断出:无固定形状、可为液体和气体的物质,从“流动”我们推断出:连续不断地移动位置。但是“流体流动”不是一个整体概念,无法从整体概念的角度推理。因此,能够从整体概念角度实现推理功能的语言组合是词,无法从整体概念角度推理的语言组合是短语。
有时我们也会难以确定一个语言组织是否具有推理功能,也就是对数个词的组合是词还是短语难以确定。如:“改革开放”,按照该结构的本义,它属于两个独立的概念:“改革”和“开放”,两个词都可以独立使用。当它们同时出现时,我们更多地把它们看作一个整体的过程,有词化的倾向,两个概念有同化的趋向:改革的主要内容是开放,开放是改革的主要措施,推理为:新的体系和制度确立,旧的体系和制度改变。endprint
例4中国改革开放开始于1979年。
例4中,“改革开放”是一个整体事件和整体概念,确定为词更为合理。
概念的第三个功能是概念叠加功能,这一功能对科技术语的产生非常重要,其意义在于把两个或多个概念叠加形成一个新的概念。就词与短语的区别而言,我们感兴趣的是概念叠加后,是形成了新的概念,还是仍然维持原来的概念独立存在?如果是前者,语言形式就变成了词,如果是后者,语言形式仍然是两个或多个短语。所罗门举了两个例子:“斑”与“马”两个概念结合形成新的概念“斑马”,这两个词素结合也形成了一个新词[6]103。那么“斑马”与“厩”结合,是否形成了新的概念“斑马厩”?虽然看起来“斑马”和“斑马厩”的构成理据是一致的,都是由“厩”附加修饰成分构成,但是,在汉语中有“马厩”这个词,那么“斑马厩”与“马厩”是否有类别的不同?如果承认斑马是马的一类,而且能饲养马的房子,也肯定可以饲养斑马。因此,可以推断出两种情况,其一,语言中有了“马厩”这个词,“斑马厩”这个表达式完全没有必要产生;其二,即使在特殊语境里需要“斑马厩”这个说法,也只能认为它是一个短语,因为“厩”可以替代“马厩”,所以“斑马厩”可以解释为“斑马马厩”,与“马厩”无本质区别,并未形成新的概念。
概念叠加形成新的概念与叠加概念的数量无关,也就是说构成的新词与词素的多少无关。如:我们用“人控交会对接”表达一个连续的过程,是一个词,没有异议。但是如果只出现“交会对接”,我们或许会认为表达了动作的两个阶段:“交会”和“对接”。如果这样认为,就应该将其看作是短语,而不是词。如果把“交会”“对接”看作连续不断的一个过程的两个阶段,就更接近于词的特点。
再如“冷冻技术”是任何降低温度到零度以下的技术,没有特指某个特殊的冷冻过程,可以视为短语。也可以勉强视为词,因为类似“技术”“系统”“方法”“现象”等词有时并不表示核心含义,虽然其处于中心词素的位置。但是“人体冷冻技术”特指一个非常复杂的冷冻过程,并暗含冷冻体未来可能复活等因素。可见修饰概念成分的增加,起到了区别性特征的细化的作用,增加了新概念的概念固化程度,驱动言语短语词化为词。但是成分增加到一定程度,难以维系词结构的平衡,就会又变为短语,如:“现代人体冷冻技术”“古代人体冷冻技术”就有短语的特征。假设“现代人体冷冻技术”指世界公认的一套冷冻技术,“古代人体冷冻技术”专指公认的一套冷冻技术,那么勉强还可以认为两个表达式都是词,但事实是这样的共识和唯一性尚不存在。在科学界,每当前缀是“现代…”往往是对一系列事物的综述。
四结语
词与短语的模糊界限是一个具有实际意义的话题,不仅能帮助我们确定词和短语的身份,而且能帮助我们理解语言所表达的概念,对理解科技术语的形成与演变机理也有一定的指导意义。本文首先分析了词与短语的模糊边界的两种情况,即时模糊与历时模糊。接着从内部结构和功能两个层面,将词和短语与所表达的概念联系起来,通过这种联系发现词与短语的模糊界限。复合词与概念的结构相同,都有核心成分和修饰成分,只不过有时核心成分与修饰成分并不是一一对应。把词、短语与概念结构特点相比较,分析词与短语的模糊界限。其次,通过概念的三个主要功能,分析了词与短语的不同表现。具有归类功能的语言组合是词,不具有归类功能的语言组合是短语;能够从整体概念角度实现推理功能的语言组合是词,无法从整体概念角度推理的语言组合是短语;概念相加,形成了一个新的概念即为词;概念相加,仍然是各自独立的概念的累加,没有形成新的概念即为短语。
参考文献
[1] 朱德熙.语法講义[M]. 北京:商务印书馆,2000:11.
[2] 张晖.科技新词,就在你身边——从首批科学技术新词发布说起[J]. 中国科技术语,2014(5):57-59:58.
[3] 赵爱.近现代外源科技名词称名演变研究——以《海国图志》、《辞海》(民国版)、《辞海》(90版)为例[D].鲁东大学硕士论文,2013:38.
[4] Solonchak T, Pesina S. Concept and Its Structure, 2nd Global[J]. Conference on Linguistics and Foreign Language Teaching, LINELT-2014, Dubai, December 11-13 2014, Procedia Social and Behavioral Science, 192 (2015):352-358.
[5] Schlücker B,Plag I. Compound or phrase? Analogy in naming[J]. Lingua, 121 (2011):1539-1551.
[6] Soloman K O, Douglas L. Medin & Elizabeth Lynch. Concepts do more than Categorize[J]. Trends in Cognitive Science, 1999(3):99-103.endprint