APP下载

论“词源的递归生成机制”
——词源的可计算性及其形式理论

2019-03-04杨光荣

关键词:词源音义谱系

杨光荣

(四川大学 语言学系 /中国语文现代化协同创新中心,四川 成都 610064)

2016年、2017年两次秋季学期,笔者在给四川大学文学与新闻学院汉语言文字学、语言学及应用语言学、国际汉语教育专业以及四川大学宗教研究所的博士研究生讲授“汉字汉语形音义关系史”课程中,对“形式词源学”的认识更为系统、更为深刻了。笔者在课堂讲授中,提出词源的生成遵循数学递归法则的思想,对既往已有词源“音义位”“形音义位”概念的深化与术语的明确,对已有“同源字词”概念与术语的深入,对已有词源局部函项表达式“核义(类义)”与“核音(类音)”的统一处理,对“词源函项”概念与术语的提出与探讨,对形式词源学与分析语法的统一性,对词就是句、概念就是命题认识的深入,等等,这些创获均促进了形式词源学与分析语法的发展;同时也把既往词源是分析语法的起点单位的认识更加深化了,收到了教学相长之效。

本文拟在已有“二维词源学”这一形式词源学与“分析语法”这一形式语法研究的基础上,从人类对世界感知的象似性、物理学家与哲学家马赫事物是感觉的复合、数学的递归法则等出发,把课堂上所讲授内容以及既往业已形成的有关形式词源学的研究积累,做一较为系统深入的总结,梳理词源、词源基因单位“音义位”以及“形音义位”及其词汇表征同源词、同源字词的递归属性及其遗传代际,探讨词源的形式化与形式计算技术等节点问题。

一 词源学的研究对象与基本单位

(一)词源学属于词汇学的分支学科

音系学、语义学、词源学是词汇学的三门下属分支学科,词汇学所包括的分支学科如下所示:

词源学如同音系学、语义学一样,具有基本单位。这三门学科是处于同一层次的,词源学是与音系学、语义学并列的一门学科。音系学又包括音位学、音节学,其研究对象是语言的语音单位及其组合法则,其基本单位是音素、音位,其运行单位是音节及其语流;语义学的研究对象是语义及其组合法则,其基本单位是义素、义位,其运行单位是义项及其组合法则;词源学的研究对象是音义位及其组合法则,其基本单位是通用的“音义位”以及汉语的“形音义位”,其运行单位是“词源”。词源学又以音系学、语义学为基础,因为音义位是以音位、义位为基础的。

(二)词源的抽象及语种类型与词源学的相应类型

词源可以是一个抽象概念与术语,是指人类自然语言词汇单位的生成机制,即通常所说的构词理据。词源也可以是指某一种具体语种的词源现象,即该语种的构词理据。如此,词源可以区分为如下两类:

“抽象词源”也称之为“共性词源”或“普遍词源”或“通用词源”,是指蕴含于人类自然语言或语种中的词汇单位滋生的共性法则,这是本文研究的立足点与归宿。“语种词源”是指具体语种的词源现象。本文的研究策略是以汉语这一语种的词源现象为具体材料,从中提炼出具有普遍性或通用性的共性词源法则体系。这种由词源共性法则所构成的学科叫作“形式词源学”。形式词源学就是具有普遍性或通用性的词源学分支学科,具有广泛的适用性,不受语种的限制,是词源研究走出经验研究的藩篱,初步走上成熟发展道路的标志。形式词源学有一个最重要的特征,即理论法则的完备性、自洽性与可推导性。可见,词源学可以区分为以下两类:

“语种词源学”就是“非形式词源学”,是指具体语种的词源现象而言的。语种词源是词源共性与词源个性差异的统一体。

(三)词源学的演化类型

学科的演化,一般地说,遵循从经验科学到形式科学的演化历程,这是由研究从经验到形式的演变所决定的。词源学的发展也不例外,也会或正在经历从经验词源学到形式词源学演化的历程。形式词源学就是指采用数学、数理逻辑的理论与方法来处理自然语言词源现象的一门词源学学科。自然语言的词源之所以能被形式化地处理,是因为自然语言也是一种符号系统,与数学、数理逻辑都属于一种符号计算系统。要指出一点,数学、数理逻辑的符号是一种外延符号,自然语言符号及其词源符号属于外延符号与内涵符号相统一的复符号。如此一来,符号可以区分为下列两类:

形式词源学与经验词源学的研究对象与基本单位是相同的,即二者的对象语言是一致的。不同的是,形式词源学的研究手段是形式表征及其推导,其元语言是约定的形式语言,没有歧义;经验词源学的研究手段是身心体验及其经验描述,其研究手段是未经约定的自然语言,有歧义性。词源学按照演化历程可区分为下列两类:

(四)词源学的对象语言与元语言

要从事研究,必须具备两个条件,一个是要明确所研究的对象,一个是用来对对象加以研究的元语言工具。本文的研究对象是立足于汉语的词源现象,其用来研究的元语言工具则为“形式词源学”。形式词源学的“形式语言”,我们采取从自然语言中加以提取并约定的方式,这与分析语法的形式语言的制定策略是一样的,均来自于“华沙语义学派”“莫斯科语义学派”对元语言制定的启迪。形式词源学自“二维词源学”[1](原来叫作“二维度词源学”,现在改为“二维词源学”,更符合数学要求)发轫以来,迄今已取得了长足的进展,本文的目标是进一步完善形式词源学,推动词源学学科的系统深入发展,使之成为语言学学科的基础部门,并广泛应用于心理学、美学、文学理论、人类学、自然语言处理等领域。

(五)词源的属性及其递归机制

研究自然语言,包括自然语言的词源,首先要弄清其属性,然后才能做到对症下药,做到有的放矢。

1.自然语言的属性——离散性、模糊性、随机性、递归性、层次性注参见:冯志伟.语言与数学[M].北京世界图书出版公司,2011.冯著较早系统地总结了自然语言的7种属性,笔者在本文中对自然语言5种关键属性之间的关系做了探讨,并予以排序。可见,“层次性”是自然语言的基本属性之一,但不是第一位的基本属性。不论传统语法还是结构主义语法都讲究层次性。层次性不是传统语法与结构主义语法的分水岭,而是二者的共性。[2]及其在词源滋生、运行中的作用人类对世界进行认识,首先要把世界予以离散化,即把对象切分为一个个可以历数的单位,这是自然语言的第一基本属性,学术界一般称之为“离散性”。人类对世界进行离散切分,其最方便的切分工具为“音义”,可以称之为“音义切分”。音义切分是自然语言切分世界的普遍方式,如果一种语言又有文字,那么该切分又增加了一种切分方式,即“形音义切分”,如此,对自然语言的离散切分方式可做如下分类:

“音义切分”,无文字的语言都是音义切分,即使是有文字的语言也有纯音义切分的成分,例如汉语中用汉字拼写的拟声词即是。“形音义切分”,对于有文字的语言来说,形音义切分成分占多数,汉语小篆系统的形声字占80%,这些形声字均属于形音义切分。即使是象形字、指事字、会意字也是形音义切分,与形声字不同的是,这三类字自身没有标音成分。看来,形音义切分又可以分为如下两类:

汉语的转注字属于形音义切分。假借字,如果从开始时的非假借说起,属于形音义切分;如果从假借说起,属于音义切分。“字形切分”,例如现代汉字“它”“她”“他”三字属于纯字形切分,即书面语的切分、区分,在口语中没有区别。

一般认为,汉字具有“形、音、义”三要素,这不是世界上独一无二的,凡是表意字形,都具有“形、音、义”三要素。即使是英文这样的拼音文字,也具备形、音、义三要素。但是目前的“汉语拼音”则不标义,属于纯标音文字,如此,文字可以区分为下列类型:

“文字”可以按照字形描绘意义与否,区分为“表意文字”与“拼音文字”两类。表意文字中又可以按照字形是否有“标音”成分区分为“标音文字”(例如汉字形声字)与“非标音文字”(例如汉字象形字、指事字、会意字)。拼音文字按照是否有标义成分,可以区分为“标音义文字”(例如英文)与“纯标音文字”(例如汉语拼音)。要区分一点,“表意”是指用“象形字形”“表意字形”摹写事物或拼合来表示事物以显示意义;“标义”是指用“非象形字形”“非表意字形”即“字母”来约定以显示意义。汉字的“字形”是“表意”,英文的“字母形”或字母形组合是“标义”。汉语拼音与英语字母,虽然都属于拉丁字母系统的拼音文字,但是汉语拼音是纯标音文字,即汉语拼音不标义;英文字母或字母组合则是既标音又标义。

从“音义切分”世界的角度来看,英文切分世界属于“音义切分”;汉语拼音是“纯音切分”,这是汉语拼音不能区分同音词的原因所在。汉字切分世界,与英文切分世界一样,都属于形音义切分,这是汉字能区分同音词的原因所在。要想设计出一种适合于汉语国际传播的拼音文字,能够设计出一种类似于英文既标音又标义的拼音文字才是上策。

世界是连续的,对世界予以离散切分,会产生切分所得单位“词(音义单位)”之间的边界不分明现象,这是自然语言离散切分具有模糊性的原因。具体讲来,离散性就是以“音义”记录对象,把对象加以分离,由于音义单位的模糊性,会导致切分结果的模糊性。

随机性,就词源而言,音义匹配的选择机制有随机不确定的一面,也有确定性的一面。一旦音义单位进入递归程序,递归性便保障了音义单位确定性的一面。递归性即为确定性,是对随机性的约束。语言的音义开始组合,由于内涵音义位具有意向性,会促使音义位沿着一定的方向或几个确定的方向滋生下去。递归是一个连续性的滋生过程,其滋生至少会出现两次,因此,递归至少有两个层次。从理论上讲,递归是无限的,因此其层次也是无限的。层次性是递归性的天然的附属属性,没有递归性就不会有层次性,有层次性就一定会先有递归性。递归是连续与离散的统一体,是共性与个性的合一。别异才会有个性,连续才会有共性。层次性是一种别异的属性,层次性是别异所要求的,是词源滋生中层次性产生的关键因素。

语言就是认知对象并予以记录对象的生物符号,是把连续体加以离散化的工具。连续体是没有边界的,要加以离散,离散便有边界模糊,音义匹配便产生随机性与确定性,递归便产生,递归连续产生共性(遗传),其别异便产生层次个性(变异)。就自然语言的词源滋生而言,自然语言的属性可以按照先后顺序如下排列:离散性→模糊性→随机性(不确定性)→递归性(确定性、无限性、共性遗传、谱系性)→层次性(变异性、区别性、个性差异)。

2.自然语言递归的深层基因——“递归音义基因”,词源学的基本单位词源“音义位”,汉语同源字词的基本单位“形音义位”

从整体上看,自然语言是一个递归生成的系统,这是自然语言具有可计算性的根本原因所在,也是自然语言能够数学化并建构形式理论的根本基础。分析语法这一形式语法就是建立在自然语言的递归属性之上的。

自然语言的深层递归机制何在?自然语言是人类的生物符号,具有物理属性(例如语音)与生物物理属性(例如语义),因此,自然语言的递归属性一定具有物质性的依托。那么,自然语言的深层递归机制其物理依托与生物物理依托何在?它就发生在自然语言的深层基因上,即发生在“音义基因”上,因为音义基因是构成自然语言的普遍深层基因单位,从这一点出发,自然语言的“音义基因”也可以称之为“递归音义基因”。

自然语言的“音义基因”是一个词源学概念与术语,也可以称之为“音义位”。它与语音学、音位学的“音素”“音位”概念与术语不同,音素、音位是纯粹物理的或音系的,不涉及语义;它与语义学的“义素”“义位”概念也不同,“义素”“义位”是纯粹的语义学概念与术语,不涉及语音。这些概念与术语都是出于研究者的研究策略所创造的。同样地,词源学的“音义位”是一个“音”与“义”的有机融合体,在听觉上、认知上是浑然一体的。“音义位”仅仅是一个元语言概念与术语,不得不采用离散组合“音义位”术语来分析对象语言的音义合一体单位。

“音义位”所包含的“音”,可以是“音节”整体,也可以是音节的构成部分“声纽”或“韵部”音段,也可以是声纽的“音法”[注]参见:朱晓农.音法演化——发声活动[M].北京:商务印书馆,2012.“音法”术语是学者朱晓农提出的。清代学者戴震在《转语二十章序》一文中提出“位”的术语,这里,笔者参照朱晓农的“音法”,结合戴震的“位”,提出“位法”,以便与“音法”相配。[3](清浊、送气不送气、塞、塞擦、鼻、颤、闪、边、擦等)、“位法”(双唇、唇齿、舌头、舌上、舌根、喉音等)。“音义位”所包含的“义”有“核义”与“类义”,从逻辑学角度看,“核义”相当于“内涵义”,“类义”相当于“外延义”。如此,词源的音义位可以区分为“核音义位”与“类音义位”,或“内涵音义位”与“外延音义位”,这是词源音义位的属性分类。

汉语的同源字词,是指其字形与其所记录的词的音义具有谱系关系的一组词。由于汉字的表意性质,汉字的字形与其所记录的词的初始意义即本义发生了表达与被表达的直接联系,因此字形的滋生与词的音义的滋生便发生了滋生的联动关系,这就产生了汉语的“同源字词”。

“形音义位”就是汉语同源字词的基因单位,是字形、词音、词义三者的融合体。它包含的“形”有“内涵形”“外延形”,包含的“音”“义”,其内涵与边界一如“音义位”,如此,汉语同源字词的“形音义位”也可以区分为“内涵形音义位”与“外延形音义位”两类,这是汉语同源字词形音义位的属性分类。

要指出一点,“内涵”与“外延”原本是西方形式逻辑的概念,后来发现和汉语词源学的“核义”“类义”概念与术语具有概念的相通性。词源基因单位“音义位”与汉语同源字词基因单位“形音义位”,由于“音义位”与“形音义位”的融合性与递归遗传性,它们便获得了内涵与外延的相应属性。

词源的递归运行机制——“音义位”递归地生成,汉语同源字词的递归运行机制——“形音义位”递归地生成。词源“音义位”与同源字词“形音义位”的运行,如同“音位”“义位”,也是遵循一定的法则的。词源音义位与同源字词形音义位的运行法则都是递归。词源的递归属性是生物的先验的机制,音义位的递归法则,就是词源及其词汇表征同源词的递归法则;形音义位的递归法则,就是其词汇表征同源字词的递归法则。

二 词源的静态结构及其集合论模型,词源“音义位”及其遗传与变异功能

(一)词源的静态构造

词源是由音义位所构成的。词源音义位的静态构造,可以表达为下列集合论模型:

音义位=(核音义位,类音义位)

“核音义位”与“类音义位”是词源音义位的通用组成成分。核音义位、类音义位,共同组成音义位,“词源”就是由音义位所组成的。

(二)核音义位与类音义位在词源滋生中的功能

在自然语言中,词源是一个具有滋生能力的单位,词汇的产生,就是词源不断地滋生的结果。词源就是自然语言的基因单位,自身具有结构:核音义位是词源的遗传成分,其功能是保持词源即音义位及其表征单位同源词的连续性、谱系性;类音义位是词源的变异成分,其功能是使词源即音义位及其词汇表征同源词具有离散性、区别性、变异性,以便于同源词记录具有连续性的对象而不至于混淆,有利于人们对同源词的分辨。由此看来,词源及其词汇表征同源词就是连续性与离散性的统一体,词源的核音义位与类音义位就是同源词连续性与离散性的内在机制。词源是词汇的深层基因单位,词汇是词源这一基因单位的表征单位。因此,词源学是词汇学的基础。

三 词源音义位的动态组合模型——递归函项及其组合法则——属性制约法则

(一)词源音义位的动态组合模型——递归函项

词源音义位是由核音义位与类音义位两部分所组成的,其构造为函项式:

词源音义位=核音义位(类音义位)

核音义位属于内涵音义位,类音义位属于外延音义位,词源音义位的这种逻辑属性有重要的作用,是形式词源学基础理论的重要组成部分。

词源函项与概念函项“概念=内涵(外延)”,如果撇开“音”的因素,它们具有相同的逻辑属性。

我们在前面提到,“词就是句”,“概念就是命题”。从“概念函项”出发,结合“音”的因素,就是“词基因函项”。这是自然语言的两大基础——逻辑基础与基因基础。词源函项“词=内涵音义位(外延音义位)”映射为“词函项=内涵音义(外延音义)”。概念函项映射为“命题函项=谓词(主目)”,结合“音”的因素,可以映射为“句法函项=内涵词(外延词)”。这种以概念函项为起点,映射为词基因函项、词函项,再映射为命题函项、句法函项的多层次映射关系,使我们看到了逻辑是自然语言的终极基础。由此看来,亚里士多德逻辑是传统语法的基础具有合理性,同时也看到词源作为语法的初始单位也具有逻辑基础。古希腊人把词源列为语法的组成部分是站得住脚的。

(二)词源音义位的属性制约法则及其机制

1.词源的属性制约法则

词源内部的内涵音义位与外延音义位,虽然共居于同一词源之内,但并不是同类型的组成单位,二者在属性上分别属于不同的性质,起遗传作用的成分叫作“内涵音义位”,起变异作用的成分叫作“外延音义位”。其组合机制是内涵音义位与外延音义位的属性制约法则,即内涵音义位对外延音义位具有一种制约关系。我们把这种制约关系叫作“词源的属性制约法则”。

这种制约关系属于属性制约,即两个单位之间是异性相结合。如果两个单位是同一属性,则这两个单位会相互排斥,这就叫作自然语言符号的“同性相斥异性相吸”现象。这一自然语言单位的属性制约法则,其作用是一以贯之的,从词源层次一直贯穿到句法领域。

2.词源内涵音义位与外延音义位属性制约法则的深层机制——“适配法则”

词源的内涵音义位与外延音义位之间,具有一种内在的适配机制,我们把这种机制称之为“适配法则”。“适”就是纵向的对应之意,“配”就是横向的配合之意,适配法则的深层,隐含着数学机制,即集合论之间的对应关系。

3.词源音义位的适配形成“词源函项”

词源音义位是一个音义融合单位,在感知上是浑然一体的,难以区分出音与义。词源的音义位适配,就是制约,在纵向上表现为集合之间的对应关系,如下所示:

在词源音义位初始结合之后,词源音义位就进入滋生过程。在词源音义位的滋生过程中,词源的核音义位映射在该词源的类音义位上,形成新的词源函项,表达如下:

从数学上说,“核音义位”为函项关系,函项关系属于一种制约关系,它约束自变元的生成结果。“类音义位”代表一种新的物象,这新的物象被注入遗传成分即核音义位,已有的核音义位与新的类音义位的融合,即成为新的同源词。

核音义位与类音义位的组合,是遵循词源音义位适配法则的。适配法则与数学的优选法,都属于数学法则,与数学上黄金分割率的精神非常相似。要指出一点,词源的适配法则,是自然语言词源符号内部的符号之间的对应,不是数值的对应。

4.词源音义位适配法则的象似性认知机制

词源音义位的适配,从认知上讲,就是象似性适配,即“意象”适配“物象”。象似性适配还可以表达为集合论之间的映射,如下所示:

可以写成意象性函项式:

意象(物象)

这一函项式,又可以映射为词源函项式:

这就是说,词源音义位的适配认知机制,是来自于人类象似性认知的适配法则。象似性适配就是一个象似元函项“意象(物象)”。象似元的背后,便是大脑的神经元。象似元就是一个认知单位,从人工神经网络的角度看,是对大脑神经元的模拟。在目前尚未揭示出人类自然语言滋生的脑机制之前,象似元是一个可行的研究的出发点。

(三)人类认知的象似性

1.人类象似性认知的多层次嵌套

同一个物象,可以形成多层次的意象,这多层次的象似性认知映射为相应层次的词源音义位。这是词源具有层级性的原因。象似性认知的层次性如下:

(意象1(意象2(意象3,…,意象n(物象))))

“意象1”概括度最高,依次次之。

词源的分类是意象类型,同源词的分类也是意象类型,即“核音义”类型。“(意象1(意象2(意象3,…,意象n(物象))))”可以映射为“(核音义位1(核音义位2(核音义位3,…,核音义位n(类音义位))))”,同源词的层次嵌套性就是这样形成的。

“意象”在词源上形成内涵音义位,在逻辑上形成内涵;“物象”在词源上形成外延音义位,在逻辑上形成外延。可见,从象似性认知层面来讲,语言学的词源与逻辑学的概念具有同源性,这也是古希腊亚里士多德的形式逻辑是传统语法的逻辑基础的原因。即使是德国数学家弗雷格建构的现代数理逻辑,也与语言学具有同源性。

2.象似性的类型

象似性可分为视觉、听觉、味觉、触觉以及联觉等单项象似性与合成象似性。音是来自于听觉,义则来自于听觉、视觉、味觉、触觉等管道。象似性可分为如下类型:

语音作为象似性的来源之一,也可以形成意象,其类型如下:

“音象”就是“语音意象”的简称,音象的其他下位概念以此类推。在汉语同源词的滋生中,由“非合成音象”所构成的“音义位”,不列入词源之列,即“四声别义”不作为词源现象。由“音段音象”与“音节音象”所形成的音义位才属于词源的范围。

(四)词源音义位的语音物理分布异位法则

词源音义位的核音义位、类音义位,从理论上说,既可以分布于语音中音节的声纽音段上,又可以分布于音节的韵部音段上,还可以分布于音节整体上。但是,词源核音义位,或类音义位,不可以单独同时分布于同一个音节的声纽音段与韵部音段上,即是说,如果词源核音义位分布于同一个音节的声纽音段上,该音节的韵部音段就不可以与具有核音义位的音义位适配了;反之亦然。可以表达如下:

a.声纽音段-核音义位(韵部音段-类音义位)

b.韵部音段-核音义位(声纽音段-类音义位)

c.音节-核音义位(0)

如果核音义位是分布于整个音节之上,类音义位就变成了黏着在音节上的“浮游类音义位”,“0”表示“类浮游音义位”,其区别性就要依靠语境来区分了。自然语言的区别性,包括词源的区别性,一般来说有两类,一是“语境区别性”,一是“非语境区别性”。由此出发,词源类音义位也可以分为如下两类:

因此,同源词的音段,如果从谱系角度划分,可以分为如下两类:

以上“非同源音节”“同源音节”可以表示为函项式:

a.核声纽(类韵部)

b.核韵部(类声纽)

c.核音节(0)

如此看来,词源的“同源音”类型,就是“声纽词源”(声纽同源音)、“韵部词源”(韵部同源音)与“音节词源”(音节同源音)三种。

(五)词源音义位的属性变换

词源的核音义位与类音义位的属性是可以变换的。词源音义位虽然可以区分为核音义位与类音义位,但是二者之间是可以变换的,即在一定词源语境条件下,核音义位与类音义位之间存在着属性变换关系。这一变换的条件就是“词源语境”。

词源语境,类似于句法语境,因为词源的构造也是函项结构,即“核音义位(类音义位)”,这与句法函项在构造上是一致的。如果词源音义位在未进入词源函项之前,即处于孤立状态条件下,词源音义位的属性是一个属性值域(音义位),既可以是内涵性的,又可以是外延性的;一旦词源音义位进入词源函项“内涵性(外延性)”的语境中,该音义位便获得了确切的属性值。词源音义位在同一个词源函项中,其属性是不可以改变的。

(六)词源音义位的波动性、三维性、最优点

词源音义位具有波动性,这一方面来自于音位的物理波动域与听觉上通解度的约束机制;另一方面来自于义位(意象成分)的心理波动域,二者合成了“音义位”的波动性。“字词源”的“形音义位”也具有波动性,“形位”的视觉性制约“形音义位”的波动性,增加稳定性。“物象”具有相对稳定性,许慎540个“部首”是对物象的分类,朱骏声883个“声母”是对意象的分类,意象是内涵性的,物象是外延性的,外延域随内涵域大小而范围变化,物象随意象大小而范围变化。

词源的音义位制约,是一种“三维制约”,可以表示为:

(音位,义位,音义位)

即是说,语种词源的形成,要受到语种的音位、义位与音义位三种因素的协同约束。语种不同,这种协同约束会有语种差异。无文字的语言,其词源音义位的制约都属于三维制约。

对于有文字的语言来说,例如汉语,由于汉字的表意性质,“词源的音义基因”就变成了“字词源的形音义基因”,字词源的形音义基因是一种四维制约:

(音位,义位,形位,形音义位)

由于汉字的表意性,在形成“形音义位”时,字形的选择会依据与“义位”适配的原则进行,汉字中的“先起本字”与“后起本字”都遵循这一原则,因此,字词源形音义位适配的四维约束也可以化归为词源音义位的三维适配。

词源音义位适配有最优点,这就是音义波动域的中心,核音义位就是音义位波动域的代表点。核音义位自身就是一个最小域波动点,可以称之为“最小波动域”。

(七)词源复杂函项是一个多峰嵌套函项

词源滋生是一种目标函项。“核音义位”这一象似性单位,自身就是一个多层嵌套函项。一组同源词多到17个、18个,是由多峰函项形成的;如果一组同源词仅有2个,这就形成单峰函项。

(八)核音义位的遗传代际与类音义位的边界模糊度

“核音义位”这一象似性单位的离散距离有远近,近的离散核音义位,谱系关系近,词源谱系关系有代际之分。如果一组同源词多到17个、18个,就意味着该同源词的遗传距离要大于2代。

词源类音义这一象似性单位,没有代际之分,但是其边界有模糊度。同源词系联中同源词的两属情况就是这样形成的。

四 词源的动态运行词汇表征——同源词及其与近义词、多义词的关系,同源词的公理化推导

(一)同源词与近义词的非谱系关系

1.同源词与近义词分属不同类型

同源词,就是具有亲缘音义位的一组词。“亲缘音义位”,就是指同源词中所共有的“核音义位”成分,这是判定同源词的唯一标准,近义词不是同源词。

这里要指出,同源词是就谱系关系(音义亲缘)而言的,近义词是就类型学关系(外延义类型或内涵义类型的相近与非相近)而言的,二者之间构不成同类项关系,二者分别属于不同的系统。从逻辑上讲,同源词与非同源词构成对待关系:

近义词与非近义词构成对待关系:

2.同源词谱系字形与非谱系字形的类型

如果按照文字字形是否具有谱系关系来划分,同源词可以区分为“谱系字形同源词”与“非谱系字形同源词”,如下所示:

“同源词”都是指其音义位具有亲缘关系的一组词,这是一个默认的定义。“谱系字形同源词”与“非谱系字形同源词”,分别指同源词具有谱系字形与非谱系字形的同源词,谱系字形同源词也可以称之为“同源字词”。

谱系字形同源词(同源字词)的遗传基因是“形音义位”,非谱系字形的遗传基因是“音义位”,这是二者的根本区别。从时间上讲,同源词是汉语史前时期的产物,同源字词是汉语历史时期的产物,同源字词是同源词的延续。

(二)多义词与同源词的联系与区分

“一词多义”的性质,属于共时词音记录历时谱系义项,即是说,“一词多义”现象,是指一个共时词音容纳多个历时谱系义项。一词多义的“义项”之间具有“本-引关系”,这是一种意义的谱系关系,与同源词意义谱系关系的性质是一致的。不同的是,同源词的词音(含整音节、音段、音法、位法等)是历时的,是历时的若干离散的谱系词音记录具有谱系关系的连续性义项。这是人们并不把“一词多义”现象列入同源词范围的原因。本文所讨论的同源词现象不包括“一词多义”现象。

这里要强调一点,“一词多义”现象(俗称“多义词”),是同源词产生的前奏,一旦多义词的共时词音发生历时演化,词音节以区别性的形式分别记录多义词的历时谱系义项,同源词便产生了。可见,多义词与同源词具有历时的发生学的关系,属于同类项。

多义词是与单义词相对待的,单义词、多义词、同源词形成一种发生学的历时演化序列,可以表示如下:

a.单义词1→多义词1→同源词1
b.单义词2→多义词2→同源词2
……
c.单义词n→多义词n→同源词n

a组序列与b组序列以及c组序列,是各自滋生演化的,演化到多义词、同源词阶段,两组之间或两组以上之间开始产生近义词,包括指称义相同的近义词与内涵义属于同一语义属性域的近义词。

(三)同源词的滋生法则

1.同源词的滋生法则——“同源词函项”

词源自身就是一个递归函项,这是就普遍词源而言的。词源的词汇表征,可以是单音节单纯词,也可以是复合词,还可以是多音节单纯词。

具体到一组同源词,如果从词源函项来看,就是具有同一核音义位而其类音义位不同的词源函项组,这叫作“同源词源函项组”,表征如下:

同源词1=核音义位(类音义位1)

同源词2=核音义位(类音义位2)

同源词3=核音义位(类音义位3)

……

同源词n=核音义位(类音义位n)

(2≤n≤20)

2.同源词源函项的滋生限度与近义词产生机制

任何一个“同源词源函项组”,其滋生限度或滋生能力,并不是无限的,而是有限的,其递归限度取决于两个条件:一个是“核音义位”的遗传度——遗传距离,即核音义位能够把多少“类音义位”系联到一起;另一个是“类音义位”的区分度,即被核音义位系联在一起的类音义位是否还具有足够的差异成为一个单独的词汇单位。根据笔者以往系统地系联汉语、藏语同源词的经验,核音义位的遗传距离越大,其系联能力就越小,被系联的类音义位的区分度就越小。当核音义位的遗传度达到不同的“同源词源函项组”之间的词出现近义现象时,就是该同源词源函项组的滋生限度,因此,同源词源函项组的滋生限度如下:

同源词源函项组滋生限度→跨同源词源函项组近义词出现,即2≤同源词滋生限度≤20。

符号“→”表示同源词源函项组滋生到出现跨同源词源函项组近义词时,其滋生能力便趋于终止,不再具有滋生能力。同源词源函项组的滋生限度就是从2个到20个之间。

这里顺便指出,在同一语种中,“词义”完全相同(外延词义与内涵词义完全相同)的“同义词”是不存在的,因为这样的同义词就是一个词,这不符合自然语言对世界的离散化记录功能。词汇学中通常所说的“同义词”,实际上是近义词。

近义词是存在的,近义词有的来自其他语种,属于固有词与借词构成的近义词。如此,近义词按照来源可以区分为如下类型:

3.语种共时近义词的稳定格局

一种语言的共时近义词,多数是自源的,即来自于语种内部的。近义词,是同源词源函项组滋生能力枯竭时的产物,也是多义词系统的词义交集现象,因此,近义词不同源。近义词也是自然语言的生物机能之一,凡是语言都有近义词,这是自然语言的普遍属性之一。

一种语言的共时近义词格局是相对稳定的,这是因为近义词是多义词、同源词系统交集的产物。尽管语种不同,但是多义词、同源词的类型学机制是一致的,因此,近义词产生的机制也是类型学的,其格局也相对稳定。

近义词不是一个可以递归地生成的系统,以往有学者例如清代学者王念孙认为近义词是同源词,现代学者也有这样认为的。这是不符合事实的说法,是不正确理论所导致的观点。

(四)自然语言符号的复认知与象似元

1.自然语言是一个复认知符号系统

自然语言是一个对世界的认知系统,其组成缺少不了两个成分,一个是来自于世界的,一个是来自于人类心智的,这是人类认知的根本特征,也是自然语言符号的根本特征。我们把这种认知称之为“复认知”,可以表达为函项式:

心智(世界)

称之为“复认知函项”。自然语言就是一个复认知函项符号系统,物理学家、哲学家马赫称事物是感觉的复合的原因也在这里。

2.象似元递归及其映射

词源核音义位与类音义位的形成及其函项机制,来自于象似元递归及其映射。

人类心智的“意象”建构核音义位,类音义位则是由世界的物理表象(物象)建构的。心智的意象与物理的表象,是一种映射关系:

这就是说,离开了世界的物象,就没有人类的心智意象。这是人类认知具有唯物主义的一面。由于自然语言符号具有相对的独立性,离开世界也可以独立存在,因此,心智意象也可以映射为虚幻的物象,如下所示:

这是人类认知具有唯心主义的一面。

“物象”(包括物理物象与虚幻物象)与“意象”共同构成了“象似性”,象似性的基本单位为“象似元”,其物理依托是大脑的神经元。象似元可以表达为下列集合论映射模型:

从起源层次上说,词源在自然语言符号层次上是由核音义位与类音义位所组成的,表现为音义位;从认知层次上说,词源是由意象与物象所合成的,表现为象似性的单位象似元。意象来自于物理世界的物象,但是也可以是自然语言脱离物理世界物象的虚幻表达。意象即使是物象的映射,也不是纯粹的照相,而是掺杂了人类的认知因素,因此,意象就是心智所合成的物象。

由于自然语言符号的唯物性与唯心性,加之自然语言符号的相对独立性,自然语言既可以陈述事实,也可以虚构谎言;自然语言既可以反映现实,又可以建构符号事实。因此,人类天生就是一种陈述事实与虚构谎言的动物;社会制度包括行政制度、经济制度、法律制度以及文化体系就是自然语言形塑而成的。

3.词源核音义位与类音义位的属性变换的物象与意象机制

从来源上说,词源的核音义位来自于心智意象,类音义位来自于世界的物理物象,二者是不可以互换的。但是由于自然语言符号具有相对独立性,即可以脱离开物理世界而独立存在与运行,因此词源的核音义位与类音义位的属性在词源滋生的链条中是可以转换的,其条件是词源函项语境。这类似于句法函项中外延词相与内涵词相的变换,二者的机制与条件是一致的。

(五)同源字词的“字词源函项”

同源字词的基因单位“形音义位”,其构造是一个字词源函项式:

同源字词源=核形音义位(类形音义位)

例如:

判=半帮母元部分开(刀,0,0)

(按:刀仅仅别义)

畔=半帮母元部分开(田,0,0)

(按:田仅仅别义)

泮=半帮母元部分开(水,0,0)

(按:水仅仅别义)

叛=半帮母元部分开(反,0,0)

(按:反仅仅别义)

这一组同源字词,“半”代表“核形音义位”,“半”的音是一个整音节,由声纽与韵部组成;该音节由声义符“半”来记录。半的组成为:半=(核形,核音,核义),即(核形“半”,核音节“帮母元部”,核义“分开”),简化为(半,帮母元部,分开)。

“半系”同源字词,例如“畔”,其“类形音义位”的组成为(类形,类音,类义),即(类形“田”,类音“0”,类义“土地”),简化为:畔类形音义=(田,0,土地)。

核形音义位(半,帮母元部,分开)与类形音义(田,0,土地)形成适配制约关系,即“分开土地”,可以写为“词函项式”:“畔=分开(土地)”。

(六)同源词滋生的公理化推导

1.同源词包括同源字词的滋生

同源词包括同源字词的滋生,是一个类似数学公理化推导的过程,表述如下:

已知:核形音义位与类形音义位形成递归函项:核形音义(类形音义)。

把核形音义位(半,帮母元部,物中分)与类形音义(田,0,土地)分别代入“核形音义位(类形音义位)”;

得:半帮母元部物中分(田,0,土地);

得同源字:半+田=“畔”;

得同源词:帮母元部分开;

得同源字词:半帮母元部分开田地=畔。

可见,同源词或同源字词,其滋生、孳乳就是一个公理化的推导。这表明,人类的造词造字行为,在精神上类似于数学的推导。

2.同源字词滋生的“形音义”适配法则

“核形音义位”是一个整体函项关系,所谓“整体函项关系”,是指内涵性质的“形”“音”“义”在词源的滋生过程中作为一个整体发挥作用。

“核形音义位”函项关系所遵循的适配法则,与“核音义位”所遵循的适配法则是一致的,其深层就是集合论的对应关系。

3.同一个“音单位”的音节异部分布性质与词源函项语境对“形音义位”“音义位”属性的制约

同一个“音”单位,不论是音节的“声部”(含声纽音段、声纽音法、声纽位法等),还是音节的“韵部”〔含韵部音段、韵腹、韵尾、韵法(含元音舌位、唇形)等〕,在同一组同源词滋生中,不可同时既做核音,又做类音。

如果以音节整体(简称“整音节”)承载核音,类音即为黏附性的浮游音单位,该同源词即为“同一音节同源词”,简称“同音同源词”,这就是传统词源学所说的同源词语音的“音同”现象。

“音”单位,如果孤立地看,即未置于词源函项语境中,其词音属性是不确定的,其词音属性域为(内涵音,外延音);一旦被置于词源函项语境中,其语音属性就确定了,或为内涵音,或为外延音,二者择一,不可得兼。

核义是内涵义,代表行为;类义为外延义,代表对象。“核形”是内涵形,例如“畔”字的“半”,记录行为;“类形”是外延形,记录指称、对象,例如“畔”字的“田”旁,记录田地。

核形音义位,就是表示行为的形、音、义,是核形、核音、核义的简称;类形音义位就是表示指称、对象的形、音、义,是类形、类音、类义的简称。

核音义位,就是表示“行为”的音、义;类音义位,就是表示指称、对象的音、义。

五 音节构造与词源构造的关系,单系词源与复系词源

(一)音节是与词源结合的直接层面,汉语的音节类型

音节是自然语言语音运行的感知单位。音节,不论单音节还是多音节,又是与语义的义项相结合的单位。自然语言的音义一体现象是发生在音节层面的。词源与音节层面直接发生联系,词源的基因单位“音义”就是由音节层面的“音”与“义”合成的。

依据传统的“双声为训”与“迭韵为训”现象,可以肯定,先秦汉语的音节已经是声部韵部的双部制了;加之汉字的单音节性,那么,先秦汉语的音节属于单音节框架下声部韵部双部制是无疑的。看来,音节可以区分为下列类型:

音节的“声韵双部制”,是一种普适性的类型学现象。“多音节”就是由两组以及两组以上的“声韵双部”所组成的。单音节是由一组“声韵双部”所组成的。汉语的单音节性,至迟在甲骨文设计之初便已经形成,即是说,汉语的单音节形成时间距今至少有3000年以上了。

(二)从“连续音”到“分节音”音段与超音段的相对独立,“分节音”与“韵律”的适配法则

从语言的演化来说,语音经历了“连续音”“分节音”两个阶段。连续音是人类尚处于动物阶段的发音形式,其特征是未产生分节音,音段与超音段浑然一体,未发生相对分离。在分节音阶段,连续音演化为分节音,这是音段与超音段相对分离的条件。“多音节分节音”属于分节音的早期阶段,“单音节分节音”属于分节音的晚期阶段。多音节分节音与轻重音韵律形式相适配,单音节分节音与声调韵律形式相适配,这是因为单一声韵双部(单音节)不可能同时容纳轻重音韵律的法则所致,即是说,多音节的二元性与轻重音的二元性形成适配,单音节的一元性与声调韵律的一元性形成适配,表示如下:

可见,分节音的一元性与二元性是声调韵律与轻重音韵律形成的机制。现代汉语普通话的轻重音,其形成也符合这一机制,现代汉语的双音节词基本上都是由单音节复合而成的,形成音节的二元性,于是便产生轻重音的韵律形式。因此,说现代汉语是声调语言不太确切,这是从单字调说起的;实际上现代汉语既是声调音节语言(简称声调语言),又是轻重音音节语言(简称轻重音语言),是声调与轻重音并存的语言。

学术界认为,北京话的轻声是次重音,轻声以外的音节是重读音节。这与英语轻重音分布于一个多音节上的情况是不同的。这是单音节一元性的表现,即一元性的单音节,其韵律可以同时表现为一元性的声调与一元性的重音或轻音(次重音),但是在同一个单音节上不可以同时表现为一元性的声调与二元性的轻重音。

汉语声调何时产生?至迟在《诗经》时代即西周初期,汉语的声调已经产生,但尚处于萌芽状态,表现为固定音高,形式为“55”“33”高低两类四种“55”“33”“35”“53”,属于“一重曲折调”。如此推测《诗经》时代的声调类型,是出于类型学考虑,这种高低两类四种声调类型,是轻重音与声调韵律的混合类型,是“繁-单音节”向“简-单音节”过渡时的韵律形式。当时的汉语处于从繁-单音节向简-单音节过渡的阶段,联绵字就是这种从“繁-单音节”向“简-单音节”过渡的产物,联绵字的“不可分训”与“可分训”之争,并不矛盾,不可分训是就繁-单音节而言的,可分训是就简-单音节而言的。由于汉字的单音节性与表意性,要求一个字形记录一个义项,这便有了联绵字的可分训说。甲骨文之前的原始汉语,估计是多音节语言,这样推测在理论上是有依据的。隋代陆法言《切韵》以“平上去入”四声分韵,标志着汉语声调已经定型,属于“二重曲折调”。

先秦汉语业已形成的单音节性,一直持续到现代汉语,现代汉语的双音节并不是一个语义义项适配一个多音节,而是由单音节复合而成的复合音节,因为现代汉语复合音节的“一音节与一义项相结合”的局面依然是先秦汉语所形成的,并未发生质变。所谓现代汉语词汇“双音化”,实际上就是单音节形成复合音节。汉语的单音节性是汉语的本质属性之一,这是一个音义结合的属性,没有条件演化为类似于英语的多音节性。

(三)音节构造与词源构造的关系

按照词源核音义位的音段载体分布,同源词可以区分为非音节核部同源词与音节核部同源词,如下所示:

“非音节核部同源词”是指同源词核音义位分布于音节的组成部分上所形成的同源词,包括“声纽核部同源词”与“韵部核部同源词”;“音节核部同源词”是指同源词的核音义位分布于音节整体上,叫作“音节同源词”,也就是传统词源学所说的“同音同源词”。

(四)从音节构造解析词源构造

“核音义位”“类音义位”及其函项式“核音义位(类音义位)”,是跨音位学、音节学的概念与术语。音节是自然语言语音运行的基本单位,具有很强的通用性。站在音节学的角度来看核音义位、类音义位及其函项式“核音义位(类音义位)”,核音义位,作为一个音义相结合的整体分布在音段上,或者是分布于整音节,或者是分布于声纽,或者是分布于韵部,其组合为“音节核音义位”,或“声纽核音义位”,或“韵部核音义位”,这些单位在感知上具有不可分离性。“核音义位”等术语,仅仅是描述、刻画核音义位等的一个工具,是一种元语言。

核音义位,从音节构造的角度看,包括核声义位(核声与核义合一体)、核韵义位(核韵与核义合一体)。核声义位的声,包括声纽、音法、位法;核声义位的义,是指核义。核韵义位的韵,包括韵部、韵腹、韵尾以及韵法(含舌位、唇形);核韵义位的义,是指核义。

(五)同源词函项的音节类型

1.按照同源词的音节核部分布分类

按照同源词的音节核部分布,同源词函项可以区分为下列两类:

“非音节核部函项”是指核音义位分布于音节的声纽或韵部上的同源词函项,包括“声纽核部函项”“韵部核部函项”两小类;这两小类同源词函项,属于双声或叠韵同源词函项,也可以称之为“音近同源词函项”。声纽核部函项为“同源词=核声义位(类韵义位)”,滋生“双声同源词”。这是传统词源学的“音近”类型之一。韵部核部函项为“同源词=核韵义位(类声义位)”,滋生“叠韵同源词”。这是传统词源学的“音近”类型之二。

如果在同源词函项“同源词=核音义位(类音义位)”中,其词汇表征单位出现跨区域对应或跨时代对应,则滋生“音转式同源词”,这属于方言之间的音转式同源词或古今代际音转式同源词。

“音节核部函项”是指核音义位分布于整音节之上的同源词函项,该类函项属于“同音同源词函项”。

2.词源构造的相对独立性与“类音义位”的音段离散距离的大小、远近,“同源异派”的机制

词源构造,具有相对独立性,是与音节构造不同的结构单位。在词源构造的内部,核音义位与类音义位具有不可分离性,二者缺一不可,被属性制约法则以函项形式所制约。但是二者在语音的物理分布上不完全相同。核音义位的依托是物理的音段声纽或韵部或整音节,类音义位的依托是音段声纽或韵部,但不会是音节整体。当词源核音义位分布于音节整体上,类音义位就作为“漂浮类音义位”黏附于音节上,因为音节整体承载着核音义位,在核音义位的制约下,类音义位不会脱离核音义位而存在,这类似于物理学上的向心力,类音义位始终是围绕着核音义位的。词源函项就是一个词源语境,在词源函项语境的制约下,类音义位也不会脱离核音义位而独立存在。因此,词源类音义位依据存在方式可以区分为以下两类:

词源音义位的类音义位成分以及分布类型,如下所示:

如果同源词函项为“核韵义位”,则“类声义位”的离散距离(远近)可远可近;如果同源词函项为“核声义位”,则“类韵义位”的离散距离(远近)可远可近。至于核韵义位、核声义位的离散距离,属于词源的遗传代际问题,离散距离大会产生同源异派现象,核音义位会发生分支遗传现象。

传统词源学的“音近义通”,把“音”(包括核音、类音)定得不能太远,是说音的离散距离不能太大。

“类音义位”的远近,实际上也是词源遗传代际的远近,距离越远,代际越远,“同源异派”的可能性则越大。所谓“同源异派”是指同源词滋生中出自同一源头却分别滋生出不同遗传方向同源词分支的情况。因为同源异派的实质,是在词源滋生中随着滋生链条的延长,核音义位对类音义位的约束越来越松弛,直至无法约束之际,同源异派就出现了。

(六)“同源音节函项”的形成

1.词源的构造与音节的构造

词源的构造为“词源函项”,音节的构造为“音节函项”,词源构造与音节构造配伍,形成“词源-音节函项”,简称“同源音节函项”。词源函项与音节函项表示如下:

词源函项=核音义位(类音义位)

音节函项=声部(韵部)

要指出的是,超音段是附着在音段上的,具有相对独立性,因此,超音段与音段之间也会形成函项关系。但是由于超音段的改变仅仅会产生语法意义,因此一般说来不列入同源音节函项之列。

2.“初始音节”的形成与“音节函项”,韵尾的类型以及先秦汉语韵部“阳阴入”三分的理论合理性

声纽在事实上不存在纯粹的声纽,声纽是由辅音与一个极为轻微的元音合成的。声纽是辅音打头形成的,介音可以前属于声纽,称之为“声纽化元音”,也可以后归之于韵部,称之为“元音化介音”,介音就是一个边界模糊(居于辅音与元音之际)的两栖音。韵部是以元音为轴心的,元音前为辅音,元音是辅音的黏着音,当黏着音响亮时就称为韵部。所以,初始音节的构造为“辅音+元音”。辅音为函项,随着元音或韵尾的不同可以输出一个相应的音节:

音节=辅音(元音)

这是“音节函项”,是具有类型学普遍性的音节构造。

辅音之后的元音弱化,弱化到仅仅感知到辅音的存在,便输出一个声纽。韵部来自于声纽辅音之后元音的响亮化,即是说,辅音输出的是一个声纽还是一个韵部,取决于辅音输出元音的弱化还是响亮化。

韵腹之后的韵尾,从理论上说,可以出现两类三种情况:无尾(条件:其后辅音另外生成一个音节)、有尾(条件一:其后音位依然为元音,生成元音尾;条件二:其后音位为辅音,生成辅音尾)。先秦汉语的韵部正是这样的类型。阴声韵属于无尾、元音尾,入声韵与阳声韵属于辅音尾。陆志韦、李方桂的先秦汉语音节为“CVC”(辅音+元音+辅音)型[5]35的说法,遗漏了阴声韵这一种,戴震韵部“阳阴入”[4]29三分说更具有理论上的合理性。要指出一点,陆志韦、李方桂所主张的CVC型音节,属于“次生基本音节”,不是基元音节即初始音节,不属于音节的递归起点单位,下文将详细介绍。

(七)单音节的生成模型与音变类型

1.单音节的生理生成模型

辅音的形成,从生理上说,来自于口腔通道的“阻碍”,辅音又叫作“阻碍音”;元音的形成来自于口腔通道的“畅通”,元音又叫作“畅通音”。音节就是口腔通道因“阻碍”与“畅通”所形成的。因此,音节的生理结构就是“阻碍+畅通”,这是音节的“生理基元结构”。如果发音通道仅有“畅通”而没有“阻碍”,就会形成由元音构成的“连续音”,因此,“阻碍”是形成“分节音”的管界,所谓“分节音”,就是由辅音划分语流界限而形成的语流音段。从理论上说,“畅通”前或后均可以有“阻碍”,因此,音节的次生生理基元结构又有“阻碍+畅通+阻碍”。这是音节的普适性基元生理结构的两种类型。陆志韦、李方桂称上古汉语的音节结构为CVC型,就是这里所说的两种基元生理结构之一,但这是一种次生型的基本音节结构,从生成上讲,是基元音节CV的派生音节。

如果“阻碍+畅通”,或“阻碍+畅通+阻碍”按照出现“次数”论,又有以下普适性音节形成的生理构造机制表达式:

a.阻碍n+畅通n,n≥1;

b.阻碍n+畅通n+阻碍n,n≥1。

可见,a,b是基本音节单位的生理构造机制,其中,a又是最基本的音节的生理构造机制,叫作“基元音节生理构造机制”,该机制生成的音节叫作“基元音节”。n=1,就是“单辅音单元音音节”;n≥2,就是“复辅音复元音音节”。

2.单音节的复杂生成模型

a.元音被声纽辅音j化w化,形成介音:

Cj=j(辅音(元音));或Cw=w(辅音(元音));

条件:声纽辅音之后的后附元音被声纽辅音半辅音化。

从形成上说,介音都是前附于辅音的,介音的形成机制来自于元音的前置半辅音化。

b.前置声纽辅音n≥2,形成复辅音声纽(复声纽):

C前C基=c前(辅音(元音)基元);

C基C后=c后(辅音(元音)基元);

条件:辅音前置于或后置于基元音节的辅音声纽,三合复辅音及其以上复辅音声纽的形成依此类推。

c.后置辅音n≥1,形成单/复辅音韵尾

以基元音节“辅音+元音”为出发点,辅音后置于“基元音节”,形成单/复辅音韵尾:

C辅音韵尾=c(辅音(元音)基元);

条件:基元音节“辅音+元音”在“阻碍+畅通”之后又“阻碍”。

d.基元音节的元音n≥1,出现一次或两次响亮,形成单元音或复合元音韵腹ō:

V无韵尾=辅音(元音n),n≥1;

条件:“阻碍+畅通n”,n≥1;

e.基元音节“辅音+元音”以“元音”收尾,输出元音韵尾:

V元音韵尾=v(辅音(元音)基元);

条件:口腔通道基元生理结构“阻碍+畅通”,后附连续性“畅通”。

f.基元音节“辅音+元音”后附“半元音”,输出半元音韵尾:

J半元音韵尾=j(辅音(元音)基元);

W半元音韵尾=w(辅音(元音)基元);

条件:口腔通道基元生理结构“阻碍+畅通”,后附“半阻碍”收尾。

3.音变类型

a.音变按照“基元音节语境”来划分,有基元音节语境音变与非基元音节语境音变两类:

b.按照音变的物理连续性与非物理连续性来划分,有下列两类:

发生在基元音节语境内的音变有物理连续音变与非物理离散音变。该层次的音变是纯音变(非涉义音变)与涉义音变。自由音变属于纯音变,例如汉语方言中的鼻音n-(中古泥母),边音l-(中古来母)在西南方言中混读比较普遍,乡村及老一辈在混读中倾向于多读l-,“牛奶”一词,多读l-;年轻人与城市居民在混读中倾向于多读n-,“牛奶”一词,多读n-。这种混读现象属于自由音变,是历时的代际自由音变与共时的城市与乡村区域自由音变,这是发生在基元音节之内的“音法”(鼻音/边音)离散音变与“位法”(舌尖中/舌尖中)连续音变。这种鼻音n-(中古泥母)与边音l-(中古来母)的混读现象,在代际传承与群体内部通解度的系统协同的双重约束下,将会继续存在。

这种发生在基元音节之外的音变,也有连续音变与离散音变之分。

4.同源音变与非同源音变

音变按照是否涉及词源,可以区分为同源音变与非同源音变。非同源音变又叫作类型音变。

同源音变,就是指发生在“词源音义位”语境或“词源函项语境”内的音变,有连续音变与离散音变之分,均属于涉义音变,可作如下分类:

5.传统词源学的“音转”

传统词源学的“音转”,包括连续音变与离散音变,有音同、音近假借与音同、音近同源之分,还包括音同、音近近义词现象,此外还有韵文韵语的音同、音近押韵现象。总之,传统词源学的音转性质与范围可区分为谱系与类型两类:

“类型音转”就是非涉义音转,“谱系音转”就是涉义音转。可见,类型与谱系或非同源与同源是区分传统词源学音转的关键。有学者称传统词源学的音转是“不科学”的,实属误解;有学者拿上印欧语的音变规则来衡量汉语音韵学的音转,也是不恰当的。印欧语的音变属于连续性的物理音变,因为印欧语是一种多音节的语言,以连续的物理音变为主;汉语属于单音节的语言,既存在着音节之内的连续性的物理音变,又存在着大量的离散的音节之间的离散音变。即是说,汉语音变与印欧语音变属于不同的类型,如下所示:

“多音节音素的连续音变”,其语境是多音节语境,其音变是非跳跃性的,亦步亦趋式的;“单音节音素的离散音变”,其语境是单音节语境,其音变是跳跃性的,非亦步亦趋式的。当然,多音节音变也存在着离散性的,不过不占主要地位罢了。

6.印欧语的构拟

印欧语的构拟,依据的是基元音节语境内的物理连续性音变的法则,其适用范围是短程音变。汉语的音转,依据的是音节基元语境内的连续性音变或词源音义位语境之间的离散性音变,以及音近近义词、音近假借的类型学音变,既有短程音变,又有长程音变。

(八)音节的递归生成属性

1.口腔通道的有限“四维时空”属性

口腔通道是一个管状三维空间,加上时间,便构成四维时空。口腔这一四维时空是有限的,“管子的长度男性大致是17厘米左右,女性为15厘米左右,小孩大约9厘米”[6]41,但是却可以生成无限的语流。这是音节以及音节流(简称语流)形成的生理基础。口腔这一时空体生成的语音,是携带着各种信息的,这些信息的形成以“语音”的种种属性例如“粗”与“细”、“锐”与“钝”、“紧”与“松”、“高”与“低”、“前”与“后”、“长”与“短”等姿态(简称“音姿”)来成象——描绘外在的世界与表达内在的心理,以形成“物象”与“意象”。这是语音成象的生理因素。

2.音节的基元单位

音节的基元单位如下:

辅音+元音,或CV

在传统音韵学中,辅音(声纽)是扭结之音,寓有连缀之意,因此,因连缀而形成划界之音,即是说,辅音是一种管界音,是用来区分元音的界限的,因为辅音的形成机制是“阻碍”,类似于关卡设限,元音的形成机制是“畅通”,音节就是在口腔的阻碍与畅通的周期性循环中形成。辅音作为界限音,辅音管界之内形成音节,辅音管界之外也形成音节。可见古代学者的观察是比较精准的。

从音位理论上说,声纽可以是一个辅音音位,这是音位学上辅音不能单独构成音节的解释。但是在实际语言的感知中,声纽一般不会以单纯辅音音位的面貌出现。在音节语境中,声纽可以变换为一个音节,例如在复辅音声母中,前置辅音可以变换为一个音节,哪怕是一个弱化音节,太原方言中的“嵌l词”便属于这种情况,例如“圪揽”(意为“棍棒”)”,其读音可以在复辅音“kl-”与弱化音节“k1-”之间自由变读。事实上,在口腔通道“阻碍”之后“除阻”惯性的作用下,接着就是一个不管多么轻微的“畅通”,“k1-”从来不会以纯粹复辅音音位“kl-”的形式出现,“kl-”仅仅是一个理想化的理论设计,自然语流中很难出现纯粹的复辅音音位。

韵部在感知上是一个音节,这是韵部含有响音元音(口腔构成“畅通”通道)的缘故。声纽单辅音在口腔“阻碍”之后,一定后附着“畅通”,即是说,辅音声纽之后一定伴随着元音是发音生理的必然性所致。因此,辅音声纽在感知上类似一个音节。

3.音节的递归法则——物理线性分布

音节的滋生类似于自然数的滋生,是一个递归的过程,表示如下:

a.设/辅音+元音/为音节;

b.如果/辅音+元音/为音节,那么,

/辅音+元音/1+/辅音+元音/2,…,+/辅音+元音/n也为音节;

c.除以上a,b以外,其他的都不是音节。

这是自然语言“音节”的递归生成表示,与数学上自然数的形成所遵循的法则是一致的。这一机制来自于自然语言语流的物理线性分布原则。可见,语流的物理线性分布就是一种数学上的递归。

要补充一点,语流的物理递归与语义的心智递归这两种对象的递归,语流的物理递归是无法改变的,语义的心智递归服从语流的物理递归。具体表现:一方面是依托于语流形式,语义单位义项的排列遵循线性法则,这是语义的义项递归与语流递归一致的地方;另一方面是语义单位义项的组合关系除了遵循线性法则,还可以遵循非线性法则。这就是说,语义的递归具有线性与非线性两种,而语流的递归则仅仅有线性的一种。分析语法就揭示了语义组合的这种线性与非线性类型。结构主义语法的长处在于以语流的物理线性法则来刻画语义的线性组合现象,这是其成功之处;但它又来强行刻画但实际上又刻画不了语义的非线性组合现象,这是结构主义语法遇到的最大难题。如此,结构主义语法可以区分为“物理结构主义语法”与“数学结构主义语法”,如下所示:

数学结构主义语法包括“线性”与“非线性”,因此物理结构主义语法仅仅是数学结构主义语法的一个特例。分析语法属于数学结构主义语法,或非线性结构主义语法。

以上关于音节的陈述,属于“形式音系学”之列。形式音系学、形式语义学与形式词源学共同组成了形式词汇学。

4.音节与义项的“音节义项函项”,形成单音节语与多音节语

音节的递归生成,与义项的递归生成构成音义合一的递归适配生成函项,这便是音义滋生以产生词源的机制。

在音节层面,音义适配递归生成便形成“单音节语”(孤立语)与“多音节语”(非孤立语),表示如下:

a.单音节语

单音节=基元音节n(义项);

条件:n=1。

这里,“基元音节”表示函项关系,“义项”为自变元,“单音节”表示依变元,为输出的结果。

b.多音节语

多音节=基元音节n(义项);

条件:n≥2;

可以看出,单音节语实际上是“单音节适配单义项”,多音节语实际上是“多音节(两个或两个以上)适配单义项”。

由此可知,单音节语的语法标记,只能是词标记,这是由单音节的一个声韵双部匹配一个义项单位决定的。多音节语的语法标记,可以是词汇标记,也可以是形态标记,这是由多个声韵双部匹配一个义项决定的。

(九)词源构造(音义位)的音节构造分布机制

1.词源音义位作为词源的基因单位

词源音义位作为词源的基因单位,依然是一种二维构造(核音义位,类音义位);汉语音节的音段同样也是一种二维构造(声纽,韵部),如此一来,词源音义位构造与音节声韵构造之间会形成下列三类关系:

在第一类中,词源的核音义位分布在音节的整音节上,词源的类音义位其分布就是0音节,即不分布于音节的音段上,而是漂浮在音节的音段之外,这叫作“词源类音义位的漂浮分布”。因为词源的类音义位是词源的必不可少的组成成分,例如,“半系”同源词的类音义位就是一种音节音段之外的漂浮分布,但是在“半系”同源字词中,词源的类形音义位却是依托于形声字的形符上,起到了依字辨义的作用。在第二类与第三类中,词源的核音义位与类音义位,呈现交错分布,即词源核音义位分布于音节的声纽音段上,类音义位就得分布在韵部音段上;核音义位分布于韵部音段上,类音义位就得分布在声纽音段上。

这种词源核音义位、类音义位(词源构造)与音节声纽音段、韵部音段(音节构造)的交错分布,是词源构造(核音义位)的内涵性与类音义位的外延性制约的结果,即词源核音义位与类音义位在音节音段(音节构造)上并置,由于二者的属性不同,同性(内涵性或外延性)音义位不会同处同一音节的同一音段上。这有点类似于物理世界的异性相吸。

2.词源构造(音义位)内部的异性音义位组合机制的来源

由上文可知,词源音义位的核音义位与类音义位分别来自于象似元(意象,物象)的映射,意象与物象分属于两个不同的心智世界与物理世界,二者不可同处于同一个世界之内,否则不会产生词源现象。

(十)单系词源与复系词源——齐冲天“声韵语源”说辨析

1.单系词源与复系词源

所谓“单系词源”,就是指词源的核音义位的来源即词源的来源是单一的;所谓“复系词源”,就是指词源的核音义位的来源即词源的来源是非单一的,即复合的。到目前为止,见到的复系词源是属于二合复系词源,即声韵复合词源,即同一个词源的声纽词源与韵部词源是由两个单系词源复合而成。

词源都是由核音义位与类音义位两部分复合而成的。核音义位的存在形态是被音节的音段所承载,核音义位没有“漂浮音义位”现象;类音义位有的被音节音段所承载,有的属于“漂浮音义位”。如此一来,类音义位依据是否被音段承载,可以区分为两类:

要补充一点,这里的“词源的来源”的概念,蕴含着词源的相对性,即是说,“词源”是一个相对概念,一个词所从出的词就被称之为该词的“词源”。“绝对的词源”有没有呢?有。绝对的词源就是指只滋生其他词而自己不被滋生的词,这样的词源叫作“原词”,相对于原词的词被称之为“派生词”。派生词中又滋生其他词的词被称之为“词源”,可见“词源”是一个相对概念。如此,词源按照绝对与相对的标准可以做如下分类:

2.齐冲天“声韵语源”的含义

齐冲天在《声韵语源字典·五、论声韵语源》中说:“从来都认为,汉语中一个单音节的词,就只有一个语源。例如:政者,正也。政、正同音。整,正亦声,征之言正也。整、征、政,亦声韵相同,皆可认为是同语源之词。若是双声为训的两个词同语源,便认为它们韵母之间的差异是语音发生变化所致;若是叠韵为训的两个词同语源,便认为它们声母之间的差异也是语音发生变化所致。语音的变化,无疑是大量存在的,有规则性的,也有特殊性的。但是漫无边际、散乱如麻而又无证据的音转,在原则上就不是科学的说明。我认为,由于双声为训与叠韵为训之同时存在而并行不悖,由此两部分音义结合而构成其语源的词,是具有两个语源的词。不这样,就不能解释这种复杂分歧的音义现象。这是一种特殊语源,我称之为声韵语源。”[7]29

根据齐氏以上材料,他把语源区分为一个来源(“同语源”)与两个来源(“声韵语源”)。

根据齐氏所提供的材料以及相关的分析来看,齐氏的“声韵语源”,即一个单音节词具有两个语源的情况是指我们的“复系词源”。相对于复系词源的,是“单系词源”。齐氏在上文提到的“正系”(“正系”意为以“正”为形音义标志的同源词谱系,这是对不同同源词谱系的命名与称呼,下仿此)词源所包括的“正”“整”“政”“征”等同源词就属于单系词源。

单系词源、复系词源都属于词单位之间的谱系关系。既然是谱系关系,就会以遗传成分贯穿于同源词之间,这样的遗传成分在同一组同源词中仅有一种,不会出现两种。不但单系词源遵循这一法则,复系词源同样遵循这一法则。不同的是,复系词源往往会再行分化为同源词支系。在复系词源再分化而成的同源词支系中,复系词源也许会以复系词源整体遗传下去,也许会发生分化,复系词源以单系词源身份遗传下去。

以下就齐氏所提供的同源词材料,根据笔者所建构的形式词源学理论予以形式刻画,与齐氏的经验解释进行对照,以辨明齐氏所主张的“声韵语源”说的真实情况,从而说明笔者所提出的“单系词源”与“复系词源”的存在。

(1)单系词源(例1)

(遗传成分) (变异成分)

核形音义位(函项关系) 类形音义位(自变元)

a.正=正照母耕部一以止 (从止,0,立正)

“《说文》:‘是也。从止,一以止。’止足之进,实即立正。”

b.整=正照母耕部一以止 (从敕,0,告诫)

“从敕,正声,《说文》:‘齐也。’正为纠正、治理,敕为告诫、整饬,……整是军队的整。”

c.政=正照母耕部一以止 (从攴,0,正万物)

(例子a, b, c来自于齐冲天等《汉语音义字典》上册,页318。笔者予以形式刻画)

d.征=正端母蒸部一以止 (从彳,0,正行)

“或作辵,《说文》:‘正行也。从辵,正声。’《尚书· 胤征》孔传:‘奉辞伐罪曰征。’” 意为止(纠正)罪之军事行为。(按:齐氏确定“征”的音韵地位为“端(知)母蒸部”)

(例子d,综合来自于齐冲天等《汉语音义字典》上册,页318;下册,页625。笔者予以形式刻画)

齐氏认为,以上“正系”同源词不属于“声韵语源”,即为“非声韵语源”,意为“单系词源”。我们对齐氏所提供的材料同源词“正”“整”“政”“征”的形式刻画表明,“正”作为“正系”同源词的“原词”,其形(正)、音(照母耕部)、义(一以止)贯穿于“整”“政”“征”之中,是“正系”同源词的遗传成分、核形音义位成分。

“正”“整”“政”“征”的变异成分即类形音义位成分,其“类义”成分、“类形”成分分别是“立正”(从止)、“告诫”(从敕)、“正万物”(从攴)、“正行”(从辵)。词源的类形音义位分别属于不同的事类、物类或行为类,代表不同的对象,以起别异的作用。要指出一点,在“正”中,类形音义位的“类音”是以“0”来表示的,意为“正”的读音是由“正”的整音节记录的,“正”的“类音”是一个“0”形式,作为“漂浮类音位”附着在“正”的整音节后。“正”的类形为“止”,其类义为“立正”,蕴含在类形“止”里,即由类形“止”来记录。在同源词“整”“政”“征”中,它们的核音“正声”(照母耕部,“征”的音韵地位为“端母蒸部”,“照母”“端母”分别为正齿音、舌音,属于声纽离散音变;“耕部”“蒸部”同为阳声韵,收后鼻音,属于韵部离散音变。“正”与“征”的音变是一种谱系离散音变)均来自于原词“正”的读音,它们的类音均为漂浮类音位“0”,它们的类形分别是“敕”“攴”“辵”,其类义“告诫”“正万物”“正行”分别由各自的类形来记录。

可见,齐氏所分析的“正系”四个同源词,是一个“单系词源”,即“正”字形所记录的整音节形音义位词源。“正系”词源是一组同源字词。这是形式词源学用来对“非声韵语源”即“单系词源”的情况所做的形式描述,与传统词源学的经验解释是一致的。

形式词源学也可以用来分析齐氏所说的“声韵语源”情况,用同样的理论与方法处理齐氏所提供的材料,结论会令人信服,以下“例2”就是用形式词源学来刻画齐氏所认为的“声韵语源”即“复系词源”。

(2)“复系词源”(例2)

齐冲天在《汉语音义论》中说:“有没有明确地把双声训与叠韵训相结合的例呢?这种理论上的阐述未曾见过,实际训释词义中,凤毛麟角般极少的例,还是有的。一叶知秋呀。以下试举二例来看:乔(乔),《说文》:‘高而曲也。从夭从高省。段玉裁注:‘《诗》曰:“南有乔木。’这里‘高而曲’,是把两义素结合起来了,中间加‘而’字连接。这里乔与高双声为训乔与夭叠韵为训,两者结合起来了,乔木是既高又曲的,只曲不高之木很多,就不叫乔木。”[8]73

其一,词源核义的类型

齐氏这里提到的“乔”(乔)有“高而曲”的意义,这属于一个内涵义。从性质上看,是可以作词源的核义成分的。这又是一个“复合内涵义”,或“复合核义”,即由两个内涵义成分“高”“曲”复合而成的内涵义。

如此看来,词源内涵义或核义可以区分为:

其二,“复系词源”滋生中的一元派生与分支派生均遵守共同的“词源函项适配法则”

词源滋生为具有谱系关系的一组同源词,就像河流一样,有“河之源”与“河之流”(这里“流”有下游之意)。例如“乔”具有“高而曲”义,其作为“词源”即“乔系”这一组同源词的滋生源头,可以出现三个滋生方向:“高而曲”方向即“乔”复合方向、“高”单方向、“曲”单方向即“夭”单方向。这种复合核义作为“词源”的多向滋生现象有的属于“单系词源”,有的属于“复系词源”。“乔”作为“词源”,所滋生出的“乔系”三个同源词分支“乔系”(高而曲,复系词源)同源词、“高系”(单系词源)同源词、“夭系”(曲,单系词源)同源词,分别是三个同源词分支的源头。

“乔系”词源作为“复系词源”滋生同源词分支时,要分别适配三组不同的“类义”:

a.“乔系”类义:鸟、角、鱼、木、糸、矢、艸;

b.“高系”类义:人、足、走、手、马、心、山、金;

c.“夭系”类义:女、木。

(以上“乔系”词源分支“类形音义位”,依据齐氏《汉语音义字典》归纳,页899-900)

可以看出,“乔系复”(高而曲)词源在滋生三组同源词分支“乔支系复”(高而曲)、“高支系”(高)、“夭支系”(曲)时,遵循词源函项“核音义位(类音义位)”的适配法则。即使在“乔支系复”(高而曲)同源词的滋生中,核形音义位“高而曲”也是作为一个形音义整体而被遗传的。这是复系词源的单(合为整体)、复(可分化为分支)性质所致。

其三,词源的代际问题

词源既然是一个人类的生物机能系统,就有代际问题,也就是滋生中的时间先后以及谱系关系的亲疏远近问题。

词源的代际划分,有两种情况:一种是词源外部的分期断代,即依据历史朝代的兴废更替,对词源滋生的先后时间顺序予以划分。该标准易与历史的断代分期对接,直观易懂,缺点是不能正确反映词源自身的内在的历时演化史。另一种是词源内部的分期断代,就是按照词源自身的滋生顺序及其分合演变的顺序来进行分期断代,优点是能反映词源的历史演化顺序及其内在的分合演变,缺点是外行不易看懂。一般来说,把词源的内在断代分期与外在断代分期相结合,可收互补之效。

其四,复系词源的形成与词源代际的断代分期

“夭系1”词源、“高系1”词源分别是复系词源“乔系复2”的第一代词源,“乔系复2”是“夭系1”词源、“高系1”词源的第二代。“夭系1”词源、“高系1”词源均称之为原词,下标为代际标号,下标“复2”意为“复系词源”第二代的标记。

词源的代际是一个相对概念,有的词源要找到真正的第一源头是不容易的,这就像人类的家族谱系一样,是一个相对的谱系关系,真正的家族第一源头是不容易找到的。

“乔系”词源作为“夭系”词源、“高系”词源的第二代词源,词源遗传成分可以保留也可以丧失。如果“乔”作为一组同源词的“词之流”即被滋生出的派生词,具有两个“词源”,就属于复系词源,就属于齐氏所说的“声韵语源”。

词源是一个递归系统,是类似自然数的递归系统。自然数是由“0”作为基元单位再实施加“1”规则(0+1)滋生出无限的自然数的递归系统。齐氏的“声韵语源”是就某一具体词源的形成而言的,即是说,有的词源是复系词源,其源头有两个;一旦复合而成一个词源,该词源的再滋生依然遵循词源函项的递归法则。复系词源作为词源再滋生,也是一个由“少”到“多”的递归滋生过程。这就是说,词源,不论单系、复系,均遵守词源递归法则。

“乔系复2”词源作为一个复系词源,在再滋生中虽然分化为三个同源词分支,其中一个分支“乔系复3”,在核义遗传上保留了“乔系复2”词源“高而曲”的复合核义;另外一个“高系3”同源词分支,仅仅保留了“乔系复2”词源的“高核义”,丧失了“乔系复2”词源的“夭核义”即“曲核义”;第三个“夭系3”同源词分支,则仅仅保留了“乔系复2”词源的“曲核义”,丧失了“乔系复2”词源的“高核义”。

我们就齐氏所举这一例“乔系复2”同源词进行形式刻画,以便深入观察“复系词源”的性质。

(遗传成分) (变异成分)

核形音义位(函项关系) 类形音义位(自变元)

第1代

“夭系1”原词:

夭=夭影母宵部屈 (从大,0,大字的头屈右) (齐氏《汉语音义字典》,页120)

“高系1”原词:

高=高见母宵部崇高 (从 口,0,台观高之形) (齐氏《汉语音义字典》,页897)

第2代

原词滋生复系词源:

“乔系复2”词源:/高而曲/

乔=夭高群母宵部高而曲 (从夭从高省,0,树木)

第3代

复系词源再滋生

“高系3”词源:/高/:

a.侨=高群母宵部高 (从人,0,身材)

“高系3”词源:/高/:

b.蹻=高见纽宵部举足而待 (从足,溪母,足部行动)

“高系3”词源:/高/:

c.屩=高见纽韵近 (从尸从彳,见母药部,举足行高)

“高系3”词源:/高/:

d.趫=高群母宵部善缘木走 (从走,0,行高才能)

“高系3”词源:/高/:

e.挢=高群母宵部举手 (从手,0,举手行为)

“夭系3”词源/曲/:

f.娇=乔群母宵部扭捏 (从女,0,女性身姿)

“高系3”词源:/高/:

g.骄=乔群母宵部马高六尺 (从马,0,马匹身高)

“高系3”词源:/高/:

h.憍=乔群母宵部高仰 (从心,0,人头姿势)

宋代《集韵》:“矜也。”又:“高仰也。”

“乔系复3”词源:/高而曲/:

i.鷮=乔群母宵部尾巴长毛高而曲 (从鸟,0,鷮尾姿势)

“乔系复3”词源:/高而曲/:

j.鱎=乔群母宵部头尾翘起 (从鱼,0,白鱼形状)

《玉篇》:“白鱼也。”

“乔系复3”词源:/高而曲/:

k.峤=乔群母宵部高而曲) (从山,0,山姿)

《尔雅 释山》《说文新附》称“锐而高”。

l.桥=乔群母宵高而曲 (从木,0,水梁)

“高系3”词源:/高/:

m.鐈=乔群母宵长足 (从金,0,似鼎器具)

“乔系复3”词源:/高而曲/:

n.繑=乔群母宵部高而曲 (从纟,0,绔纽)

“乔系复3”词源:/高而曲/:

o.轿=乔群母宵部走高山地 (从车,0,车)

《汉书 严助传》:“舆轿而领”,颜师古注:“轿者桥,谓隘道舆车也。”按:“隘道”高而弯曲。

“乔系复3”词源:/高而曲/:

p.矫=乔群母宵部拨正高而曲折处 (从矢,0,揉箭箝)

“乔系复3”词源:/高而曲/:

q.荞=乔群母宵部高而曲 (从艹,0,麦类)

《辞海》:“草本,茎赤,弱而翘,叶为三角形,有长柄。子实磨面如麦,供食用。”

(以上例字来自齐氏《汉语音义字典》,页899-900,有的字例解释,按照形式词源学理论做了调整。)

3.“复系词源”与“同源异派”

从以上以“乔系复2”为中心的同源词系联中,可以看出,齐冲天的“声韵语源”说,实为“复系词源”的形成及其“同源异派”现象。“同源”即是同出一源,“异派”即是属性“分异”,各自派生。不同同源词支系,来自于同一词源。

复系词源现象最早记载在东汉许慎的《说文解字》中,之后,学者齐冲天做了辛勤探讨。笔者在《词源观念史》中对齐氏的探讨给予积极评价,在本文中又从形式词源学的角度做了形式刻画、分析,为复系词源奠定了理论基础。可见,形式词源学的法则是通用法则。

(十一)“四声别义”不属于同源词现象

汉语的四声别义如同英语的轻重音别义,属于一种超音段的韵律区分语法意义与词性现象,该现象不属于同源词现象,仅仅是一种语法上区分词性及其语法意义的手段。如此,句法中区分词性及其语法意义的手段可以做如下分类:

四声别义不属于同源词现象的理由如下:其一,声调、轻重音在本质上是物理的声学现象,是一种类型学的现象,属于语言的自源系统,声调的分化也属于类型学的分化;其二,词源现象是物理现象与心智现象的合一体,属于谱系现象,其内部蕴含着遗传成分。

(十二)声纽词源与韵部词源的审美属性

声纽词源会产生双声为训,双声就是“押声”,叠韵词源会产生迭韵为训,叠韵就是“押韵”。双声与叠韵的机制就是重现。双声词源与叠韵词源形成核意象与核声象的双重重现,这属于语义与语音的和谐现象,具有审美属性。

六 词源滋生的时间类型与同源词的发生学类型,同源词谱系结构的代际断代及其历史层次

词源的滋生,有时间上的关系,也有谱系上的结构关系,因此,词源可以从时间与谱系两方面来进行分类考察。

(一)词源滋生的时间类型

1.“音、义共时滋生词源”与“共时同源词”

词源“音义位”的滋生,包括“核音义位”与“类音义位”的滋生,其中“核音义位”的滋生,有的属于共时滋生,很难区分出“音”“义”二者时间上的先后顺序,这种核音义位的共时滋生,也叫作“非线性滋生词源”。由“非线性词源”滋生的同源词,叫作“共时同源词”。

例如“湄”与“楣”,这是一组同源字词,二者均从“眉”(见于甲骨文、金文[9]103、《说文》小篆)得“核音义”。“眉”的形音义位的组成,核形音义位为/眉明母脂部目边侧/,类形音义位为/0,0,目上毛/。由“眉”的核形音义位/眉明母脂部目边侧/滋生出两个同源字词“湄”(见于甲骨文[9]347、《说文》小篆)、“楣”(见于《说文》小篆)。从字形上讲,“眉”在先,“湄”在后,但是二者均见于甲骨文,作为同源词来看,“眉”与“湄”孰先孰后,孰为“原词”,委实不易确定。“湄”与“楣”这两个同源字词在滋生的先后顺序上是明确的,“楣”是晚出字形,始见于《说文》小篆,是秦汉时期的产物。“湄”的核形音义位为/眉明母脂部水边/,类形音义位为/水,0,河流/,属于漂浮类形音义位。“楣”的核形音义位为/眉明母脂部门户横梁/,其类形音义位为/木,0,房屋/,属于漂浮类形音义位。从类义上看,“湄”是自然河流,属于自然地理地貌,“楣”属于人工建筑房屋构件。就时间关系而言,当然是自然“河流”在先,人工“建筑物”居后。根据以上“湄”与“楣”的断代情况,“湄”先“楣”后确定无疑。至于“湄”“楣”同源字词产生的核形音义位条件,“湄”“楣”二者的共同核形音义位为“词源”/眉明母脂部边侧/。只有既具有该词源音义位,又具有“河流边侧水草交汇地类似于眉毛状、门楣类似于目上毛状”的认识,才会滋生出“湄”“楣”同源字词来。

但是“河流边侧水草交汇地类似于眉毛状”与“门楣类似于目上毛状”这两个认识,按照各自的类形音义位断代情况,可以断定“河流边侧水草交汇地类似于眉毛状”的认识在先,“门楣类似于目上毛状”的认识在后。

由于“眉”与“湄”孰先孰后,委实不易判定,因此,“眉”与“湄”二者属于“共时同源词”是无疑的,“眉”“湄”与“楣属于历时同源字词”。从字形谱系来看,“眉”是原字,“湄”“楣”是派生字。综合三者的形音义来看,三者之间的时间顺序及其滋生的谱系关系如下:

a组是“眉系”同源词代际关系,b组是“眉系”同源字代际关系,“下标”表示代际。“湄2”与“楣2”虽然时间上有先后,但是同属于第2代同源字。

要指出一点,在“原词”难以决断的情况下,我们本着“文先字后”的原则,把该组同源字词命名为“‘眉系’同源字词”。“眉系”同源字词还有其他成员,这里属于列举性质,以说明问题为限。

音义共时滋生的法则,就是“音即是义,义即是音。”得音便得义,得义便得音,音义同时俱得。人们的日常感觉也有音义俱得的情况,例如“惊叫声”即是“惊恐义”,“哭声”即是“伤心义”,“笑声”即是“开心义”的现象。这是音义共生的普遍现象。

从符号的角度来看,自然语言就是一个“音义”符号系统。“音”自身是符号,属于物理与心智符号;“义”自身也是符号,属于物理与心智符号;“音”与“义”的结合体“音义”就是一个复合符号,属于物理与心智所构成的“二维符号”。二维词源学作为形式词源学的基础,其基本原理就在于此。

“音义”符号的“复符号”性质,其基本属性就是“音携带着义,义携带着音。”这是自然语言这一复符号的“音义互载法则”。即是说,自然语言复符号的音义具有不可分离性。学科中的音位、义位之分,都是出于研究策略的元语言工具的需要,不属于自然语言的本体问题。

自然语言的音义复符号,其表达世界,包括内心世界与外界世界的形式就是“成象”,音因义以成象,义因音以成象。音象与意象的复合体就是音义复符号。因此,音义复符号是一个有机融合体,具有不可分离性。

声音都有“象”,这叫做声音成象;声音所成的“音象”属于意象的一种。意象是递归地生成的,意象映射为词源“音义位”,由此而递归地生成。

2.“音、义历时滋生词源”与“历时同源词”

词源音义位的滋生,包括核音义位与类音义位的滋生,其中核音义位的滋生,有的核音、核义滋生不属于共时滋生词源,而是核音、核义滋生有着时间上的先后顺序。例如“夭”的核音义位与“高”的核音义位,这两个单系词源的产生就在“乔”这一复系词源之前。由此可见,单系词源的核音义位在时间上先于复系词源的核音义位,这可以作为同源词谱系结构代际划分的一条内在标准。

传统词源学中有“音”与“义”孰先孰后的问题,是一个不恰当的问题。由于自然语言的音义复符号性质,即音义具有不可分离性,因此音、义孰先孰后的问题违反自然语言音义复符号的不可分离性。音、义孰先孰后这个问题之所以产生,是由于研究中元语言工具的作用引导研究者把元语言与对象语言即研究对象混为一谈。音、义孰先孰后自古代就被谈论,到了清代的小学家谈论尤甚,但是至今不得其解,原因就在这里。再说,研究策略上音、义分离,标音有国际音标,表义有相应的工具,并不能改变自然语言这一音义复符号的音义不可分离属性。

词源,其核音义位,的确有初始组合,这形成第一代词源。经过音义的初始组合,之后,初始词源便进入音义复合符号的递归滋生过程。在整个词源的滋生谱系序列中,音义复符号始终是作为一个整体出现的。

(二)“音义同源”的复符号机制与语种“异音”问题

1.音义同源的系统共性

音义同源,取决于自然语言的复符号机制,即音义的不可分离性。但是人类的自然语言,只要语种不同,说话的差异就达到相互不可通解的地步。

从语音上看,自然语言的语音,尽管语种的差异很大,但是分解到区别特征的层次,具有共同的12对区别特征。这属于系统的共性。

2.发音差异的个性与系统协同

自然语言是人类的音义表达系统,执行这一表达任务的是个体的人。个体的发音差异形成音义表达系统的别异区分,这是“口音”的来源。个体的人又是属于群体的成员,成员之间的通解度又要求个体发音的可交流性,这便形成族群内部的音义表达的系统统一性,语种便产生。语种总是属于某一群体的,这是音义表达的系统性与群体的通解度所决定的。群体内的个体发音差异,形成一个波动域,这是口音差异的来源。口音差异演化为土语,土语演化为方言,方言演化为语种,因此,土语、方言、语种之间没有分明的界限。语种不单纯是一个语言概念,也是族群、政治、群体心理乃至风俗习惯的混合体。语言就是心智,是人类的心灵家园。语言就是心灵的交流交际范围,语言不通,会把人区分为不同的交流交际圈子。语言与政权、国家相结合,就出现了“国语”“官话”“标准语”等概念。

汉语产生于何时?汉语方言产生于何时?从理论上说,“汉语”产生于“汉族”族群出现之时,汉语与汉族的产生是同步的。甲骨文是用来记录汉语的;商代甲骨文、西周金文都是统一的文字,这反映了当时汉语尚未分化为不同的方言,仅仅是处于“土语时期”。到了东周时期,这就是春秋战国时期,许慎《说文叙》所称的“言语异声,文字异形”就是在这段时间形成的。东周长达500年,进入农耕文明“土地载能大幅提升人口急剧增加耕地大幅扩张”循环的历史时期,划地而居而耕而生,导致农耕社会聚落区域的地理分割性,缩小了人类的交际范围。口音差异与通解度的系统协同造就了土语,可以说,汉语的“土语时期”在夏代就出现了,经商代延续至西周,经历东周500年的诸侯国地理割据与农耕社会的划地而居而耕而生,形成言语异声文字异形的局面,汉语进入了“方言时期”。这是秦帝国统一六国后实施“书同文字”的语言背景。汉代扬雄《方言》便是记录当时汉语方言(包括部分民族语言)的。可见,汉语方言的形成可以追溯到东周时期。

(三)字形历时滋生与由义制形的“历时同源字词”

自然语言以口语为基本形态,以书面语为次生形态。文字是记录口语的符号,先有语言后有文字是一个一般的法则,同源字的产生在同源词之后,是一个常态。

我们在上文已经说过,汉语的同源词,按照字形是否具有谱系关系,可以区分为“谱系字形同源词”与“非谱系字形同源词”。从时间上说,汉语在汉字产生以前,属于史前时期,在汉字产生以后,属于历史时期。即使是历史时期的汉字,也不是同时产生的,甲骨文时期的汉字,古文字学家陈炜湛估计,能够识别的大约有1 700多个,其中见于《说文》的大约1 000个,尚未识别的大约2 900多个,识别与未识别的合计大约4 600个[10]27;秦汉时期的小篆,《说文解字》记载的已经达到9 353个了;这里“秦汉”的“秦”不仅仅指统一六国后的秦帝国,而且还包括战国时期的秦诸侯国,因为《说文》小篆是秦国文字。可见,《说文》小篆实际上是战国文字,是通行于从秦诸侯国到汉代的文字。小篆是高度统一、标准化的。

就汉字的“本字”而言,也有“先起本字”与“后起本字”的区分,“箜篌”就是一个后起本字,是在“空侯”的基础上滋生的。“空侯”是乐器名,较早见于西汉《史记·封禅书》,《词源》“空侯”词条解释:“祷祠太一后土,始用乐舞,益召歌兒作二十五弦及空侯,琴瑟自此起。”也作“坎侯”“箜篌”。[11]1260“箜篌”较早见于《隋书·音乐志》,《词源》“箜篌”词条解释:“《释名·释乐器》谓为师延所作,为空国之侯所存,故亦称空侯。《宋书·乐志二》谓空侯,初名坎侯。汉武帝令乐人侯晖依琴作坎侯,言其坎坎应节奏。《隋书·音乐志下》谓出自西域,西凉有卧箜篌,竖箜篌。”[11]1281可见,“箜篌”作为乐器专名,是因义(类义)以制形,这是一个后起本字。由此看来,汉字的创制,有由音以制字与由义以制字之分:

例如“取”(见于甲骨、金文、简帛、古玺、古陶[9]87,《说文》:“捕取也。”)与“娶”(始见于《说文》:“取妇也。”),这是一组同源字词,二者具有产生的时间先后关系,先出现“取”,这是甲骨文时代的文字,然后才会产生“娶”,这是小篆时代的文字,二者断代明确。这两个同源字词的核形音义位为/取清母侯部捕捉/,“取”为核形,“清母侯部”为核音节,“捕捉”为核义。二者的类形音义位分别是,“取”为漂浮类音义位/0,0,可捕捉的/(类义包括敌方的左耳朵、敌方的女人等战利品),“娶”的类形音义位为/从女,0,女子/。就“取”“娶”的词源核义而言,是“捕捉”义,但是捕捉核义的类义“女子”是否就是后起的,则很难断定;就“娶”的类形“女”(从女)来看,“娶”是一个后起的同源字词。因此,“取”“娶”属于历时同源字词。要指出一点,“取”“娶”作为同源字有先后,但是作为同源词,则很难断定。

(四)同源词谱系结构的类型及其代际划分与历史层次

同源词就是具有谱系关系的一组词。同源词的谱系内部,具有一定的结构关系,这与人类家族的谱系关系及其结构比较相似。

1.直系词源关系与隔代词源关系

直系词源关系,就是指A词与B词有直接的滋生与被滋生的关系。这类似于人类家庭中的父与子之间的谱系关系。

隔代词源关系,是指A词与B词之间不是直接的滋生与被滋生关系,而是中间隔着C词、D词等跨代词源关系。

2.单系词源关系与复系词源关系

单系词源关系,是指在一组同源词中,其“词源”来自于一个源头。在连续的遗传代际中,“词源”未发生复合。

复系词源关系,是指在一组同源词中,其“词源”,包括“初始词源”“派生词源”,来自于不只一个源头。

3.词源的代际划分标准类型

词源谱系,可以按照朝代代际来划分,这叫作“词源的外部代际标准”。

词源谱系,也可以按照词源自身滋生来划分,这叫作“词源代际的内部划分标准”。

在词源谱系的代际标定上,同时标定朝代代际与词源代际,这叫作词源谱系代际的双重标定。

4.词源谱系结构的代际类型

同源词谱系结构的命名,采取四级制命名法,即把一个同源词谱系的成员分别命名为“A原词1”“B系复2”(单系词源不予以标明,采取默认定义)、“C系3分支”、“D词4”四个层级,表示它们的滋生代际层级。“原词”为最高层级,“词”为最低层级,“词”为同源词的简称。遇有“单系词源”或“复系词源”,复系词源加以标明,称之为“B系复2”。一般情况下,单系词源不标“单系”,仅标“系”。“系”往往是一个词,即原生词;“复2”“系3分支”一般是一组词;“词4”是没有词源滋生能力的单个同源词,是同源词谱系的末端成员。“词”没有词源滋生能力,但是具有复合能力,即与其他词形成复合词。同源词谱系滋生到“词”为终点。

同源词谱系结构的类型:

a.单系词源与单系同源词

例如:上文所举的“正系”同源词就属于单系同源词,详见前文。

b.复系词源与复系同源词

例如:上文所举的“乔系复3”词源就属于复系同源词,详见前文。

c.混合系词源与混合系同源词

例如:上文所举的“夭”原词与“高”原词所形成的“单复系词源”,详见前文。

同源词谱系“代际断代”,如图1所示:

图1 同源词谱系代际断代图

同源词谱系“汉字-朝代断代”,表述如下:

第1代 汉字断代

“夭系1”原词:

夭=夭影母宵部屈 殷商甲骨文,商周金文

“高系1”原词:

高=高见母宵部崇高 甲骨文,金文,战国简帛文、古玺文、古币文,汉印文

第2代

原词滋生复系词源:

“乔系复2”词源: /高而曲/

乔=夭高群母宵部高而曲 金文,简帛文、古玺文,汉印文,石刻文

第3代

复系词源再滋生

“高系3”词源: /高/:

a.侨=高群母宵部高 简帛文、古玺文,汉印文

“高系3”词源: /高/:

b.蹻=高见纽宵部举足而待 西周《诗经》,东汉《说文》小篆

“高系3”词源: /高/:

c.屩=高见母药部 《说文》小篆

“高系3”词源: /高/:

d.趫=高群母宵部善缘木走 金文,《说文》小篆,汉印文

“高系3”词源: /高/:

e.挢=高群母宵部举手 西汉《尔雅·释兽》,《说文》,唐代《唐韵》,北宋《集韵》,元代《韵会》

“夭系3”词源/曲/:

f.娇=乔群母宵部扭捏 《说文》小篆

“高系3”词源: /高/:

g.骄=乔群母宵部马高六尺 《诗经》,《说文》小篆

“高系3”词源: /高/:

h.憍=乔群母宵部高仰 北宋《广韵》,《集韵》,《韵会》

“乔系复3”词源: /高而曲/:

鷮=乔群母宵部尾巴长毛高而曲 《说文》小篆

“乔系复3”词源: /高而曲/:

i.鱎=乔群母宵部头尾翘起 南朝梁《玉篇》

“乔系复3”词源: /高而曲/:

j.峤=乔群母宵部高而曲 《尔雅·释山》,北宋《说文·新附》

k.桥=乔群母宵高而曲 《说文》小篆,汉印文,石刻文,唐写本

“高系3”词源: /高/:

l.鐈=乔群母宵长足 金文,《说文》小篆

“乔系复3”词源: /高而曲/:

m.繑=乔群母宵部高而曲 《说文》小篆

“乔系复3”词源: /高而曲/:

n.轿=乔群母宵部走高山地 东汉《汉书》《玉篇》《广韵》《集韵》《韵会》

“乔系复3”词源: /高而曲/:

o.矫=乔群母宵部拨正高而曲折处 《说文》小篆,汉印文,石刻文

“乔系复3”词源: /高而曲/:

p.荞=乔群母宵部高而曲 《尔雅·释草》《玉篇》《唐韵》《广韵》《韵会》

(以上汉字断代,出土文字、传世文字、文献用字并用,《诗经》文献用字,按照时间推测当为春秋古文。参照高明《古文字类编》、藏克和等《实用说文解字》、齐冲天等《汉语音义字典》,并参以己见酌定。字例解释,参照齐氏等《汉语音义字典》,页899-900,有的字例解释,按照形式词源学理论作了调整。)

“乔系复2”复系词源,其字形跨越商代、周代,春秋战国、秦代、汉代、魏晋南北朝、隋唐、宋代、元明清、现代,纵贯夏代以下各个朝代,涵盖了汉语从甲骨文以来有文字的整个历史时期,而且延续至今。随着汉语族群及其母语的绵延不绝,“乔系复2”复系词源还将继续延续下去,与汉语共始终。

“(代1),(代2),(代3),…,(代n)”是一个理论模型,同源词谱系结构的代际,从理论上说,其“词源活力”是一个无限存活的过程,“乔系复2”复系词源,从西汉《尔雅》算起的话,距今已经有2224年了。只要汉语这一语种还存活,“乔系复2”这一复系词源将会一直延续下去。要指出一点,以上“乔系复2”复系同源词的谱系成员仅仅延伸到第三代就中止了。这就是说,一个词源的存活力与该语种同寿命,但是该词源的遗传代际成员则是有限的,这是因为该词源的类音义位的传播幅度是有限的所致。即是说,一个词源的存活力并不因该词源遗传代际的有限性而中止。

任何一个词源,其类音义位的范围即传播幅度都是有限的,一般地说,传播幅度大约在20个同源词。要指出一点,一个词源的传播幅度是以该词源的同源词的个数来计算的。

但是按照历史朝代来给同源词谱系结构断代,则出现了与内部代际断代不对应的情况。“乔系复2”复系同源谱系,按照内部断代仅仅有三代。如果按照“词源活力”(即词源是否具有延续性)计算,时间跨度却从汉代一直延伸到现代(标志为被现代字词典收录,依然被汉语母语者所使用);如果从“乔系复2”的两个原词“夭系”“高系”算起,时间长达2500年以上,“夭”字、“高”字在商代的甲骨文中出现。这就是说,同源词谱系的稳定性非常高,远比朝代的寿命长而且稳定。与人类的生物遗传基因相比,人类男性基因单位Y-DNA,在男性之间可以稳定地遗传上千年,同源词谱系的基因单位“核音义位”可以稳定地遗传至少2000年以上,还将随着汉语继续延续下去。这就是说,人类语言基因的遗传稳定性及其寿命要高于人类的生物基因。

因此,在语言史例如汉语史的断代中采取朝代断代不能反映语言内部的演化情况,朝代断代仅仅可作为一种参照。

从以上“乔系复2”复系同源词谱系结构的断代情况可以看出,同源词谱系的代际断代与朝代断代没有内在的联系,因此,朝代断代就是一个非常外在的标准,不能反映同源词谱系的内部演化情况。由此想到,现在汉语史学界流行的朝代断代与汉语史的内部演化也没有内在联系。历史语言学以及历史比较语言学的年代学需要加以改革,历史语言学以及历史比较语言学的现行范式需要重塑。

语言演化的“历史层次”,其层次标准也应该是语言内部的,笼统的“上古层次”“中古层次”“现代层次”其作用非常有限,不能够用来刻画语言演化的内部情况。

同源词谱系代际确定的作用,首先,这是确定语言系属的基础;其次,这是构拟原始共同语的基础;第三,这是构建历史语言学以及历史比较语言学新范式的基础。

七 词源所蕴含的句法机制——词源函项与句法函项的逻辑统一性,形式词源学与分析语法的逻辑统一性

(一)词源所蕴含的句法机制

1.词源作为句法的初始单位及其在教学语法上的作用

在古希腊,词源是包含于语法之中的,但是词源与语法究竟是怎样一种关系不得而知。我国古代对词源的经验解释材料非常丰富,但是并没有明确论述词源与语法的关系。词源是解释词的构造理据的,其构造为词源函项“内涵音义位(外延音义位)”;句法是解释句子的构造机制的,其构造为句法函项“内涵词(外延词)”,二者存在着一种从词源底层到句法表层的映射关系,词源函项与句法函项都统一于逻辑函项“内涵性(外延性)”构造。可见,词源单位是句法的初始单位。迄今为止,句法都是以词为初始单位的,即使是把“语素”定为句子的最小单位,由于汉语的单音节性,语素基本上也是一个单音单纯词,因此,词源作为句法的初始单位具有坚实的事实基础与合理的理论依据。词就是句,词的展开——词源函项,就被映射为句法函项——这是句子从词源深层结构到语法表层结构的真实关系。

从大学教学语法方面看,把词源与句法从结构上统一起来,可以使学生获得从词源深层到语法表层的统一认识;把词汇与句法统一起来,可以避免目前词汇、语法分立教学体系的条块分割状况。

2.词源函项蕴含着句法函项——词源函项对句法函项的映射层次

就自然语言符号而言,词源函项,就是最为深层的句法函项。词源函项对句法函项的映射关系可以分为下列三个层次:

从“词源函项”映射到“语法句法函项”共有三个层次。词源函项这一层次,是语法句法的底层,这一层次主管词的创造,包括词的音义位的创造。“逻辑句法函项”这一层次,是最为关键的层次,“内涵词”“外延词”都是音义合一体,内涵词包括“内涵义”与“内涵音”,外延词包括“外延义”与“外延音”,表示内涵义的内涵音与表示外延义的外延音,可以是“有形态标记音”,也可以是“无形态标记音”。该层次属于以位置(表层为物理语流分布,深层为逻辑分布)来确定意义,印欧语的“格”范畴、马建忠、黎锦熙为汉语设计的“次、位”概念与术语(属于经验元语言),都是在这一层次产生的,语言的有形态与无形态也都是产生在这一层次上。“语法句法函项”这一层,就是人们习见的句子层次,这是一个视觉层次,语言的有形态与无形态,都是根据这一层做出区分的,传统的形态类型学也是根据这一层来划分的。

3.“词源函项的属性制约法则”与“句法函项的属性制约法则”的逻辑统一性——统一于“属性异性逻辑制约法则”

词源函项“内涵音义位”与“外延音义位”的属性制约法则、逻辑句法函项的“内涵词”与“外延词”的属性制约法则,都可以抽象为“属性异性逻辑制约法则”。这也是词源函项与句法函项具有统一性的原因。

(二)形式词源学与分析语法的逻辑统一性以及共同的复认知基础

形式词源学的深层结构是词源函项“内涵音义位(外延音义位)”,分析语法的深层结构是句法函项“内涵词(外延词)”,二者均可以统一于逻辑函项“内涵性(外延性)”,这是形式词源学与分析语法的共同逻辑基础。

无论是词源函项,还是句法函项,都是人类心智对世界认知结构复认知函项“心智意象(物理物象)”的映射。人类的复认知,既具有物理的物质基础,又具有生物物理的心智基础,这就是说,自然语言是物理物象与心智意象的复合象似性符号体系。形式词源学与分析语法就是建立在这一自然语言复合符号体系基础之上的。

八 形式词源学产生的思想元素

(一)汉语词源学演进到经验词源学与形式词源学并存的阶段及其标志性术语

汉语词源学一直处于发展、演进之中。汉语词源学的发展、演进,从学科的性质来看,已经从经验词源学演进到形式词源学与经验词源学并存的时期。经验词源学经历了漫长的发展、演进历程,从先秦到20世纪末叶形式词源学产生之前,都是经验词源学的一统天下,“义类”与“事类”,“右文说”,“纲义”与“目义”,“音近义通”“转语”“通假”等,都是经验词源学的标志性术语。自1998年“二维词源学”问世标志着形式词源学产生起,汉语词源学进入了形式词源学与经验词源学并列发展、演进的时期,“二维词源学”“计算词源学”“同源音义位”[12]13“词源递归地生成”“词源递归函项”、“核义”与“类义”、“核音”与“类音”、“核音义位”与“类音义位”“词源音义位”“词源音义位适配法则”等,都是形式词源学的标志性术语。

(二)形式词源学产生的思想元素

任何一门学科的产生,都是有条件的,是一定条件下的产物。形式词源学的产生,只能是在现代数学思想例如笛卡尔解析几何、康托尔集合论、艾赫布朗与哥德尔递归函数(1930年前后)、弗雷格有关数学思想问世的条件下产生,不可能产生于这些思想之前。应该指出的是,经验词源学中不可能自动产生形式词源学思想,因为在1997年之前的经验词源学时期没有出现形式词源学的思想元素(“二维”“递归”“形式化”“词源函项”等),这就像苹果落地(对象语言)是万有引力(元语言)的作用,但是在牛顿万有引力定律产生之前的苹果落地现象(对象语言)却不曾蕴含着万有引力思想(元语言)一样,“词源递归地生成”的思想,是在递归论数学思想产生之后才有可能出现的,“词源递归地生成”是用来分析“词源”这一对象语言的元语言工具,不可把对象语言“汉语词源现象”与元语言“形式词源学”混为一谈;况且,形式词源学的产生尚需经验词源学与数学、数理逻辑等学科有关思想的综合集成才行。基于此,形式词源学这一分析对象语言“词源”的元语言工具即是“普通词源学”或“通用词源学”。作为普通词源学或通用词源学的形式词源学可以用来分析汉语词源现象,也可以用来分析汉语以外的其他语种的词源现象,这是元语言的通用工具属性使然。汉语词源就是属于汉语这一具体语种的词源现象,汉语词源现象不等于汉语以外的其他语种的词源现象,这是语言世界观问题,这是对象语言的本体论问题。形式词源学,其宗旨是提炼出人类自然语言的生成机制与法则这一元语言通用学科体系。

猜你喜欢

词源音义谱系
神族谱系
“Sentence”:词源追溯、结构意义与术语中译
从构词词源看英汉时空性差异
百年大党精神谱系的赓续与文化自信
“五官”一词源于五个人
王锡良陶瓷世家谱系
“顿”的量词用法的词源
“乡音无改鬓毛衰”之“衰”字音义的词源学解释
佛经音义同形字辑释
上古汉语“施”字音义考