少数民族语言文字研究前沿问题核心聚类分析
2022-10-02杨媛媛
杨 媛 媛
(渤海大学 文学院, 辽宁 锦州 121000)
一、引 言
前沿问题是某一特定学科领域的专家学者所共同关注的、最新出现的或最亟待解决的问题。根据领域和关注点的不同,不同科学研究领域的前沿问题具有不同的领域特征和专业性。但不论是哪一个具体的学科领域,学者们对研究前沿的基本认知是一致的。
少数民族语言文字是语言资源的重要组成部分,少数民族语言文字研究是我国语言文字研究的重要分支,自新中国成立以来取得了丰硕的研究成果。纵观新中国成立以来的少数民族语言文字研究,在不同的历史时期呈现出不同的热点问题和前沿问题。对热点问题和前沿问题进行梳理和定位,不仅能够全面地反映我国少数民族语言文字研究的全貌,也有助于继续深入少数民族语言文字理论研究。
二、少数民族语言文字前沿问题的界定与确定
(一)研究前沿的界定
最早提出“研究前沿”概念的是美国学者Derek J.de Solla Price,1965年他发表在Science上的论文NetworksofScientificPapers——Thepatternofbibliographicreferencesindicatesthenatureofthescientificresearchfront[1]提出了学术论文之间的相互引用使这些论文之间形成了网络关联,处于网络中心位置的是具有较高引用频率的论文。Price提出,某一年度论文的参考文献和引用关系形成了论文之间非常重要的关系网络。每一组最新发表的论文都和一小部分之前发表的论文具有非常紧密的关系,而与大多数之前发表的论文具有较弱的、松散的关联。这一小部分论文叫作“增长点”或“表层”,即“活跃的研究前沿”。Price认为,这就是研究前沿的存在方式。我们根据Price的研究,可以给“研究前沿”作一基本的界定:某一特定研究领域,在某一特定时间段内具有较高被引用频率的一小部分论文的集合。
(二)前沿问题的确定
本文以科学计量学对研究前沿的界定为基础,以最新版本的CiteSpace软件为辅助工具,对中国社会科学引文索引(CSSCI)中以“中国少数民族语言文字”研究为主题的研究论文进行穷尽式下载,对研究文献之间的引用关系、关键词、主题词、突显关键词等不同层次的聚类信息进行多视角的分析和解读,从而实现对我国少数民族语言文字研究领域研究前沿问题的挖掘和呈现。
CSSCI创建于1998年,对1998—2019年发表的论文,以“中国少数民族语言”“汉藏语系”“阿尔泰语系”对应的中图分类号“H2”“H4”“H5”进行检索,共得到论文2 784篇。 对这些论文进行参考文献的抽取,共得到参考文献31 377篇。
三、少数民族语言文字研究前沿问题
对获取研究文献的被引、共被引、聚类等情况进行分析。抽取研究文献之间的引用关系,得到领域内部高被引文献,见图1。
2 784篇研究文献及其31 377篇参考文献共形成聚类363个,大部分聚类比较分散,研究文献之间的关联具有一定距离,图1所展示的是最集中的聚类。图中可见,该聚类由一个闭环组成,由5个小的聚类环聚而成,不同的节点代表了研究主题的各个分支,节点的大小代表了研究文献在聚类中与其他研究文献的关联强度。我们按照顺时针由上到下的顺序,分别对该聚类中不同的分支聚类进行考察。
(一)汉语与侗台语族的亲属关系
提取最大的节点,命名为节点1,对此节点所代表的研究文献和它的施引文献进行分析,见表1。
分析发现,这些文献围绕着共同的研究主题——汉语和侗台语亲属关系问题。以李方桂为代表的汉藏语言学家一直致力于使用历史比较语言学的方法构拟汉藏语系诸语言的原始共同语,这也是我国少数民族语言文字研究中起步较早且最具代表性的领域。以同源词和借词为依据,探究语言之间的亲缘关系,学者们提出了很多理论和方法,如邢公畹的深层对应理论[2]、戴庆厦的语言影响理论[3]、陈保亚的语言联盟说[4]等。丁邦新提出最关键的问题在于将语音对应与基本词汇相结合[5]。以此文为中心形成的研究聚类主题为汉语与侗台语是否具有亲属关系,确定亲属关系的因素主要依靠语音与词汇的对应关系,语音对应主要包括声调和韵母,词汇对应主要通过同源词和借词。而声调、韵母、同源词、借词之间的对应关系又是互相影响、互相参照、互相对应的关系。同时该聚类的大部分学者认同汉语与侗台语具有亲属关系,该主题的研究任务是挖掘更多的对应语料来佐证其亲属关系。
表1 节点1被引文献与施引文献表
在抽取图1中各节点文献的研究主题过程中发现,由这部分关系节点形成的研究文献聚类的平均发文时间早于其施引文献聚类,该聚类的主题按照时间的先后分为两个阶段:早期研究从考古学和人类学的视角分析了汉藏语系的起源和各语族语支的分化历程;后期的研究则在厘清汉藏语系亲缘关系分化的基础上,从借词和声调对应关系角度着重考察了海南地区黎语与临高语、黎语与汉语的借词,通过黎语与侗台语族其他亲属语言的对比构拟黎语的古音。
由节点1的施引文献聚类和节点聚类所形成的研究主题,我们发现两个聚类的研究主题具有高度的相关性和一致性,形成了以节点1为中心的汉藏语系亲属关系探究,研究的焦点问题是汉藏语系分化后汉语与侗台语族的亲属关系,研究的方法是通过历史比较语言学的语音对应和同源词、借词的对应来确定其亲属关系或联盟关系,研究的主要对象包括黎语、上古汉语和客家话,研究涉及的学科包括考古学、人类学、民族学。代表学者包括邢公畹、吴安其、丁邦新、刘新中等。
(二)白语的系属分类
节点2的研究聚类以藏缅语的分类和白语的系属问题为核心。先从语言的谱系分类原则梳理出汉藏语分类的依据,历史比较语言学对古印欧语最早的谱系分类主要依靠语音和形态的对应关系。除了语音、语法系统本身,在词汇的层面上追溯语音和形态对应关系的就是同源词。几千年前汉语与藏缅语已经完成了分化,藏缅语的谱系分类与谱系分类原则一致,以语音、形态的演变和对应关系来追溯其历史亲缘。也有很多学者依靠两种语言中同源词的比例来判断其亲属关系。在对以上原则一致认同的基础上,对于汉藏语系内部的一些语言划分的具体操作,学者们仍有很大的分歧。白语就是学者们争论的焦点,在汉藏语系内部,对于其应归属于汉语族、藏缅语族彝语支、藏缅语族白语支、汉白语族白语支,学者们纷纷提出了不同的主张。而处于本聚类核心位置的吴安其通过列举白语松紧元音的对立、彝缅语族语序和后缀、核心词来源的对比,认为白语与彝缅语更为接近,是彝语支语言,并以剑川方言为代表构拟了古白语的语音系统[6]。
(三)上古汉语与原始汉藏语的构拟
节点3的研究焦点从直接描写汉藏语系内部语言关系转移到汉藏语系语言结构的描写。而这里的语言结构并没有脱离对原始汉藏语系原始共同语的追溯和构拟。对上古汉语具有使动意义的前缀“s-”“k-”,后缀“-s”以及浊声母“g-”“b-”的对立的描写分析[7],最终说明了上古汉语中遗留了原始汉藏语中一定的形态变化。这种遗留又有力证实了汉语在汉藏语系中的地位及汉藏语系各语族之间的亲属关系。
而汉藏语系语言从上古时期曾经存在过的形态经过几千年缓慢的演变到形态的消失,经历了三个不同的历史阶段,并伴随了汉藏语从无声调到有声调、复辅音声母的简化、复辅音韵尾的脱落、声母清浊对立的消失这种语音系统的演变历程。语言系统中语音、词汇、语法各要素之间相互关联又相互制约,当一个要素系统发生演变,系统间承载信息的总量需要重新平衡时,就会引发其他两个要素系统的演变。上古汉语形态标记语缀的从有到无、声调的从无到有正是语言要素系统相互影响制约的印证。汉藏语系内部的其他语言也经历了类似的演变,古彝语中动词复辅音的前部经过与语法形式的相互作用和共同演化,逐渐变成了具有使动意义的前缀词素。而上古汉语与古彝语从有形态向无形态、从无声调到有声调,从复辅音的脱落和分化的演变历程完成了汉藏语系语言从黏着到屈折再到分析类型的并存和过渡[7-9]。
(四)藏缅语语法结构演变
节点4形成的研究聚类主题与节点3相近,以动词使动范畴作为观测点来构拟藏缅语语言类型的演变。动词的使动范畴在藏缅语族的语言中普遍存在,但经过语言漫长的演变历程,相同的语法范畴在不同具体语言中的残留具有很大的差别。使动范畴的表达既有粘附性前缀,又有屈折性后缀,还有词根屈折和虚化助词等不同的表达形式。每种使动形式内部又有很多不同的具体的变化形式,有的语言使用不止一种使动形式。孙宏开考察了藏缅语内部最古老的嘉绒语,与景颇语、独龙语等[10],大体可以追溯出使动范畴的历史演变过程:第一阶段从最原始的使用单一前缀“s-”到多种前缀,再到后缀;第二阶段从前缀的逐渐弱化,使一部分辅音由浊音变为清音,元音松紧、长短发生变化,到前缀的脱落,导致藏缅语声调的产生;第三阶段随着前两种形式的逐渐弱化,由于语言表达的需要,动词的虚化和虚词逐渐产生。以使动语法范畴为观测点,可以看到的藏缅语语法结构的演变过程经历了黏着、屈折、分析三个阶段的变化。但演变的结果并不是完全相同地统一使用了分析性形式,每一种语言的使用和发展都有其自身的特点,因此对三种演变形式有着不同的保留程度,有些语言中还保留着形态化的标记,形态化与分析性并存,如独龙语[11]。
通过对以上4个节点的分析,可以看出1998—2019年间,我国少数民族语言文字研究领域的前沿问题为汉藏语系内部亲属关系的判定和构拟。在汉藏语系内部语言之间亲属关系的梳理过程中,学者们也在不断加深对汉语的探源,在对汉藏语系古老形式的追溯中逐渐加深对上古汉语的认识和构拟,从而形成了汉语与非汉语研究的交织与呼应。
四、前沿问题核心聚类的分歧与共识
(一)汉藏语系语言系属关系的主要分歧
对汉藏语系语言亲属关系的系属判定,学界的分歧很多。从语言谱系分类的层级上来说,世界上的语言按照语系—语族—语支的层级系统分类。对于汉藏语系目前学界普遍采用的是李方桂的分类,即汉藏语系分为汉语、藏缅、苗瑶、侗台四个语族,各语族内部又分为不同的语支[12]。但在整个汉藏语系系属分类的研究中,来自全世界的汉藏语研究者们对于分类的分歧涉及谱系分类的各个层级。从语族的系属层面上,学者们分歧最多的就是侗台语是否归属于汉藏语系的问题,一部分学者认为其属于澳泰语系,澳-卡岱语族,卡岱语支,代表人物有本尼迪克特[13]。本尼迪克特还提出苗瑶语族也不属于汉藏语系,马提索夫对汉藏语系的分类也只有汉语和藏缅语两个语族[14]。沙加尔提出汉语与南岛语有同一起源[15],有学者在支持这一学说的基础上提出建立一个囊括汉藏和南岛两大语系的华澳语系,代表人物有郑张尚芳和潘悟云。沙加尔在提出汉语与南岛语同源的基础上还提出了汉语与藏缅语并非同源,而是由长期的历史接触产生了大量的借词[16]。从语支的系属层面上,对白语的系属分类学者们表示出不同的看法,郑张尚芳认为白语和汉语具有亲缘关系,属于汉白语族,白语应单独成为一个语支[17];陈保亚认为白语是汉语方言[18];一部分学者认为汉语属于藏缅语族,但对语族归属一致的情况下,具体属于哪个语支大家又产生了分歧,戴庆厦认为白语属于南部语群,应单列白语支,罗常培、赵衍荪、孙宏开、吴安其认为白语属于彝语支[19]。
(二)汉藏语系语言系属关系分歧的本质
对汉藏语系系属分类的研究,是在西方学者使用历史比较语言学的基本方法,对印欧语系语言完成原始印欧语的构拟、印欧语的系属分类的基础上进行的。面对印欧语系谱系分类的成功经验,学者们希望将其运用到汉藏语系的谱系分类之中。然而汉藏语系的语言与印欧语系完全使用表音的字母的形式有着极大的区别,我们可以借鉴的只有历史比较语言学的基本思想和研究方法。
那么在历史比较语言学经典方法的指导下,通过两种可能存在亲属关系的语言的同源词的对比,从而寻找其语音和语法的对应关系,确定其是否存在亲属关系,成为我们印证两种语言亲属关系的重要途径。因此,在汉藏语系亲属关系的系属分类中,“同源词”成为学者们用来判定两种亲属语言关系的最重要的工具。然而,在整个汉藏语系语言的研究中却没有一种普遍认可的确定两个词语是同源词的理论和行之有效的方法,因而这种最重要的工具就失去了统一的标准。学者们往往使用不同的标准去判定两种语言中的同源词,这就造成了通过否定对方同源词的准确性和严密性,进而推翻其结论的互不认同的局面。
(三)汉藏语系语言系属关系的共识与影响
正是国内外学者们的种种分歧促进了更深入的思考和进一步的研究,同时使得同源词和借词成为解决汉藏语系系属分类分歧的关键问题。在不断深入的研究中,学界加深了对它们的理解并逐渐达成共识。而立足于汉藏语系语言的研究,也使学界从更广阔的视野上促进了汉语源流的考辨和上古汉语的构拟[7,9],从汉藏语系内汉语与非汉语互相结合、互相参照、互相印证的跨语言的对比中去加深对汉语结构历史演变的认识和梳理。在对汉藏语系语言亲属关系的考察中,除了依靠最为常用的同源词标准外,语音系统的对应和语法结构的参照为亲属关系的判定提供了参考。上古汉语的语法结构演变伴随着语音形式的变化。上古汉语中表示使动意义语法范畴既可以使用黏着前缀和后缀,也可以通过声母的清浊对立,在漫长的发展和演变历程中,语音和语法相互作用、相互影响,逐渐实现了从黏着形式到屈折形式的过渡,从而经历了由主要依靠形态到主要依靠语音形式的演变历程。在演变中汉语的辅音、元音、声调系统发生了简化、脱落、分化等一系列的演变。而屈折形式并不是汉语演变的终点,在语言发展的历程中汉语又完成了逐渐由屈折形式向分析形式的过渡。
五、前沿问题核心聚类所体现的研究视角
前沿问题的形成体现出国内外学者对同一问题的不同研究视角。
第一种,立足于汉藏语系的整体宏观视角。当我们用整体的视角将汉藏语的研究看作一个大的统一体,站在汉藏语系的最高点,也就是最上位概念,以整个语系的视角俯视下面的语族、语支、语言时,就会发现学者们研究的焦点问题是定位问题。所谓的“定位”就是为各个层级的单位找到它在汉藏语系大家族中的位置,是否属于汉藏家族,属于哪个层级,是语族、语支,还是语支的下位层级。在整体视角的考察中,同源词是学者们判定语言之间系属关系的重要依据。同时,在立足于语言学研究的同时,学者们打开了更广阔的视野,从人类学、考古学、民族学的多种例证中,搜索能够证明上古时代人类种群迁徙的证据,以及人种之间亲缘关系的材料。
第二种,立足于语言要素的个体微观视角。立足于某一种特定的语言,考察各语言要素在不同历史时期的共时分布和历时演变。汉藏语系内部语言数量众多,对任意一种具体语言的描写细致到位,形成体系,就会立刻引发学者们对其他语言是否具有与其相似结构的思考。如对使动语法范畴的描写和分析,先后就有对汉语、嘉绒语、独龙语、景颇语、达让语、书面藏语、林布语、羌语、彝语、纳西语等不同语言的深入考察[10]。个体考察的视角以某一具体的语言要素作为坐标原点,以这种语言要素在语言系统中所处的语音、词汇、语法位置作为横坐标,以汉藏语系中数量众多的其他语言作为纵坐标,从而形成了一张星罗棋布又密切交织的汉藏语系语言要素描写分析的巨大网络。而这些网络产生的节点,往往是两种或几种语言相同结构或相同要素的对比分析。对比产生的结果又让学者们清晰地看到这些语言之间是否具有亲属关系,它们在语言发展的历史长河中各自经历了怎样的演变,相互之间具有怎样的影响。在个体视角的考察中,任何一种语言要素都可能是对具体语言描写的对象,因此同源词作为词语层面的分支,不再是考察语言之间亲属关系唯一的依据,语音、语法等语言要素都是学者们深入描写并进行对比分析的对象。