世界诸语言*
2016-03-13俄罗斯
Вяч. Вс. Иванов(俄罗斯)
●语言文化与国家战略
○“丝绸之路”经济带沿线国家语言谱系研究(1)
世界诸语言*
Вяч. Вс. Иванов(俄罗斯)
世界诸语言(Языки мира)指居住在(和曾经居住在)地球上的各个民族的语言,总数在2500到5000种之间(准确数字无法确定,因为不同语言之间以及同一种语言的方言之间的区别是约定性质的)。世界上最通行的语言(将说该语言的人以及在族际和国际交往中以该语言作为第二语言的人都计算在内)有:汉语(10亿以上;1985年数据,下同)、英语(4.2亿)、印地语及与其相近的乌尔都语(3.2亿)、西班牙语(3亿)、俄语(2.5亿)、印度尼西亚语(1.7亿)、阿拉伯语(1.7亿)、孟加拉语(1.7亿)、葡萄牙语(1.5亿)、日语(1.2亿)、德语(1亿)、法语(1亿)、旁遮普语(0.82亿)、意大利语(0.7亿)、朝鲜语(0.65亿)、泰卢固语(0.63亿)、马拉提语(0.57亿)、泰米尔语(0.52亿)和乌克兰语(0.45亿)等。世界上所有的语言根据它们的亲属联系可以区分为语系,其中每个语系都源自一组彼此相近的方言,这些方言在古代同属一种语言或者同一语言联盟(即一组地域上邻近并拥有一系列共同特征的语言);参见词条“语言的谱系分类”。
研究得最深入的语系是印欧语系(参见词条“印欧语系”)。印欧语系源于一组近亲方言,使用这些方言的人口在公元前第三千年就开始从西亚向黑海北岸的南部和里海沿岸地区扩展。根据公元前第二千年的古文字遗存辨识出后来消亡的小亚细亚印欧语言——楔形文字赫梯语,它与晚近时期(古希腊罗马时期)的吕底亚语相近,另外还发现了其他的安纳托利亚语——帕莱语和楔形文字卢维语,其中楔形文字卢维语延续至公元前第一千年,成为象形文字卢维语和(古希腊罗马时期的)吕西亚语。借助自公元前第二千年的文本遗存还辨识出古希腊语的一种方言,以线性文字B书写的克里特-迈锡尼文本使用的就是这种方言。在公元前第二千年,与希腊语相近的雅利安(印度-伊朗)印欧诸方言的使用者已经居住在近东,西亚古文字遗存中的美索不达米亚雅利安语的词汇和姓名都证明了这一点。在努里斯坦(阿富汗的一个省)使用的现代努里斯坦(卡菲尔)诸语言起源于古老的雅利安各部落的方言,它们处在雅利安诸语言的两个基本语支(即印度语支与伊朗语支)之间的过渡区间。
古印度语的早期文本成稿于公元前第二千年末至公元前第一千年初。从古印度语(其标准形式为梵语,一直到现代仍在印度使用)衍生出了中古印度诸语言,即普拉克里特诸语言,而从这些中古印度诸语言又发展出了现代印度诸语言:印地语、乌尔都语、孟加拉语、马拉提语、旁遮普语、拉贾斯坦语、古吉拉特语、奥里亚语(或称奥德里语、乌特卡利语)及其他语言。与古印度语极相近的有公元前第一千年的古伊朗诸语言——古波斯语、只有一小部分词为人所知的米提亚语和阿维斯陀语(写作《阿维斯塔》的语言),以及后来的北部黑海沿岸的西徐亚诸方言和萨尔马提亚诸方言。与后者在历史上相关联的有东部地区的中古伊朗诸语言——栗特语(曾为中亚各民族的交往语言)、和田塞语、巴克特里亚语和花剌子模语,这些中古伊朗诸语言因其千余年的文献记载而知名。中古波斯诸语言(或称巴列维语)和帕提亚语同属于西部中古伊朗诸语言。属于现代伊朗诸语言的有:西部诸语言——波斯语或称法尔西语、塔吉克语、库尔德语、俾路支语、塔特语、塔雷什语及其他语言;东部诸语言——达里语、普什图语或称阿富汗语、奥塞梯语(历史上与伊朗东部的西徐亚语相关联)、帕米尔诸语言(其中包括瓦罕语、舒格南语及其他语言)、雅格诺布语(是栗特语的延续)。
自公元前第一千年起的一些古文献获得破解,它们使用的是若干西部印欧语言,其中包括意大利克诸语言;意大利克诸语言这个概括术语将人们凭借数量有限的文献遗存揭示的奥斯克-翁布里亚诸语言和拉丁语结合在一起,后者与法利斯克语属于拉丁-法利斯克语族(维涅特语也与该语族相近)。拉丁语仍作为天主教教会语言保存至今。罗马帝国分裂后,拉丁语的某些方言发展成为罗曼诸语言:西班牙语、葡萄牙语和与其相近的加利西亚语、卡塔兰语、法语、奥克西坦语或称普罗旺斯语、雷托罗曼语、意大利语、撒丁语、19世纪末消亡的达尔马提亚语和罗马尼亚语,还有其他一些与罗马尼亚语相近的巴尔干罗曼诸语言及其方言。
与意大利克诸语言相近的是凯尔特诸语言,其中包括高卢次语族(消亡的高卢语)、盖德尔次语族,后者囊括爱尔兰语(有自中世纪早期起的古文献)、苏格兰语、马恩语(马恩岛上)以及不列颠次语族,包括布列塔尼语(借助自8世纪的古文献疑难注释和14世纪的文学文本而知晓)、威尔士语(或称威尔斯语)和消亡了的康沃尔语。西班牙还保留下来为数不多的用伊比利亚凯尔特语(凯尔特伊比利亚语)书写的古老铭文。在古代印欧诸语言的西部诸语族中,除意大利克诸语言与凯尔特诸语言外,还包括属伊利里亚语族的诸消亡语言(其中尤为突出的是伊利里亚语和梅萨普语)以及日耳曼诸语言,其中,日耳曼诸语言分为3个次语族:东日耳曼次语族——消亡了的哥特语;北日耳曼次语族或斯堪的纳维亚次语族——瑞士语、丹麦语、挪威语、冰岛语;西日耳曼次语族——英语及类似英语的弗里西亚语、弗拉芒语、荷兰语、阿非利堪斯语(布尔语)、德语和依地语。处于西部印欧诸语言(凯尔特诸语言、意大利克诸语言、日耳曼诸语言、伊利里亚诸语言)和东部印欧诸语言(雅利安-希腊-亚美尼亚语族,包括雅利安诸语言、希腊语和亚美尼亚语,后者依据自公元5世纪用格拉巴尔文字书写的古老文本而知晓)之间的是波罗的-斯拉夫诸语言。波罗的-斯拉夫诸语言分为两大类:与西部印欧诸语言极为相近的,包括西部波罗的诸语言(消亡的普鲁士语和其他仅知道个别单词的一些方言)、东部波罗的诸语言(立陶宛语、拉脱维亚语)的波罗的诸语言和斯拉夫诸语言,后者包括东斯拉夫诸语言(俄语、乌克兰语和白俄罗斯语)、西斯拉夫诸语言(捷克语、斯洛伐克语、波兰语、卢日支语、已消亡了的拉贝河沿岸语)和南斯拉夫诸语言——古斯拉夫语(以其为基础形成教堂斯拉夫语的数种不同变体或称抄本,它们作为教堂用语保留至今)、马其顿语、保加利亚语、塞尔维亚-克罗地亚语和斯洛文尼亚语。曾经处于东部语言和西部语言中间位置的古印欧语还包括消亡的吐火罗诸语言(在中亚地区发现的公元5-8世纪的古文献),凭借一些资料判断,它们与安纳托利亚诸语言是联系在一起的。许多消亡的印欧语都仅仅借助少得可怜的资料为人所知,如凭借在小亚细亚(弗里吉亚人约公元前12世纪从巴尔干半岛迁居至此)发现的碑铭被人所知的弗里吉亚语;如同伊利里亚语一样,与现代阿尔巴尼亚语有联系的巴尔干半岛上的色雷斯语;与希腊语相近的古马其顿语;和印欧前希腊语(或称佩拉斯吉语)相近的腓利斯丁语;与凯尔特语相近的北意大利勒蓬蒂碑铭语;利古里亚语等等。
属亚非超语系(阿非罗-亚细亚超语系或称闪米特-含米特超语系)(参见词条“亚非诸语言”)的有闪米特诸语言、古埃及语(及其延续科普特语)、柏柏尔-利比亚诸语言、库施特诸语言[索马里语、奥罗莫语(加拉语)和其他语言;部分库施特语有时被单列为亚非诸语言的一个专门的奥莫特次语族],乍得诸语言(其中使用最广泛的是豪萨语)。闪米特语族由5个语支构成,这5个语支似可合并为东西两个基本语支,进而再将它们划分为南、北两个次语支。东部(或称东北部、北部边缘)闪米特诸语言中有消亡的阿卡德语,亦即亚述-巴比伦语,或称巴比伦-亚述语。西部闪米特诸语言中的北方语支(或中北部语支)包括迦南诸语言和阿拉米诸语言(诸方言)。迦南次语支又包括已消亡的埃勃拉语或称古迦南语(最古老的文献于1974-1979年在叙利亚北部古老的埃勃拉城中被发现,这些文献属于公元前第三千年的下半叶,与阿卡德语十分相似)、腓尼基语[腓尼基-布匿语;腓尼基国、地中海地区腓尼基人居民点(其中包括当时使用腓尼基-布匿语的迦太基城邦)的语言]和摩押语、古犹太语及其现代形式伊夫里特语。与迦南次语支密切相关的还有拉斯沙姆拉(古乌加里特)城出土的公元前14-15世纪文本的乌加里特语,但该语言如同部分的埃勃拉语一样,处在东西闪米特诸语言的中间地位。属阿拉米次语支的有阿拉米语,该语言在公元之初曾是近东地区使用最广泛的语言,但后来几乎完全被阿拉伯语所取代;东部阿拉米诸方言与亚述语(艾索尔语)历史上相关联。西南闪米特诸语言可分为3个次语支:中南次语支(阿拉伯语)、南阿拉伯次语支和与其相近的埃塞俄比亚闪米特次语支(埃塞俄比亚闪米特诸语言中使用最广泛的是阿姆哈拉语)。
属卡特维尔语族,即南部高加索语族(参见“卡特维尔诸语言”)的语言有:格鲁吉亚语、梅格列尔语[与拉兹语(恰内语)一起构成赞次语族]、斯万语。有推测认为,卡特维尔诸语言与北高加索诸语言是亲属语言,并且一起组成高加索(伊比利亚-高加索)语系,但这一假设没有得到证实;高加索语系所根据的那些共同词汇和形式中的大部分情况都可以由它们随后归入的同一个高加索语言联盟加以解释。
高加索(伊比利亚-高加索)诸语言有时被与巴斯克语(在西班牙和法国南部)合并为巴斯克-高加索语系,但巴斯克语与高加索诸语言的亲属关系尚未得到证实。
芬兰-乌戈尔诸语言(或称乌戈尔-芬兰诸语言)分为两个基本次语族:芬兰次语族和乌戈尔次语族。属于乌戈尔次语族的有西西伯利亚的鄂毕-乌戈尔诸语言——汉蒂语(奥斯恰茨语)、曼西语(沃古尔语)以及匈牙利语,操匈牙利语者因为早在公元第一千年远迁西方,以致与鄂毕-乌戈尔诸语言使用者的空间距离已相隔十分遥远。芬兰次语族包括彼尔姆诸语言——科米-彼尔姆语、科米-齐梁语和乌德穆尔特语(沃加克语)以及波罗的海沿岸-芬兰-伏尔加诸语言。伏尔加诸语言,即摩尔多瓦诸语言(埃尔齐亚-摩尔多瓦语和莫克沙-摩尔多瓦语)、马里诸语言(草地马里语和山地马里语)、萨阿米语(即苏联摩尔曼斯克州和斯堪的纳维亚各国的两种方言)和波罗的海沿岸-波兰-芬兰诸语言(芬兰语、爱沙尼亚语和一些使用地域不广的语言)合在一起均可纳入波罗的海沿岸-芬兰-伏尔加诸语言。
芬兰-乌戈尔语系和苏联极北地区的萨莫迪诸语言(涅涅茨语、埃涅茨语、已消亡的恩加纳桑语或称塔夫吉语、塞尔库普语)有亲属关系,与之共同组成乌拉尔(芬兰-乌戈尔-萨莫迪)语系。与乌拉尔诸语言相近的是正在逐渐消亡的尤卡吉尔语(西伯利亚北部)。有些科学家认为,乌拉尔语系可与阿尔泰诸语言一起组成范围更加广泛的乌拉尔-阿尔泰语系。阿尔泰超语系包括突厥诸语言、蒙古诸语言、通古斯-满诸语言等;朝鲜语和日本语(后者与朝鲜语构成阿尔泰诸语言内部的特殊紧密统一体)归属阿尔泰语系的观点还处于证实的过程中。在阿尔泰超语系中,突厥诸语言与蒙古诸语言的联系表现得尤为紧密;在突厥诸语言中,与蒙古诸语言最接近的是楚瓦什语,在某些方面楚瓦什语显示出特别的古旧色彩。
突厥诸语言(按А.Н. 萨莫伊洛维奇更加确切的分类)包括以下一些语组:1)布加尔语组,楚瓦什语属于该组;2)西南语组,包括土耳其语、阿塞拜疆语、土库曼语和其他语言;3)西北语组,包括鞑靼语、哈萨克语、巴什基尔语、卡拉伊姆语、库梅克语、诺盖语、卡拉卡尔帕克语以及和阿尔泰语构成吉尔吉斯-克普恰克专门语组的吉尔吉斯语;4)东南语组,包括乌兹别克语(排除其被归入专门语组的某些克普恰克方言)和现代维吾尔语;5)东北语组,属于该组的有雅库特语和西伯利亚、阿尔泰的其他一些语言,还有一些拥有远古文献遗存的已消亡的突厥语言[古回鹘语(古突厥语)和叶尼塞-鄂尔浑文字语言]。现代蒙古诸语言包括布里亚特语、蒙古语、阿富汗莫戈勒语、中国东北部的达斡尔语、中国蒙古尔语(青海湖区域,即土族语,参见《中国大百科全书(语言文字)》(1988年))。通古斯-满语包括濒危的满语、埃文基语、与埃文基语接近的埃文语和东西伯利亚及远东地区的其他一系列语言。
日语与琉球语(琉球群岛)有近亲关系。但是,日语和琉球语在世界诸语系中的地位仍不十分清楚,它们不仅与阿尔泰诸语言,而且与马来-波利尼西亚诸语言都有共同的特征。
印度(主要是印度南部)的绝大多数人口使用达罗毗荼语系(参见词条“达罗毗荼诸语言”)的语言,包括泰米尔语、与其相近的马拉雅拉姆语和坎拿达语,还有泰卢固语、库伊语、贡迪语、布拉会语(印度西北部)等。根据苏联、芬兰和美国研究者解读,公元前第三千年原始印度文化简短碑铭文本是用与原始达罗毗荼语(或称共同达罗毗荼语)相近的语言书写的。这令人信服地证明,人们曾多次提出的关于远古达罗毗荼诸语言和乌拉尔诸语言以及已消亡的埃兰语(西亚的古老语言之一)有亲缘关系的假说是正确的。
根据В.М. 伊里奇-斯维蒂奇论据十分周详的假说,印欧、亚非、卡特维尔、乌拉尔、阿尔泰和达罗毗荼等诸语言共同构成诺斯特拉超语系(亦称“博列伊”或“博列阿尔”超语系,参见词条“诺斯特拉诸语言”)。有些学者把楚科奇-勘察加语系的诸语言(楚科奇语、科里亚克语、阿柳托尔语、伊捷尔缅语等)也纳入其中。发生学联系至今尚不完全清楚的某些欧亚地区语言(特别是格林伯格假说提及的尼夫赫、阿伊努、爱斯基摩-阿留申等语言),虽然不排除它们有可能属于诺斯特拉超语系(格林伯格所谓的“欧亚超语系”),但概率更高的是,此外的很大一部分欧亚语言属于其他语系。
许多研究工作者认为,北部高加索语言不过是些残余,它们的前身曾经是一个范围宽广得多的语系。
北部高加索诸语言包括阿布哈兹-阿迪格诸语言(即西北部高加索语言)和纳赫-达吉斯坦诸语言,即东北部高加索语言。阿布哈兹-阿迪格语族(参见“阿布哈兹-阿迪格诸语言”)包括组成阿布哈兹-阿巴津次语族的阿布哈兹语和阿巴津语、组成切尔克斯次语族或称阿迪格次语族的阿迪盖语和卡巴尔达-切尔克斯语、乌贝赫语以及已消亡的哈梯语(公元前第二千年因楔形文字古文献而为人所知,与阿迪格语极为相近)。
纳赫-达吉斯坦诸语言一般分为纳赫诸语言或称车臣-印古什诸语言(车臣语、印古什语、巴茨比语)和达吉斯坦诸语言(达吉斯坦境内的约三十种山地语言),其中,达吉斯坦诸语言包括阿瓦尔-安季-策扎次语族(使用最广泛的是阿瓦尔语)、拉克-达尔金次语族(达尔金语和拉克语)、列兹金-塔巴萨兰次语族(列兹金语、塔巴萨兰语及许多其他语言)。与东北部高加索诸语言(特别是与其中的纳赫次语族)相近的是现已消亡的胡里特语(公元前3,000年至公元前2,000年的文本出土自美索不达米亚北部、小亚细亚、叙利亚北部)和乌拉尔图语(公元前1,000年乌拉尔图国位于历史上的亚美尼亚境内),胡里特语和乌拉尔图语构成胡里特-乌拉尔图次语族(人们尝试将埃特鲁斯语归入该次语族)。
根据早前提出并且后来得到严谨验证的推测,北部高加索语系与叶尼塞诸语言具有亲属关系,北部高加索语系曾一度被与叶尼塞诸语言一起归入一个十分庞大的语言统一体,即叶尼塞-北高加索语言统一体。属于叶尼塞语系的有叶尼塞河流域数个村落住民使用的克特语(叶尼塞-奥斯加克语)以及几种与之有亲属关系的西西伯利亚消亡语言(科特语、阿桑语及其他语言)。不少学者认为,叶尼塞(克特)诸语言与藏缅语言也有亲属关系。
汉藏语系(有些学者对该语系语言的一致关系持异议)中的藏缅语族(参见“汉藏诸语言”、“藏缅诸语言”)包括拥有极其宝贵的中世纪(自8世纪)古文字遗存的藏语、与其有近亲关系的诸藏区方言、古文字遗存同样源于中世纪的缅甸语以及其他与缅甸语构成紧密统一体的倮倮-缅甸语言,如阿卡语、利苏语等。唐古特语也属于藏缅诸语言,大量撰写于中世纪的唐古特语文本不久前才得以解读。与藏缅语族密切关联的还有克钦诸语言(景颇语或称克钦语;缅甸和中国西南部)。属藏缅诸语言的还有博多-加罗语支 (博多语或称博罗语等,用于印度阿萨姆和其他一些邦)、西部喜马拉雅语支(尼泊尔西部),其中博多-加罗语支包括钦(库基-钦)次语支的各个语言。汉藏诸语言还包含研究得很不充分的若尔盖语支(在四川、甘肃及周围山区)。有推测认为,列布查语(在锡金)是其他汉藏诸语言中与汉语相对来说最接近的。
不过,汉语(重要词汇与藏缅诸语言共同)较之汉藏语系其他所有语言,占据着特殊的地位。汉语就其词汇而言,与汉藏语系其他语言的区别很大,以致与该语系所有语言的共同祖语的分离时间可以追朔到不迟于公元前第五千年(中国北部发现的汉语书面文本,即在甲骨上刻写的用于占卜的铭文,始于公元前第二千年末;通过对比晚近时期的各种方言和早期借入其他语言的词汇,使我们得以复原以象形文字传承的古汉语历史音韵)。数量繁多的汉语方言可归纳成4种主要方言:数量最多的北方方言(中亚的东干语与其有历史关联)和吴、粤、闽方言(按另一种分类法则有7种)。有些研究者曾提出过假设:北美洲的纳-德内诸语言与汉藏语系是连接起来的,而与该地区其他阿美林德语有本质的区别。这种观点逐渐演变为构建一个超语系共同历史比较语法的尝试,这个超语系除大量非诺斯特拉欧亚语言(约定名称为“雅弗”,参见词条“语言新学说”);包括北高加索诸语言和与其有亲属关系的古代东方诸语言——哈特语、胡里特语以及可能与其相关联的埃特鲁斯语(使用者先前由小亚细亚迁至意大利),或许还有苏美尔语、叶尼塞诸语言、结构上与叶尼塞诸语言相近的西班牙巴斯克语和喜马拉雅山区布鲁沙斯基语、汉藏语系诸语言)外,还包括隶属北美洲纳-德内语系的语言(阿塔帕斯克语族中的阿美林德诸语言以及正在消亡的埃亚克语、特林基特语;印第安海达语是否属于这一语系,最近一段时间尚有争议)。北美洲纳-德内语系的源头位于阿拉斯加以南。未尝不可以认为,该语系扩展到新大陆要晚于其他所有的阿美林德语。根据这一“雅弗”语新假说,后来称为纳-德内语系的群体迁移至新大陆前,整个这一超语系的起源更可能的应是旧石器时代(和中石器起始时代)的中部亚洲地区。一部分方言的使用者可能由中部亚洲迁居至靠近西部的地区,与高加索及其南面相邻地区的一部分诺斯特拉诸语言的使用者开始发生早期的接触。这一非诺斯特拉超语系的另一部分方言一直扩展(人搬家,语言随着走;不是语言走,人不走)到欧洲西部(如果巴斯克语一方面与北高加索诸语言,另一方面与叶尼塞诸语言和布鲁沙斯基语有共同语法特征,而且苏美尔语中也存在这些共同语法特征,那么这就足以将所有这些语言都纳入到该超语系之中),这发生在后来几波印欧人移民定居欧洲(尤其是西欧)之前,这一印欧人群体是从诺斯特拉诸方言使用者的总群体中分离出来,在西亚集结形成的。中部亚洲完好保存下来的那部分“雅弗”超语系语言,是人类早期在大部分中亚地区开始居住的标记,那里的水文地理名称证明,操叶尼塞诸语言者曾在现代哈萨克斯坦境内生活过(由西亚诺斯特拉语分布区分离出来的印欧、土耳其和乌拉尔方言的使用者开始经中亚迁居之前)。这样的话,布鲁沙斯基语和部分藏缅语言就可以视为早期中亚语言分布区遗留下来的语言了。而藏缅语言其他分支的使用者,如操汉语和纳-德内语系者,很早之前就迁往东方和东北方了。人们推测,远自公元前4,000年-公元前3,000年,中国人的直系祖先就已经居住在长江以北的地区了。但是,虽然有大量事实佐证这里所描述的超语系诸方言使用者古代的迁徙图景,但这个超语系总体上的统一关系及其使用者们的迁徙特点依旧只是假设性质的(较之诺斯特拉超语系统一关系的假设程度更大,后者的解体时间较晚)。东亚和东南亚诸语言的准确分类引起的争议更大。
苗瑶语(中国西南部、泰国和越南北部)因有大量时代相当久远的借词,较早前曾被划归汉藏语系。约在公元前2,000年-1,000年之交,由于与苗瑶语有远亲关系的部分泰语言(侗-水次语族)使用者的迁移,操苗瑶语者分成苗、瑶两族。有推测认为,苗瑶语、泰诸语言、加岱诸语言(有时划归较广义的泰语族)和澳斯特罗尼西亚诸语言(早期称为马来-波利尼西亚语)共同构成统一的澳泰超语系。澳泰超语系的解体应不晚于公元前5,000年(如果不是更早的话)。其中,纯泰次语族包括:彼此接近的诸西南泰语言(泰语或称暹罗语、老挝语、掸语、阿霍姆语),远在中世纪就使用这些语言创建了首批书面文本;诸东北泰语言(或称诸北泰语言)包括北壮方言(中国南部)和布依语;诸中泰语言(侬语和南壮方言)。侗水语族更接近于西南泰语分支,但是侗水语族的分离时间一般确认在秦汉之前(根据西南泰语、侗水语中古汉语借词的年代)。侗-水语族与纯泰诸语言(或按另一术语系统称为壮傣语)有联系。黎语、拉嘉语、仡佬语和其他语言组成澳泰超语系的加岱语族。澳斯特罗尼西亚语系是否属于澳泰超语系的问题仍有争议。
根据澳泰超语系假设,澳斯特罗尼西亚诸语言与苗瑶诸语言、泰诸语言、加岱诸语言之间的关系特别接近,这可以通过占诸语言(越南南部的一组澳斯特罗尼西亚语言,包括以古占婆国文字闻名近一千五百年的占语和嘉莱语等)的特点加以验证。但对于共同占语及其后来的许多演变成现代诸占语的方言而言,有一些特征则可以用它们后来与亚洲东南部其他语系各种语言的接触来加以解释。除占语支外,属于澳斯特罗尼西亚诸语言的还有北澳斯特罗尼西亚语支(台湾的邹语和其他一些结构颇为古旧的澳斯特罗尼西亚语言;其中的一些已经完全消亡,另外一些的使用者也屈指可数)、包容面十分宽广的印度尼西亚语分支(马来语、印度尼西亚语、爪哇语、巴塔克语、达雅克语以及其他一些印度尼西亚语言,他加禄语以及其他一些菲律宾语言,马达加斯加岛上的马拉加西语等)。由于澳斯特罗尼西亚语的初始词汇中有大量表示沿海生活的特有单词,澳斯特罗尼西亚语的原始发祥地可以认定为或者是其北部分布地区(即中国东部、台湾),或者是某个大型岛屿(可能是爪哇岛)。由于较晚时期几次东迁(大约发生在进入公元前第五个千年的时期)的缘故,分布到大洋洲的波利尼西亚诸语言和美拉尼西亚诸语言都与印度尼西亚语相近。
日语(和与其相近的琉球语)中那些明显将其与澳斯特罗尼西亚语连接在一起的特征和日语中的阿尔泰语言(归根结底是诺斯特拉诸语言)成分之间的相互关系问题至今仍然是一个谜。毫无疑问,一系列澳斯特罗尼西亚语语素渗透到了日语之中,就像渗透到阿伊努语中那样(似通过古日语),但是这些语素与源自阿尔泰语语素的对应程度和性质还有待确切说明。澳斯特罗尼西亚诸语言总体上在古代已具备隶属澳泰语系的属性,它们与澳斯特罗亚细亚超语系语言有着很多共同特点。依据澳泰语假说,之所以有这些共同特点,是由于澳斯特罗尼西亚语中存在古澳斯特罗亚细亚底层语的缘故;这样的话,澳斯特罗尼西亚诸语言就是从东南亚扩展开来的。根据另一种可供选择的假说,澳斯特罗尼西亚语属于一个包括澳斯特罗亚细亚诸语言在内的澳斯特里克超语系。澳斯特罗亚细亚诸语言包括:越芒诸语言(越南语及越南境内与之有亲属关系的几种语言),它们有一个与泰诸语言共同的规模可观的(底层语?)词层;或许还有塞芒-凯撒次语族诸语言,但它们的谱系关系尚未完全厘清;孟-高棉诸语言(与老挝巴拿语支相近的柬埔寨高棉语和孟语支语言),它们与苗瑶语有一定的联系(可能是晚近时期频繁接触的缘故);崩龙-佤诸语言(崩龙语、梁语、缅甸佤语、泰国拉瓦语、喀语、偏语以及老挝和中国南方的一些山区语言);孟加拉国的卡西语,由于大约公元前四千年至三千年汉藏部落(克伦人和钦人)的迁徙,卡西语很早就和崩龙-佤语相分离;蒙达诸语言(在印度东北部和中部构成同一语支的桑塔利语、蒙达里语和霍语;卡里亚语以及加尔各答以西的一些亲属语言;再向西的库尔库语;构成一个单独语支的萨瓦拉语或称索拉语)。印度有一些其他语言与这些语言的关系尚不清楚,特别是印度中部的纳加利语以及尼科巴群岛的尼科巴语(有时视为同崩龙-佤语和孟-高棉语相近)。澳斯特罗亚细亚底层语不仅在澳斯特罗尼西亚语中发现,而且在古汉语中发现,这一情况也时常作为论据,用以反对古汉语与藏缅语可确定无疑合并为同一语系的观点;然而,这些澳斯特罗亚细亚语词汇更应是在操澳斯特罗亚细亚语某种方言的民族居住在长江流域的河谷地区(长江这个名称本身就是来自澳斯特罗亚细亚语)时被引借到古汉语中的,而那时操古汉语的另一些民族则生活在更北部的地区。
依据不久前才提出的印度-太平洋假说,安达曼群岛上的一种濒危语言(有时将其与归属于澳斯特罗亚细亚语系的萨凯语作比照)与新几内亚及相邻岛屿上的绝大部分语言(被约定称为巴布亚诸语言)有亲属关系。可能印度-太平洋超语系也包括某些被认为是澳斯特罗亚细亚语系的其他一些语言(比如萨凯语)。在其余的“巴布亚”语言中可以划分出若干暂时不互相隶属的语组。但是它们之中的一部分语言可能应当与澳大利亚诸语言合并,共同构成一个其整体性毋庸置疑的统一的澳大利亚语系。
依据新的分类尝试,非洲撒哈拉以南的居民主要使用两种超语系语言:由尼日尔-科尔多凡语系(刚果-科尔多凡语系)和尼罗-撒哈拉语系构成的刚果-撒哈拉超语系(较早的术语系统称为“苏丹语系”)以及孤立存在的科伊桑超语系。尼日尔-科尔多凡语系由尼日尔-刚果和科尔多凡两个语族构成。尼日尔-刚果语族中有一个涵盖很广的贝努埃-刚果次语族,包括类班图诸语言(班图诸语言也属其中),班图诸语言中最主要的语言有斯瓦希里语、卢旺达语、刚果语、隆迪语、卢巴语、卢干达语、林加拉语、谢索托语和(伊西)祖鲁语。蒂夫语是苏丹境内东部类班图诸语言中地域分布最广的语言。一些学者认为,班图诸语言和苏丹的类班图诸语言同属于尼日尔-刚果语族,一方面与亚非诸语言相关联,另一方面又同苏丹的一些科尔多凡语言(即刚果―科尔多凡诸语言)相关联。与班图诸语言和类班图诸语言有显著差别的是贝努埃-刚果诸语言内部的下列语支:平原或称高原语支(坎巴里-雷舍语、皮蒂语、比罗姆语等)、类朱孔语支、克罗斯里维尔语支(博基语等)。尼日尔-刚果语族内部的其他次语族中还有阿达马瓦诸语言(图拉-克穆语、昌巴-蒙巴拉语、达卡塔赖语、维雷-杜鲁语、穆穆耶-津纳语、达马卡里语、荣古尔-罗巴语、卡伊语、伊延-蒙加语、隆古达语、费利语、宁巴里语、布亚-霍别语、马萨语)。尼日尔-科尔多凡语系的东部语言包括:格巴亚-恩格巴卡语、班达语、恩格班达-耶科马语、赞德-潘比亚语、恩格巴卡-马博语、即班格巴语、恩多戈-曼加尔语、马迪-敦戈语、曼敦加-姆巴语。尼日尔-科尔多凡语系还包括:西部大西洋次语系(富拉语、沃洛夫语、基西语等);曼迪次语系(马林克语、班巴拉语、索宁克语、门德语等);沃尔特次语系(莫西语或称莫雷语、格鲁西语、洛博语等);克瓦次语系(阿坎语、埃维语、约鲁巴语、伊博语等)。一些类班图语言(比如蒂夫语)、“西尼格里特”诸语言(阿达马瓦语、乌班吉语、科尔多凡诸语言)以及克瓦诸语言,近来常常作为论据,证明很久之前曾经提出过的假说——所有的“苏丹”(“刚果-撒哈拉”)语言,包括尼罗-撒哈拉诸语言在内,是一个统一体。尼罗-撒哈拉语系包括沙里-尼罗语族、中部苏丹语族以及北部(邦戈-格贝里语、萨拉语、瓦勒语、布巴马语、克雷什语、宾查-卡拉语)和东南部苏丹语族(莫路-马迪语、坎格别鲁-阿卢亚语、芒布鲁-埃费语、伦杜语)。据推测,桑海、撒哈拉、马巴、富尔、科马等语族都是各自独立的语族。如果不久前重新开始的论证“所有刚果-撒哈拉语言(苏丹诸语言)是一个统一体”假说的工作得以成功的话,那么这将为研究两大语言集合之间的相互联系开辟非常广阔的前景;这两大语言集合一方面是北非和欧亚毗连地区的各种语言[这些语言总体而言都属于诺斯特拉超语系中的亚非(闪米特-含米特)语言],另一方面是撒哈拉以南的各种非洲语言。在亚非诸语言和贝努埃-刚果诸语言(尤其是班图语和其他类班图语言)之间发现了某些相似特征,如果这些特征无法解释为这些语言在非洲大陆晚近时期相互影响的结果的话,那么就可能是时间非常遥远的、古老的那些亲属联系(归根结底是在诺斯特拉超语系与刚果-撒哈拉诸语言之间)的表现。
霍屯督诸语言在非洲南部占据着十分特殊的地位,它们和布须曼诸语言常常合并,称为科伊桑诸语言。科伊桑诸语言还包括其他几种东非语言(桑达韦语、哈扎语)。或许恰恰是科伊桑诸语言呈现了非洲远古住民所持语言的特征(就像叶尼塞诸语言及其一些亲属语言是欧亚很大部分地区早期住民所持语言的残余一样)。南部非洲所谓俾格米诸语言的研究十分薄弱(术语本身就像“巴布亚”诸语言一样,带有约定性质)。
西伯利亚北部和远东地区部分语言的名称,如“古西伯利亚”诸语言或称“古亚细亚”诸语言,也是不具有现实分类意义的约定符号。人们将叶尼塞诸语言称为西部“古西伯利亚”语言,是因为认清了叶尼塞诸语言和北高加索诸语言及其他一些与北高加索诸语相近语言之间是有联系的(叶尼塞诸语同乌拉尔语相近因而也与诺斯特拉语相近的“古亚细亚”尤卡吉尔诸语之间,存在各别相似性,这可能是由于在西伯利亚以及接壤地区晚近时期接触的缘故)。像楚科奇-科里亚克诸语言(楚科奇语、科里亚克语、伊捷尔缅语)这样的古亚细亚语言都可以归入诺斯特拉超语系中(虽然这一假说只有部分研究者接受)。
类似的假说在讨论尼夫赫(吉利亚克)语时也曾提出过,但涉及的可能只是一些个别外来词(与东亚和远东其他语言共同的)的借入问题。在东亚诸语言中,孤立存在的还有阿伊努语(日本北部),常常被拿来同美洲印第安诸语言作对比(就像叶尼塞诸语言一样)。爱斯基摩语是阿留申语或称乌南甘语的近亲语言,广泛分布在东北亚、北美和格陵兰岛的沿海地区。也许,这是自“旧大陆”至北美最后几波移民浪潮中的一波留下的遗迹。近来,爱斯基摩-阿留申语与印欧语以及整个诺斯特拉超语系的对比研究越来越多。除了与“旧大陆”两个囊括广泛的超语系接近的爱斯基摩-阿留申诸语言和纳-德内诸语言外,与诺斯特拉超语系进行对比的美洲原住民语言还有佩努蒂亚语系的语言(特别是加利福利亚北部的温顿语和其他语言)。但是这里所谓的联系性质更加可能的是只表明这些阿美林德语言在到达北美之前(更确切地说在西伯利亚疆域)曾与乌拉尔-尤卡吉尔诸语言发生过相互影响(这里言及的可能只是语言接触所产生的痕迹,而不是语言的亲属关系);与此同时,一部分共同词汇成分也可以在叶尼塞语中找到平行现象。其他曾经作过的“旧大陆”语言和阿美林德语言之间(比如突厥诸语言和南美克丘亚语)的对比研究涉及的只是各别的一组组彼此孤立的词,无法由此得出可能存在语言亲属关系的确定结论。
大部分北美洲的语言都结合成大规模的超语系,它们相互之间可能最终都有亲属关系。属于这些超语系的(除了孤立的纳-德内诸语言)有阿尔冈基亚-莫桑超语系,或称阿尔冈基亚-瓦卡什超语系。根据众多分类法之一,该超语系由阿尔冈基亚诸语言和瓦卡什诸语言组成。其中阿尔冈基亚诸语言是研究得最深入的语系,包括里特万次语族(加利福尼亚太平洋沿岸的尤罗克语和维约特语)、加拿大和美国的阿尔冈基亚语族(克里语、奥杰布瓦语、梅诺米尼语、福克斯语和其他语言)。瓦卡什诸语言(努特卡语、夸扣特尔语和温哥华岛及大陆相邻地区的贝拉贝拉语)、切马孔语(部分已经消亡)和极其古老的萨利什诸语言(舒斯沃普语、卡利斯佩尔和其他一系列语言)一起构成莫桑语系。有推测认为,阿尔冈基亚-瓦卡什诸语言(阿尔冈基亚-莫桑诸语言)与库特奈诸语言(加拿大边境地区)、加尔弗诸语言之间也有特殊的联系(加尔弗诸语言进而区分为路易斯安那州和密西西比州的穆斯科吉-纳切兹语族、纳切兹次语族和乔克托-阿拉巴-克里克次语族;已经消亡了的图尼卡语和路易斯安那州同一语族的另外两种语言是孤立存在的)。霍卡-苏超语系所占地域十分辽阔,分为霍卡和苏两组语言。霍卡语组包括雅纳语和一系列其他语言,以及亚利桑那州和加利福尼亚州的尤马诸语言,墨西哥、尼加拉瓜和洪都拉斯的一些各别语族。苏语组包括拉科塔语、克劳语、北美大草原的其他一些语言以及消亡了的东南语族。近来人们将易洛魁诸语言、卡多诸语言与霍卡-苏诸语言合并在一起。尤基-佩努蒂亚超语系包括尤基语(之前被错误地划归霍卡-苏超语系中)和佩努蒂亚诸语言[温顿语(常像尤基语那样被拿来与乌拉尔-尤卡吉尔诸语言作对比)、米沃克语、迈杜语和其他一些加利福尼亚州中部语言];整个超语系的统一性受到一些美国学者质疑。 阿兹特克-塔诺超语系(或称塔诺-犹他-阿兹特克超语系)涵盖犹他-阿兹特克诸语言(其中的古阿兹特克国语言拥有前哥伦布时期墨西哥的象形文字古文献遗存和持续时间很长的晚期文献传统);还有新墨西哥州的塔诺语和俄克拉何马州的基奥瓦语。在中美洲特别重要的是玛雅-索克超语系,它由玛雅语系和米赫-索克语系构成,其中玛雅语系包括玛雅语(大量已被部分破解的前哥伦布古代铭文和手稿以及一系列墨西哥和危地马拉彼此相对接近的其他语言;米赫-索克语系包括一些已经消亡的语言以及墨西哥特万特佩克半岛上的米赫语、索克语和波波卢卡语)。这个超语系还包括瓦维诸语言(特万特佩克半岛太平洋沿岸)和托托纳克语族(其中有墨西哥的托托纳克语和特佩华语);但这一假说遭到质疑。
根据阿美林德假说,阿尔冈基亚-莫桑超语系、尤基-佩努蒂亚超语系、塔诺-犹他-阿兹特克超语系和玛雅-索克超语系不仅相互之间,而且还同下列南美洲主要超语系有亲属关系:阿拉瓦克超语系(一组分布于圭亚那、委内瑞拉、玻利维亚和哥伦比亚广阔地域的语言);雅诺马诺-帕诺-塔卡诺超语系(包括从尼加拉瓜到哥伦比亚疆域的奇布查语系、分布极广的南美洲印第安人的克丘亚语——从前印加王国的基本语言, 以及在秘鲁和玻利维亚广泛使用的艾马拉语);图卡诺超语系(哥伦比亚、厄瓜多尔和巴西);维托托超语系(哥伦比亚各个独立部落的语言);图皮-瓜拉尼超语系(一组分布于圭亚那、巴西、玻利维亚和阿根廷广阔疆域的语言,纳入其中的还有巴拉圭的主要语言瓜拉尼语和曾于公元16-17世纪之交在巴西东部沿岸用于部落、民族之间交往的图皮-南巴语);吉超语系(包括许多支巴西印第安语言)。雅诺马诺-帕诺-塔卡诺、阿拉瓦克、图皮-瓜拉尼等诸语言常常结合起来组成安第斯-赤道超语系。关于加勒比诸语言(委内瑞拉和圭亚那)的地位问题,至今悬而未决。根据阿美林德假说的众多方案之一,加勒比诸语言不属于统一的阿美林德语系,阿美林德语系在主体移民落户美洲之后很快就解体了。美洲南部和中部种类繁多的语言(也包括部分北部语言)中,尚有一些研究得不够充分,因此它们的分类具有约定性质,约定的程度不低于“旧大陆”的巴布亚诸语言和俾格米诸语言。
早前在提出关于所有的美洲印第安语言无一例外地彼此间都有亲属关系的假说时,M.斯瓦迪士曾推测说,世界上所有现代语言都起源于数万年前“旧大陆”某一语系的各种方言(按照斯瓦迪士的说法,在当时还存在其他的一些语系,只不过后来都消失得无影无踪了)。然而,斯瓦迪士和现代语言学(参见词条“语言年代学”)广泛使用的确定语系解体时间的方法,未能对超过4,000-5,000年之前的语言解体时间作出可靠的结论,因此斯瓦迪士(以及之前的A. 特龙贝蒂)关于美洲和“旧大陆”所有语言单源发生(单一起源)的各种结论都不可靠。但与此相反,近年来的研究却使人们得以将“旧大陆”和新大陆几乎所有从前已知的主要语系合并成为数相对不多的超语系,它们之间毕竟可以发现一些联系。近年来语言谱系分类领域取得了辉煌的成就,这使人们可以作出论据更加充分的推测, 因为我们起码可以把大部分已知的语言(如果不是全部的话) 在谱系上联成一体。
世界上还有大量语言缺少足够研究,这是对世界语言早期历史作最终结论的障碍。可以这样认为,大多数语系只保留在一些个别的地名和借词中,或者说它们已消失殆尽;有些远古语言的文献遗存(比如,克里特语的象形文字)至今未得到破解。人类的有些极其古老文明语言(如苏美尔语、埃特鲁斯语)在语言谱系分类中至今未找到大家公认的位置,虽然在这方面近年来取得了一系列辉煌的成就。
美洲、非洲、东南亚、新几内亚和大洋洲语言的分类在很多方面尚未得到细致的研究。因此,现代科学描绘的人类语言历史图景还只是十分概略的。
(译者:刘永红;审校:许高渝、张家骅)
Benedict, P.K. Austro-Thai and Austroasiatic[A].AustroasiaticStudies[C]. Honolulu, 1976.
Benedict, P.K. Vocalic Transfer: A Southeast Asia Areal Feature[J].ActaOrientalia, 1979(40).
Bodmer, Fr.DieSprachenderWelt, 3Aufl.[M]. Köln-B., 1964.
Chafe, W.L.TheCaddoan,IroquoianandSiouanLanguages[M]. The Hague, 1976.
Finck, F.N.DieSprachstämmedesErdkreises, 3Aufl.[M]. Lpz., 1923.
Goddard, R.H.Algonquian,WiyotandYurok:ProvingaDistantGeneticRelationship,Indo-EuropeanStudiesII[M]. Cambridge, 1972.
Gray, L.H.FoundationsofLanguage[M]. New York, 1939.
Greenberg, J.H. Historical Linguistics and Unwritten Languages[A].AnthropologyToday[C]. Chicago, 1953.
Greenberg, J.H.StudiesinAfricanLinguisticClassification[M]. New Haven, 1955.
Greenberg, J.H. The General Classification of Central and South American Languages[A].MenandCultures:SelectedPapersoftheFifthInternationalCongressofAnthropologicalandEthnologicalSciences[C]. Phil., 1960.
Greenberg, J.H.TheLanguagesofAfrica[M]. The Hague, 1966.
Greenberg, J.H.LanguageintheAmericas[M]. Stanford, 1987.
Gregersen, E.A. Kongo-Saharan[J].JournalofAfricanLanguages, 1972(11).
Haas, M. R.HistoricalLinguisticsandtheGeneticRelationshipofLanguages[M]. The Hague, 1969.
Hamp, E.P. Selected Summary Bibliography of Language Classification[J].StudiesinLinguistics, 1960(1, 2).
Holmer, N.M. Further Traces of Paleo-Eurasian[J].InternationalAnthropologicalandLinguisticReview, 1953(2, 3).
Homburger, L.LeLangageetlesLangues[M]. Paris, 1951.
Kieckers E.DieSprachstämmederErde[M]. Hdlb., 1931.
Köhler, O. Geschichte und Probleme der Gliederung der Sprachen Afrikas[A].DieVölkerAfrikasundIhreTraditionellerKulturen,Tl1[C]. Wiesbaden, 1975.
Levine, R.D. Haida and Na-Dene: A New Look at the Evidence[J].InternationalJournalofAmericanLinguistics, 1979(2).
Milewski, T.ZarysJęzykoznawstwaOgólnego,cz. 2-RozmieszczenieJęzyków,zesz. 1-2[C]. Lublin-Kraków, 1948.
Mukarovsky, H.G. Bantusprachen und Sudansprachen[J].AfrikaundÜbersee, 1979(2).
Norman, J. Mei, T.-L. The Austroasiatics in Ancient South China: Some Lexical Evidence, Monumenta Serica[J].JournalofOrientalStudies, 1978(32).
Ohly, R.JęzykiAfryki[M]. Warsz., 1974.
Pei, M. A.TheWorld’sChiefLanguages[C]. L., 1949.
Sadovszky, O. J. Report on the State of the Uralo-Penutian Research[A].Ural-AltaischeJahrbücher,Bd. 48[C]. Wiesbaden, 1976.
Schmidt, W.DieSprachfamilienundSprachenkreisederErd[M]. Hdlb., 1926.
Swadesh, M.MapasdeClasificaciónLingüísticadeMéxicoylasAméricas[M]. México, 1959.
Swadesh, M.TraslaHuellaLingüísticadelaPrehistoria[M]. México, 1960.
Swadesh, M.TheOriginandDiversificationofLanguage[M]. Chicago, 1972.
Voegelin, C.F., Voegelin, F.M. Languages of the World[J].AnthropologicalLinguistics, 1965(6, 7).
ComparativeStudiesinAmerindianLanguages[C]. The Hague-Paris, 1972.
LesLanguesduMonde,t. 1-2[C]. Paris, 1964.
Алексеенко Е.А. и др. Кетский сборник. III. Антропология, этнография, мифология,лингвистика[С]. М., 1982.
Брук С.И. Этнодемографическая ситуация в послевоенном мире[J]. Советская этнография, 1976(3).
Брук С.И. Население мира. Этнодемографический справочник, 2 изд.[Z]. М., 1986.
Иванов В.В. Генеалогическая классификация языков и понятие языкового родства[M]. М., 1954.
Иллич-Свитыч В. М. Опыт сравнения ностратических языков,т. 1-2[M]. М., 1971-1976.
Ольдерогге Д.А., И.И. Потехин. Народы Африки[C]. М., 1954.
Реформатский А.А. Введение в языкознание, 2 изд.[M]. М., 1960.
Сердюченко Г.П. Языки Азии и Африки, т. 1-3[C]. М., 1976-1979.
Токарев С.А., Золотаревская И. А. Индейцы Америки. Этнографический сборник[C]. М., 1955.
Токарев С.А., С.П. Толстов. Народы Австралии и Океании[C]. М., 1956.
Шор Р.О., Чемоданов Н.С. Введение в языковедение[M]. М., 1945.
Яхонтов С.Е. Языки Восточной и Юго-Восточной Азии в IV-I тысячелетиях до н.э.[A]. Ранняя этническая история народов Восточной Азии[C]. М., 1977.
Языки народов СССР, т. 1-5[C]. М., 1966-1968.
*本文系国家社科基金重大项目“俄罗斯《语言学大百科词典》翻译工程”(11&ZD131)的阶段性成果。
H003
A
1000-0100(2016)03-0001-8
10.16263/j.cnki.23-1071/h.2016.03.001
定稿日期:2016-04-15
【责任编辑李洪儒】
特约主持人:张家骅教授
主持人话语:自本期开始,《外语学刊》将开设“‘丝绸之路’沿线国家语言谱系研究”栏目,根据中国国家主席习近平提出共建“丝绸之路经济带”的重大倡议,从我国出发,有计划、有步骤地引进苏联、俄罗斯学者关于相关国家语言的研究成果。引进不是目的,而是手段。我们的目的是:第一,推动我国外国语言文学学科开启语言类型学和语言谱系研究的新阶段,消除当前研究范围过于狭窄的弊端;第二,为我国汉语界、民族语言研究领域的语言类型学和语言谱系研究提供参考;第三,从语言文化切入,探索基础研究与智库建设相结合的有效路径。“他山之石可以攻玉”应该成为我国外语工作者专业教育和学科研究的重要理念。