APP下载

建设中国
——东南亚国家跨境语言资料库构想

2018-05-11朱梅丽

西部学刊 2018年3期
关键词:东南亚资源库语料库

朱梅丽

把语言上升到战略资源的高度,走出了仅把语言看做符号系统与交际工具的认识藩篱。随着“一带一路”开放合作的“朋友圈”不断扩大,语言在服务互联互通、会通中外思想、超越文化藩篱、推动文明创新、促进人文交流等方面的重要价值愈发凸显。“一带一路”沿线各种语言在相互接触中有可能会受到其他语言的影响而产生某些变异,也有可能各自继续保持着强大的生命力。

跨境语言资源在我国边境地区与邻近国家(接壤或不接壤)的社会各领域中都发挥着重要的应用价值与不可或缺的社会功能。我国56个民族异彩纷呈的语言,就是一座天然的语言资源宝库。西南边境的少数民族语言与部分东南亚国家的官方或非官方语言属于跨境语言,为了更好地服务于互联互通,中国作为“一带一路”倡议的发起者和重要建设者,应对沿线跨境语言早作安排与规划。

本文在分析中国与东南亚跨境语言资源的基础上,提出了建设中国——东南亚跨境语言资源库的构想。

一、建设中国——东南亚国家跨境语言资源库的必要性

中国至东南亚是丝绸之路经济带的重要地域,也是21世纪海上丝绸之路的重点方向。两者不仅在地缘、历史上有着密切关系,中国的西南边境与东南亚各国也存在着丰富的跨境语言资源,在“一带一路”顶层设计的规引下,中国—东南亚跨国合作和民间贸易往来会更加频繁密切,并且都需要借助语言这一重要的工具与资源。东南亚部分国家的官方或非官方语言,在我国西南边陲属于少数民族的非通用语言,它们相同或相似,不同国境公民可以互相通话。语言发生接触,会出现“语言变异”“语言安全”“汉语危机”的担忧或“趋向”。面对“一带一路”的语言安全隐忧,中国作为发起者和重要建设者,应重视对沿线东南亚国家跨境语言资源的规划与建设。与“一带一路”跨国经济合作相适应,建立我国与东南亚跨境语言资源库是实现互联互通的迫切要求。

二、中国——东南亚跨境语言资源分析

“一带一路”沿线有65个国家,其中东南亚有11个国家:东帝汶、菲律宾、柬埔寨、老挝、马来西亚、缅甸、泰国、文莱、新加坡、印度尼西亚及越南。从国情来看,除越南是社会主义国家外,其余都是资本主义国家。从经济发展程度来看,除新加坡属于发达国家外,其余均为发展中国家。从宗教来看,佛教、基督教、伊斯兰教均有分布。作为各项制度、文化载体的语言也错综复杂。基于各国经济、政治、文化、社会发展不平衡、不协调的问题,与东南亚开展经济文化区域合作,互通往来,必须从语言入手。

(一)关于跨境语言

1983年戴庆厦的《论跨境语言》一文首次提出“跨境语言”这一概念。近几年随着国家对周边关系的重视,语言学界出现了跨境语言的研究热潮。跨境语言是指分布在不同国境中的同一语言。狭义的跨国语言是指相接壤的不同国家中的同一语言,广义的跨国语言是分布在包括接壤与不接壤国家在内的同一种语言。本文使用跨境语言概念采用其广义。

(二)中国——东南亚跨境语言资源

一是中国少数民族语言与东南亚国家官方语言。在跨国经济往来和外交关系中一般均采用各国的官方语言,受地理、历史等因素影响,东南亚部分国家的官方语言与我国西南边境少数民族语言相通。下面是对东南亚国家官方语言的分析:

东南亚各国官方语言谱系分类

柬埔寨 南亚 孟--高棉 东孟--高棉 柬埔寨语老挝 汉藏 壮侗 壮傣 老挝马来西亚 南岛 马来--波利尼西亚 西部 马来语缅甸 汉藏 藏缅 缅 缅甸语泰国 汉藏 壮侗 壮傣 泰语文莱 南岛 马来--波利尼西亚 西部 马来语南岛 马来--波利尼西亚 西部 马来语汉藏 汉 汉 华语达罗毗荼 南部 泰米尔 泰米尔语印欧 日耳曼 西日耳曼 英语印度尼西亚 南岛 马来--波利尼西亚 西部 马来语越南 南亚 孟--高棉 越芒 越南语新加坡

其中,东帝汶与菲律宾有两种官方语言,新加坡有四种官方语言,跨不同语系、语族。

结合我国各少数民族语言的谱系分类,从上表可推测:东南亚国家的老挝语、泰语,分别与我国境内同属汉藏语系的克木语、傣语,是相同或十分相近的跨境语言;南亚语系的越南语与我国境内京语是跨境语言。以京语和克木语为例,在中国京语主要分布在广西防城港市所辖的东兴市江平镇京族三岛,使用人数六千人左右,是一种濒危语言。中国京语与越南主体民族越族的语言越南语实际上是一种语言。克木人是亚洲中南半岛民族,主要分布在老挝琅南塔省克木族,在中国也有少量克木人,分布在云南省西双版纳傣族自治州的勐腊、景洪。

老挝语、泰语与越南语作为官方语言,在经济合作、文化交流、民间友好往来中发挥了不可替代的作用。

二是中国少数民族语言与东南亚国家非官方语言。东南亚国家也存在几种非官方的跨境语言,例如拉祜语,瑶语,景颇语等。拉祜语属于汉藏语系、藏缅语族、彝语支,在中国主要分布在云南省的思茅、临沧地区和西双版纳傣族自治州。在东南亚拉祜语通行于缅甸、泰国和老挝。中泰共有的瑶语,主要分布在泰国的优勉族与中国的瑶族。景颇语属汉藏语系、藏缅语族、景颇语支,在中国,主要分布在云南省德宏傣族景颇族自治州的芒市、瑞丽、盈江等县。缅甸称克钦语,主要分布在缅甸北部。此外,布朗语、佤语、崩龙语以及柬埔寨的高棉语也与克木语同源并流。

上述几种语言在我国作为少数民族语言,语言使用者相对较少,且有的语言没有或后来放弃书面文字,加之汉语普通话的推广,经济、交通的发展,村落的迁徙等因素,我国境内通晓跨境语言的人数锐减,情况堪忧。因此建立中国——东南亚跨境语言资源库迫在眉睫。

三、中国——东南亚跨境语言资源库建设构想

(一)关于构建中国——东南亚跨境语言资源库

中国——东南亚跨境语言资源库就是广泛收集我国西南边境地区与“一带一路”沿线东南亚各国共同存在的跨境语言,通过信息技术开发跨境语言知识库、人才库、语料库以及机器词典等,拯救我国西南边陲濒危语言,保护民族语言多样性,建设语言生态文明,供政界监测东南亚国情、学界研究东南亚语言生活、商界开展贸易合作以及语言、旅游爱好者学习东南亚语种等。我国西南边陲少数民族语言与东南亚各国的官方或少数民族语言相同或相近,可以沟通交流,均可作为跨境语言资源库的语料收集对象。有的是同一种语言在境内外的不同名称,如我国境内的景颇语与缅甸的克钦语,我国境内的京语与越南的官方语言越南语等。有的原本相同,但受时空影响发生语言变异,如我国境内的傣语与泰语等。

(二)构建中国——东南亚跨境语言资源库的要点

现代信息技术空前发展,在语言资源保护与监测方面发挥的作用也越来越受到重视。如语保工程就强调运用现代信息技术对语言资源展开调查、采集、展示和开发研究。利用互联网与大数据,收集和分析跨境语言资源,建立语言知识库,语言人才库,语料库,特别是双语语料库。在先进的信息技术的支持下,将跨境语言资源进行系统地形式化描述,制作机器词典(包括网页端与移动设备端)。

一是建立语言知识库。建立收录关于语言使用及语言系统的各种信息的数据库。一般按照某个范畴体系或概念层级系统进行形式化的描述和组织,能够为语言信息处理的基础研究和应用开发提供支持。“一带一路”沿线东南亚跨境语言知识库,就是收录各跨境语言的相关信息,如中国边境少数民族语言与东南亚各国语言源远流长的历史,语言分化与变异特征,现今的地域分布等。

二是建立语言人才库。政策沟通、道路联通、贸易畅通、货币流通、民心相通实现的核心和基础是人才。培养通晓沿线东南亚跨境语言的人才,涵盖中国与东南亚各国,也包括本民族或其他民族。该类语言人才应具有的特征:具备高度的政治素养,充分的知识储备,对跨境语言持认同态度,掌握良好的跨文化交际技能,有志于为“一带一路”朋友圈“点赞”助力。

三是建立语料库。为语言研究和应用而收集的,在计算机中存储的语言材料。经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,能够观察和把握语言事实。处在中国境内的跨境语言,一般使用人数相对较少,接近濒危,可采用田野调查的方法进行收集,如中国京语。对于东南亚境内占优势的一方可通过大数据信息技术收集分析,如越南语。“一带一路”沿线中国——东南亚跨境语言语料库可以应用于语言学理论研究、语言应用和语言工程。特别是应建设收录汉语与跨境语言的双语语料库或英语与跨境语言的双语语料库,便于互译与推广。

四是编撰机器词典。使用信息技术对跨境语言的词语条目的语音、词法、句法、语义等信息进行系统的形式化描述,对自然语言资源进行加工,设计开发网页端和移动设备端的应用程序。如“景颇语学习”APP,“窥‘傣’知‘泰’”APP,“学京语观越南”网站等。

参考文献:

[1]戴庆厦.边疆地区语言状况研究须有中国特色[J].中央民族大学学报,2015(6).

[2]黄行.我国与“一带一路”核心区国家跨境语言文字状况[J].云南师范大学学报(哲学社会科学版),2015(5).

[3]邢欣,邓新.“一带一路”核心区语言战略构建[J].双语教育研究,2016(3).

[4]农雪明.东盟框架下的广西语言生态发展[J].中北大学学报(社会科学版),2015(5).

[5]李锦芳,艾杰瑞.中越语言走廊述补[J].百色学院学报,2015(5).

[6]陈颖.语言资源理论视阈下广西面向东盟的语言产业发展研究[J].广西社会科学,2015(6).

猜你喜欢

东南亚资源库语料库
健身气功开放课程资源库建设研究
《语料库翻译文体学》评介
贵州●石斛种质资源库
闽菜“太平肉燕”飘香东南亚
HARD CELL
把课文的优美表达存进语料库
高中历史信息化教育资源库应用探索
福建基础教育教学资源库建设研究——以福建基础教育网资源库为例
奇幻迷香 寻味东南亚
美俄聚焦东南亚