APP下载

语言距离的测度及其在经济学中的应用

2015-11-05苏剑黄少安

江汉论坛 2015年3期

苏剑 黄少安

摘要:语言距离是指不同语言的差异程度,理论界采取了语言考试测评以及编辑距离的方法测来度语言距离,前者较为流行。把语言距离应用到经济学研究主要有三个指向:语言距离与国际贸易的相关性研究,语言距离与国际贸易流量成反比;语言距离对收入分配产生影响,语言距离是影响移民地选择以及移民工资收入差距的重要因素;语言距离与语言规划关系密切,语言距离对于少数民族双语教育、外语教育改革、语言产业战略的构建以及汉语言的国际推广有重要的理论价值和实践意义。

关键词:语言距离;贸易流量;收入分配理论;语言规划

中图分类号:F069 文献标识码:A 文章编号:1003-854X(2015)03-0005-06

一、引言

伴随经济快速发展、现代科技进步、信息交流频繁,语言的作用凸显,其实现路径主要依赖于信息传递与交换效率。信息传递效率高,编码与解码的速度快,交易能够顺利完成。相反,交易则可能迟滞,延缓经济的发展。使用通用语言可以降低交易成本,不仅能促进微观个体收益,更能促进国际贸易顺利完成,增加双边贸易流量。然而,世界各国语言不同,从微观上看,语言差异可以影响到该国移民的语言熟练度,影响移民与土著的收入分配效率。从宏观上讲,首先,语言差异要求两国选择某种语言以降低交易成本来提高贸易效率。传统的国际贸易理论研究以引力模型为基础,其主要命题是国际贸易流量与地理距离成反比,与两国的经济总量成正比。显然这一理论假设由于控制变量太少而解释力不足,应该考虑其他控制变量的影响因素,语言就是其一。其次,语言差异影响到一国语言的推广策略,进而影响一国的语言规划。就我国来讲,语言差异与少数民族的双语教育、汉语言的国际推广及孔子学院全球分布策略都有密切的关系。因此如何测度语言差异并把它引入到经济学模型中来已成为重要的理论问题,恰恰是语言与经济学的学科特性以及研究内容促成了两者有力牵手:语言是交际的媒介,而经济理论又是研究人类选择行为,既然涉及到选择行为,就离不开互动,互动最常规性的工具就是语言。鲜有学者对以上理论问题进行梳理评析,这显然不利于语言与经济关系的深入研究。本文研究的重要意义表现在以下三个方面。其一,引进语言距离概念以表示语言差异,评介语言距离的测度方法,并梳理评析其在经济学中的应用,突出语言对收入分配的重要作用。其二,扩充语言经济学理论内涵,深化语言经济学的研究主题。语言与国际贸易的相关性研究已成为本世纪初语言经济学研究的时髦话题,其研究成果也能凸显语言的人力资本属性。其三,本研究的重要政策启示在于为制定国家语言战略提供指导,比如雅思以及托福等英语准入考试,正是语言与收入分配关系理论的政策内涵;呼吁编制语言距离数据库。从客观上为我国外语教育改革提供方法。另外,‘测度汉语与少数民族语言的语言距离,尤其是语言、语法以及词汇方面的差异,可以帮助少数民族更好地学习通用语言,促进少数民族经济的发展。当然,语言距离的深入研究也为构建与发展我国语言产业战略,实现文化大繁荣提供理论基础。

二、语言距离的涵义及测度方法

1.语言距离的涵义

“距离”是物理学的术语,不少学者把“距离”引介到本学科中来隐喻相关概念,比如遗传距离以及制度距离等。经济学者Chiswiek采用了类似的方法,把语言差异隐喻为语言距离,但是如此定义还远不能触及语言距离的内核。语言距离的涵义应该包括定性与定量两个方面。从定性的角度,我们采取Isphording和Otten的观点认为语言距离指不同语言的差异程度,主要从词汇、语法、语音以及拼写规则体现出来。仅仅这样的定性还不够精确,也很难把它应用到经济学的研究中来,既然语言距离涉及“度”的概念,必须对之定量估计才能有实际意义和应用价值,学者们采取了不同的方法进行测度。

2.作为虚拟变量的测度

早期的经济学研究或忽视语言对经济的作用:或限于语言变量的测度难度,一般都把语言变量作为虚拟变量,把语言距离单一设置为0或者1,比如两国使用相同母语或者两国母语相似度极高,可以认为两国的语言距离为零,反之两国母语不同,则语言距离视为1。不可否认,经济学者用虚拟变量测量语言距离,已开始注意到语言的人力资本属性,承认了语言与经济的强相关性,这也使语言经济学的研究初露端倪。但是如此单一的方法还没有真正把语言距离测度出来,即使引入经济学模型中,也不能充分解释语言距离对经济的作用,其局限性主要表现在:测度方法比较简单,比如日语、汉语以及英语是三种不同语言,在研究语言与经济的相关性时,往往把日语与汉语的语言距离和日语与英语的语言距离设定为1,但是日语与汉语两种语言的表意性与英语的表音性决定了日语与汉语的差异程度远比日语与英语的要小,因此计量模型虚拟变量系数就存在失真,需要修正。Lohmann在研究语言与国际贸易关系时,引入了语言障碍指数用以衡量语言距离。语言障碍指数的区间是(0-1),零意味着两种语言完全通用,1代表两种语言没有相似性,可以根据WALS数据库测度出语言障碍指数。WALS数据收录了40名学者关于2950种语言的139种语言特点的研究成果。在计算语言障碍指数时,对语言的不同特点进行赋值,这种方法可以测度不同语言之间的距离,较虚拟变量有了较大的进步。

3.语言培训考试测评

目前,用考试的方法测评语言距离流行于经济学界,但是不同学者采取了不同类型的考试分数来表示语言距离。Hart-Gonzalez and Lindemann选取说英语的美国人对他们进行16-24周的语言培训,之后进行测试评分,列出了国际上43种语言与英语距离的评分,分数越低者与英语的距离就越远,如下表1。他们的实验结果为语言与国际贸易的后续研究提供了有效数据。Chiswick and Miller根据上述方法测度语言距离,并尝试用语言距离的相关理论研究经济问题。Ku and Zussman采用TOEFL的成绩测度各国语言与英语的语言距离,用以研究英语作为世界通用语言在国际贸易中的作用。苏剑、葛加国采用他们的方法,根据某校留学生的数据,测度各国语言尤其是非洲各国与汉语的语言距离,并把它们应用到国际贸易理论中来,这是把语言距离引入到中国的初次尝试。

综上,我们发现,语言学上的谱系树模型和语言距离有些类似,但是其内涵有不同之处:谱系树模型把语言是否来自于同源划分为不同的语系与语族,属于定性研究;而语言距离是语言经济学的概念,是把语言之间的差异进行定量测度。从下表1可以看出,此种方法对语言距离的测评也验证了语言学的谱系树模型:与英语同属印欧语系的语种,其与英语的语言距离较小,汉藏语系与英语的语言距离较远。采取考试评分从微观视角测度了不同语言的差异,进而为研究语言的经济作用提供数据支撑与方法,但是这种方法也有局限性。其一,用考试测评语言的差异程度具有较强的主观性,必须假定人力资本的同质性,这可能与现实相悖。尤其是把托福考试的成绩作为两国的语言距离,就忽视了学习语言的性别、年龄、师资以及时间成本的因素。其二,这种测度方法较为单一,基本上都是测度他国语言与英语的语言距离,其假设条件是非英语国家的人学习英语和英美国家的人使用他国语言具有对称性,否则,英语与他语的语言距离就与他语与英语语言距离不一致。人力资本的异质性可能会导致这种假设与现实不吻合,比如,汉语与英语的语言距离与英语与汉语的语言距离不同,恰恰是由于两国人学习语言的能力不同,也与目标国家的语言内部结构要素有很大的关系。其三,测度他国语言与英语的语言距离,很难换算出其他语种之间的语言距离。尽管有较多的局限性,语言距离的考试测评法较虚拟变量有较大的进步与理论扩展,也易于操作,因此许多经济学家都采取该种方法测度语言距离。进而引入经济学模型中来。

4.编辑距离法

Bakker使用LD方法测评了语言距离。所谓LD亦可称为编辑距离,它是由两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离在语言学的应用应该关注美国语言学家莫里斯·斯迪士(Morris Swadesh)早期关于核心词汇的研究成果。他从统计学的角度研究了印欧语言,认为所有语言中都基本上有200多个核心词汇列表,掌握这200多个核心词汇列表就可以进行简单的交流。Bakker从200个核心词汇中抽出40个较为稳定的词汇,如表2。与Chiswick测评方法不同,编辑距离测度语言差异更具有客观性,Isphording and Otten认为这种方法更具有精确性,同时这种方法也得到了许多经济学者和语言学者的关注与改进。

经济学从开始关注语言的作用到语言距离的测度,大约有半个世纪的历史,其趋势由简到繁。目前来看,采取考试测评的方法测度语言距离是较为主流的方法,可操作性强。但是近两年来,编辑距离法得到经济学者的青睐,其方法的客观性以及全面性为经济学研究提供了更为精确的数据,但是限于这种方法的复杂性,测度成本较高,需要多学科的融合,尤其需要计算机编码知识,因此该方法尚不能流行于经济学界。

语言距离的含义及测评对经济学的研究具有重要的意义,相关数据被广泛应用于收入分配理论和国际贸易理论,突出显示语言或者语言行为对经济活动的作用。语言距离的测评对语言的国际推广与传播以及语言产业战略构建具有重要的指导意义,我们将在Isphording and Otten的基础上分三个层次梳理语言距离在经济学中的应用,以期得到启示。

三、语言距离与收入分配理论

经济学家一直就很关注收入分配问题,从古典经济学到新古典经济学以及到现代的收入分配理论,都在试图解决收入分配中的公平与效率以及收入分配与经济增长的相关性问题。语言距离的引入扩充了收入分配理论的研究广度与深度。该项研究主要围绕某国居民与移民的收入差距,以实证研究为主,具有较强的应用价值,主要涉及以下三个问题:首先,语言距离增加了某种语言的学习成本,降低某种语言的学习效率,在多大程度上影响个体对目的地的移民选择。通常认为,个人倾向选择与本国母语相近的国家移民,Adsera and Pvtlikova通过实证研究深化了这一研究结果,认为对非英语国家与英语国家的目的地选择中语言距离对前者影响较深,语言距离并不是影响选择移居英语国家的主要因素,这可能与其他因素有关,尤其是经济因素。同时他们的实证结果显示,目的国语言多样化指数越高(多极化)将会降低向本国移居的吸引力,语言单极化倾向明显的国家更受移民的青睐。其次,语言距离如何与语言熟练度相关,进而影响收入分配。该项研究始于Chiswick,他构建了影响语言熟练度的模型进而研究语言熟练度与工资收入分配的关系,计量结果显示语言的熟练度与经济激励(economic incentives)、移民与居民的接触程度(exposure)有正相关关系。随后的研究又修正了起初的理论模型,认为移民对当地语言的熟练度与目的地定居时间(duration in destination)成正比,与移民的年龄(age at migration)、教育水平成正比(education)。他们的理论模型已经触及到了语言距离的概念,Chiswick and Miller认为语言距离是影响语言熟练度的重要因素。Isphording and Otten使用编辑距离法测度语言距离,通过实证研究得出三个重要的结论:(1)更高的语言距离与移民更低的语言熟练度相对应;(2)语言距离是移民后二语获得的重要影响因素;(3)语言距离每增加1%,将会使语言熟练度降低3.6到4.6个百分点。再次,语言距离与最优移民时机。此项研究与语言学“关键期假说”相类似,一般认为,人们年龄越小越容易学习目的国语言,移民的工资收入水平与当地居民无差异。B1eakley and Chin得出了14岁之前是移民的最佳时机的研究结论。选择最佳时机移民,两国的语言距离并不会影响移民的语言熟练度以及工资收入差距。

语言距离与收入分配相关性研究,对一国的语言规划与微观个体的移民具有重要的意义。第一,较大的语言距离增大了学习土著语言的成本,其降低了对土著语言的熟练度,是造成收入差距的重要原因,有碍于社会稳定,因此制定语言准入考试政策尤为重要,比如英语国家设定的英语准入考试(GRE、TOFEL)就是该理论下的语言政策之一。第二,语言距离与收入分配的研究也为微观个体选取目的地以及移民时机提供了指导。第三,语言差异反映了民族差异与社会民俗文化的差异,而后者阻碍了跨国政治与经济制度相互学习和借鉴,导致了跨国人均收入差距,因此语言距离可能是影响人均收入差距的本质的核心元素,因此采取宽松的贸易与语言政策,促进各种语言词汇的交叉借用是必要之举。

四、语言距离与国际贸易理论

20世纪40年代詹姆斯·施瓦特(James Stewart)首次将引力应用于社会科学,而最早将其应用于国际贸易问题研究的是丁伯根。引力模型预言两个国家的双边贸易流量是两国经济规模以及两国之间距离的函数。基准模型如下:

其中Tij表示双边贸易量,Yi、Yj代表两国的经济规模,用两国国内生产总值和人均生产总值来表示,Dij表示两国首都之间的地理距离。基准的引力模型预言了双边贸易量与两国的经济规模成正比,与两国的地理距离成反比。引力模型为国际贸易理论研究提供了标尺,许多经济学者以该模型为理论基础,寻找影响双边贸易流量的控制变量。随着多控制变量的引入,不断地拓展了引力模型,使之更有说服力,也有力地证实了相关假说。把语言变量引入引力模型,扩展了国际贸易理论,开拓了语言经济学研究范围。早期的研究往往把语言作为虚拟变量,认为使用通用语言可以促进双边贸易,如Rose、Anderson and Wincoop的研究,但是世界各国的母语不同,更精确地测度语言变量并研究语言与国际贸易的相关性尤为重要。经济学家主要从以下视角来研究。第一,英语作为世界通用语言,测度英语熟练度对国际贸易的作用。世界上多数国家的母语不同,选取非母语的通用语言是贸易成功的重要标志,英语的通用性理所当然地成为各国贸易首选。Hutchinson认为某国母语与英语距离较远,该国与美国的贸易流量就越少。Ku和Zussman通过实证研究,认为英语能力与双边贸易存在着强的正相关效应,英语熟练度可以减弱两国由于语言距离所造成的差异。如上文所述,英语熟练度即其他语言与英语的语言距离,Melitz深化通用语言促进国际贸易的命题,研究通用语言内部因素影响贸易流量的机制,具有重要的应用价值。第二,语言距离与贸易流量的相关性。Lohmann在考察语言障碍指数与双边贸易的关系时得出结果:语言障碍指数增加10%,贸易流量降低7-10%。苏剑、葛加国根据某高校留学生的数据。编制了其他国家尤其是非洲国家语言与汉语的语言距离。进而研究如何影响与中国的贸易流量,其结论也与前者相似,即语言距离与贸易流量呈反比。Isphording and Otten使用混合语(1ingua fran)代替母语(native language)计算出编辑距离,认为语言距离显著影响贸易流量,从较低的语言距离(比如英语与俄语)到较高的语言距离(比如英语与日语),可以使贸易流量降低约4个百分点。

通过以上梳理,我们可以发现,语言与收入分配关系的研究凸显语言的人力资本属性。而语言与国际贸易流量的相关性则表明语言信息传递的本质功能。我们可以把语言类似于货币,汇率是不同货币之间的比价。语言距离也可以视为不同语言的比价,但是汇率升跌源于市场机制,而语言距离则是语言演化的结果。总之,在国际贸易理论的研究中,语言是不可或缺的重要变量,在测度语言变量时可以采取不同的方法,也可以多种方法比较,以便得出更有意义的结果。

五、语言距离与语言规划的经济学分析

语言距离可以应用于语言规划的经济学分析,这是语言距离理论的重要扩展。语言距离的深入研究可以服务于国家语言战略的制定。主要表现在以下三个方面。

第一,语言距离与我国语言产业战略的构建。语言具有经济价值和资源属性,语言能形成一个产业,而且构建这样的产业可以获取语言红利。据格林的统计,英国每年可获得100亿欧元的净利,如果考虑投资方面的优势。英语国家每年可获得170亿至180亿欧元的收益。目前针对语言产业的研究主要局限于定性研究,鲜有定量研究。语言距离的数据库建立就为语言产业的战略制定提供了数理支撑。语言距离与语言产业构建关系密切,是互动的,在全球构建语言产业,推广传播母语,有利于语言借用,降低学习该国语言的难度,从而又能促进本国语言的学习和语言推广。比如英语培训产业已经形成了较大的产业链,而许多语言也与英语实现了借用,如汉语中的“Hold”住等,语言的交叉借用又保证了语言的健康发展,提升了该种语言的生命力。

第二,语言距离与孔子学院的全球分布策略。汉语言的国际推广以及孔子学院的海外建立是我国一项重要的语言文化战略,应该考虑两个问题:其一,按照苏剑、葛加国的研究结果,国外建立孔子学院,使中国语言文化深入世界各地,提高其他国家对汉语语境的熟悉程度,从而降低学习汉语的难度具有战略意义。需要深入的工作是:建立测评语言距离的来源,研究语言三因素(词汇、语音、语法)的差异对语言距离的影响,并建立与之相适应的教育培训系统,而不应该采取单一固定的教育培训模式。比如安道尔人和越南人在面对汉语听说读写四种能力时,安道尔人读、写能力较弱,越南人听的能力较差,因此应分别加长对安道尔人读和写以及对越南人听的培训时间。第二,按照上文的结论,语言距离越小,双边贸易流量就越大,从而推动本国经济的增长,但我们应该看到仅仅通过短期的职业培训不能缩短两国的语言距离,这就涉及孔子学院在全球分布策略问题。可以这样认为,其他条件不变的情况下,应该优先在与汉语语言距离较近的国家传播汉语并建立孔子学院。

第三,语言距离与我国少数民族双语教育。双语教育对少数民族经济发展具有重要的意义,如何加强对少数民族双语教育是一项关键工程。语言距离对少数民族的双语教育政策具有重要的理论启示,采取考试测评法或者编辑距离法,测度少数民族语言与汉语的语言距离,为研究语言距离与少数民族的就业水平以及工资收入差距的相关性提供数据支撑,从而可以得出有益的少数民族的双语语言政策。同时,构建语言距离数据库可以清晰地看出少数民族语言与汉语之间的内外部差异,以便在汉语言的教育中采取适宜与高效率的语言政策。

六、结语与前瞻

通过梳理语言距离的测度方法以及在经济学中的应用,有以下结论与启示。

首先,语言与收入分配的相关性凸显语言的人力资本属性,语言熟练度是影响个体就业、工资收入以及移民的关键因素,而语言距离是语言熟练度的重要变量,甚至在研究过程中可以把语言距离当作语言熟练度的替代变量。该研究也具有重要的应用价值,为一国的语言准入考试政策提供了理论基础。就世界范围来看,英、美两国所实行的雅思或者GRE准入考试,正是基于语言与移民工资收入的相关性而制定的语言规划,显然这一项政策能够更好地维护土著国的社会稳定。就我国来讲,随着综合国力的增强、国际地位的提高以及汉语的有力推广,汉语逐渐受世界各国人民的青睐。因此,应该制定相关的汉语标准化考试,促进移民更好地融入中国社会,也可以创造更多的语言红利。

其次,语言与双边贸易流量呈反向关系。学者们采取了虚拟变量、考试测评或者编辑距离法刻画语言变量验证了该命题。语言距离甚至可以类比为货币汇率,是不同语言间的“比价”。语言距离与贸易的相关性充分体现了语言的信息传递功能,其经济学机理主要表现在两个方面:其一。通用语言在国际贸易中具有重要作用,母语相同或者相近可以有效地降低交易成本,提高贸易的效率。其二,语言是文化的表征,是文化的核心元素,因此语言距离从深层次反映两国的文化差异甚至可以延伸到两国制度的差异,进而增大交易成本,影响贸易的顺利实现。这一结论也具有政策的内涵,例如语言的国际推广,从短期上看,不能缩短两国的语言距离,但是传播了本国的语言,有利于两国语言词汇交叉借用,促进了两国文化的融合,从而更有利于实现双边贸易。因此,从促进国际贸易的角度来讲,语言推广可以获得更大的语言红利。

最后,从宏观视角上来看,语言距离与语言规划的经济学分析凸显语言的产业和资源属性,构建语言产业以及汉语的国际推广能够创造“语言红利”,促进经济增长,这也是国家语言战略的要义。语言距离数据库的编制为语言产业战略的构建以及汉语言的国际推广提供理论指导。根据已有的语言距离数据和理论,初步认为在其他条件不变的情况下,可以优先在与汉语语言距离小的国家推广汉语,构建汉语言产业。因此,语言距离可以辅助制定孔子学院全球分布策略,提高孔子学院办学成效。另外,语言距离的微观化,测度语法、音节以及词汇的差异,以期推广汉语因材施教。提高汉语言文化的传播效率。总之,该方面研究具有重要的战略意义,是国家文化大发展大繁荣战略的重要体现。

语言距离及其在经济学中的应用,属于前沿理论研究,相关文献集中于2000年之后。目前的研究主要专注于国际化研究,鲜有国内相关研究,应该从以下几个方面深化研究;其一,划分国际贸易的类别,比较研究语言距离在影响货物贸易流量与服务贸易流量的差异。这一研究主题意在说明语言翻译标准化对双边贸易的重要意义。其二,用语言距离的测评方法研究国内语言差异,比如说验证语言距离与省际贸易,尤其是少数民族语言与汉语的语言距离与收入分配以及贸易的相关性,对于促进少数民族经济发展,缩小我国收入差距具有重要的价值。

作者简介:苏剑,男,1982年生,山东枣庄人,经济学博士,山东大学语言经济研究中心研究人员,山东济南,250100;黄少安,男,1962年生,湖南洞口人,长江学者特聘教授,山东大学经济研究院院长,山东济南,250100。

(责任编辑 陈孝兵)