最简递归之前景探索:生物语言学的优化合并与最简计算
2015-03-20NoamChomsky广东外语外贸大学马志刚
Noam Chomsky(著)广东外语外贸大学 马志刚(译)
最简递归之前景探索:生物语言学的优化合并与最简计算
Noam Chomsky(著)广东外语外贸大学 马志刚(译)
人类语言最基本的特点是:每种变体都能提供无限多的层级结构表达式,而所有的层级结构表达式均可在两个界面处获得解读:感觉运动系统将其外化,概念意愿系统赋予其心智特征。这种属性的产生离不开递归程序,而核心问题则在于如何确定这种递归程序的实质。科学研究的常规模式将其溯源至最简单的解决方案,即最简递归,从而可以强化解释力,促进语言习得研究,并有望为语言能力的进化提出突破性见解。以此为目标的探索已经摒弃了诸多缺乏理据的硬性规定,同时也使普遍语法的一些基本特点更为坚实。此类探索的诸多结论之一就是证明两个界面之间存在不对称性:外化仅仅是辅助性程序。这个结论符合目前对语言特点的了解,也与语言进化的极少量证据一致。
普遍语法;最简方案;递归;界面;合并;顺序;效率
1.递归程序
就语言研究的目的而言,我们完全可以把递归视为逐一枚举的一种手段,即采用有限的计算程序对一组离散客体实施枚举。这种计算程序可以编程在普通的数字计算机上,从而可以实现记忆和时间的无限运用。如果把递归程序P看作是整数的函数,其范围可以表示为R=(R(n)),即采用P所枚举的客体集合。有趣的是,R可以是无限集,也可以是有限集(甚至是空集)。在语言研究中,我们关注的是递归程序的一种特例,即生成语法Gi(即最为纯粹的初始语法);每种语言的生成机制都会生成层级结构表达式,并且在两个界面处为每个表达式赋予抽象表征:感觉运动系统(SM)为其实施外部实现(ER),而概念意愿系统(CI)为其赋予心智表征,即通常所谓的思维,包括对经历的理解、反思、推论、计划、想象等等。从这个角度看,每种语言的生成语法Gi都可被看作是亚里士多德传统语言概念的一种实例化,即语言是具有意义的声音(Language is sound with meaning)。不过,现在已经明确的是,语言的声音部分仅仅是外部实现的一种特例。
2.结构概念、自由表达和界面的本质
外部实现与内在意义之间相互关联的方式原则上是无限的,而在漫长(且成果斐然)的语言研究史上,这一点也间或被提及(尽管并不常见)。达尔文曾写道:“人和动物的区别在于人类有能力把极其多样化的声音和意义联系起来(也就是具有一种生成语法G),而这种能力几近无限(almost infinite)”。“几近无限”是一种传统说法,大致可以解读为“非常多”或者是“无限多”。把无限多的声音和意义联系起来的能力其实就是字母表得以形成的基础(伽利略曾为这种“神奇的发明”而着迷)。按照波特-罗亚尔派哲学家的话说,字母表这种方式“可以基于25-30个声音构建出无穷多的表达式,从而能明示我们的一切思考活动,并显现出我们灵魂的所有运动轨迹”。因此,了解语言本身的无限性并关注语言运用的创造性,很快就成为笛卡尔科学和哲学的核心因素。一个世纪以前,奥托·叶斯珀森提出疑问:既然语言经验有限,那么语言要素是如何存在于言说者的心智中并产生了“结构的概念”;这种结构概念“确定无疑,足以引导言说者构拟自己的句子”,至关重要的是其所构拟出的是“自由表达”,这种自由表达对于言者和听者通常都是全新的,而且具有无限性。
据此,语言学家们的任务就是发现这些机制及其涌现于人类心智中的方式,而且要更进一步地揭示出“蕴含在所有语言的语法之下的伟大原则”;借此获得“洞察人类思想和人类语言最为深刻的本质”——这些想法今天已不再怪异,但在结构主义思想和行为主义科学主导语言研究的时代,这些想法却过于离奇以至于叶斯珀森的深刻见解被边缘化了。叶斯珀森的研究思路可以重新表述为:(语言研究的)基本任务是调查界面的本质、联系界面的生成程序并确定这些程序在心智中出现和使用的方式,关注的焦点自然就落在了“自由表达”上;同时还有关于神经表征和语言进化的问题,以及更多其他问题。
3.伽利略方法论与生物语言学
就亚里士多德“(语言是)有意义的声音”这个表述而言(即Language is soundwithmeaning中的with),自经典时代起,从宽泛意义上对声音的研究就已为数众多,包括可以把生成的结构表达式转换为外部实现的整个外化过程:音系学、形态学、音韵学等等,也包括对意义这种更不易说清的话题的研究。但是“有意义的声音”这种表述中的with所表达的概念在很大程度上被忽略了,部分原因可能是因为对意义进行深入调查的工具尚不具备,也可能是因为意义仅仅被视为简单的“单词运用”。在17到18世纪的认知革命阶段,一个普遍性的见解是:词序即思绪。因此,除了词序变化、如何组词为更大单位等话题之外,对于with这样的概念并无更多的讨论。现在,我们可以采用递归这个术语来解读with这个概念,而如今我们也更明确地知道,这绝非一项容易破解的复杂工程。
现代科学主要采纳了伽利略的方法论路线:大自然是简单的,因此要“遵循最容易和最简单的规则”;如他所述:不论所研究的现象多么多样化、多么异质化,科学家的任务都是要尝试建立原则。就语言研究这一特例而言,科学家的任务就是要确定,在界面条件的允准范围内,人类语言距离最简递归有多近。就生成语法而言,我们的任务就是确定语言在多大程度上等同于最简递归。正因为如此,近期有文集以《界面+递归=语言?》为其标题,其中的问号表明我们所不能理解的东西还很多。
类似的努力有时并不被看好,甚至可能被视为毫无意义,而这种看法并非仅仅针对语言而言。就在前不久,分子生物学家得出一种貌似可信的结论:有机物的变异如此随意以至于“几乎无穷多的细节都需要以个案的方式逐一分类”,其中的“几乎无穷”通常可以做多种理解。基于同样的理由,朱斯 (Joos 1957)回顾了盛极一时的“鲍阿斯传统”:语言间的“差异无限、无从预测”,因此每种语言的研究都“不能参照任何事先确定的方案”,也不能有任何先入之见。这种观点当然不可能完全正确,但在当时看来是一种比较合理的普遍性观点。基于这种观点,语言学理论就是对语料加以程序化分析,基本上就是切割和分类。然而在如今的普通生物学中,情形却大为不同,而现在的语言学也是如此,尽管异议还为数不少。
生成语法的现代复兴主要是在“生物语言学”的框架内发展起来的,而语言机制则被视为人类个体的心智/大脑的组成部分,就如同视觉感知模块、运动组织模块等。生成语法从分析程序转向生物语言学研究之后,语言学证据更为丰富、更为多样化,这一点对每种语言的具体研究都有影响,包括语言习得、神经科学、分离性,以及对于其他具体语言的诸多研究。这些研究的理论假设就是语言能力依赖于人类共享的生物属性。然而,从盛行的结构主义/行为主义语言学彻底地过渡到生物语言学的过程并非一蹴而就的,毕竟在应用分析程序来组织语料的同时还要对语言习得进行探索,而在这一认知过程中,所习得的语言毕竟离不开儿童浸淫于其中的语料。
4.语言习得的3个因素与最简强势命题(SMT)
过去30多年来对语言习得的广泛研究富有启发性,同时也表明语言习得的过程是绝不可忽视的。即便是对习得过程的第一步也绝不可忽视,毕竟我们并不真正了解儿童是如何从纷繁的杂音中抽象出和语言相关的语料的。最近有证据表明大猩猩的听觉系统和人类解读言语声音的方式一样。即便如此,语言习得过程中的第一步也是由内在的计算机制所决定的,而后期发展出的成熟的语法知识也应该是由内部计算机制所决定的。
尽管还存有争议,但基本上可以确定的是:语言“代表着一个领域专属的心智能力,这种能力的基础是其他心智能力所不具备的结构方面的组织原则和限制,其加工和计算都是自动化的且具有强制性”。Curtiss(2013)做此结论的依据是她基于分离性和其他证据所做的一些开创性工作。不过,语言的使用远远超出了这些限制范围。今天没有理由去怀疑笛卡尔的一些基本见解:语言的日常使用具有无穷的创新性,可以以之应景但却非因景而生;或者说,就内部状态而言,语言运用能引发他人思考,而他人自己也完全可以做类似的表达。我们还应该记住洪堡特曾被广为引用的格言:语言的日常使用涉及有限手段的无限运用。如何使有限手段得以无限运用,目前的研究已成绩斐然,但“无限运用”本身却依然如谜一般难以掌握。在生物语言学框架内,语言的核心就是内化语言;“内化”意指个体的、内部的、意愿性的,因为我们关注的是具体的计算程序,而不仅仅是其运作范围,因此有关语言的其他概念都是经由推演而生的,而且还需要考虑各种情形。我们把内化语言视为能生成表达式的计算程序P,而每个表达式都包含成对的界面表征。与有机体的成长和发展相同,语言习得过程也受到诸多因素的交互影响:
1)外部语料;
2)基因禀赋;它能够把语料转化为语言经历,然后引导内化语言的习得进程;
3)适用于任何事物(并不局限于有机体)发展的普遍原则。
对于内化语言这样的计算系统,理应遵循第三个因素(包括计算复杂性)的普遍条件。尽管这些条件尚不具有精准的定义,但有些特点已经很清楚:少优于多;最少量的搜寻要胜于更深入的搜寻,等等。这些概念非常简单,但却会让我们走得很远。而基因因素也由几部分组成,其中包括:
1)语言专属的成分(普遍语法UG);
2)其他认知程序,比如,对语料的统计分析方法;
3)结构的决定性因素、大脑的组织方式,以及和语言相关的其他系统。
这些组成部分是如何交互影响的正是语言习得所关注的课题。常规的科学理性要求,除非有实证证据要求复杂化,否则在调查的每个阶段都应该采纳最简单的假设,而且复杂化往往会减弱解释力;如果解释语言进化是切实可行的,那么复杂化假设就会为提出突破性见解设立更多的障碍。即便这一点并未明示,但在严肃的语言研究中,指导性原则总是如此。比如转写方式、结构主义音系学的对称性探索、生成语法把短语结构还原为X-阶标理论、进而再还原为光杆短语结构,等等,在这些传统问题上莫不如此;而在此过程中逐步消除硬性规定和复杂技术,同时也简化转换技术进而发展到移动-α,最后统一短语结构和转换语法,终于形成了如下所述的最简计算操作。
在现代生成语法的早期阶段,这些调查普遍都采用认识论术语加以陈述,以便寻找理论的最简性,但不能和内化语言的评价手段混为一谈,而应该和理论立场中立的实证假设有关,比如,合法的语言学归纳应该如何(Chomsky 1965)。随着程序性分析和生物语言学框架之间的区别越来越清晰,认识论版本被形而上学的术语重新解读:寻找认知系统的本质,特别是语言的本质。这种无间断的持续努力在20年前被最简方案(MP)加以重新表述,而提出最简方案的基本动因是为了建立新的研究范式,这种新范式近期被称为“自下而上研究普遍语法”。遵循这种研究方案,我们要问的是:对于内化语言而言,最优化的解决方案是什么,进而提出了强势最简命题(SMT):每种语言实际上都是满足界面条件的优化方式。
由于最简强势命题和繁杂的语言学语料之间存在巨大张力,因此我们自然会问这种张力能否通过对语料进行深入分析或者通过对最简计算的本质重新加以修订来克服(甚至是对其他假定的第三因素的原则性修订或者是对其他可以被独立检验的实证假设的修订)。最简方案在理论取向上保持中立,无论对语言和认知的本质持何种观点,任何人都可以选择或者不选择探索这些问题。最简方案并不是理论,而是一种研究方案,丝毫没有超出正常科学的界限。尽管对此已有重复性的说明,但最简方案还是经常被误解为一种新的语言学理论。因此,即便在专业文献中也经常会出现“最简方案遭到了批驳”或者“最简方案其实并非最简”等说法。这些评论其实都令人费解,因为研究方案是不可以被批驳的,尽管研究方案有可能执行得不够理想、或许不够成熟、或许被加以误导。
关于语言习得,一个意义深远且引发众多实证研究的命题就是连续性假设(Continuity Hypothesis):儿童在设定所习得语言的参数之前,可以自由地尝试各种与普遍语法兼容的语言学选项。据此可以很自然地得出结论:儿童语言完全有可能不同于成人语言,但这些不同点与普遍语法是兼容的,因此完全可以以某种非常有趣的方式存在于其他语言中。与之相关的观点还有成熟性假设(Maturity Hypothesis):普遍语法的某些原则只有在成熟阶段的后期才是可及的。上述两种观点都具有坚实的实证支持和重要意义。
生成语法自肇始以来就认为,语言习得过程中,普遍语法与其他认知机制交互影响,这一点已被视为理所应当的。有很多文献讨论这种交互影响是如何发生的(Yang 2002),而自从20世纪50年代以来普遍盛行的观点是:仅仅只依赖其他任何单一的认知机制就足以解释语言习得,因此语言并没有真正作为独立的研究客体。这一点暂且不论,但普遍语法不存在的命题过去和现在都站不住脚,而该命题目前已经具有了坚实的基础。
5.命题T、优化合并与界面解读
有限的计算程序P 以某种方式包孕着合并操作,而这种操作把已经构建好的句法体组合成新的句法体,但在初始合并时采用的是一组原子客体(或许具有其内部结构)。大致的情况可能是,原子客体是从词库中抽取出来的词项(尽管该操作本身并不简单);计算程序P具有工作间(a work space),其中包括词库以及经由P形成的句法客体(为了实现计算目的,其中可能也包括从词库中抽取的其他成分)。
优化假设是合并具有最简单的形式:两两合并操作运用于X、Y,形成Z={X, Y};X和Y都不会被该操作改变(No-tampering Condition, NTC);且X和Y之间也是无序的。这种优化假设并非如此简单,而是具有充实内容的。以线性顺序为例,如果合并后的成分无序可言,那么很自然的结论就是线性顺序等形式安排都是在感觉运动系统的要求下外显的结果,因此并不会进入到概念意愿系统,也不会进入核心句法和语义部分的推导当中。操作程序P的总体框架中包含狭义句法(NS),负责生成具有层级性但却无序的表达式,这些表达式被移交给概念意愿界面,其中的原子成分没有任何变化,也不会增加任何新成分(Inclusiveness Condition, INC)。辅助性的外化程序(EXT)把狭义句法生成的表达式映射到感觉运动系统的界面,但外化程序不会影响句法表达式向概念意愿系统的映射。从这些结论中可以得出一个概括性更强的命题。即命题T:语言的优化仅仅是相对于概念意愿界面而言的,而外化是辅助性的次要现象。
基于这一视角的其他见解都认同一种传统观点:语言主要是思维工具,而其他功能均为附带现象。果真如此,那么就应该把亚里士多德“语言是具有意义的声音”的观点修订为语言是“具有声音的意义”,这可是颠覆性的修订。还有一些熟知的证据支持对INC条件做一些细微修订:未赋值的特征(包括结构格和动词、形容词的人称和数等特征)都是在狭义句法阶段得到赋值的,这一点是以正常方式向CI界面实现映射的先决条件。但是除此之外,似乎还没有足够的理由要修订INC。至于语序,有充分的概念必要性将其局限于外化程序,但也有实证论据(特别是Richard Kayne近期的研究)并不支持该假设。本文坚持最简假定,但要指出,也有不同见解存在。
从弗雷格的哲学视角来看,基于合并的系统具有组合性:对X的解读就是对其组合部分以及如何组合的方式加以解读的结果。语言的各个方面都有充分的证据表明,这个原则具有普适性,而在语法的各个组成部分都有连续循环的计算。另外一个限制性更强的条件是严格的连续循环性:参与计算的句法体不可再被修订。显然,该条件可以显著地降低计算成本并引发诸多后果。该条件的具体版本之一就是语段理论。语段理论确定了狭义句法计算中何时向界面移交句法体的具体步骤,进而在界面处诱发非常有限(且不充分)的组合性。
如果合并是两两执行的,那么合并(X, Y)仅仅具有两种可能的情形:要么X和Y完全不同(即外合并EM),要么其中之一就是另外一个的组成成分(即内合并 IM)。内合并产生了自然语言中随处可见的移置性特点,而移位的拷贝理论就是力图对此加以解释。如果Y是X的一个组成成分,那么基于NTC,内合并(X, Y)= {X, Y},Y就有两个拷贝,一个Y是已经成为X组成部分的拷贝,另一个Y是与X合并的拷贝。如果X是(1),而Y是which boys,那么(2)具有Y (which boys)的两个拷贝:一个通过外合并位于X之内,而另外一个则通过内合并与X合并。后续的外合并操作就生成(3):
(1)the girls expect which boys to see each other;
(2)which boys [the girls expect which boys to see each other];进一步应用外合并就可以生成:
(3)I wonder [which boys [the girls expect which boys to see each other]];
感觉运动系统的外化操作赋予句子以语序,同时删除层级较低的拷贝,从而生成(4):
(4)I wonder which boys [the girls expect to see each other];
(5)I wonder for which boys, the girls expect that those boys will see the other girls.
如果(4)中括号内的句子单独出现,the girls可解读为each other的先行语,但(4)中的情形并非如此;移交给CI界面进行解读的是(3),因此局部先行语就是which boys,这就是重构(这个术语源于早期更为复杂的规定性方法:采用新的操作把前置成分重新插入)。 删除内部拷贝是最简计算原则使然,可能是第三因素的要求:删除拷贝的操作彻底简化了向SM的映射过程,而SM也因之彻底简化了外部实现过程。层级最为显著的拷贝得以保留,否则就无法证明曾经发生过移位操作。可能会有大量的、更复杂的情形出现,但无论如何最简计算(即优化合并和拷贝删除)是生成语言最基本特点的操作。
即便是像(4)这样简单的句子也有不少有趣的特点,其中之一是此类句子会造成感知困难:先要确定“缺位”的位置。在比较复杂的结构中要确定“缺位”的位置是比较困难的,而解析系统面临同样的问题。但是,如果拷贝得以保留,这个问题在很大程度上就可以解决。如果计算效率和使用效率(包括交际效率)之间出现矛盾,大多数情形下都是计算效率最终胜出。其他情形也大致如此:歧义性、花园路径句、岛屿结构。总体看来,这些证据都进一步证明命题T是正确的。
关于(4)的另外一个问题是,为何不能将其解读为(5)这样的意义呢?毕竟(5)也具有可理解的语义解读,而且可以维护约束理论的A原则,即以最简单的形式直接应用于表层表征中:其中相互代词的先行语眼耳可及,理应是最近的也是最恰当的表达式。但该原则在实际运用于抽象形式时含有拷贝成分,而拷贝成分仅仅能被思维系统所见,却不能被SM系统所见。不过,语言的设计要求并不允准这种更为简单的选项,因为对于语言系统的运作而言,被SM系统外化的仅仅具有辅助性意义。这一点需要再重复一下。还有很多例子都可以说明同样的结论。考虑如下违反空语类原则(ECP)且不知所云的(6),并与更容易接受的(7)相比较:
(6)a.how many mechanics do you wonder if fixed the cars
b.which mechanics do you wonder which cars fixed
c.which mechanics do you wonder fixed which cars
(7)a.how many cars do you wonder if the mechanics fixed
b.which cars do you wonder which mechanics fixed
实际上,(6)试图表达的意义并没有什么不对,而且也很简单,尽管语言设计也允准累言赘语,但(6)依然不合语法。如果ECP岛屿条件可以采用优化设计的术语加以解释,那么这就可作为进一步的证据来说明计算效率的确优于使用效率(产出、感知、交际,等等)。当然,这一“如果”比较大胆,虽然这是完全有可能的,而且已经有些极富启示性的解决方案。
一个更为简单的例证是争议较多的结构依赖原则(非正式术语),指的是最简距离的计算是基于结构性而非线性。如(8)所示,其解读为(9)而非(10),尽管(10)的语义也是可以理解的:
(8)can eagles that fly swim
(9)is it the case that eagles that fly can swim
(10)is it the case that eagles that can fly swim
就计算程序而言,(8)和(10)间的联系远比(9)和(10)间的联系更为简单,但是在任何语言的任何结构中,语言都不允准(8)和(10)间的联系。语言的这些普遍特点最为简单的解释就是:线性顺序并不进入核心的狭义句法部门和语义计算部门。这又支持了前文所描摹的语言的结构性设计假设以及命题T。就结构依赖原则而言,在计算认知科学领域内发展出了“一个家庭小产业”,试图说明结构依赖原则源自于其他认知过程,但却并无任何建树。
从内合并和非破坏性条件的角度来看,对于移置性最简单的解释就是要区分拷贝和重复,这一点的直觉基础很清楚。就每句话语而言,其中都有可能重复冠词、介词、动词,等等。但这些重复的词项之间并无关联,因为它们都是单独从词库或者工作间中抽取出来的。比如,在(11a)这样的宾格结构中,John这个词项重复了两次,而在(11b)这样的非宾格结构中,则出现了John的两个拷贝。
(11)a.John saw John.
b.John arrived John.
这两种情形的区别在于词项是如何从工作空间中抽取出来的。(11a)中,John被抽取了两次,而在(11b)中只被抽取了一次。在解读时,词项的重复之间是无关联的;但拷贝则在概念意愿系统中被视为具有非连续性(discontinuous),并且被解读为一个成分(尽管不同的拷贝对句子的整体解释有不同的贡献)。如果内合并只在语段形成后才执行,那么拷贝和重复之间的区别必须在移交句法体时已经确定。非连续性成分的作用理应非常有趣,暂且不论。
前文所提议的总框架以及总体性命题T都与目前对语言一般性特点的了解是一致的。句法结构向概念意愿界面的映射程序通常被认为是恒定的(即句法结构获得语义表征在任何语言中都要经历相同的程序)。考虑到儿童习得语言时可依赖的证据如此贫乏,因此很难想象有关语言的总体性命题会是另外一种情形。到目前为止,有充分的证据证明,如果参数变异仅限于词库(甚至仅限于其中的功能成分),那么狭义句法所允准的变异就非常有限,甚至不允许有任何变异。因此,即便是计算复杂性的一些简单原则,比如非破坏性条件和包含性条件,都应该能完全适用于狭义句法,而外化则会违反这些计算原则以及其他有效计算的自然原则。一般说来,外化是复杂的、多样的,而且很容易受制于历时的变化,这也说明外化其实就是一种辅助性现象。
6.语言进化与递归程序
上述有关语言机制的总体图景和语言演化的时间进程基本吻合,尽管我们对此所知甚少。大致的情形似乎是这样的:五万年前,自从我们的祖先离开非洲后,语言机制没有任何进化,或者说普遍的认知能力没有任何进化。尽管有可能存在个体差异,但是目前尚未有组别差异的证据。比如,来自于新几内亚某个部落中的婴儿如果已经被隔离了几千年甚至上万年,但如果她自出生后就在波士顿长大,那么她就和其他波士顿的同龄人一样也会习得同样的语言;反之亦然。
如果我们再追溯到此前的五万年左右,就没有任何证据可以证明人类语言的确存在过;而人类学证据也表明,语言以及与之相伴的复杂认知机制出现在进化历程中一扇极狭窄的“小窗口”时期,也就是在Jared Diamond所谓的“大跃进”时期出现的。即便把这个年代数字翻一倍或者更多也不会有多大变化,这个“窗口”在进化历程中非常狭小,是在与其他存活物种分离后的几百万年后才出现的。这些事实都表明,在如此短暂的进化时段内,大脑中某种细微的重组生成了语言的核心特征:合并以及由其而生成的句法体;更为关键的是,这些句法体均可以移交给概念意愿界面。这种突变发生于个体而非群体,而经历这种重组的个体因此就拥有了一种思维语言(Language of thought, LOT):即进行解读、反思和计划等的手段,而这种手段原则上是可以无限运用的。是否存在独立的思维语言的命题还需要进一步论证,但目前看来概念意愿界面生成的其实就是一种表征方式,而语义并非迥异于思维的独立系统。就如同雪花因顺应第三因素而臻至完美一样,始发于某个个体的系统必定是优化的,而这是由第三因素所决定的,而非因外部压力所致,从而印证了最简强势命题。这种基因突变完全可以部分地传递给后代,如果这种变异携带某种选择性优势(似乎是比较合理的),那么通过一个很小的猎人-采集人的社团就可以遗传繁衍。当这种能力得以共享,在某个时刻就可将其外化以进行互动,包括进行语言交际。但是,外化也提出了一个更难回答的认知任务:是否有必要把类似于强势最简命题的内部系统与感觉运动系统连接起来,而目前的化石证据表明,感觉运动系统已经存在几十万年了。因此,可以采用多种方式来解决这个问题,而每一种解决方式都很复杂,都有待修订。这和我们对语言的了解基本上吻合。事实上,很难想象出一种并不包含这些步骤的进化路径,而其他假设则很难找到支持性论据。
某种获益的属性得以存活其实是低概率事件,类似事件或许已经发生过多次且最终未能存活,但至少有那么一次,我们的祖先把这种获益的属性保留了下来。或许有人会猜疑,生成合并的基因突变或许已经发生过许多次,而且不仅仅是在原始人种的这一条生物链条上。但除非合并机制和概念意愿系统相连,否则就不会有任何实际用处,因此也就不太可能存活下来。有很多说法认为,合并机制或许也在鸣禽类身上发生过,但是对鸣禽的鸣叫机制已经有很多更为简单的解释。人类认知的其他例证中也存在递归生成,其中最为著名的就是自然数,而最早关注自然数中递归生成的是华莱士和达尔文。但是包括自然数在内的所有其他例证很有可能都是依附于语言而存在的。文献中有一些有趣的证据说明其他灵长类动物(或许还有其他物种)也具有人类语言中的谓词-论元形式的抽象表征,而且提议说“大跃进”或许就是外化,而不是递归生成(即合并)。其实,后一个结论是值得质疑的。要生成思维语言,从而提供一种能进行自由表达和思想解读的特定手段,基于合并生成的表达式就必须和最为基础且业已存在的某种心智结构相联系。或许就是这些与概念意愿系统相连的特定手段,或许是某种行为者-行动图式,或许还有其他手段。因此,要生成外化的人类语言就必须经过两个步骤:合并和外化;第一步骤把有限的基础表征转化为无限的结构性思维语言。之后若没有外化发生就会是非常离奇的事情。
通常认为,内合并要比外合并更为复杂,而且要求具有形式—拷贝、再合并、拷贝辨识、拷贝删除等操作,但这并无任何正当理据。因为不必具有形式—拷贝操作或者再合并操作,只需最简单形式的合并操作就可以满足非破坏性条件,也可以生成拷贝。把两个句法体合并为新的句法体的操作,原则上要么涉及拷贝要么无涉拷贝。拷贝辨识是基于简单的特点,很容易在语段层面上辨识出来。拷贝删除是因遵循基本的第三因素使然。比如,出于更易于发音或者出于交际效率的原因而要求所拼读的内容应该尽可能少。最简方案曾认为,外合并及其前身是自然的,而无处不在的移置性则是语言设计方面的“不完美”之处且需要加以解释,但这种想法并不见得能成立,因为我们现在意识到内合并和外合并完全都可以统一到合并之下。因此完全可以认为,内合并更为简单,原因是外合并要求在包括词库在内的工作空间内探寻,而内合并仅仅针对某个单一的句法体,因而更为经济简约。直接否认这两种情形中的任何一个都需要具有实证支持的硬性规定。同时,本来通过采用外合并和内合并可以自由解决的那些问题如果要采用任何新技术来解决,都需要解释为何要引入新技术。
在设计完美的系统中,这两种逻辑上成立的合并都有可能与界面效应对应。在感觉运动层面上,这一点很明显:内合并与移置性对应,而外合并与相邻性对应。在概念意愿层面上,这种区分与语义的双重性对应:外合并生成普遍性论元结构,而内合并生成新旧信息、焦点等和篇章相关联的所有其他结构。这种对应非常齐整,但目前还有可能被否定,因此还不能成立,比如把控制结构还原为论元移位的提议就试图否定这种对应。要确定这种对应完美与否及其成因应该是非常有趣的研究任务。
正如文首所提及的,递归性程序不必生成一组无穷的句法客体,或者说递归程序根本就不能生成任何句法客体。因此,我们可以想象出内化语言具有有限范围的情形。比如,想象一下“截取英语”(Truncated English, TE),它缺乏能产生无限长度的英语句子所需要的所有语言学手段;缺乏连接词、重叠性修饰语(比如old old man;very very old)、领属结构(比如father of father of Bill),等等。学习TE的儿童当然不会意识到其极端的表达限制,因此会继续学习以至于习得TE,就如同TE和正常的基于无限合并基础之上的英语一样,但他们在习得阶段的某个时间点上却会发现用这种语言说不了多少东西。因此,是否存在TE真令人怀疑。如同上文提及的习得情形那样,或许儿童只需采用普遍语法(UG)的资源就可以发明某种简单的表达模式:无须任何输入就可以孤立地习得一种语言,而许多语言早期习得的例子虽然与成人语言不同,但却是遵循普遍语法的。这仅仅是理论上的一种可能性。从TE中不会了解到普遍语法和递归,也不会了解到普遍性的语言机制。这是有点儿离奇。有人提议,亚马逊语言之一(Pirahä语)与截取英语非常相似,不过这个观点还存有争议。上述观点被广为宣传,被视为已经对语言和认知产生了深远的影响,但到底是否正确还不太清楚,因为还得不出更具普遍性而且不停留在TE层面的结论。
7.结语
生成语法的最早版本假定存在两个组成部分:短语结构语法(PSG)和转换语法(TG),而且还辨识出了一些可容纳进生成系统的普遍性特点:组合性、词序、投射和移置性。前三者隶属短语结构语法,最后一个特点(移置性及其长距离的形态关系)被分配给转换语法。短语结构语法在60年代因众多原因而被放弃并被X-阶标理论所替代。X-阶标理论极大地简化了生成系统,但也施加了新的条件,即普遍向心性。且不做深究,但语法部门的组织分工方式已经得以保留。我们已经看到,有很多理由把线性词序和层次组合性分开,在合并的基础上把移置性和组合性融合起来。这样就只剩投射问题了(若采用最新的术语就是加标问题),其特别之处在于它是理论内部的概念,而其他的概念实际上在语料中都是可以辨识出来的。这也提出了非常有趣的问题,其中有些与向心性假设密切相关(笔者认为还是值得质疑)。要对最简递归予以合理解释,上述内容就是大致的轮廓。很明显,这是语言学理论的当务之急,而且会带来值得探索和仔细研究的众多分支性问题。
Chomsky, N.1965.AspectsoftheTheoryofSyntax[M].Cambridge:The MIT Press.
Chomsky, N.2007.Approaching UG from below[C] // U.Sauerland & H.M.Gärtner (eds.).Interfaces+Recursion=Language?.New York: Mouton de Gruyter.1-30.
Chomsky, N.2008.On phases[C] // R.Freidinetal.(eds.).FoundationalIssuesinLinguisticTheory.Cambridge: The MIT Press.133-166.
Chomsky, N.2011.What is special about language?[J].LanguageandOtherCognitiveSystems(2):271-272.
Chomsky, N.2013.The problems of projection[J].Lingua(130):33-49.
Chomsky, N.2014.Minimal recursion: Exploring the prospects[C] // T.Roeper & M.Speas (eds.).Recursion:ComplexityinCognition.New York: Springer International Publishing.1-15.
Curtiss, S.2013.Revisiting modularity: Using language as a window to the mind[C] // M.Piatelli-Palmerini & R.Berwick (eds.).RichLanguagefromPoorInputs.London: Oxford.68-90.
Falk, J.1992.Otto Jespersen, Leonard Bloomfield, and American structural linguistics[J].Language68 (3): 12-23.
Joos, M.1957.ReadingsinLinguistics:TheDevelopmentofDescriptiveLinguisticsinAmericaSince1925[C].Washington: ACLS.
Yang, C.2002.KnowledgeandLearninginNaturalLanguage[M].New York: Oxford University Press.
(责任编辑 姜 玲)
通讯地址:510420 广东省广州市 广东外语外贸大学外国语言学及应用语言学研究中心
H04
A
2095-5723(2015)04-0019-08
2015-10-13
Chomsky(2007, 2008, 2011, 2013, 2014)就最简方案中的若干议题发表了一系列观点。基于上述文献,本文对Chomsky(2014)所提出的“最简递归”、“界面非对称性”、“外化程序”、“思维语言”等概念加以简要述评。Chomsky教授本人同意将此文译为汉语(主标题和小标题由译者所加)。译文对相关概念的阐释均为译者之解读(若有偏误,均由译者承责)。