乔姆斯基语言观与语言智能研究
2024-02-08于志
摘要:目的:文章讨论乔姆斯基语言观及其语言学理论与语言智能的关系,驳斥以大语言模型为代表的新一代人工智能只强调经验主义和行为主义而完全摒弃理性主义和心智主义的发展路径,强调从乔姆斯基的语言理论和语言观中为语言智能的发展汲取智慧。方法:文章从两个层面建构乔姆斯基语言观和语言智能的联系。一方面,通过论述从传统计算语言学或自然语言处理到以大语言模型为代表的人工智能范式转变过程中的变与不变,使语言智能得以继续保留从以乔姆斯基为代表的传统语言学理论中获得启发的可能。另一方面,通过爬梳乔姆斯基的基本观点和语言观,包括天赋假说、普遍语法和语言官能,论证乔姆斯基超前的理论预见性,其所关注的语言问题正是语言智能亟待解决的。结果:在现代语言学主流流派中,乔姆斯基的逻辑理性主义和心智主义观点尤其值得当前语言智能研究吸收借鉴。结论:随着计算科学的发展和人工智能技术的进步,前沿研究深入交叉,语言智能逐渐受到语言学研究者的青睐。语言智能是语言学与人工智能的交叉领域,其发展同语言学尤其是以乔姆斯基为代表的传统语言学经典理论密不可分。
关键词:乔姆斯基;语言智能;语言观;理性主义;心智主义
中图分类号:H0;TP18 文献标识码:A 文章编号:1004-9436(2024)18-0-03
0 引言
2024年,诺贝尔物理学奖授予美国科学家约翰·霍普菲尔德和英国裔加拿大科学家杰弗里·辛顿,旨在表彰他们“通过人工神经网络实现机器学习的基础性发现和发明”。杰弗里·辛顿是人工智能领域研究机器学习,尤其是深度神经网络方法的著名学者。不同于同时获得诺奖的学者约翰·霍普菲尔德,辛顿几乎没有任何传统理论物理学的学习和研究背景,单纯是因为提供了基础性方法就斩获了诺贝尔物理学奖。因此,获奖信息甫一公布,即引起全世界范围内物理学学者和公众的热议。除此之外,辛顿获奖时的言论,同其在早前获得尤利西斯奖章时的获奖发言[1],同样在语言学界引起轩然大波[2]。因为他在获奖发言中不止一次提及语言学同大语言模型技术、人工智能发展的关系问题,并毫不客气地对以转换生成语法理论提出者美国著名语言学家诺姆·乔姆斯基为代表的语言学研究范式提出了批评,认为“语言学家被一个名叫乔姆斯基的人误导了好几代”,提出了与乔姆斯基截然相反的语言智能观点。总体来看,辛顿代表一种联结主义范式的观点,这种路径采用数据驱动的神经网络方法使机器具有“类人”表现,并在大语言模型技术中获得巨大成功。基于这种范式,海量的数据、足够的算力和先进的算法足以完成从数字智能向人类智能的转换。而乔姆斯基代表的是符号主义范式的观点,通常采用先验规则约束描写人类语言能力,以先天的规则和参数描写使机器具备“语言能力”。而随着认知科学的发展,强调具身经验和强化学习对能力的正向作用的行为主义范式也成为一种流行观点,在强化学习增强人工智能领域发挥关键作用。就现实来看,联结主义范式的成功只是暂时的,而并非“终结性”的。符号主义范式并未完全失去意义,行为主义范式更是具有重要价值。实际上,“当局者迷”,“旁观者”也未必“清”。人工智能发展70年,理论在争辩,范式在更新,技术在进步,算法在迭代,算力在升级。身处转折的当下,一方面有大语言模型的成功示范,另一方面有来自不同理论学科和产业的争议,这些有助于持续推动人工智能领域的研究和发展。而对乔姆斯基的认识,也不是仅通过辛顿的获奖和他的发言就可以完全颠覆的。乔姆斯基所关注的语言问题实际上并没有完全得到解答,大语言模型的暂时成功并不能直接回应其关切。尽管现在的人工智能技术已经具备某些人类语言智能的表现,但要真正将二者画上等号,还需要非常严谨科学的论证。本文主要讨论乔姆斯基语言观及其语言学理论与语言智能的关系,旨在从乔姆斯基的语言理论中为语言智能的发展汲取智慧。
1 语言学与人工智能的交叉领域:语言智能
计算语言学是现代语言学研究最前沿的研究领域之一,在计算机科学中也有自然语言处理的相关研究。计算语言学主要是研究如何利用计算机来分析、处理和理解自然语言的一门科学。计算语言学自发轫以来,就具备深厚的跨学科基础,根植于计算机科学、语言学和认知科学等众多学科中,具有很强的跨学科属性和理论的复杂性。语言智能则是语言学与人工智能的最新交叉领域,关注的是人工智能技术背景下与语言相关的问题,包括语言的神经认知基础、语言生成与理解机制、语言的社会问题、自然语言处理、人工智能语言等一系列内容。
传统的计算语言学研究者一致认为计算机对自然语言的研究和处理大致流程如下:首先,提出需要通过计算机处理的语言学问题;再根据语言学理论把需要研究的语言学问题形式化,使之严谨规范并能采用一定的数学描述方法描述出来(规则方法),或把需要研究的语言学问题抽象成数学模型(统计方法);然后通过计算机语言来设计计算机程序,使计算机能够通过算法自动处理形式化的语言学问题,或者按数学模型进行相应的统计和处理;根据算法,运行编写的计算机程序来实现自然语言处理;最后对计算机处理的结果进行实验分析,得出结论[3]。由此,基本上可以得出两个观点:一是自然语言处理首先是语言学问题,其要解决的一定是在语言学所涉问题范围之内的对象,如人机对话、情感分析、主题计算等。这些语言问题都可以在传统的理论语言学中发掘其理论根源,这意味着传统语言学研究对自然语言处理具有指导意义。二是自然语言处理和传统语言学研究的区别主要在于其需要将语言理论应用于计算机程序运算上,以实现计算机算法的自动化操作。自然语言处理虽然根植于人类语言生成和理解的经验成分,但已经将经验成分转化为形式化的规则描写,编译成机器语言,把自然语言完全编码为计算机代码,命令计算机完成相关程序运行。这和传统语言学中投射的经验主义和人本主义色彩有着本质区别。而随着基于深度神经网络的机器学习算法在2012年之后逐渐成为主流,人工智能技术呈现出全新面貌。2022年以后,以大语言模型为代表的新一代人工智能彻底改变了传统自然语言处理或计算语言学的研究路径。大语言模型通过“预训练模型+微调”范式,从海量的预训练数据中学习“知识”,在面向用户的指令输入时,可以流畅地通过生成自然语言的方式输出回答。这完全绕过了传统的自然语言处理任务,直接实现了由计算机掌握并使用人类自然语言,完成任务处理工作。
但不论是传统语言学研究还是自然语言处理,以及进入大语言模型范式下的人工智能研究,对自然语言的共同关注是殊途同归的,就是破解人类自然语言的密码,使机器能够自如流畅地使用人类语言。语言智能就是对这一问题进行探索的学问。而对于这一问题,深受理性主义思想影响的乔姆斯基的语言理论具有启发意义。乔姆斯基的理论彰显形式化和逻辑理性的光芒,但他同时坚持心智主义的语言观,将语言学带出了行为主义的桎梏,引入了心理和天赋官能的观点。可以说,乔姆斯基的思想一方面根植于传统语言学的沃土,另一方面也向人工智能的高厦延伸。因此,本文试图从乔姆斯基语言观的视角为语言智能的发展提供某种智慧。
2 乔姆斯基的语言观
1957年,乔姆斯基出版《句法结构》一书[4],创建了转换生成语法理论。由于其不同的语言观带来的研究新范式,其成就被称为“乔姆斯基革命”。生成语法在唯理主义哲学观的基础上,主张解释充分性,以内省、演绎、形式化的方法探寻人类语言的普遍运作机制和特点[5]1。自理论创建以来,乔姆斯基不断修正完善生成语法理论,整个理论完成了5次重大调整。围绕乔姆斯基的语言理论,国内外学者从不同角度展开研究,甚至一度出现逆乔姆斯基语言理论的纯粹批判态势,并未完全客观地展示乔姆斯基语言观的全貌。
而实际上,乔姆斯基的语言观本身才是更值得注意的问题。对乔姆斯基来说,其理论前提假设主要包括三点。首先,他认为人的语法知识是天赋的,即天赋论假设。长久以来,柏拉图问题一直困扰着语言学家,因为人类在语言上表现出来的创造性正好呼应柏拉图问题。在乔姆斯基天赋论之前,行为主义的观点大行其道。乔姆斯基认为人类的语言行为机制和动物研究中的行为原则有着根本不同,人类有推理、概括功能,语言行为是人类心智系统的体现,是受遗传决定的。在结构主义的影响下,乔姆斯基认为,儿童在出生时便具备关于语言的语法结构的所有知识,这种先天的知识解释了人类为何总能快速且成功地掌握语言[6]。这种观点把语言学研究带入了心智主义的新发展阶段,行为主义心理学的“刺激—反应”语言发展观基本失去解释力。
其次,乔姆斯基主张人类语言是一个演绎的形式系统,即普遍语法。不同人的外在都有一定差别,如有人高、有人矮,但原则上,人的基本生理构造是相同的,都有一个脑袋、一个躯干。语言也有如此特点。根据乔姆斯基的研究,不同的语言系统存在许多显而易见的差别,但是语言与语言之间,包括那些根本没有任何历史渊源的语言之间,同样存在许多显而易见的共同原则[5]18-19。人的“初始状态”是人类的种属特性之一,是儿童先于语言经验的心智状态,它将经验映射到稳定状态。普遍语法是这种“初始状态”的一部分。所有人都遵从普遍语法,事实上,人出生时便具备一整套语言规则,它是所有语言共有的,先天地规定着人类语言的组织原则[7]。普遍语法体现的是人的语言能力,体现了“人对语言的直觉理解能力和创造性运用语言的能力”[5]19。普遍语法的原则是对语言系统形式、属性的抽象描写,并不一定具有现实性。
另外,乔姆斯基认为人的大脑中有特别的语言机制——语言官能。语言是一个复杂但精确的系统,是话语的无限集合。既然语言能力是人类的遗传生物特性,那么人类的生理结构必然有语言产生的某些生物前提,也就是说,作为人类心智系统的核心器官——大脑中应该有某些实体来操控复杂的语言行为。乔姆斯基把这个暂时不能被脑科学家观测或分离提取的实体假设为语言官能,也就是语言获得机制。
综上所述,乔姆斯基把语言研究带入了关注人类认知的生物特性和大脑语言机制的阶段,大胆地从假设入手,采用假设演绎的方法进行研究。语言学也从经验主义和行为主义的桎梏中得到解放,语言学家开始从理性主义和心智主义的视角来研究语言,开辟了一条新的研究路径。
3 乔姆斯基对语言智能的影响
乔姆斯基的语言学说对当今社会的许多领域都产生了重要影响,如乔姆斯基语法就深刻地影响着自然语言处理技术的发展。另外,心理学、逻辑学、哲学、神经生理学等学科也深受乔姆斯基学说的影响,而这些学科现在看来都与语言智能研究密不可分。
研究语言智能的前提就是要尽可能地解码人类语言生成和理解的神经认知机制、运作方式、结构和功能的对应关系等基础问题。乔姆斯基的语言天赋论和语言官能的假设都是对这些问题的大胆假设,在这个基础上对人类语言理解和生成机制进行仿拟,这恰恰是语言智能的重要发展方向之一。研究人工智能如何掌握语言,掌握了语言的哪些方面,其语言能力的优越表现是如何出现的,等等,绕不开对人类语言智能的认识。而当前对这一问题的研究,神经语言学和乔姆斯基开创的生物语言学都可以提供重要证据。在这一点上,乔姆斯基的语言观为这种发展路径提供了巨大帮助。可以说,以大语言模型为代表的人工智能在通向通用人工智能的发展之路上必须尊重传统语言学的重要观点,尤其是不能忽视乔姆斯基语言观点的重要性。
4 结语
本文论证乔姆斯基语言观与语言智能的关系,驳斥了以大语言模型为代表的新一代人工智能忽视理性和心智观点的发展路径,认为乔姆斯基语言观值得语言智能研究借鉴。本文还对语言智能作了初步论述,作为语言学和人工智能的交叉领域,对其研究有待深入。此外,本文从辛顿与乔姆斯基的观点碰撞入手,仅就乔姆斯基的语言观展开讨论,但在传统语言学理论中,仍有许多值得语言智能研究吸收借鉴的精华,这也有待深入讨论。
参考文献:
[1] 陈国华,杰弗里·埃佛勒斯·辛顿.杰弗里·辛顿接受尤利西斯奖章时发表的获奖感言[J].当代语言学,2024(4):489-495.
[2] 冯志伟,陈国华,李宇明,等.“辛顿·乔姆斯基·语言学发展”多人谈[J].语言战略研究,2024,54(6):5-17.
[3] 刘颖.计算语言学[M].北京:清华大学出版社,2014:引言I.
[4] Chomsky, N.Systematic Structure[M]. Netherlands: Mouton, The Hague" 1957: 1.
[5] 赵美娟.乔姆斯基的语言观[D].上海:上海外国语大学,2007:1,18-19.
[6] Chomsky, N.Knowledge of language: Its nature, origin and use[M]. New York: Praeger Publishers, 1985: 69.
[7] Chomsky,N. Rules and representations[M]. New York: Columbia University Press, 1980: 4.