APP下载

自然语言逻辑的产生与人工智能中的知识表示

2015-04-16

关键词:模糊性语义逻辑

王 芳

(福建师范大学福清分校思政部,福建福清350300)

随着信息时代的发展,人工智能和自然语言逻辑之间的关系越来越紧密,人工智能的发展推动了自然语言逻辑的诞生,拓宽了自然语言逻辑的研究领域,同时,自然语言逻辑的深入研究又反过来为人工智能的进一步发展提供科学的研究方法,解决了人工智能中的知识表示问题,这两者相互影响、相互作用。

一、自然语言逻辑的产生

人类语言的发展经历了从自然语言到形式语言的变革,再从形式语言回归自然语言的辩证发展过程。在20世纪,以形式语言为基础和形式化方法为手段的形式化运动,成为席卷西方学术界的一种思潮。“与此同时,20世纪中期,另外的一种思潮也悄然兴起,这就是回归自然语言的新思潮,诞生了一门新的学科——自然语言逻辑”[1]。

自然语言逻辑,又被称之为语言逻辑、自然逻辑,是19世纪中叶以来运用现代逻辑的方法来研究自然语言的一门新学科。“由于自然语言本身的复杂性以及现代数理方法的多样性,自然语言逻辑就出现了从不同角度进行研究的思路:如莱可夫等人从语言学角度探讨自然语言语法结构与其逻辑结构的对应关系;蒙太格则从现代逻辑观点出发构建自然语言的语句系统;也有从语言的交际角度结合语法、修辞等特点来研究自然语言中逻辑问题的思路,等等”[2]。由此,自然语言逻辑研究的奠基者周礼全明确提出自然语言逻辑的研究要运用现代逻辑的方法,结合现代逻辑学、现代语言学和现代修辞学的理论对自然语言进行研究,建立新的逻辑系统——自然语言逻辑,有效地丰富和扩大当前的逻辑理论,从而为人们的正确思维和成功交际提供帮助。在周礼全的鼓励和倡导下,一批学者埋头致立于这一研究,可谓硕果累累。他们在关于自然语言逻辑的研究对象等一些问题上表达了不同的观点和看法。蔡曙山指出,“语言逻辑使用现代逻辑的方法来研究自然语言的逻辑问题,包括自然语言的结构、意义和使用的问题,也就是自然语言的语形、语义、语用问题”[3]。因为他认为自然语言逻辑是使用现代逻辑的方法研究自然语言的逻辑问题,那么根据他的理解,自然语言的语形、语义和语用当然指的就是自然语言的逻辑语形、逻辑语义和逻辑语用。邹崇理在《自然语言逻辑研究》一书中也表达了同样的观点。另外一些学者如周晓林认为自然语言逻辑研究自然语言的语形学、语义学和语用学。“逻辑语形学、逻辑语义学、逻辑语用学”与“语形学、语义学、语用学”的区别在于,后者所涉及的范围远远大于前者。据此,自然语言逻辑有广义和狭义之分,广义的自然语言逻辑研究的是自然语言的语形、语义、语用问题,而狭义的自然语言逻辑研究的是自然语言的逻辑语形、逻辑语义、逻辑语用,本文采用的是狭义的自然语言逻辑。

自然语言逻辑研究自然语言,自然语言与形式语言相比,一个显著的不同点就是自然语言依赖语境,因此从逻辑角度来研究语言同语境的关系也是至关重要的。蔡曙山明确指出,“自然语言是人与人之间的交际工具,因而从逻辑角度来研究人与语言之间的关系,即语用逻辑,也是非常重要的”[1]。如果从实际生活来看,自然语言逻辑研究就不应该像形式逻辑那样抽象化,然而,现有的自然语言逻辑正好显示了高度形式化、抽象化的特点。《自然语言逻辑的研究内容——周礼全语言逻辑思想的启迪》一文的作者在文中的最后表达了自己的担忧,他说“假如自然语言逻辑研究再回到这种抽象,并进而形成某些符号系统,那就势必会带来一系列进一步需要解释清楚的问题”[4]。如自然语言逻辑之所以产生的内在动机与这种逻辑的研究结果及其发展现状是不是相应相称,关于自然语言本身的逻辑能不能是这种完全符号化的形式系统,自然语言逻辑究竟应不应该像形式逻辑那样抽象化,这种形式化、抽象化的进一步发展是否会导致自然语言逻辑的研究脱离自己的发展轨道等。文中作者对自然语言逻辑发展现状的担忧是值得进一步思考的。目前,形式化是自然语言逻辑发展的一个特点,之所以形式化与其使用现代逻辑的研究方法和现代信息时代发展的需要密不可分。一般来说,自然语言逻辑有2种基本的研究方法:(1)使用传统逻辑的方法分析经验语言学;(2)使用现代逻辑的方法对自然语言的语形、语义和语用各方面的特征进行分析。第一种方法的优缺点显而易见,其优点是直观、易于理解,缺点是缺少统一的语义。而第二种方法可以有效弥补前一种方法的缺陷,是语言逻辑中最常用的方法,所以自然语言逻辑的研究就打上了形式化的烙印。但就目前的研究而言,自然语言逻辑的3个研究部分:逻辑语形学、逻辑语义学和逻辑语用学,前2个方面研究得比较充分,已经到达了形式化、抽象化的要求,这和语言学中相对应的3个部分的研究情形是类似的,而逻辑语用学的形式化研究尚在起步中,并且对逻辑语用学的形式化研究起步最晚,难度最大。除此之外,自然语言逻辑形式化还有另一个深层次的原因,即自然语言逻辑不仅是现代逻辑学和现代语言学交互作用的产物,更是顺应信息时代发展的需要,是自然语言逻辑在人工智能下的进一步发展,人工智能的发展要求自然语言逻辑形式化。

二、人工智能中的形式化

“人工智能”一词最早是在1956年达特茅斯学会上提出的。此后,研究者们扩展了人工智能的概念,发展了许多关于人工智能的理论。人工智能是通过研究人脑思维活动的规律,从而让机器模拟人脑的智力系统,其目的是为人类提供服务。或者换句话说,人工智能是通过构造出具有一定人类智能的系统,让机脑代替人脑去完成以往要靠人的智能才能完成的任务,或者那些靠人脑难以完成的任务,如四色定理的证明。美国斯坦福大学人工智能研究中心的尼尔逊给人工智能下了一个这样的定义:人工智能是关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学[5]。在这3点中,首先要获得知识,其次是表示知识,最终是使用知识,从获得知识到使用知识的桥梁和中介是表示知识,人类知识的获得是来之不易的,需要把它表示出来,而表示知识是使用知识的前提和基础,所以如何把获得的知识表示出来显得尤为重要,因此,人工智能的关键是要怎样表示知识,而知识的表示与现代逻辑的发展密不可分。

现代逻辑在20世纪获得蓬勃发展,随着研究范围的不断扩大,关注的热点随着形势的发展最终扩大转移到与计算机人工智能和自然语言有关的问题上。当今,信息计算的发展要求运用逻辑的框架来概述自然语言的特征,如计算机处理信息的步骤是:(1)用形式化的方法表达所关注的自然语言问题;(2)用算法表示已经形式化的表述;(3)根据算法编制有关程序。而计算机处理自然语言的关键就是把自然语言变成适合计算机处理的信息数据,所以人工智能逻辑中一个重要工作就是用计算机能够处理的形式语言来表示自然语言,换言之,就是知识表示。知识表示不像生物学、人类学那样对人类或其他动物本身进行仔细考察,而是研究人类知道些什么来理解人类智能。更具体地说,知识表示不研究知识的定义、知识的获取与发现、知识的传播与理解等问题,它更多关注的是如何用符号语言表示知识。如果能够用形式语言表示人类用自然语言表达的知识,那么计算机就可以“理解”和“掌握”这些知识,并运用这些知识产生人工智能,电脑就可以运用人类知识像人脑一样思考问题和解决问题。所以说自然语言逻辑的形式化是顺应信息时代发展的需要,人工智能的发展要求自然语言逻辑形式化。

三、面向知识表示的自然语言逻辑

最早是采用一阶逻辑的方法来处理人工智能中的知识表示,但很快发现,一阶逻辑难以描述现实世界,主要的困难就是知识表示的不确定性,几乎凡事都有例外情况,没有绝对的一般化。沃克认为,不确定性在日常生活中无处不在,咎其原因是知识片面不完整。不确定性是知识片面不完整引起的,而知识的不完整主要有2个方面的原因:(1)客观原因,客观世界是无限发展的,我们不可能获得关于世界的所有知识,即使获得了,知识也不是一成不变的,它会随着事物的发展而改变我们对事物原有的认识。客观世界的纷繁复杂,是不确定性的最基本原因。(2)主观原因,是人的无知和惰性,当人们没有掌握完全的知识,事实上完全的知识是可望而不可及的,而人们自以为掌握了完全的知识,以及人们懒惰的心理要求,认为掌握的知识已经足够用了,没有必要再去获得新的知识。在日常生活中不确定性随处可见。如2个人在交流的过程中,不可避免地会产生不确定性,作为主体的2个人的知识背景不同,理解的偏差,特定场合的背景噪音干扰,口齿不清,自然语言的歧义性等,为了理解说话人的意图,当辅之以其他的信息,如特定的语境,说话者的手势以及沟通的深入等都可以降低这些不确定性。不管怎样,不得不承认,虽然不确定性给人们设置了种种障碍,但人们离不开不确定性,日常生活中人们都是在不确定性的环境中分析问题,解决问题。目前对于不确定性的处理,非单调逻辑成为一种重要的方法。

除了知识表示的不确定性带来的困难,逻辑学家、语言学家以及人工智能学家发现,更大的困难来自知识表示本身,知识表示就是如何表示世界的事实。为了让机器能够表示知识,做出推理,实现人工智能,就需要把人类所掌握的知识表示成机器能够识别的符号系统。常用的方法是一阶逻辑,而一阶逻辑所能刻画的知识毕竟是很有限的,就是说并非所有的自然语言都能用一阶逻辑来刻画,它只能刻画自然语言中的某些类型的语句。于是,顺应人工智能发展的需要,人们开始探讨能够刻画更多的自然语句的理论。

目前面向知识表示的研究的一个重大缺陷,就是它过于依赖一阶逻辑,而无法充分地描述自然语言。一阶逻辑是为形式语言量身定制的,而人类的绝大多数知识是用自然语言表达而不是用形式语言表达的,这就使得传统的知识表示在应用方面受到很大局限,不能真正为人工智能提供支持。当然,之所以用形式语言构造一阶逻辑,而不是采用自然语言,也是因为自然语言本身具有的内涵性、模糊性、交互性、形态性和多样性等一系列显著特点。为了扩大知识表示与推理的应用范围,实现它对人工智能的支持力度,建立面向知识表示的自然语言逻辑,就要回归自然语言,而自然语言的这些特点虽然给一阶逻辑带来重重困难,同时也为自然语言逻辑的蓬勃发展带来更加广阔的应用前景。

接下来从自然语言的内涵性、模糊性和交互性这3个典型特点来描述顺应时代发展的面向知识表示的自然语言逻辑是如何应对挑战和采取策略的。

1.面对自然语言的内涵性的挑战。自然语言的内涵性不仅包括语义上的内涵性,也包括语用上的内涵性。语义上的内涵性指的是用以确定表达式指称的语义内容,语用上的内涵性指的是所谓的言外之意。自然语言的内涵性使得它能够表达人类的许多知识,但问题是经典逻辑是外延逻辑,它无法刻画自然语言的内涵。弗雷格认识到由于内涵的存在而带来的认知差异,这种认知差异反映在逻辑和形式语义上,就是经典的等值替换原理的失效。起初人们认为内涵语境只限于命题态度句,但内涵语境的范围远远超出了命题态度句,它在自然语言中几乎无所不在。

例1:李四是个好丈夫。

例2:李四是个好男人。

一般情况,丈夫指的就是男人,然而现实生活中往往会发现好丈夫未必就是一个好男人,反之亦然。正是由于经典逻辑的外延性,在经典逻辑产生不久,就因为它不合乎人类自然语言推理,一系列非经典逻辑应运而生。在众多非经典逻辑中,基于可能世界的模态逻辑脱颖而出,成为处理自然语言内涵性现象的重要工具,但它在语义的表达上仍过于粗糙,因此,在自然语言中替换失效的情况仍然存在,这就是所谓的“超内涵语境”。所谓“超内涵语境”指的是在所有可能世界中具有相同真值的语句并不必然具有相同的内涵。

例3:玛丽结婚了并且生了一个可爱的女儿。

例4:玛丽生了一个可爱的女儿并且结婚了。

其中例3和例4在所有的可能世界中皆有相同的真值,但它们却不具有相同的内涵。为了克服这一现象,有效的进行知识表示和推理,超内涵逻辑产生了。

2.面对自然语言的模糊性的挑战。众所周知,自然语言具有模糊性。由于这种模糊性,在人工智能中不但有明确概念组成的“知识库”,而且有包含模糊概念的“知识粥”。人类所具有的知识的存在形式更多是以“知识粥”的形式存在的,而人工智能则需要的是计算机易于处理的由明确概念组成的“知识库”,这使得我们想要把模糊性的“知识粥”变成精确的“知识库”。起初模糊性被认为是自然语言的重大缺陷,当试图去消灭它,让它被精确性取而代之的时候才发现,这是不可能的,也是不现实的。更为重要的是,语言的模糊性并非只有消极意义,语言的模糊性在很大程度上方便了信息与知识的交流与共享。诸如此类的词语不断涌现,如也许、应该、可能、大概等。如果追求所谓的绝对精确,人们恐怕无法交流,更不要说知识的获取了。如问路的时候,你问别人某地的距离,别人只能给出一个大概的公里数,而难以达到精确,过度的精确现实生活中不仅不可能做到,而且对于问路人而言没有任何意义。因此,处理模糊性的办法并不是消灭它,而是最大限度地对自然语言本身进行描述和刻画,揭示包含模糊表达式的命题在语义和推理上的特征,从而获得对人类模糊性知识的机器表示,最终完成机器对人类智能的模拟。如模糊逻辑有针对自然语言中的量词进行系统研究,就有了关于模糊量词的表示的理论。

3.面对自然语言的交互性的挑战。自然语言不仅可以表达意义,促使行动的发生,甚至可以改变人们的信念、知识、态度和情感,这就是常说的“以言表意”“以言行事”和“以言取效”。如你到一户人家作客,看到主人家窗户开着,而且此时你感觉很冷,你说“今天天气真冷”,主人可能就能领会你的意思,关上窗户,从而达到你想要的效果,而不需要自己发生行为。这就是言语行为理论。当从行为的角度来看自然语言时,自然语言就不再是一个静态的过程,而是是一个动态的过程,它不仅是动态性的,也是多主体性。在人工智能中人们早已认识到多主体性的重要性,而且越来越清楚地认识到,如果仅仅从个体出发是无法把握智能的全部的,人类的理性和智能是群体交互作用的结果。自然语言的交互性是由自然语言的动态性和多主体性共同构成的,经典一阶逻辑显然不能满足这一要求,因为它既不是主体也不是动态的。近年来发展起来的动态认知逻辑,既考虑到多主体性又考虑到动态性,为面向知识表示的自然语言逻辑提供了很好的工具。

如上所述,虽然自然语言的内涵性、模糊性和交互性这些特点使其形式化带来重重困难,但同时也为自然语言逻辑的蓬勃发展带来更加广阔的应用前景,为自然语言的研究开拓了新的领域。

[1]蔡曙山,邹崇理.自然语言形式理论研究[M].北京:人民出版社,2010:40,100.

[2]邹崇理.自然语言逻辑研究[M].北京:人民出版社,2000:1.

[3]周礼全.逻辑与语言研究:第一集[M].北京:中国社会科学出版社,1980:86.

[4]王健平.自然语言逻辑的研究内容——周礼全语言逻辑思想的启迪[J].哲学动态,2012(6):101-104.

[5]胡勤.人工智能概述[J].电脑知识与技术,2010(13):3507-3509.

猜你喜欢

模糊性语义逻辑
刑事印证证明准确达成的逻辑反思
逻辑
创新的逻辑
我国传统色名的模糊性
语言与语义
《刑法修正案(十)》中“公共场合”的教义学理解——兼论刑事立法语言的统一性和模糊性
女人买买买的神逻辑
网络语言的模糊性特征初探
“上”与“下”语义的不对称性及其认知阐释
认知范畴模糊与语义模糊