人工智能基础理论研究的重大进展:评钟义信的专著《高等人工智能原理》
2015-11-26何华灿
何华灿
(西北工业大学计算机学院)
2014年3月科学出版社出版了北京邮电大学教授钟义信的最新专著《高等人工智能原理》[1],该书有5篇10章共538千字。第1篇探讨智能科学中的科学观(第1章)和方法论(第2章),第2篇阐述全信息理论(第3章)和知识生态理论(第4章),第3篇论述智能科学的研究模型和信息转换原理(第5~6章),第4篇分析高等人工智能理论与现行人工智能理论的关系(第7~9章),第5篇讨论高等人工智能原理的典型应用(第10章)。书的读者对象群主要是广大人工智能科学工作者、博士生、硕士生和本科高年级学生。该书在人工智能的基本观念、基本方法、基本模型、基本理论等方面都有重大突破,形成了一个全新的人工智能理论体系,与当今国内外普遍流行的人工智能理论体系相比有全面提升[2-5],用“高等人工智能原理”命名恰如其分。该书不仅能使读者全面了解人工智能的基本原理和方法,而且能启迪思维,引导读者步入自主创新之路,具有承前启后,继往开来的特殊作用。
1 该书的写作背景
1.1 时代背景
自20世纪中叶以来,随着现代信息技术特别是电子计算机技术的广泛应用和国际互联网的普及,人类已从“能源时代”进入到“信息时代”。世界各国先后在社会生产、科学技术、社会管理和社会生活中普遍实现了信息互联互通和信息处理的计算机化和网络化,这标志着信息化社会的初级阶段已基本完成,信息化社会的智能化阶段已开始。所谓“智能化”就是指在整个社会活动中普遍地采用智能科学技术,用智能机器(人)代替人去完成各种低层次的繁琐工作及危险操作。于是各行各业的智能化呼声此起彼伏,响彻世界各地。然而,现有的人工智能科学技术脱胎于能源时代形成的“确定性世界观”,其中的“还原论”科学观,“分而治之”的方法论,“各自为战”的智能研究模型,“互不联通”的研究学派等等,这一切都必须在“智能化”的时代需求面前做出根本性改变!因为人脑的智能活动过程不是一个简单的机械运动过程,而是一个发生在复杂性系统中的非线性演化过程,不确定性是其本质特征,它需要在“不确定性世界观”下才能被准确地把握和描述。
2006年是国际人工智能学科诞生的50周年,中国人工智能学会在北京举办了隆重的“国际人工智能学术大会”,来自五大洲近30个国家和地区的同行专家出席了会议。在会议的“发展战略”论坛上,时任中国人工智能学会理事长的钟义信教授代表会议主办方做了主题发言,他明确指出,当前人工智能研究存在三大问题:
1)符号主义、连接主义和行为主义三大学派互不联通,相互对立。
2)在智能研究中忽视了对情感与意识的研究。
3)在智能科学研究中缺乏与认知科学研究的互动。
于是他在大会上发出了3项呼吁:
1)在学术上实现符号主义、连接主义和行为主义三大学派的联通以形成合力。
2)把意识、情感、智能作为统一的三位一体进行全面研究。
3)加强智能科学与认知科学的联合研究。
这3项呼吁的核心思想就是呼吁国际人工智能学术界摆脱源自“确定性世界观”的“还原论”科学观和“分而治之”方法论的束缚。因为正是这些科学观和方法论把人工智能的研究分裂成了互不联通的“三大学派”。只有摆脱了“还原论”和“分而治之”的束缚之后,才有可能使人工智能研究走上基于“不确定性世界观”的发展新轨道。钟义信教授的这3项呼吁立即在会议上获得了模糊数学创始人L.A.Zadeh和国内外许多与会者的高度赞同,他们认为这实际上是“未来50年人工智能研究的学术纲领”。
1.2 个人学术背景
实际上,在2006年国际会议之前,钟义信教授已经在上述3个方面进行了大量的研究工作,会议之后又进一步进行了深化和拓展,系统地积累了丰硕的研究成果。例如:
1)他在1965—1988期间完成了把Shannon的“信息论”[6]拓展成为“全信息理论”的研究,出版了《信息科学原理》[7],阐明了机器获取信息能力的一般机理。
尽管“信息”概念的提出是Shannon对信息时代的第一个伟大贡献,钟教授在研究Shannon信息论时发现,这里的所谓“信息”是根据通信工程的特殊需要,只考虑了信息的形式因素(信号波形),没有考虑信息的内容和价值因素;只考虑了随机型(统计型)信息,没有考虑非统计型信息。这种信息论根本不能满足其他信息领域、特别是智能科学领域的要求。他根据整个信息科学特别是智能科学的全局需要,指出“本体论信息”只是事物本身呈现的运动状态及其变化方式。而“认识论信息”才是认识主体从本体论信息中感知的事物运动状态及其变化方式,它包括形式(语法信息)、含义(语义信息)和效用(语用信息)3个相互关联的方面。这种把语法、语义和语用信息看成是三位一体的认识论信息称为“全信息”,Shannon的信息仅是全信息中的统计型语法信息。
2)他在1988—2000年期间创建了“知识理论”的基本体系[8],阐明了机器获取和提炼知识能力的一般机理。
1970年代由A.Feigenbaum等建立了“知识工程”[9],关注了人工智能系统中基于专家知识的推理问题。1990年代由R.Agrawal等建立了“知识发现”[10],关注了针对关系数据库的知识发现问题。但是这两种原理都立足于某种特殊背景,且两者不能互相联通,不是一般性的知识理论。钟教授研究发现,知识与认识论信息相通,人脑获取信息、知识和智能的过程是一个非线性的生态演化过程,其“外生态规律”是一个不断提升的信息转换序列:认识论信息—知识—智能。其“内生态规律”是一个不断完善的无限循环过程:本能知识—经验知识—规范知识—常识知识—规范知识—经验知识—常识知识…。
3)他在2000-2007年期间建立了基于机制主义的“智能理论”[11],阐明了机器生成智能策略和智能行为的一般机理。
在此之前,人工智能中已经形成了三大学派:基于智能系统结构模拟的连接主义学派,基于智能系统功能模拟的符号主义学派,基于智能系统行为模拟的行为主义学派。它们在人工智能中三足鼎立,未能形成一个统一的人工智能理论体系。钟教授提出了基于全信息理论和信息—知识—智能转换的机制模拟方法,他把机制模拟与知识内生态学结合,发现基于结构模拟的人工神经网络系统、基于功能模拟的物理符号系统、基于行为模拟的感知—动作系统分别是机制模拟系统的A、B、C型,从而统一了结构、功能、行为模拟学派。他把机制模拟方法应用于基础意识与情感研究,发现基础意识、情感、理智分别是基于K1、K2、K3型知识的信息转换产物,建立了“意识—情感—理智三位一体”的“高等人工智能理论”。
4)他在2007-2013年期间提出了信息转换的方法论[12],揭示了赋予机器“认知和行事”、“情感与理智交互”及“人机合作”能力的奥秘,并论述了“知行机器的能力和局限”。
在建立了全信息理论、知识理论和智能理论之后,怎样把它们集成为一个统一的整体,这就是方法论的挑战。几百年来,“分解分析,各个击破,直接综合”一直是人们解决物质科学领域复杂问题的有效方法论。使学科不断分化,理论不断深入,促进了近代科学的发展和繁荣。这种方法论体现了物质科学的科学观:物质观、结构观、还原论。面对信息科学的研究,“分而治之”方法论不再能够有效解决问题。这是因为,“分而治之”的结果丢掉了在复杂性系统中扮演创生者的“涌现效应”,使各子系统之间相互联系和相互作用的信息全部消失,而这些信息正是复杂信息系统的生命线,因而各个击破之后的结果根本无法复原成原来系统的作用。所以信息科学特别是智能科学需要的科学观是:“信息观,系统观,生态观,主客互动创学观”。体现上述科学观的信息科学方法论是:“信息转换与智能创生”。
可见,《高等人工智能原理》不是通常授课老师为讲授人工智能课程而编写的普通教材,它不仅囊括了国内外人工智能研究的基本原理和方法,而且凝聚了钟义信教授自己数十年来自主研究的许多成果和心得。他把人工智能研究从简单机械系统的科学观和方法论的禁锢中解放出来,站在复杂性系统的科学观和方法论的高度,全局把握了人工智能学科发展的大方向,所以这是一部能够承前启后,继往开来的具有深远影响的学术专著。
2 该书的主要创新
2.1 科学观和方法论的创新
自从300多年前人类社会进入能源时代以来,已经形成了一个庞大的物质科学理论体系。能源时代主要使用的工具系统是工具机和能源机,物质科学的主要研究对象是物质内部结构和外在性能,以及简单机械运动过程中的传动方式和能量转换规律。因此,物质科学所运用的科学观是“物质观”、“结构观”、“机械观”、“还原论”,由此所形成的方法论是“分而治之,分析综合”。应该承认,物质科学的科学观和方法论是对古代“笼而统之”的科学观和“抽象思辨”方法论的一次否定和创新,在近代300多年的科学研究中发挥了巨大的指导作用,为科学的发展和繁荣做出了历史性贡献。
在信息时代,这一切发生了根本性变化,信息科学(特别是其中的智能科学)涉及的是复杂性系统中的信息处理过程和智能活动过程,其变化规律已与简单机械系统中的物质运动和能量转换规律完全不同。信息科学研究的对象是信息,研究的目的是理解通过什么样的信息处理过程能够生成有用的知识和解决问题的策略。其中,信息所描述的是现象,知识所描述的是规律,而解决问题的策略所描述的是系统的智能行为。智能系统的重要功能是能够根据行为的效果反馈进行学习,吸取经验和教训,改进自己的行为,不断演化提高。可见,这是一个发生在复杂性系统中的典型的生态活动过程,具有生态系统中必不可少的各种生态变化规律和涌现效应。科学研究对象不同了,研究的观念和方法当然也要发生变化。因此,信息科学的研究不应当简单地沿用近代物质科学的科学观和方法论。
钟义信教授根据信息的特点,提出信息科学和智能科学的科学观是“信息观”、“系统观”、“生态观”和“主客互动创学观”,与此相应的方法论则是“信息—知识—智能转换”方法,也可以表述为“信息转换与智能创生”方法。“信息转换”是手段,“智能创生”是目的。“转换创生”的特点是“生长”。“信息转换”的结果不但不丢失信息,而且可以通过主客互动和学习增加求解问题所需要的知识,“创生”出解决问题的策略。
2.2 信息—知识—智能的三位一体
信息是整个信息科学和智能科学最基础、最根本的概念。钟教授阐明并遵循了符合“信息观、系统观、生态观”的科学观和“信息转换与智能创生”的方法论要求的“信息”概念,这就是“形式因素(语法信息)、内容因素(语义信息)、价值因素(语用信息)”三位一体的认识论信息,即“全信息”。这里的“全”就是指“形式、内容、价值”的三位一体,符合“信息的系统观”。同时,他坚持了“信息、知识、智能(策略)”三位一体的“全过程”,而不是仅仅孤立、静止地研究信息而不考虑知识和智能(策略)。这也是信息的“系统观”和“生态观”所要求的。
现有人工智能研究没有理解信息科学的“信息观、系统观、生态观、主客互动创学观”和“信息转换与智能创生”方法论,所以它存在严重的局限性。《高等人工智能原理》就是运用信息科学的科学观和方法论来突破现有人工智能研究局限性的一个成功的尝试。
3.2 智能的三位一体研究模型
《高等人工智能原理》的研究模型如图1所示。模型中的本体论信息是“外部世界各种事物所呈现的运动状态及其变化方式”,它与认识主体无关;认识主体所获的认识论信息就是“形式、内容、价值”三位一体的全信息。整个信息运动的全过程包含了:由本体论信息到认识论信息的转换、由认识论信息到知识的转换、由认识论信息、知识和目的到智能策略的转换以及由智能策略到智能行为的转换。可见,模型如实地体现了以“信息观、系统观、生态观”和“主客互动创学观”为标志的科学观和以“信息转换与智能创生”为特征的方法论。
图1 序列量子神经元模型Fig.1 Sequence-base quantum on model
虽然模型所表现的过程看起来很完美,但是,由于现实世界存在的复杂性和非理想性因素,按照模型显示的过程和方法所得到的效果不可能完全理想。于是,模型中效果检验所得到的误差(也是一种信息)必须反馈到整个系统的输入端。针对这个误差,系统通过学习补充信息、完善知识、优化策略,改善效果。这种“反馈—学习—优化”的过程可能需要进行多次,每次都使效果得到一定的改善,直至满意为止。
图1所示的《高等人工智能原理》的研究模型,充分显示了它的完整性、真实性和合理性。相比之下,目前学术界所采用的人工智能研究模型,大体上只相当于图1模型中的“理智”模块,没有“基础意识”也没有“情感”,当然也没有“综合决策”;而且,它们所应用的信息也基本上是Shannon信息。
读者在书中可以具体看到,利用图1所示的基本模型,可以退化为基于结构模拟的人工神经网络系统(A型)、基于功能模拟的物理符号系统(B型)、基于行为模拟的感知—动作系统(C型),从而可以统一结构主义、功能主义和行为主义三大学派。利用图1所示的基本模型,还可以演变成意识型(K1知识支持)、情感型(K2知识支持)和理智型(K3知识支持)的信息转换系统,建立“意识—情感—理智三位一体”的“高等人工智能理论体系”。
3 结束语
从以上的介绍可以看出,《高等人工智能原理》的最大贡献是彻底改变了传统人工智能原理中“能源时代”印记——用简单机械系统中的“确定性世界观”、“还原论”的科学观念和“分析综合”的方法论来研究智能科学问题。第一次自觉地运用复杂性系统中的“不确定性世界观”、“生态演化”的科学观和综合平衡和涌现相结合的方法论来研究智能科学问题。这是一个伟大的转变,具有里程碑意义。
当然,《高等人工智能原理》的出版只是一个良好的开端,其开辟的大方向完全正确,但要建立起一个系统完整的高等人工智能理论体系来,切实解决好诸如从信息—知识—智能的转换全过程中的具体逻辑规律问题,智能系统内部的多目标之间的协调、智能系统与外部环境之间的协调,出现某种涌现结果的条件和时机的把握等等,还有许多深入细致的研究工作要做,这些都需要我们整个人工智能学术界的共同努力。
[1]钟义信.高等人工智能原理—观念—方法—模型—理论[M].北京:科学出版社,2014:1-416.
[2]何华灿.人工智能导论[M].西安:西北工业大学出版社,1988:1-266.
[3]蔡自兴,徐光佑.人工智能及其应用[M].3版,北京:清华大学出版社,2003:1-403.
[4]陆汝钤.人工智能[M].北京:科学出版社,1995:1-1296.
[5]NILSSON N J.Artificial intelligence:a new synthesis[M].郑扣根,等译,北京:机械工业出版社,2000:1-281.
[6]SHANNON C E.A mathematical theory of communication[J].BSTI,1948,(47):379-432,632-656.
[7]钟义信.信息科学原理[M].北京:北京邮电大学出版社,1988:59-132.
[8]钟义信.知识理论框架[J].中国工程科学,2000,2(6):50-64.
[9]FEIGENBAUM A.The art of artificial intelligence:themes and case studies in knowledge engineering[C]//IJCAI 5,1977:1014-1029.
[10]FAYAD U.Advances in knowledge discovery and data mining[M].Boston:MIT Press,1996:1-129-8.
[11]钟义信.机器知行学原理[M].北京:科学出版社,2007:249-269.
[12]钟义信.信息转换原理:信息—知识—智能的一体化理论[J].科学通报,2013,58(14):1300-1306.