认知技术的变革及前景展望
2023-07-10江铭虎
【摘要】人脑是语言的大脑,语言是记载知识的工具,可以说,语言使人类的历史得以留存。人类认识可以划分为物理对象、主观意识和客观知识三个世界,认知领域、物理领域和信息领域密切相关又存在着一定的差异。计算机互联网络是信息时代的第一次革命,自然语言处理是人工智能的核心技术;人工智能促进了认知科学与技术的发展,认知技术是互联网信息时代的第二次革命,将改变我们的工作和生活方式。
【关键词】语言 人脑 认知领域 物理领域 信息领域 人工智能
【中图分类号】R318/TP18 【文献标识码】A
【DOI】10.16619/j.cnki.rmltxsqy.2023.11.003
引言
人脑与语言共同经过了漫长的进化,人脑进化为语言的大脑。动物没有语言,因而没有历史。人类拥有语言,语言可以描述记载人类所积累的智慧结晶——知识,知识的积累带来逻辑、思维和文化的进化,最终形成了文明智慧的人类社会,人工智能(artificial intelligence, AI)也由此诞生并迅速发展。
语言是一种形、音、义结合的词汇和语法体系,是人类沟通交流的一种方式(江铭虎,2022)。语言虽变化无穷,但其语法类型有限,是可以归类、分析、统计和学习的,因而可以通过计算机的训练学习实现语言的自动理解与产生。蔡曙山指出,人类的心智与认知产生于脑的进化与分工,奠基于语言,发展于逻辑与思维,积淀为文化,构建了社会(蔡曙山,2021;蔡曙山、江铭虎,2016)。
认知科学和AI之间存在着密切的关系,认知是指人类的思维和知觉过程,包括知觉、记忆、思考和语言等方面。人脑虽然天生就存在着若干成型的特定功能脑区,但要充分挖掘出人脑中所蕴藏的巨大潜力、开发出更多的脑部功能,后天的学习和思维训练是不可或缺的,其中语言就需要后天的训练和学习。如果不了解大脑的运作和认知机制,就无法对人类的语言认知规律有深入的理解(江铭虎,2016)。AI研究中的许多概念和算法都借鉴了认知心理学的研究成果。例如,类脑计算模型在自然语言处理(natural language processing, NLP)和计算机视觉等领域都是在模拟人类的语言和视觉系统。反之,AI也对认知科学的发展产生了积极的影响。例如,AI的深度学习算法为认知神经科学的研究提供了新思路。
语言是记载知识的工具,语言使人类的历史得以留存
人脑与语言共同经过了漫长的进化。从人类进化的角度来看,语言的发展是当今人类最独特、最显著的特征。王士元指出,没有人类发达的大脑,就不可能有我们变化无穷的语言;同时,没有语言来帮助我们组织思想以及累积几百年的科学成果,我们也不可能了解大脑这个极为繁复精密的器官。显然,大脑和语言息息相关、相互演化,语言与大脑是共同进化的(王士元,2011;2008)。就哺乳动物的大脑而言,人脑相对身体的比例是最大的,且是连接最复杂的,人脑的体积和复杂性在进化的过程中不断增加,使得一些旧有的功能得以改进,一些新的功能(如语言、创造工具)得以涌现,这种现象丰富了人类的行为和认知技能,并且决定了他们在物种竞争中的优势地位。
大脑器官如此复杂,人类智力的进化并不是刹那间发生的,其中语言的使用和发展起了决定性作用。表1展示了人类祖先进化的大致时间段与脑容量的关系。大约50万年前,口语出现,人脑中操作口语的机能以及语音和对应的语义开始进化,神经系统自然而然地联为一体,人脑表面积开始增加(江铭虎、王琳,2013;江铭虎,2019)。诺姆·乔姆斯基(Noam Chomsky)认为,语言出现于20万~6万年前,大致是13万年前,即经历了大约5,000~6,000代人的进化时间(Chomsky, 2008; 2014)。人类对语言的适应使其变得如此复杂又如此有效。一旦符号交流在早期的原始人类社会中变得稍微复杂,它独特的代表功能和开放的灵活性意味着它可以被用于无数的目的,并产生同样强大的再生结果。现存语言的多层结构和我们易于使用的语言,都只能被解释为二次选择的结果,这种二次选择是由首次引入符号过程的社会功能所产生的。特伦斯·迪肯(Terrence Deacon)认为这可能有助于解释为什么符号交流是像猿类这样脑容量大、寿命长的生态物种才能进化出来的(Deacon, 1997)。因此,无论计算能力如何提高,大脑的绝对大小都可能在语言进化中扮演了一个重要的角色。多尔·希尔顿(Dor Shilton)等指出,人类进化的两个重叠阶段包括:在语言出现之前,涉及原始人类生活方式的最初发展阶段,即狩猎和觅食、工具制造和异体养育;在语言出现之后,涉及情感和认知可塑性进一步提高的阶段,这是通过语言来指导想象力的结果(Shilton et al., 2020)。
人脑是语言的大脑。语言是人类独有的,其特点是能够生成和处理具有层次结构的句法序列,这与非人类灵长类动物有所不同。语言的复杂性远远超过任何现存灵长类物种交流系统的复杂性,其工作机制远比人们所想象的要复杂得多,而且语言功能的发展也建立在感知觉、运动等基本生理功能的基础上。它的独特之处不仅在于其结构的复杂性,还在于其与核心认知能力密不可分。交流是语言演化的重要动力,合作是语言演化的基础。语言的古老源头是初期的共享意图,有了共享意图,就有了合作。人类语言是我们的天性(即生物学和基因)和我们的后天培养(学习经验和环境)之间持续而根深蒂固的相互依存关系的作用结果。语言依赖于我们与其他物种共享的许多机制,自然选择改善人类的某些技能,其中脑容量的增加、发音声道的进化、交流意图的社会需求、复杂序列的学习能力等因素,所有的这些技能综合起来使人类的语言成为可能。因此,发展好语言功能需要以丰富的感知觉、运动经验为基础。同时,参与语言处理的这些脑区并不是独立工作的,而是相互組织起来,形成了用于处理语言的神经网络。符号化的系统性表明,大脑内符号关联的表示应分布在不同的脑区,而相似的词汇共享神经共性。相关脑区组织成不同的信息处理网络,来处理不同方面的语言信息,某一脑区既接受来自多个其他脑区的神经信号,也向多个脑区发送信号。信号的传递不是一次性完成的,也不是单向的,而是在不同脑区之间多次往返、多向交互的。语言与范围广泛的人脑神经集成在一起,并且不断地相互作用共同进化。
马丁·诺瓦克(Martin A. Nowak)指出,人类语言经过几十万年的进化,使我们实现个体间无限的非基因信息的传递,并推动了文化的进化(Nowak et al., 2002)。语言与这些核心认知过程相关联,语言信号会反馈和影响我们对世界的认识和表示。习得人类语言需要掌握一个复杂的、多层次的符号系统,这个系统由语音、音位学、形态学、句法、语义和语用学等几个成分交织在一起,从而实现对我们思想和文化的传袭。这种语言与认知的联系是学习和文化传播的渠道。
语言本身基于符号来表示概念,概念符号系统位于这些脑区的“心理词典”中。人类语言的一个决定性特征是其灵活表示和重组概念的能力。人类的基因组深深植根于我们的生物构成中,基因组通过建立能够适应和重组以响应输入的神经系统,为语言习得提供了平台。人类语言的灵活性意味着我们可以用它来表示几乎任何我们能想到的东西。手势、声音、面部五官以及相关特征共同进化,形成一个日益复杂、动态和多样化的人类语言与非语言交流系统。当我们出生时,口语和听力的神经生物学系统就已经配置完整,使我们能够相对容易地掌握口语;而阅读和写作能力需要经过正规的指导,只有经过多年的接触和经验才能逐渐发展完善,学习阅读和写作会重新开发我们的大脑。
共同进化的观点认为,语言的进化不是发生在大脑的内部或外部,而是发生在文化进化过程中影响生物进化过程的界面上(Deacon, 1997)。共同进化过程在塑造人脑和心智方面发挥了重要的作用。如果不承认人类解剖学、神经生物学和人类心理学都是由一种最能被描述为思想的东西所塑造的,即符号参照的思想,那么就不可能理解人类的思想。虽然符号思维可以完全是个人的,但符号参照本身在本质上是社会性的。也即是说,我们不仅通过与社会其他成员的互动获得这种表达方式,而且符号本身也可以追溯其社会起源。从具体意义上说,人类独特的思想是一种不寻常的再生挑战产物,这种挑战只有符号参照才能解决。人类语言复杂,但易于学习和使用,这依赖于有效的符号交流。长期的共同进化积淀不仅使符号交流变得更容易、更有效,而且呈现出越有效地获取符号信息和越强大地运用符号交流的趋向。
语言的语法语义和社会属性。人类语言从表面看只是符号串,而其实际是具有层次树状句法结构的。人类语言服从形式分析:所有的语言,无论是书面语还是口语,都是由小的元素分层递归地组合构建成较大的单元,它们具有声学特征或人工特征,可以依次用來组成音节、词语、短语和句子,再由此组成段落和篇章,这样的组合规则不是任意的,每种语言都有具体的规则。句子中词的组合方式是由该语法规则系统中的层次结构决定的,因此人类的语言具有处理层次构造序列的能力和处理递归结构的能力。
语言的生物过程理论认为,人类天生就有认知语法结构的能力,使他们能够发展和理解语言(江铭虎,2022)。根据这一理论,这个语法结构系统嵌入到人类遗传之中,并支撑着所有语言的基本语法。语言系统是一个复杂的系统,在自然科学中,通常将复杂的现象和系统分解为基本元素或操作,以便使用。这些基本元素一旦确定就可以进行整合,用于解释一个复杂的系统。复杂语言系统的分解要素是词素和句法规则。对于句法领域来说,这种方法效果很好,因为有一个清晰的语言学理论定义了一个最基本的规则,即整合。人类可以创建和理解全新的消息,新消息是通过混合、类比或转换旧信息而自由创造的。语言的一个主要特征是,一个简单、有限的音位项集合可以产生一个无限的词汇系统,其中规则决定了每个词项的形式,而意义则与形式密不可分,因此语音语法是现有语音单位的简单组合。语言的另一个重要特征是词法和句法,其中预先存在的单元被合并,从而产生了语义上新颖或截然不同的词汇项(江铭虎,2022)。
语言是变化发展的,人类的创造力推动语法的变化,听者必须具有丰富的想象力和创造力。语法化实质上是建立在隐喻的基础上的。禁止隐喻的使用会阻止语法的发展,同样也会排除所有表达抽象思想的可能性。语法化要求一种语言系统在一群讲述者中经常使用,并从一群讲述者传递到另一群讲述者。提出问题的能力被认为是区分语言和非人类动物交流系统的能力。伊丽莎·纽波特(Elissa L. Newport)指出,人类习得其母语的机制,既需要先天条件又需要后天培养,也就是说该过程既包括学习者所接触的语言环境,又包括学习者所具备的先天素质,还需要以特殊的方式来学习瞬时组织语言的模式(Newport and Aslin, 2004; Newport et al., 2004)。语言是一种沟通方式,是人类行为的重要部分和定义我们社会身份的一种文化载体。人类语言还有一个基本的特征使之能够服从于形式分析:语言结构由根据一定规则组合起来的较小的单元组成,进入较大结构的小单元的组合顺序在几个不同的水平产生。音素形成音节和词汇,词汇形成词组和语句,这样的组合规则不是任意的,每种语言有具体的规则,由此产生有效或有意义的语言结构的具体规则。人类天生就能学习语言,乔姆斯基指出,语言是一个自由创造的过程,它的规律和原则是固定的,但是生成原则的使用方式是自由的,甚至单词的解释和使用都涉及一个自由创造的过程,乔姆斯基认为语言是一种“心理器官”,是一组有限的计算机制,它可以无限变化,允许我们产生无限的句子(Friederici and Chomsky, 2017; Smith, 2004; Berwick and Chomsky, 2016)。
语言是人类的基本特征,也是一种文化共性。与其他非人类动物有限交流的系统不同,人类的语言是开放的、发展的,通过组合有限数量的符号可以产生无限数量的意义。我们所说的几乎每一个复杂的事情都可能是之前从未说过的。语言真正的奥秘在于我们如何使用极其精细复杂的词汇和语法结构系统,实时地自由表达我们的意识和思想。外在化的语言不仅是一个认知层面的问题,还是一个社会层面的问题。将语言符号外在化,无论是在墙上的绘画还是书写的文字,在某种意义上来说都是社会层面的问题,社会文化领域中应有某些存在的环境来支持它。龟甲、兽骨上雕刻的甲骨文,以及语言形式的外在化符号的产生,需要的不仅仅是大脑中的某些东西,更需要一个复杂的社会环境来支持它,并让它变得有价值。语言本身是集体的产物,而不是个人的产物,具有社会属性。语言从一开始就具有系统性和社会性。语言是由基因决定的,是生物进化的结果,是社会互动和交流的结果,对于人类之间的交流以及统一民族、文化和种族群体的认同感至关重要。至少五千年前书写系统的发明使语言得以保存在实物上,这是人类一项重大的技术进步。
当接触到语言数据时,听者-说者的大脑会将声音和意义联系起来。通常我们会根据上下文学习单词,通过逐步习得来区分其含义,通过捕捉其细微差别、内涵以及它们与事物的匹配方式,来学习单词的含义。思想是认知活动的产物,通过它,可对我们的内在和外在世界进行假设,使其概念化、结构化和战略化。学习是由经验和神经元重组介导的发展或成熟过程,学习结果是知识和技能的积累,以更好地理解经验和思想并使其有意义。通过语言将想法概念化,我们开始了解一些东西,即通过语言中介的互动,在面对新的体验时,建立一些东西(如一个词或概念)与某些东西的意义之间的关系。通过叙事来使用语言及其与文化的紧密联系是人类认知的核心。
人类对世界的认知及认知科学的发展
人类认识的三个世界划分。诺贝尔医学奖得主约翰·卡鲁·埃克尔斯(John Carew Eccles)和哲学家卡尔·波普尔(Karl Popper)将心智问题分为三个世界(领域)的概念(Eccles and Poppe, 1984),认为人类经验中的一切都可被归入物理对象及状态领域、意识状态领域和客观感知知识领域中的一个类别(如表2所示)。蔡曙山将人类认知分为五层级(蔡曙山,2021),将埃克尔斯和波普尔的人类经验的划分上升到理论的高度,认为人脑“进化奇迹”之处在于,其不仅仅是一个有血有肉的认知计算器官,还能够产生神经认知、心理认知、语言认知、思维认知和文化认知五大非凡的现象(前两项认知是动物也具有的低阶认知,后三项认知是人类独有的高阶认知),这一奇迹的产生是语言使用的直接结果。
世界1是物理对象及状态的世界,包括整个宇宙的物质和能量、所有的生物以及人类为编码信息而制造的所有人工制品,如工具、机器、书籍和艺术品等,世界1是唯物主义者的全部世界;世界2是各种意识状态和主观认识的世界,我们感知的全部内容都在世界2里,包括外在感觉、内在意识和纯我意识三个层次;世界3是客观知识,是人类知识积累的结晶。这三个世界很容易界定,在人类认知的三个世界的分类中,没有任何遗漏,它涉及存在的和我们所经历的一切,即所有皆可归类到三个世界当中(Eccles, 1973; 1970)。
人类具有两种记忆(世界2):情景记忆(记住曾经发生过的特定事件)和程序性记忆(一种与技能学习有关的记忆)。一方面,语言使用程序性记忆,我们大部分的发音、语法处理和句子构造都是不需要多加考虑的技能,就像骑自行车、游泳一样轻松;另一方面,我们可以使用程序存储系统,它包含的符号可以自动地“访问”大脑语义网络,以及我们曾经的丰富的人生经历。人脑可以使用一种记忆来联想并组织另一种记忆,而其他物种则无法使用这种记忆。
语言是只有人类才能实现的一种独特的交流形式,大脑在漫长的进化过程中进行了很多改变才使语言交流成为可能。客观知识(世界3)用语言记载,是经验(世界2)的先驱。当我们学习新信息并通过应用所学到的知识来修正行为时,我们就会创造出一种新的更丰富的体验。因为情感是体验的最终产物,所以我们有意采取的行动的结果是以一种新的情感产生一种新的体验。当我们有意识地了解如何根据所学和所做的事情来创造新的体验时,我们就拥有了智慧,智慧能够有意识地理解我们如何创造经验,并通过不断进化最终形成世界3的客观知识。因此,智慧的进化是指,基于我们已经学习、展示,然后体验的知识,通过理解我们所创造的感受而获得智慧的过程。学习知识是思考,运用知识是实践和体验。能够用心去重复体验,就是人类的智慧。
主观认识(世界2)到客观知识(世界3)的转换是指一个人从自身主观的认知和体验,逐步理解和接受客观存在的知识与事实的过程。这种转换通常需要通过学习、实践和反思等多种方式来实现,主观认识到客观知识的转换是一个不断学习、实践、反思和调整的过程。而客观知识的形成过程是一个经验(世界2)和理性相结合的过程,需要通过观察和实验去发现事物的属性和规律,收集数据和信息,经分析推导发现其中的规律和联系,得出初步的结论,然后经检验和验证、通过再次实验、比较和重复观察等方式以确保其正确性和可靠性。论证后的客观知识可通过科教出版或工程应用等方式进行传播,这个过程需要不断地更新和完善,以适应不断变化的世界和知识需求。
人类智慧是人类独特的认知能力和智慧表现,具有以下特点:人类的抽象思维能力能够将具体事物抽象成一般概念和规律,从而更好地理解和掌握事物的本质;人类的创造性思维能力能够创造新的概念、思想、艺术和科技,推动社会的发展和进步;人类的自我反思能力能够审视自己的思想、行为和价值观,并不断自我改进和完善;人类具有群体意识和合作精神,能够合作解决问题、分享知识和经验;人类的情感认知能力能够感知和理解自己与他人的情感和情绪,从而更好地沟通和交流;人类的长期思考能力能够预见未来的可能性并做长期规划,从而更好地面对复杂的问题和挑战。这些特点共同构成了人类的认知和智慧的本质特征。
人类智慧(世界2)和客观知识(世界3)都是被用来解决问题、进行决策和推理的。客观知识是基于科学实验和研究得出的结论和事实,具有客观性、可重复性、普遍适用性;而人类智慧则更多的是基于个人的经验、观察、洞察和直觉,具有主观性和不确定性。人类智慧具备对世间万物声像图文的多模态感知能力,将不同事物联系起来的逻辑认知能力和对社会环境反馈信息的学习校准能力。人类智慧的进化和形成是一个漫长而复杂的历史过程,是由多方面因素相互作用和影响的结果,它受到大脑结构、语言交流、工具使用、农业革命、工业革命、社会文化、学习教育等多个因素的影响和作用。这些因素的相互作用和影响推动着人类智慧的不断进化与发展。
认知科学、物理科学和信息科学的关联与区别。认知科学是一门研究人类思维、学习、记忆、感知和决策等方面的多学科领域,涉及神经科学、语言学、哲学、心理学、AI和教育学等学科,是研究我们如何思考、感知和下决定的。认知技术将这些学科与工程相结合,对人类认知、智能,以及模擬和增强认知能力的技术与应用进行开发,以增强人类能力进而改变我们的生活和工作方式。
认知与意识密切相关,本质上是主观的,是由个人经历、信仰和情感塑造的。认知过程相较于物理或信息过程更复杂和灵活,这一过程往往需要整合多种信息,运用逻辑推理和创造性思维。认知技术依赖于大数据和先进的算力来学习、推理,并与人类互动,类似于人脑,可学习和适应新情况、创造新的解决方案,具有灵活性、智能性、交互性和自主性。认知领域、物理领域和信息领域密切相关但又有所不同,如表3所示,三者虽都是人类活动和知识发展的重要领域,但各有其研究的特点和应用领域,这些应用领域之间也存在相互联系和交叉应用,如信息技术在物理领域的实验和计算中的应用,AI在认知领域的应用等。
认知领域又是一个快速发展的领域,涉及复杂的多学科相互作用。通过跨学科合作,认知领域汇集了不同学科的技能和专业知识来解决复杂问题。从数据科学和工程技术到认知心理学和神经科学,从认知计算到虚拟现实,从导航、自动驾驶、智慧城市、智慧金融到大数据医疗,理论与应用研究的不同领域专家能够借鉴广泛的学科见解和技术,促进开发过程中的多样性和包容性,通力合作开发新技术和新应用,推动认知领域的创新发展。
信息时代的两次革命。计算机互联网的出现是信息时代的第一次革命,它彻底改变了人们获取、传播和共享信息的方式。计算机互联网为信息时代带来了重要变革。一方面,互联网极大地提高了信息的传播速度,通过电子邮件、即时通讯和社交媒体等工具,人们可以在几秒钟内将信息传递到世界的任何一个角落,实现了实时交流和全球信息共享;另一方面,人们获取信息变得更加便捷,过去人们可能需要花费大量时间在图书馆或通过传统媒体获取信息,而现在通过搜索引擎和在线数据库就可以实现,NLP和数据挖掘技术的快速发展更是加快了人们获取自己所需内容和知识的效率。
认知技术作为信息时代的第二次革命,强调人类智能和认知能力在信息处理与应用中的重要性。一方面,基于AI特别是NLP技术,计算机能够更好地理解、处理和分析大量的信息;另一方面,认知技术的发展将改变人机交互的方式,通过NLP和语音识别等技术,计算机可以更好地理解人类的意图和需求,提供更人性化的用户体验。此外,通过分析和处理大数据,计算机可以提供更全面、准确的信息支持,辅助决策,这使得认知技术在医疗诊断、金融投资和战略规划等领域具有广泛的应用前景。
AI技术促进了认知科学与技术的发展。人类认知的研究历史悠久,认知心理学、认知语言学和认知神经科学等有影响力的理论模型为理解人类智力的本质及其背后的认知过程提供了框架。认知技术是一种利用AI技术模拟人类认知过程的技術,使机器能够像人类一样感知、理解、学习、推理和解决问题。AI是一项交叉研究,基于多学科融合,促进了我们对语言学的了解与认识,促进了语言学理论本身的发展。NLP是AI的核心技术之一,目标是让机器像人类一样具有理解语言的智能,缩小不同语种的人类交流和机器理解之间的差距。自然语言研究从传统的挖掘具有理论价值的语言事实并给出解释,到挖掘便于机器存取的结构化的语言大数据知识,实现了从大规模语料中统计出语言的用词组句规律。
自然语言是人类最主要的交流工具,通过理解和生成人类语言,计算机可以与人类进行有效的交互。由于大量的数据是以自然语言的形式呈现的,通过NLP,计算机可以通过处理和分析这些文本大数据来理解和生成人类语言,并挖掘有价值的信息和知识来支持决策制定、舆情监控等任务。通过NLP技术可以构建和训练大型语言模型,对语言规律和概率进行建模,对文本进行分析理解,并应用于文本分类、命名实体识别、自动文本摘要、机器翻译、语音识别与合成、问答系统、人机对话系统等场景。搜索引擎可以理解用户意图并从海量数据中检索相关信息,并提供准确的搜索结果,这为许多AI应用提供了理论基础和技术支持。ChatGPT作为一种AI的大型语言模型,是认知技术的一种应用,它的底层逻辑是大数据的统计。当机器不能准确知悉事物的本质时,通过大数据的统计训练来获取经验,通过迭代运算对未知状态逐步逼近,从而判断事物的本质属性。这一过程能够实现的前提是,人们使用正确语句的概率远大于错误语句的概率,在此基础上,只要语料规模足够大,计算机就能够统计出语言的组词造句的规律性知识,用于自动语言理解和生成,其应用场景广泛,将为人们提供更加智能化、便捷的服务和解决方案。
随着更大规模的数据集和更强大的计算资源迅速增加,我们可以期待技术进一步实现更准确、更全面的语义理解能力,这将有助于提高机器对文本的深层理解,包括上下文推理、情感分析和逻辑推理等方面。随着全球化的不断推进,跨语言的交流和信息处理变得越来越重要。未来的NLP系统将更好地处理不同语言之间的语义差异、语法结构和文化背景的差异,提供更准确和自然的跨语言交流支持;同时,致力于提高对长文本的处理能力,加强对话系统的建模能力,这有助于实现更智能、更灵活的对话体验,使机器能够更好地理解和参与到复杂的人机对话中。就其在相关技术领域的应用来看,NLP技术结合计算机视觉可以实现图像描述生成;结合知识图谱和语义网络可以实现更深层次的知识推理;结合增强学习可以实现更智能的对话代理。NLP技术的更广泛应用将为人工智能的发展带来新的机遇。
自然语言的句子无限,但句型有限,自然语言有很多歧义(其句子结构和含义可以有多种解释),而通过一系列的算法和模型来解析语法结构、进行词义分析,经上下文推断、语境识别和语义角色标注等措施,技术可以消除自然语言的歧义。其中一种方法是根据预先定义的语法和规则来处理语言;另一种方法是使用统计模型,即通过分析大规模语料库来学习语言规则和模式。当前使用的深度学习技术,如循环神经网络(recurrent neural networks, RNN)和转换器模型(transformer),就是通过大规模训练来学习语言的表示和生成,并结合语法、语义和上下文信息,以生成准确和合理的语言表达。自然语言复杂多变,解决语言的歧义性、处理低资源语言,要继续收集与标注大规模数据集、不断改进和优化算法,持续推动跨学科的合作与研究。
AI的发展水平与社会的进步和人类的福祉密切相关,AI的飞速发展将在科技和文化领域引发巨大的变革,给我们的工作和生活带来显著的影响。认知技术可以帮助我们更准确和高效地处理大量的信息,提高我们的决策能力和工作效率,更好地应对日常生活和工作中的挑战;基于认知技术的智能家居、智能物流和智能医疗等可以帮助企业开发更智能的产品和更人性化的服务,为我们带来更加便捷和优质的生活和工作体验;更重要的是,认知技术的发展有利于助推创新加速,这既可能引发许多学科的突破性进展,又能够提高生产力,进而推动整个社会和经济的发展。
认知技术将改变人们的工作和生活方式
认知技术是指与人类认知能力相关的技术,通过模仿、增强或扩展人类的认知过程来改变我们的工作和生活方式。人们越来越关注能够以自然方式学习、推理和与人类互动的智能系统的发展。这得益于AI领域的突破,以及越来越多的大数据和计算能力的可用性,例如,预测和预防自然灾害、防控群体性疾病等。随着认知技术的发展,人们对边缘计算能力的需求越来越大,边缘计算能力可以支持分布式环境中数据的实时处理和分析,机器学习模型和其他智能系统也越来越需要其带来的算法可解释性和透明度。认知技术与物联网的融合,为一系列行业的智能自动化和数据驱动决策创造了新的机遇。认知技术与物理系统的集成将带来机器人、自动驾驶汽车和智能城市等领域新应用的发展。这些技术正在改变我们与机器的交互方式和彼此之间的交流模式,并有可能徹底改变我们的生活和工作方式。认知领域的关键优势之一是它能够进化与适应不断变化的环境和新发现,为创新增长创造机遇。认知技术在未来几年可能产生如下新的突破和应用。
企业发展。认知技术可通过更好地理解企业员工的思维过程来帮助制造业设计更加高效的生产流程,其理论可应用于培训和教育,帮助企业更好地培训和指导员工。通过理解学习者的认知过程和思维习惯,认知技术可以设计更有效的培训课程和教育方案,提高员工的学习效果和工作表现;通过理解用户的认知过程和习惯,认知技术可以设计更便于使用的产品、更符合用户认知习惯的产品界面和操作方式,提高产品的易用性、用户体验和产品质量;通过理解人类的认知过程和决策原理,认知技术可以设计更智能、高效、安全和灵活的自动化生产系统,降低生产成本,更好地满足市场需求;通过自动化的生产线、智能助手和机器学习算法,认知技术能够洞察大数据中的隐藏模式,从而帮助企业提高生产效率、减少错误率和进行更明智的决策。
智慧城市建设。认知技术可通过理解人类的认知过程和行为习惯,帮助设计更符合人类需求、更人性化的城市环境,更智能化的城市管理和公共服务系统,包括交通设施、公共空间和建筑物等,提高城市的宜居性和用户体验,优化社区城市管理,完善医疗保健和教育等公共服务,提高居民的生活质量和幸福感。通过理解司机和乘客的认知过程和行为习惯,认知技术能够设计更智能化的交通管理系统,提高交通效率和安全性,帮助优化城市交通流量,减少交通拥堵和事故;通过理解罪犯的认知过程和行为习惯,认知技术可以设计更具针对性的监控和预防犯罪系统,提高城市的安全性和治安水平。
智能金融研发。智能金融是结合AI技术和金融业务,实现智能化的金融服务。数据挖掘、机器学习和NLP等AI技术能够对金融大数据进行分析和预测,帮助金融机构更准确、更智能地进行投资决策;区块链技术可提高金融交易的透明度和安全性,并通过智能合约等技术实现金融服务的自动化和智能化;云计算和大数据技术可帮助金融机构存储和处理金融大数据,提高数据的利用效率和系统的分析能力,降低金融机构的运营成本及风险。智能金融的研发为金融业带来了更多的创新和发展机遇,智能金融与金融科技相结合,可以实现支付、借贷、保险等领域金融服务的创新和升级,更全面地保障金融安全和客户权益。
大数据医疗发展。随着医疗信息化的迅速推进,医疗数据的数量和种类迅速增加。大数据医疗对于推动医疗领域的发展和改善人民健康有着重要的作用。机器(深度)学习、数据挖掘等算法能够通过分析和处理医疗大数据,发现潜在的规律和变化趋势,预测疾病可能引发的风险,推断患者在各病程阶段的反应,协助医生提升诊断疾病、制定治疗决策的准确性,提高治疗效果、减少医疗资源浪费;智能诊断、智能监测和远程医疗等技术可以实现医疗服务的智能化,电子病历、医学影像和基因序列等大数据可以被应用于疾病的诊断、预测、治疗和预防;通过收集和分析大量的患者数据,认知技术能够优化医疗资源的配置,针对不同的患者制定不同的治疗方案,从而提高医疗服务的效率和质量;个性化的健康管理和监护系统将帮助人们更好地管理健康和预防疾病,有效监测和管理患者的健康状况,提供个性化的健康建议;通过挖掘临床大数据,认知技术可以优化试验设计和样本选择,加快新药研发和上市进程;通过医疗保险大数据的采集与分析,认知技术能够实现医疗保险赔付模式的升级,提高医疗保险服务的效率和质量;通过在本地计算设备上进行数据训练和模型更新,认知技术可以全面保护数据的隐私性,促进数据使用方的平台合作与协同发展。
导航与无人驾驶技术进步。导航是通过各种设备和技术来帮助人们确定当前位置并找到目标位置的过程,它不仅需要提供准确的位置和路线信息,还需要与用户进行良好的人机交互,使得导航更智能化、人性化和便利化。传感器数据、地图数据和历史数据等多源数据的融合技术,能够提高导航的准确性、实时性和可靠性;多模式导航将多种交通方式集成在一起,如公共交通、出租车和共享单车等,为用户提供更便捷、更全面、更省时的出行服务,实现多种交通方式的信息互通,实现车辆之间的信息交流、信息共享和路况实时监测的智能路网,为导航提供更准确和实时的路况信息和路线规划,提高导航的效率和安全性。
无人驾驶技术是认知科学和AI技术在交通运输领域的应用,其通过传感器和控制系统来实现汽车的自主驾驶,大大提高交通的安全性和疏解效率,有利于车辆更好地感知和适应交通环境,改善交通流量管理,减少交通事故和交通堵塞。无人驾驶汽车的智能化和自适应能够根据道路、交通和天气等条件进行自主决策,提高汽车的驾驶安全性和稳定性。人机交互技术让乘客与汽车之间更智能和自然地交互,实现更省时、便捷的出行体验。无人驾驶汽车与智能路网相结合,能够实现交通的自主调度和优化,从而改变人们的出行和生活方式,提高交通运输的效率和安全性。
结语
认知技术的竞争实际是人才的竞争,我国政府一直高度重视人才的引进和培养。清华大学自2005年成立了教育部认知科学创新基地,北京大学和贵州民族大学等高校均建立了认知科学一级学科,可培养本、硕、博不同层次的认知科学理论与技术人才。腾讯、百度、阿里等科技公司近年来竞相投入了大量的人力和物力进行组织攻关,通过一系列战略重点部署和实践来推进认知技术的研发,寻求认知技术的新突破。从政府层面来看,通过一系列的国家重点研发计划、国家自然科学基金和国家社会科学基金等方式,国家不断加大对脑机接口、认知科学、AI(特别是NLP)、类脑计算和社会计算等重基础、宽应用研究的支持力度,积极模拟人类智能,进行类脑计算,构建人造大脑,挖掘大规模数据中的人类知识,促进了来自不同领域和不同背景的研究人员形成有凝聚力的研究团队,为得到更具影响力的研究成果打下了坚实的基础。
认知技术具有潜在的经济、社会、教育和战略效益。随着认知技术变得越来越复杂,广泛来源的数据激增,为认知技术的更深一步研发提供了新的机遇。AI是认知技术的关键推动者,深度学习、强化学习和NLP等领域的研究扩展了AI研究的边界,为认知技术的新突破提供了支撑。认知技术将改善人机交互方式,使得计算机更好地理解和响应人类的需求、提供更智能、高效和个性化的解决方案,这将引发诸多行业领域的变革。
值得注意的是,在发展认知技术的同时,也应注重制定相应的技术监管框架和标准,以应对包括与隐私、偏见、公平、安全、道德和伦理相关的问题。例如,恶意行为者出于经济利益或其他目的,滥用认知计算模型来产生大量垃圾邮件,或用来生成大量虚假和不良信息,将造成一系列不良影响。政府和科研机构组织应为这些技术的开发与部署制定相应的道德框架和指导方针,促进相关问题的国际合作,以确保负责任地使用技术并造福社会。
(本文系国家自然科学基金重点项目“语言理解的认知机理与计算机模型研究”和国家社会科学基金重大项目“语言、思维、文化层级的高阶认知研究”的阶段性成果,项目编号分别为:62036001、15ZDB017)
参考文献
蔡曙山、江铭虎,2016,《人类的心智与认知》,北京:人民出版社。
蔡曙山,2021,《认知科学导论》,北京:人民出版社。
江铭虎、王琳,2013,《脑与语言认知》,北京:清华大学出版社。
江铭虎,2016,《语言信息处理》,北京:人民出版社。
江铭虎,2019,《语言的ERP脑电认知》,北京:清华大学出版社。
江铭虎,2022,《语言、脑进化与认知》,北京:清华大学出版社。
王士元,2008,《语言涌现:发展与演化》,中国台北:中央研究院语言研究所。
王士元,2011,《语言、演化与大脑》,北京:商务印书馆。
R. C. Berwick and N. Chomsky, 2016, Why Only Us Language and Evolution, MA: The MIT Press.
N. Chomsky, 2008, Language and Mind, Third Edition, Cambridge: Cambridge University Press.
N. Chomsky, 2014, The Minimalist Program, Cambridge: The MIT Press.
C. R. Darwin, 1871, The Descent of Man, and Selection in Relation to Sex, London: Jone Murray, Albemarle Street.
T. Deacon, 1997, The Symbolic Species: The Co-evolution of Language and the Brain, New York: W. W. Norton & Company, Inc.
J. C. Eccles, 1970, Facing Reality, London: Longman Publishers.
J. C. Eccles, 1973, The Understanding of the Brain, New York: McGraw-Hill.
J. C. Eccles and K. R. Poppe, 1984, The Self and Its Brain, Berlin, Heidelberg: Springer.
A. D. Friederici and N. Chomsky, 2017, Language in Our Brain, MA: The MIT Press.
M. A. Nowak et al., 2002, "Computational and Evolutionary Aspects of Language," Nature, 417(6889).
E. Newport and R. Aslin, 2004, "Learning at a Distance I. Statistical learning of Non-adjacent Dependencies," Cognitive Psychology, 48(2).
E. Newport et al., 2004, "Learning at a Distance II. Statistical Learning of Non-adjacent Dependencies in a Non-human Primate," Cognitive Psychology, 49(2).
D. Shilton et al., 2020, "Human Social Evolution: Self-Domestication or Self-Control?" Frontiers in Psychology, (11).
N. Smith, 2004, Chomsky: Ideas and Ideals, 2nd Edition, Cambridge: Cambridge University Press.
責 编∕李思琪