APP下载

人工智能视域下的数字化特定人物知识构成分析

2024-12-31杨平生

图书馆研究与工作 2024年8期
关键词:真人图书馆知识论认识论

摘 要:针对人工智能模拟和还原特定人物的场景,文章从认识论和知识论的角度分析特定人物的个人知识构成。文章首先对人工智能视域下的知识进行界定,然后以南朝梁的人物萧绎作为研究标本,研究发现,其所具有知识的底层是人类共有的具身性知识,中层是历史性模因知识、历史性朴素理论知识,表层是个人习得知识与个人经验知识,另外还有历史性社会事理知识和个性事理知识作为连接事件与经验的推理知识。知识构成分析能够起到知识校正与锚定的作用,同时通过知识构建和逻辑推断才可能突破现有知识与有记录知识的局限。

关键词:人工智能;认识论;知识论;知识构成;真人图书馆

中图分类号:G250.7 文献标识码:A

Analysis of the Knowledge Composition of Digitized Specific Individuals from the Perspective of Artificial Intelligence

Abstract This article analyzes the personal knowledge composition of specific individuals simulated and reconstructed by artificial intelligence, from the perspectives of epistemology and theory of knowledge. It first defines knowledge within the context of artificial intelligence and then uses Xiao Yi, a figure from the Liang dynasty of the Southern Dynasties, as a research sample. The study finds that the foundational layer of his knowledge comprises embodied knowledge shared by all humans. The middle layer consists of historical meme knowledge and historical naive theoretical knowledge, while the surface layer includes personal acquired knowledge and personal experiential knowledge. Additionally, there are historical social reasoning knowledge and individual reasoning knowledge, which serve as inferential knowledge linking events and experiences. Analyzing the knowledge composition can aid in knowledge correction and anchoring, and it is possible to overcome the limitations of existing and documented knowledge through knowledge construction and logical inference.

Key words artificial intelligence; epistemology; theory of knowledge; knowledge composition; human library

1 引言

真人图书馆是图书馆界的一项创举,即是读者将一个现实中的真人当做一本书来阅读,通过与真人的对话交流来获取他人的知识与经验。真人图书馆源自欧洲,2009年由上海交通大学图书馆在国内首次开展,随后许多图书馆都举办了类似活动。真人图书馆使读者能够与阅读对象实时双向互动,弥补读者在传统阅读中难以获取个人经验知识的不足,因此广受读者喜爱,但是真人图书馆也存在真人图书数量少、参与读者数量受限、活动频率不高、服务效果不理想、难以持续开展的问题[1]。这些不足都与真人管理难以规范化有关,而发展机器智能来模拟真人,采用多轮问答系统或者闲聊机器人的形式,利用人工智能技术赋能真人图书馆,是解决这一困境的方法之一。针对数字化模拟和还原特定人物的场景,本文从认识论和知识论的角度来分析探讨特定人物的个人知识构成。

2 人工智能视域下知识的界定

以往我们分析一个人物的知识构成,主要指他的习得知识、专业技能、个人著述与个人经历知识,此时我们已经预设他是一个完备的人,具有人类所应有的心智能力。但是如果需要通过机器智能去模拟真人,从类似裸机的角度考虑,这些知识就远远不是人物所拥有的全部知识,而需要重新从根本上思考知识的意义。

古希腊柏拉图定义知识是得到证成的真信念(Justified true belief),这个理论受到美国哲学家盖蒂尔的质疑,由此衍生出了现代“知识论”。人们在实践活动中获得客观世界的信息,这些信息组合在一起形成一种信息结构,现在一般将这种信息结构称作知识,知识来源于人类对客观世界的认识与经验,它的基本单元是概念[2]。概念是人类特有的知识单元,是大脑在认知进化中的一个最优选。人类大脑的功率大概在16.58W,是一个低能耗的处理器,为了尽量减少能量开销,就必须减少信息处理量,将感官输入的无数细节信息采用抽取概念的方式进行简化。以一个普通监控摄像机来比较电脑与人脑,普通摄像机能够在可见光范围内、在人类视觉尺度上穷尽所设定分辨率的全部图像细节,还能够对某一时段的海量细节进行穷尽式的记忆,等需要回忆的时候可以逐帧回放;人脑如果要观察或记忆某一时段的图像,必须先从视觉经验中提取概念结构[3],识别人物性别、衣服颜色、行为特征等,焦点也仅限于关注到的范围,这样相当于对图像信息进行了压缩,日后需要回忆的时候才能用概念作出目击证词。多个概念结合在一起,外化成一个模拟外部事件的信息结构,或者称为模型。这个模型可以是数学模型、自然语言模型甚至是用火烤出裂纹的牛肩胛骨。模型是思考的工具,人类用它来描述和预测一次狩猎、一次战争或者行星运动轨迹。模型化或者形式化是知识的表示方法,自然语言中知识总是以命题的方式陈述出来。知识并非总是完全正确的,历史上认为万世不易的知识也经常会被颠覆,罗素甚至认为“全部人类知识都是不确定、不精确和不全面的”[4]606。波普尔也认为“科学知识是真正的猜测,它不可以证实为真,只可以检验”[5]。因为知识只是我们对外部世界的一个简化认知,是进化历程中的一个方便法门,但是这种认知结构中的模糊性、适应性、用有限来包涵无限的功能,已经远远超越了机器智能。

大脑是进化的产物,知识也是进化的产物,因此个体间存在大量相同的知识,而只有少量通过学习、训练、经历获得的知识有所不同,那些大量相同的知识一般都默认作为我们的背景知识而存在,却一直被忽视,这是我们首先要探究的知识。除此之外,还有两类知识,即陈述性知识和解释性知识,也就是罗素所说的知识一般分为两类:第一类是关于事实的知识;第二类是关于事实之间的一般关联的知识[4]502。从形式上来说,人工智能构建的特定人物知识必须能符号化,符号包括口语、文字、图画、音符、代码等面向抽象概念的编码解码工具,还有用词向量表达的自然语言知识、用矩阵表达的图画像素知识等二次编码的信息。这些知识也就是波兰尼所说的显性知识,不可用符号表示或者尚未用符号表示的内容为意识存在,不包含在人与机器交流的知识范围内,除非它可以被转换为符号表征方式。

3 数字化特定人物的知识构成

分析数字化特定人物的知识构成,无论是现代人物还是古代人物,都必须依靠历史记录。但是在历史长河中,特定人物能够被文献记录是偶然的,被遗忘遗失却是必然的;而且即使有记录,和他们实际所具有的知识相比较,已表述知识只占少数,未表述知识却占了绝大多数。因此需要用符合时代特征的共性知识进行知识补全。

为了使人物和他具有的知识与当今的现实世界产生疏离感,方便我们从一定距离上进行观察,我们选择一个距今约1 500年,生活在南朝梁的人物萧绎作为研究标本。萧绎字世诚,小字七符,为梁武帝萧衍的第七子。他是一个当时典型的知识制造与记录者,有留存于世的个人著述和阅读记录,主要包含在《金楼子》一书中;同时他又具有非典型的人生经历,他死后被称作梁世祖孝元皇帝,在《梁书》《南史》《资治通鉴》等古籍中都留下了历史记录。

3.1 具身性知识

具身性(embodiment)的概念源于胡塞尔、海德格尔、梅洛·庞蒂等人的现象学,他们质疑笛卡尔式的身心二元论,认为人类的认知并不是孤立于身体之外的精神实体的产物,身体是我们认识世界的总媒介,人类的一切认知都是由身体与环境的交互所塑造出来的[6]。以机器智能模拟的特定人物,人物本身为第一人称,具身是指人物之身,不是机器之身,因此我们将与人物身体直接或间接相关的具身认知所生成的命题称作具身性知识。具身性知识的本质是先验知识,即不依赖经验而发生并使经验成为可能的先天认知,其先于经验存在并作为经验知识的认知条件[7]。具身性知识在人物的知识构成总量中占有绝对主导性的比例,它是人类的共有知识,个体间差异极小。通俗的比喻就是:人类生来不是一张白纸,而是自带操作系统的。

我们可以将具身性知识分为两类:其一,是内省的、以身体为感知器的具身性知识。我们最初对世界的知识源于感知,通过眼耳鼻舌身意(视觉、听觉、嗅觉、味觉、触觉、直觉)来观察或测量客观世界。以视觉中的注意力机制为例,我们的视觉系统会本能地过滤掉无关宏旨的事物,而将注意力集中在有关自身利益的事物当中。比如我们随意看到一个场景,往往不会留意里面静态的树木,而会关注动态的人物活动或者其他的物体活动,大脑会根据进化的积累自动判断哪些是重要的、哪些是不重要的;当我们进入一个陌生的环境,会观察到很多在熟悉环境中观察不到的细节,因为在熟悉的环境中,人类面对的危险度降低,人体系统自动降低警戒级别,视觉系统也自动屏蔽一些观察细节,以节省能量,而一旦进入陌生环境,人类面对的危险度提高,人体系统将自动提高警戒级别,视觉警惕性也会提高,对细节的分辨率也会提高;相比于混沌状态,视觉注意力对秩序有天然的趋向,我们天然会关注有秩序感的形状和物体,比如六边形的蜂巢、整齐摆放的石块、几何图案、树叶的脉络等,这是人类审美的来源,其本质是对效率的追求。以味觉判断为例,我们的舌头上分布着一万多个味蕾,这些味蕾的功能就像一个化学实验室一样可以鉴别食物分子,然后通过大脑中枢对食物进行分类,最后标记出各种“味道”来告诉我们关于这个食物的知识。这种感性先验知识是进化道路上固化在基因中的直接的具身性体现。

其二,是观照的、以身体为参照物的具身性知识。古希腊哲学家普罗泰戈拉曾经说:“人是万物的尺度。”我们能够进行理性思考,都是源于搭建了一个以人体尺度为基本参照物的关于这个世界的认知框架。比如我们一般会惧怕比自身大的物体或生物,不惧怕比自身小的物体或生物,这是因为我们以人类自身的尺度作为心理情绪警示的标尺;再如,“ENTER”(进入)这个概念可被分析为这样一个身体经验图式:物体自主移动身体,从一个源点出发,沿着一定的路径,进入一个“容器”,并由此使自己成为一个参照身体的“容纳物”[8]。我们日常认识事物的类比思维,物体的大小、高低、冷热、长短、快慢等,这些概念、知识都是在具身尺度的框架内形成的。

3.2 历史性模因知识

模因(meme)又称文化基因、谜米、觅母。英国科学家理查德·道金斯在《自私的基因》中提出,文化的传播类似生物遗传,它能导致某种形式的进化,他将这种文化传播或者模仿的基本单位称作“meme”。道金斯认为模因如同一个有生命力的结构,通过模仿的过程在人们的大脑间转移传递,从而在模因库中进行繁殖,它是一种新的复制因子,也具有遗传、变异和选择的特征[9]。

模因构成的知识,涉及语言、信仰、审美、艺术、技术、风俗、建筑、服装、饮食、器物等人类文化的每一个领域,也可以说人类的文化和观念都是由模因塑造而成。对特定人物来说,模因知识就是在生活与教育环境中潜移默化被植入脑中的文化背景观念,而人物生活的历史时代的文化背景观念就是历史性模因知识。

以萧绎生活时代的建筑知识为例,他出生并长期生活在建康城中,南朝时期的建康城沿用了西晋洛阳的建筑布局,城市在萧绎的父亲萧衍手中达到了鼎盛时期,宫室建在都城中心偏北处,构成以宫室为中心的南北轴线布局[10]。这种围绕轴线、按礼制展开的布局,在南北朝的乱世中,城市一次次地毁灭又复兴,儒家的礼法、等级制度的模因无数次地遗传、变异,却始终影响着城市的布局所体现的等级秩序。在萧绎的前朝,齐东昏侯萧宝卷曾经大兴土木,《南史·齐本纪》载其大起诸殿,皆匝饰以金璧,每一座建筑的落成,都是一次设计师头脑中的模因复制过程,屋顶、屋身、台基的形制、构件与之前的历史样式既有遗传又有变异,但是千百年来,依然保存着中国传统木构建筑的典型结构和审美特征。梁武帝崇信佛教,大力营造佛教寺院,史载当时建康城共有佛寺五百余座,皆富丽堂皇、宏伟壮观[11]1721,今天通过敦煌壁画依然能够想见当时壮丽的佛寺、佛塔,精美的佛教雕塑和壁画,能够感受到这是在继承秦汉传统建筑模因的基础上,又糅合了印度、犍陀罗和西域的佛教艺术元素,多种模因混合而形成的新的模因。如果我们让数字化的萧绎描述一个公元五百年的建筑,在他头脑中呈现出来的一定是如魏晋南北朝时期敦煌壁画建筑一样的图像,而绝非伊斯兰或者哥特风格的建筑,因为即使在他的著述中从未提及任何具体建筑形式,但是关于当时建筑的历史性模因知识已经自行演化并根植于他的脑中了。传统建筑模因遗传稳定性很高,保存至今也具有很强的辨识度,而事实上大部分模因都遗失在了历史长河中,以歌谣、俗语为例,这种出口入耳的模因由于地域、时事、方言等流传变异原因,保真度很低,比如《金楼子·志怪篇》所载:“宁得一把五加,不用金玉满车;宁得一斤地榆,不用明月宝珠。”[12]今天已经很难辨别它保留下来的是什么样的文化基因残片。

3.3 历史性朴素理论知识

发展心理学认为儿童具有关于客观世界的朴素理论,这种理论虽然只是关于事物和现象的日常理解,但是能够将客观世界的实体有一定内在逻辑地组织在一起,能够对客观现象作出朴素、直观的解释和预测,这个解释和预测可能具有违背现代科学的错误,却往往符合眼见为实的日常经验,比如向上抛一枚硬币,会被解释为上升时抛力大于重力,下降时重力大于抛力[13]。朴素理论主要包括朴素物理学、朴素生物学和朴素心理学,这三个领域构成了儿童的核心知识系统[14]。研究表明,朴素理论的信念不只存在于儿童的认知中,在受过良好教育的成年人中也普遍存在[15],伽利略所做的两个铁球同时落地的实验就证明了人们普遍存在的直觉认知错误。在此我们假定特定人物具有某一历史时代背景的朴素理论知识,不同历史时代的人物具有不同的历史性朴素理论知识。

朴素物理学是最重要的朴素理论知识,它研究人们对物理实体、过程和现象的直觉认识。朴素物理学最早由帕特里克·海斯提出,他发展了一套朴素的流体物理学公理[16]。以《金楼子》中包含的朴素物理学知识为例,试举几例:①常识性朴素物理学知识:“水至寒而有温泉之热,火至热而有萧丘之寒。重者应沉而有浮石之山,轻者当浮而有沉羽之水。”[12]已知水寒火热,石重羽轻,可以推导出水的温度比火低,火的温度比水高;石的重量比羽重,羽的重量比石轻的朴素物理知识。②天圆地方的宇宙结构知识:“天道圜而地道方。”[12]③开始、结束与时间、空间无限的物理概念:“谓始必终,而天地无穷焉。”[12]④潮汐有规律涨落现象的物理解释:“鲸入穴则水溢为潮来,鲸出穴则水入为潮退,鲸鲵既出入有节,故潮水有期。”[12]

朴素生物学是人们对生物和生理现象、过程的直观认识。以《金楼子》中包含的朴素生物学知识为例,试举几类:①真名与实体能够交感,即认为名字和它们所代表的生物或物体之间不仅是思想概念上的联系,而且是真实存在的物质联系[17]:“山中有寅日称虞吏者,虎也;称当路者,狼也;辰日称雨师者,龙也。知其物,不能为害矣(同《抱朴子·登涉》:‘但知其物名,则不能为害也。’)。”[12]②毫毛繁殖,生物的成长皆是起始于非常微小的胚芽:“晋宁县境内出大鼠,状如牛,土人谓之鼹鼠。天时将灾,则从山出游畎亩,散落其毛悉成小鼠,尽耗五稼。”[12]

3.4 个人习得知识

萧绎的个人习得知识可从他的读书与著书中探知。萧绎自幼酷爱读书,《梁书·本纪》记载他六岁的时候,高祖萧衍问他能读什么书,他答:“能诵《曲礼》”[18];《南史·梁本纪》称其性爱读书,因患有眼疾不能自己持卷看书,于是设置专人为其读书,轮流值班,昼夜不息[11]234-245。萧绎读过哪些书,直接记录有具体书名并且传世的不多,除上述《曲礼》外,大概有从母亲阮修容处接受的教育,《金楼子》记载萧绎幼年即亲承慈训,学习过《孝经》《论语》《毛诗》等儒家典籍;还有成为帝王后他曾经登殿讲学,《梁书·本纪》记载承圣三年(554年)九月辛卯日,萧绎登龙光殿亲自为群臣讲述《老子》之精要[18]。萧绎还读过哪些书,数量最多的间接证据就是他的藏书。萧绎是南朝著名的藏书家,在《金楼子·聚书篇》中萧绎自言当时自己已经四十六岁,聚书已有四十年,藏书共计八万卷,史传汉河间王刘德的私人藏书量与整个国家藏书量相等,萧绎颇为自得地认为自己已经超越了河间王刘德。萧绎藏书有记载的包括:《续汉春秋》《晋书》《晋阳秋》《肘后方》《离骚》《尔雅》等;另外,按照古人“述而不作”的编述方式,《金楼子》中有大量内容杂采自其他古书,包括《吕氏春秋》《淮南子》《文选》《说苑》《汉书》等[19],这些书也应该包括在萧绎的知识范围内;还有《金楼子》篇章中提及的古书,大多也应该包括在萧绎的知识范围内,包括《新语》《祭法》《月令》《国语》等。

萧绎崇尚立言于世,“由年在志学,躬自搜纂,以为一家之言”[12]。萧绎一生著述颇丰,《梁书·本纪》和《南史·梁本纪》记载了四百余卷,《金楼子·著书篇》记载了37种677卷,尚存于世的只有《金楼子》《古今同姓名录》以及少数诗篇,是记录萧绎个人习得知识的主要典籍。

3.5 个人经验知识

个人经验知识是特定人物所亲身经历的事件知识,包括他经历的社会实践活动和个人心理体验知识。

萧绎生于帝王之家,为梁武帝萧衍第七子。六岁即受封为湘东郡王,后任会稽太守、丹阳尹、平西将军、都督九州诸军事、镇西将军、荆州刺史。侯景之乱时,镇守江陵的萧绎兵力强盛,本无缘帝位的他看到了机会,拥兵自重,在乱世中逐渐崛起,密诏假黄钺、大都督中外诸军事,麾下名将有王僧辩和陈霸先,后改元称帝,但是在位仅两年多就在西魏与萧詧进攻江陵的战役中战败被杀。

萧绎一生的经历及个人心理历程都极为复杂。《南史·梁本纪》评价他天资聪明,相貌俊朗,英姿勃发,每有言论则声若鸣钟,却又生性好矫饰,猜忌心盛,从不将名誉给予他人,若有人略胜于他,必加以迫害[11]234-245;《梁书·本纪》评价他禀性猜忌,对人没有亲疏之别,没有办法管理下属,即使陷入危险也不知惧怕,因此功绩和美德都有很大缺陷[18]。他的性格、行事又与他自幼的心理、生理体验息息相关。萧绎自幼便遭受疾病的痛苦,从出生即患眼疾,少年时又患疮疾,十三岁开始患有心气疾,人到中年时五个儿子逐一死去[12]。庶出、不被家庭重视、天生残疾,萧绎由生理的病态造成了心理的自卑与嫉妒、猜忌,《金楼子·序》开篇便是:“先生曰:余于天下为不贱焉。”[12]这种心理自卑促使他发奋好学,同时内心也傲慢自大。他与王妃徐昭佩矛盾重重,终生唯一的感情依靠便是母亲阮修容,母亲的去世令他“贯切痛绝”,以至于他决定死后也要葬在母亲的墓旁,在《金楼子·终制篇》中坦然记载了自己的归骨之地:“山地东北隅,始生山陵小墓之前,可以为冢。已具别图,庶魂兮有奉,归骨有地,然圹中石屏风、木人、车马、涂车、刍灵之物,一切勿为。”[12,20]

3.6 历史性社会事理知识

人类社会的活动就是一系列事件在时间与空间维度上持续进行的过程,这个过程的规律和模式就是我们做出推理判断的事理知识。传统知识可以回答When、Where、Who、What等问题,事理知识可以回答Why、How等更深层次的问题,也可以对没有预设或尚未发生的问题作出解释或预测性推断。事理知识表示的是一系列事件发生的推理机制,我们当前探讨的人工智能不接触物理实体,因此这里的推理机制也只是从事件例证文本中提取的文本推理知识,其推理逻辑关系主要包括:因果事理、顺承事理、条件事理、并发事理、上下位事理、反转事理、组成事理等[21]。如果某个历史时期具有社会上普遍认可的事理知识,我们就将之称作历史性社会事理知识。

以一个萧绎曾经做过记载的事件为例说明,《金楼子·箴戒篇》载有6条关于汉昌邑王贺被废的记录,既入箴戒篇,说明萧绎认同昌邑王刘贺被废的理由和推断。《汉书·霍光金日磾传》详述了在朝堂之上以霍光为首的一众大臣是如何论证刘贺应当被废的理由:“高皇帝建功业为汉太祖,孝文皇帝慈仁节俭为太宗,今陛下嗣孝昭皇帝后,行淫辟不轨。《诗》云:‘籍曰未知,亦既抱子。’五辟之属,莫大不孝。周襄王不能事母,《春秋》曰‘天王出居于郑’,繇不孝出之,绝之于天下也。宗庙重于君,陛下未见命高庙,不可以承天序,奉祖宗庙,子万姓。当废。”[22]第一句陈述了认定的历史事实;第二句引用《诗经·抑》封住了以年轻作为脱罪的借口;第三句“五辟之属,莫大不孝”又是引用《孝经·五刑》指出事件相关法条;第四句直接引用《春秋公羊传·僖公二十四年》,背景是汉代可凭《春秋》决狱,根据公羊学“原心定罪”原则,引用经典的内容作为处理重大政治事件的依据,以“褒、贬、诛、绝”的春秋条例推理出刘贺“绝之于天下”[23];最后给出一个与第一句历史事实相衔接的技术性理由及最后的处理结果。我们可以看到,从昌邑王刘贺求长鸣鸡卵、衣车载女子、道不素食、发玺不封等事件到“光即与群臣俱见太后,具陈昌邑王不可以承宗庙状”,直到“皇太后诏曰:‘可。’”这一系列事件链条都是对已发生的事实知识的顺承描述,而霍光奏疏上引用《诗经》《孝经》《春秋公羊传》才是推理机制的关键,致使前面的事件成为最后昌邑王被废事件的原因,整个事件链条的逻辑关系从顺承事理转变成了因果事理,因此引用儒家经典成为了一个当时社会公认的事理知识。

不止政治事件的推导需要事理知识,有时物理事件的推导也同样需要事理知识。《金楼子·志怪篇》载:“凡藏诸宝忘不知处者,以铜盘盛井花水,赴所拟地照之,见人影者物在下也。”[12]其意在于:通过井中水能看到地下的物体,那么将井中水盛入铜盆,造成一个人为的同构物,则能看穿地下宝藏的特征也会迁移到铜盆水中。这种同构特征迁移的事理知识也是当时人们的普遍认知。

3.7 个性事理知识

个性事理知识与历史性社会事理知识类似,只不过反映的是个人对事件演化过程的逻辑关系认知。萧绎擅长占筮,《南史·梁本纪》记载萧绎对于各种技艺方术无所不通,军中曾经很久没有收到南部的消息,他就卜了一卦,卦象是由“剥”转为“艮”,他由此判定:“南部的消息已经送到了,应当派人去看一下。”结果正如他的判断,宾客们都惊讶于萧绎占筮的玄妙,他对此解释道:“艮卦为门,当日的时辰正好在寅时,与日辰相合,故此占得了结果。”他是根据卦象和事件发生的时辰推测的[24]。萧绎自幼学道,花十年之功写作周易研究著作《连山》,说明他的思维受易理的影响非常深,很多事件的发生他都会用易理来解释,用占筮的结果去处理,这是他的个性事理知识。

萧绎生逢乱世,经历的是中国历史上最波澜壮阔、最叹为观止而又骇人心目的魏晋南北朝,期间皇族骨肉相残的事件频繁出现,有童谣流传:“遥望建康城,小江逆流萦,前见子杀父,后见弟杀兄。”这种残酷的现实对熟读史书的萧绎一定有深深的触动,他曾言:“人间之世,飘忽几何,如凿石见火、窥隙观电。萤睹朝而灭,露见日而消。”[12]因此他的行事风格带有一定的疯狂和乖张,江陵兵败后命舍人将自己毕生所集的十四万卷藏书尽皆焚毁,拔剑斫柱,叹道:“文武之道,今夜尽矣!”这是个不难想象的场景,应该也契合他以往获得的个性事理知识。

4 符号主义与连接主义

人工智能一直有符号主义和连接主义两条代表性进路,符号主义主张模拟人类的心智,以符号表示知识,通过逻辑运算推理的方式形成智能;连接主义主张模拟人脑的神经网络连接及强度变化,以数据为驱动训练参数权重从而生成智能。符号主义在发展中陷入了框架问题的困境,即如何在一个动态变化的系统中表述事实,同时又保证系统中其他具有蕴含关系的事实属性不被这些行为所影响[25],这是由于人工智能不具备常识与技能的“白板”状态而造成的“牵一发而动全身”的困扰,框架问题成为了“一代代哲学家未曾注意的新的深层认识论问题”[26],研究者们提出了“廉价测试”(cheap test)和“省事策略”(sleeping dog)两种解决方案,但是结果都不理想;以深度学习为代表的连接主义则发展更加顺利,近年来在预训练的大型语言模型(Large Language Model, LLM)BERT、GPT、百度文心上都获得了极大成功。

本文所做的特定人物知识构成分析遵循典型的符号主义进路,那么现阶段这种研究的意义何在?著名计算机科学家、图灵奖得主杨立昆(Yann LeCun)认为语言只承载了人类全部知识的一小部分,单纯依靠语料数据驱动会受到互联网数据偏差、有限的上下文、缺乏常识这样的限制,从而不可能真正理解语言和外部世界,也不可能接近人类智能水平。事实上,这两种认知模型都有各自的优缺点。随着知识图谱为代表的符号人工智能新方法的发展,符号主义与连接主义融合的趋势也越来越清晰,从符号主义的语义符号空间和连接主义的特征向量空间进化到可计算的语义向量空间,“神经-符号机”等理论被提出,在神经网络中嵌入知识、概念与逻辑推理,可以解决知识接收瓶颈困境问题,同时提高算法的推理能力和可解释性[27]。知识图谱可用于LLM的优化,提供结构化知识表示及推理能力,提升模型的记忆力、逻辑性、可解释性及连贯性等;LLM及深度神经网络也可用于知识图谱的知识抽取和知识注入,可以根据已有三元组推导出缺失的三元组,以进行知识补全和完善,也可以通过事前及事后可解释推理模型建立用户信任[28]。

对本文所研究的人物知识构成而言,进行知识分析与重构的意义,第一,可以起到知识校正与锚定的作用,形成一个结构化的领域知识图谱,避免人工智能系统涉及具体知识时经常出错的问题;第二,单纯连接主义的成就永远是在人类已知的束缚中徘徊,而通过知识构建和逻辑推断才可能突破现有知识的极限,突破有记录知识的局限,探究特定人物所未曾言及的事物,从而让我们走出已知、踏向未知。

5 结语

许慎在《说文解字·叙》中讲远古创造符号系统时“近取诸身,远取诸物”,表明在人类文明史的上一个重大认知工具革命中,具身性与对外部客观世界的感知是知识的基本来源,那么在今天人工智能带来的认知工具革命中,它们依然会是知识的基本来源,是文明发展的基础。

本文以分析的方法,论述了构造一个特定的数字化虚拟真人,其所应当具备的知识。特定人物的知识,不同于通用人工智能知识,它具有个性与历史性限制。它的底层是所有人类共有的具身性知识,中层是历史性模因知识、历史性朴素理论知识,表层是个人习得知识与个人经验知识,另外还有历史性社会事理知识和个性事理知识作为连接事件与经验的推理知识。具身性知识相当于底层操作系统,中层和表层知识是关于事实的知识,历史性社会事理知识和个性事理知识是关于事实之间的一般关联的知识。

物理学家费曼有句名言:“凡我不能创造的,我就不能理解。”如果有一天我们能让人工智能模拟的真人走入图书馆,这是否意味着我们对人物、对知识、对自己都有了更深刻的理解?再或者借助因果关系之梯[29],让萧绎做一个反事实推断:“如果我没有在江陵烧毁十四万卷书籍,那会怎样?”是否那时我们对历史也会有更深刻的理解?

参考文献:

[1] 明均仁,陈晓禹,杨艳妮,等.我国真人图书馆建设现状调查与研究[J].图书馆工作与研究,2021(5):16-22.

[2] 李德毅,于剑.人工智能导论[M].北京:中国科学技术出版社,2018:23.

[3] KUMARAN D,SUMMERFIELD J J,HASSABIS D,et al.Tracking the Emergence of Conceptual Knowledge during Human Decision Making[J].Neuron,2009,63(6):889-901.

[4] 罗素.人类的知识:其范围与限度[M].张金言,译.北京:商务印书馆,1983.

[5] 波普尔.猜想与反驳:科学知识的增长[M].傅季重,纪树立,周昌忠,等译.上海:上海译文出版社,1986:162.

[6] 庞蒂.知觉现象学[M].杨大春,张尧均,关群德,译.北京:商务印书馆,2021:281-286.

[7] 康德.纯粹理性批判[M].李秋零,译.北京:中国人民大学出版社,2004:26-43.

[8] 徐英瑾.具身性、认知语言学与人工智能伦理学[J].上海师范大学学报哲学社会科学版,2017,46(6):5-11.

[9] 道金斯.自私的基因[M].卢允中,张岱云,陈复加,译.北京:中信出版社,2018:217-232.

[10] 刘敦桢.中国古代建筑史[M].北京:中国建筑工业出版社,1984:86.

[11] 李延寿.南史[M].北京:中华书局,1975.

[12] 萧绎.金楼子[M].台北:台湾商务印书馆,1986:22-146.

[13] CLEMENT J.Students’preconceptions in introductory physics[J].American Journal of Physics,1982,50(1):66-71.

[14] WELLMAN H M,GELMAN S A.Cognitive development:foundational theories of core domains[J].Annual Review of Psychology,1992,43(1):337-375.

[15] MCCLOSKEY M,KOHL D.Naive physics: the curvilinear impetus principle and its role in interactions with moving objects[J].Journal of Experimental Psychology:Learning、Memory and Cognition,1983,9(1):146-156.

[16] 海斯.人工智能哲学:朴素物理学宣言[M].刘西瑞,王汉琦,译.上海:上海译文出版社,2001:231-278.

[17] 弗雷泽.金枝[M].徐育新,译.北京:大众文艺出版社,1998:364.

[18] 姚思廉.梁书[M].北京:中华书局,1973:113-136.

[19] 陳志平.“一家之言”與《金樓子》[J].诸子学刊,2012(2):367-384.

[20] 王志高.丹阳三城巷(1)南朝陵墓石兽墓主身份及相关问题考订[J].东南文化,2011(6):64-74.

[21] 陈华钧.知识图谱导论[M].北京:电子工业出版社,2021:262-267.

[22] 班固.汉书[M].北京:中华书局,1962:2945-2946.

[23] 宋艳萍.公羊学与汉代政治:由海昏侯墓所出《春秋》类简牍引发[J].东方论坛,2022(1):30-57.

[24] 宋亚莉.论《金楼子》的占筮实例与萧绎的周易情结[J].东方论坛,2015(2):108-113.

[25] CHOW S J.What’s the Problem with Frame Problem?[J].Review of Philosophy and Psychology,2013,4(2):309-331.

[26] 丹尼特.人工智能哲学:认知之轮-人工智能的框架问题[M].刘西瑞,王汉琦,译.上海:上海译文出版社,2001:198-230.

[27] 魏斌.符号主义与联结主义人工智能的融合路径分析[J].自然辩证法研究,2022,38(2):23-29.

[28] 侯中妮,靳小龙,陈剑赟,等.知识图谱可解释推理研究综述[J].软件学报,2022,33(12):4644-4667.

[29] 珀尔,麦肯齐.为什么:关于因果关系的新科学[M].江生,于华,译.北京:中信出版社,2019:3-29.

作者简介:杨平生,西安建筑科技大学图书馆馆员,研究方向为智慧图书馆。

收稿日期:2023-12-28编校:王晓琳 王学思

猜你喜欢

真人图书馆知识论认识论
中国传统知识论问题意识之定位
当代知识论的中国话语
——访陈嘉明教授
马克思意识形态批判阐释的认识论困境及其终结
基于信息技术哲学的当代认识论研究
从《关于费尔巴哈的提纲》看马克思认识论的变革
知识论视野下法学案例教学法的“小技”与“大器”
真人图书馆与高校教师第三年龄人力资源开发
创建“真人图书馆”,每个人都是一本行走的书
何泛泛和她的“真人图书馆”
我国高职院真人图书馆建设的前期工作探索