APP下载

文本向量空间模型的语义边界

2019-09-10施又予

卫星电视与宽带多媒体 2019年23期
关键词:信息熵人文主义算法

【摘要】在人工智能技术越来越发达的当今社会,人工智能技术已被广泛运用到社会的信息传播和处理环节之中。无论是信息的接受者或是传播者,都在各个传播场域中逐渐熟悉,熟知并习惯了人工智能技术的扩张和发展。从技术哲学的角度观照,人工智能在某种意义上标志了当代科学技术的一个顶峰,即科学技术的扩张业已触及哲学意义上的心灵,意识等关于人的本质的问题。本文试用信息论的框架来对人工智能在智能构建的影响方向进行分析和定义,并来论证这样一个观点,即由于人工智能的“意向性”的缺失和脆弱,其无法完全摆脱自身的工具属性,在这样的前提下,仅仅作为工具的高算力,高算量技术不仅无法完全“桎梏”人类,反而给予了传播个体重塑信息传播和接收的权力。

【关键词】人工智能;算法;信息熵;技术主义;人文主义

1. 人工智能定义的确定和理清

人工智能简称AI,是近些年来热度很高的一个词汇。通常意义上在大众传播场域中,人工智能的含义受科幻文学艺术作品和影视艺术作品的影响,加之大众信息流通中附加了一种“娱乐性”的意味,其被大众狭义为一种“具有与人脑相同的智能水平的机器形式”,这种机器形式往往被普通大众具象为“智能机器人”,“自主意识的网络系统”或“赛博”等等表征符号。然而事实上,人工智能作为计算机科学的一个分支,涵盖了许多大的学科,也是一个非常广泛的研究领域,学界一般将其归纳为六个:计算机视觉、自然语言理解与交流、认知与推理、机器人学、博弈与伦理、机器学习。另一种较为简单直观的分类方式则将更倾向于这样的分类方法,即:“强人工智能”和“弱人工智能”。具体而言,强人工智能是指一种能够自主地学习,行动,设定目标和解决问题的智能,也可以说是一种能够从事人类任何智力工作的机器智能;弱人工智能即为非自主的智能,可以视作人类智能的替力或助手。“在一般的理解中,它只能执行人类设定的目的并听命于人类的行动。它能够代替人类处理许多难以完成的计算,学习,搜索,感知和管理等方面的任务”。最为重要的是,其可以随时根据人的意志而终止。

事实上,现今世界还未有真正意义上的“强人工智能”出现,但是“弱人工智能”已经充斥在我们的日常生活之中。在新闻场域中,AI新闻,AI播报员等新技术业已出现,在新闻生产端,人工智能已被运用到这种非传统自然科学的领域之中去进行实践,当然作为弱人工智能的AI新闻和AI播音员等技术产品仅仅是生产的一种革新,其本质可以被理解为一种工业式自动化迭代的一种延伸,与未来可能出现的“强人工智能”式机器还具有巨大的鸿沟。

所以,我们所赋予人工智能这个词汇符号的实际含义更多的意指事实上并非这种对工业自动化的描述,也就是说,强人工智能更符合我们所理解的,所意会的人工智能所代表的真正含义。

虽然用这种二元分类的方法似乎可以从我们所理解和意指的人工智能概念中,剥离掉弱人工智能这种“伪人工智能”,但是首先,简单的二元分类首先并不能真正理清人工智能的构成,因为或许在一个真正符合我们所理解的具备自主的意向性的强人工智能式机器中,我们所认为的“弱人工智能”或将会成为其重要的组成结构部分,那么从整体的观念上讲,强人工智能和弱人工智能的分类本就不具有除了符号系统标识之外的真正的分野能力;其次,这种分类虽然可以使我们用“程度”这一标尺来较为便捷的区分不同的人工智能,但实际上,当弱人工智能与人类社会高度交织之时,人的性质一样会面对重要的挑战。因此虽然可以借助强弱人工智能的概念来对人工智能有一个比较直观的了解,可是真正創造出一个最拟合的关于人工智能的定义依旧是十分困难的。

根据本文所选取的信息论的研究路径,人工智能的概念可被这样理解:人工智能是一种通过针对思维,感知和行动的模型表示所呈现出的约束条件并得以实现的算法,这种算法的实现也同时使其具有了哲学意义上的意向性,继而具备了作为独立智慧的主体性,从而打破了人与机器最本质的界限。

2. 信息论框架下的人工智能意向性可能

图灵测试是艾伦.图灵于1950年发表的一个经典的测试,简而言之是一个机器是否具有智能的测试方法。图灵认为只要一个机器具有“欺骗”测试者,并使测试者认为其为人的能力,那么就可以定义该机器具有智能。而在1980年,哲学家约翰.赛尔则通过“中文屋”这一实验模型对图灵测试进行了批判。

“中文屋”实验是指,如果一个完全不懂中文的人在一间装满中文字条和英文对照表的房间内,与房间外的中国人进行通过传递中文纸条进行顺畅无阻沟通,那么理论上房间外的中国人便会自然的认为房间内的人必定懂得中文,然而这却恰恰与事实并不相符。

“中文屋”实验其实隐喻了这样的事实,即便某一个机器通过了图灵测试也不能就认为该机器具有智能,实际上,机器即便通过图灵测试也只是通过编码和编程的路径给予了测试者错误的认识,因为机器与测试者的一切沟通和交流事实上仅仅是一种在已编码的数据库中寻找对应的答案,所以,即便机器看似给出了足以欺骗测试者的回应,也无法因此而断定机器的智能与否,毕竟“欺骗”这一行为也可以按照预先设定而执行,并没有脱离自身编程结构的范畴。

计算机的编程是个很复杂的过程,但是其核心结构却并非难以理解。实际上,计算机所普遍应用的一种主要的信息检索模式便是向量空间模型(VSM)。该模型把对文本内容的处理简化为向量空间中的向量运算,并且其以空间上的相似度表达语义上的相似度,使其更为直观易懂。简而言之,它是“计算向量间的相似性来度量文本间的相似性进而实现文本聚类”这种构建逻辑事实上便是对“中文屋”实验中所隐喻的计算机计算过程的准确描述。当我们将人工智能定义为一种通过针对思维,感知和行动的模型表示所呈现出的约束条件而得以实现的算法时,向量空间模型则使我们对于这种算法的结构,及其运行的路径有了更清楚的认识。那么,通过计算机强大的计算能力我们能否能够真正的实现符合思维,感知和行动这些约束条件下得以运行的算法程序呢?无论是在哲学领域还是认知科学的领域事实上都存在这样一个难以突破的难点,简略的说,这个难点便是“句法”同“语义”之间的沟壑。现有的人工智能涉及到语义分析和检索层面仍然存在一些基本的欠缺。“其主要表现是:作为它的理论基础的关于语义的研究,从根本上说仍停留在形式主义的层面,如仍只关心如何用形式方法来表示语义,如何用一些映射算法将话段转化为相应的意义表示形式。质言之,主要停留在意义的形式表示与转换上。由此决定,所研制出来的自然语言处理系统也就只能作为意义之形式表示和转换的工具而被动地发挥作用,却不能主动地、直接地接触、关注、理解、把握、处理意义。既然如此,对意义的涉及仍只是设计、操作人员的事情。”从结构主义来理解句法和语义的概念更为直观,其可以被视为能指和所指这样的在传播学中更为熟知的概念。能指即为句法,所指即为语义。理论上,只要有足够大的容量和计算能力,机器可以被构建一个包含地球上所有能指的数据库,在这个数据库中,通过向量空间模型的文本聚类便可以使其获得“能指层面”的全知,正类似人们经常使用的搜索引擎一般。但是所指,甚至第二层所指所指涉的语义却无论通过向量空间模型或是通过贝叶斯网络模型都无法得到准确,高效的答案。

前文已经论述,意向性既是人类所为人类的重要条件,也是机器具备智能的一个核心判定指标。除去对计算机算法本身的逻辑考察外,通过香农的信息论框架分析机器是否可能拥有“意向性”,也可以得到更为清晰和直观的认识。香农的信息论是二十世纪重要的学术成果之一,也往往被看做是当代信息 革命的基石。在传播学中,香农-韦弗的信息传播模型便是除过拉斯韦尔5W模型外,另一个重要的传播模型。在这个模型之中,除了基本的传受双方,信道等五个重要环节之外,香农还加入了噪音的概念,这一模型是基于其信息论所提出的,噪音便指代了信息论中一个重要的结构,即冗余,冗余的出现用常规的传播学研究视角是很好理解的,无论是我们使用结构主义的思维,理解为意指过程中的真实含义偏差。还是用与其对立的联结主义思维,将其视为对某个事物整体的象征性的理解差异都可以很好的寻找这种“冗余”所指代的噪音的意义。然而信息论则将这种冗余从另一个方向进行了解读和推演,其确立了信息的单位,比特(bit)。比特的含义不仅仅是测量一个信息的量,更是一个物理量,因为比特实际上就是用于衡量不确定性。香农的信息论除了对信息的定义之外,信息熵的提出也对我们了解和预测人工智能的未来有很重要的启示作用。信息熵相对于信息来讲具有这样的关系。当观察者对某事件一无所知时,信息熵和信息,数量相等,意义相反。这种情况下,消除信息熵便等于获取信息。且信息熵是可以与热力学熵相互之间进行转化的(即1bit=kln2J/K),这样一来,信息和信息熵概念的出现就打破了物理学注明的难题“麦克斯韦妖”,因为“麦克斯韦妖”其实是利用信息来降低信息熵从而降低热力学熵,然而信息的获取依旧需要能量,1bit的信息便需要消耗kTln2焦耳的能量,因此“麦克斯韦妖”实际上是这样一个闭环模型:能量差需要低熵,低熵需要信息,而信息又需要能量差。根据热力学第二定律可知,孤立系统中的熵不会减少,永远处于熵增的状态。熵增定律也被描述为事物总是由有序向无序状态发展,这种发展的趋势并非由外力所引起,单纯是因为不同数量的微观态共同定义的宏观态们之间的概率不同,任何事物,包括生命结构的宏观态的概率总是少于其他类型的宏观态的。结合这个角度来观照,“麦克斯韦妖”所设想的能量永动模式实际上违背了熵增定律中关于“孤立系统”的限定条件,因为这个限定条件没有考虑到信息以及信息熵的意义,香农的信息论则破解了这个难题。同样的,当我们用这个视角这个角度来度量人类,便可以得出这样的结论,人类实际上便是一个可以通过自身减熵而维持自身稳定的生命模型。这也正是普利戈金于1969年所提出的“非平衡态的开放系统,通过自我组织和协调的方式使得开放性系统达到一种动态平衡”的耗散结构。如果说人的结构本质便是一种耗散结构,那么便可以将其关于熵变的公式ds=des+dis代入人类来进行思考。在这个公式中ds=熵变,des=熵流,dis=熵源。从这个公式中可以推导出,当des<0,且des的绝对值小于dis的绝对值时,ds<0,这种情况下负熵流>熵源,总熵变就小于0。通过耗散结构的模型,我们可以这样观照,在个体的生命周期之内,通过信息的减熵人类个体可以维持熵变,从而延续生命结构的稳定,质言之,在开放系统的情景之中,外界环境的负熵输入使得该系统避免熵增,系统则因此维持一种动态的有序性。这正如著名的物理学家薛定谔的经典论述:“生命以负熵为食”所言。

在此基础上结合生物学的意义上来考量生命的演化过程,单细胞生物依靠演化来学习应激模型,但又并非完美的复刻自身,而是由自然选择筛除掉不能躲避危险的模型,又在筛选后的模型上不断重复这个过程,因此,只要种群基因库的更新速度快过环境的变化速度,整个种群就能够相对稳定的形成可躲避危险的模型。因此,突变和繁衍便是构建模型的过程。当然,如同人类这样的多细胞生物不可能随时发生变异,因为如果所有细胞都可随时发生变异便无法构成一个稳定的宏观态,但过于保持稳定性又会使得演化所需要的差异性有所欠缺,有性生殖便成为了一条相对稳妥的路径。可是问题同样随之而来,生物的移动是有性生殖的必要条件,可移动带来的环境变化同时又会无法保证如单细胞生物生存的必要条件——基因库的更新速度快过环境变化的速度。因此如人一般的多细胞生物的演化就不得不让个体在生命周期内拥有学习的能力,人类所拥有的学习能力称之为泛化能力,这使得人类的学习模型可识别从未见过的情况,正如考试不会考察学生已经练习过的原题。人工智能虽然并非人类这样的碳基多细胞生物,但若要拥有具有能动性质特征的主体意向性,泛化能力同样是关键的一环。人类生命周期内的个体记忆能力正是为了让人类从历史经验中学习,不同于记住所有发生过的事情并在这样一个记忆库中面对未知寻找应对策略这样的过拟合,人类所采用的是一种网络记忆模型,这种记忆模型是构建一个网络,根据输入直接计算出对应的输出。这种网络模型中输入可以看做是二维向量,输出为一维向量,而控制着取多少状态的连接则表示权重。网络的记忆并不是将某个选择决策先验的存储于某个特定位置,而是由所有权重共同存储,无法直接调取,只能根据输入计算输出,在神经网络记忆模型中,记忆可被视作过拟合的学习,学习又可被视为泛化的记忆。那么机器的学习能力又如何实现呢?传统的计算机所使用的逻辑便是查找记忆,也正是这种直接在庞大的数据库中寻找并调取记忆的模式,在这种情境之下,首先会面临到的问题便是前文所提到的“能指的全知”是否可能?即便我们使用文本输入的方式穷尽所有的信息,也无法达成人工智能作为主体的意向性。语义的难以捕捉和确认原则的不同一性很难使其形成真正的语义空间向量模型。即便不断的改进文本向量空间模型,甚至将文本向量空间模型通过统计学意义上的方法和路径将其迭代为语义向量空间模型,无法面对未知,更无法在面对未知时做出自由意志选择的本质问题依旧难以避免。因为统计学意义上的算法更迭是静态的,而人类社会语義的更替则是动态的。若想依靠信息来减熵就必须依赖人类对信息库的不断更迭,这种更迭近乎无止境,也是永远具有滞后性的,在这一基础上也更无法实现机器的主体意向性。正如信息论所揭示的,通过针对思维,感知和行动的模型表示所呈现出的约束条件而得以实现的算法本质上无法真正实现,机器无法打破孤立系统的限定进行减熵,以耗散结构来维持自身永续的路径又需要人类的信息补充来保证其动态的有序性。现如今很多研究者使用类似于人类的记忆和学习方式的BP算法(神经网络算法)运用于人工智能的研发中,即通过正向和反向传播的双反馈过程来作为修正各单元权值的依据,在不断的调整各层神经元的权值和阈值后,将误差信号减少到最低。但这种算法依旧没有合理的规避掉统计学的制约,语言中的使用规则既是无法量化的,也难以计算其统计学意义上的频度,归根结底,语义的边界并没有被高度拟人化结构的算法所突破。而当一个“智能体”所有行为的方法论仅能依赖于另一个智能体的输入而存在时,前者的主体意向性自然存在根本性的欠缺。

3. 边界的意义与权力的重塑

通过信息论的框架,对人工智能的分析后,可以得出这样一个简单的结论:人工智能算法的上限是对其质变的否定。也就是说,算法,算力和数据的升级仅仅是量变层面的更迭和升级。有了这样一个前提,再以回溯性的视角来观照技术主义的发展历程,人文主义所包含的理性内在和工具精神,驱动并铺垫了技术主义的源起和基建,可是却在技术化的时间进程中出现了割裂和分野。人文精神和工具精神发展出各自的形态,并最终导致了传统人文主义的出现,即强调人类的内在性,并明确内在性和外在性的区别。“随着技术、社会发展所表现出来的无可抗拒的强制力和诱惑力,他们面对内在性萎缩和外在性极度发展带来的张力显得困惑,并且在捍卫家园方面表现出类似于唐吉柯德式的盲目。”这种分野来源于技术本身的不可逆性和指数性发展。胡塞尔为了摆脱自己所陷入的自我论的困局而提出的主体间性,使得技术得以在哲学层面作为既成事实的逻辑自洽,技术没有创造主体间性,但技术所扩张和充盈的领域的确切概括正是主体间共在的向度。

这样的认识论指导下,人们对技术主义由最初的存在的主体论思考到技术犬儒主义所代表的对于技术的妥协和让渡,最终转向为科技发展和社会实践之间呈现一个互相塑造的过程的描述。当然上述的路径并非代际性的而是平行的呈弱时间线的关系。具体表现在传播领域,“传播学者不再将新媒体看作是革命性的,而是从一种演化的角度来讨论新媒体,从关注新媒体的创造性、新奇性和挑战性,转向从多元路径和健康的怀疑主义出发反思新媒体可能带来的负面后果。”这种学界研究去革命性的转型,本身就是对技术主义由神话到平庸的祛魅。也在某种程度上代表着技术观念随着时间延宕的渗透和社会意识确认。

人工智能技术在某种程度上表征了人类所有技术结构的巅峰,因为这一技术的未来可能直接影响了人类自身本体论意义上的自洽。如果说人们对于技术的发展一直囿于让渡和妥协的应对策略,那么人工智能或有的实现在很大程度上将彻底的消除绝对性,从而使人类自身陷入近乎永恒的相对主义困境之中,绝大部分的科学范式或许也将改写。也是从这个意义上讲,技术主义和人文主义存在着一种本体论向度的二元对立,这种二元对立双方在不断膨胀的张力中,如果存在边界,那么技术与人类社会的关系就会出现一种维特根斯坦早期哲学式的“语言与现实”之性质的界限。又由于二元对立自身所带有的绝对性,边界的出现并非使二者呈现一种动态平衡,而将是以一种此消彼长的形式体现。经过前文信息论框架的分析,至少在现有的科学基础之上,语义边界的存在使人工智能发展的上限被搁置,如此,作为信息传受者的个体在面对无法脱离工具属性的人工智能技术时,其信息收受的权力会被更多的放大,乃至于重塑。

Web2.0的到来使人们进入了一个社会化媒体的时代,去中心化的传播场域和大量UCG信息的产生就是这种信息传播权力重塑的重要象征。事实上,技术的升级和人工智能带来的算法,算力,算量的提升虽然带来了信息茧房,但也为个体获取信息,传播信息的能力得到了极大的提高。当剥离掉文本向量空间模型中的语义边界的哲学象征意义后,这种语义边界实践层面的影响实际上为作为传受双方的个体保持了自由选择的空间。在高度信息化的社会中,拟态环境或许难以避免,但也正是因为作为独立的具有自主意向性的人与机器不同,仅仅通过信息向个体方向的向量堆积也无法完全封闭个体的信息获取能力。相反,因为技术的发展,个体的信息传受能力会被重塑,这种重塑或许并非体现于具体的传播技术或传播能力之中。而是从哲学的角度来看,技术主义虽并非与人文主义极端对立,但技术主义的边界一旦被限定,那么人文主义的回流所带给个体在传播场域之中的张力将会成为传播场域中最重要的势能,作为工具属性的人工智能算法将很大程度上成为使用者的有效替力,届时出于传播和交往的目的性,和这种目的性周延的如差序格局一般的信息传播流的涌动则将与算法本身无关。

参考文献:

[1]徐英瑾.黑格爾“逻辑学”对人工智能的启示[J].复旦学报(社会科学版),2018,60(06):26-41.

[2]徐英瑾.胡塞尔的意向性理论与人工智能关系刍议[J].上海师范大学学报(哲学社会科学版),2018,47(05):66-76.

[3]谢娟英,刘然.基于深度学习的目标检测算法研究进展[J].陕西师范大学学报(自然科学版),2019,47(05):1-9.

[4]程学旗,靳小龙,王元卓,郭嘉丰,张铁赢,李国杰.大数据系统和分析技术综述[J].软件学报,2014,25(09):1889-1908.

[5]杨凡,任丹,丁函.计算机技术文本分类中的语义分析算法的实践探讨[J].软件,2019,40(06):78-80.

[6]廖声武,郑永涛.2018年新闻传播学关涉人工智能研究的进路[J].新闻前哨,2019(08):30-32.

[7]李剑.信息认识活动逻辑和信息价值的哲学考察[D].河南师范大学,2011.

[8]牛奉高,张亚宇.基于共现潜在语义向量空间模型的语义核构建[J].情报学报,2017,36(08):834-842.

[9]韩水法.人工智能时代的人文主义[J].中国社会科学,2019(06):25-44+204-205.

[10]易显飞.技术自身的道德意蕴:一把解开智能时代的伦理钥匙——兼评彼得·保罗·维贝克的《将技术道德化:理解与设计物的道德》[J].云梦学刊,2019,40(01):36-40.

作者简介:施又予(1992.8-),男,汉,陕西省西安市人,硕士研究生,助教,研究方向:技术哲学。

猜你喜欢

信息熵人文主义算法
Travellng thg World Full—time for Rree
近似边界精度信息熵的属性约简
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
基于信息熵的承运船舶短重风险度量与检验监管策略研究
信息熵及其在中医“证症”关联中的应用研究
论犯罪信息
人格权位置之合理性分析
人文主义视野下的高职教育研究