如何人工模拟神经元
2024-06-28陈凯
陈凯
摘要:本文提出,如同抽象绘画艺术中“抽象”一词具有多样性,在一个计算模型的实现过程中,抽象在不同的阶段以不同的方式发挥作用。从了解生物的神经元行为,到建立解释神经元行为的数学模型,到物理上实现人工模拟神经元,再到构造神经网络,人的思维抽象过程的目的和消除物都有所不同,其中,通过消除实体的物或虚拟的物的某种属性,来建立模型达成对某种形式系统的同构过程,值得加以关注,这是能够在人的创新过程中体现人在特定情境和任务下作为规则制订者的能动性和独立性的重要环节。
关键词:神经网络;模拟神经元;计算思维;抽象
中图分类号:G434 文献标识码:A 论文编号:1674-2117(2024)11-0021-05
通过考察各类艺术流派可以发现,不同的抽象主义绘画流派的作品有很大区别:毕加索将物体简化为几何形状,再重新组合成画面;康定斯基彻底摆脱了物的具象,画中的图案主要表达内在情感;克莱因的“蓝”是一幅仅有蓝色的纯色作品,不仅让绘画本身成为一种极致的抽象,而且将创作行为和观众的体验过程上升为一种抽象。笔者由此得到的启发是,“抽象”本身具有多样性。虽然所谓的抽象都是从众多事物属性中抽取出共同的、本质性的特征,而舍弃其非本质的特征的过程,但抽象的过程涉及具体的抽象意图以及选取非本质舍弃物的判别标准,使得抽象的目标和过程呈现出多样性。考虑这样的问题:从某人了解神经元的生物学行为开始,直到构造出一个人工的神经网络模型,在整个过程中,抽象思维是怎样发挥作用的?抽象思维在解决问题的过程中发挥作用的方式有哪些不同?
再现神经元特定行为特性的模拟神经元——认知上的简化
人如何了解神经元的工作过程?当然,可以从生物学和化学更为本质的角度去理解,然而也可以如行为主义的研究方法那样,仅仅考察对神经元的刺激以及得到的反应:刺激导致膜电位上升,超过阈值产生动作电位,向下一级神经元发送信号,然后进入不应期,稍后恢复响应。这样,人的头脑就在撇除生物和化学细节的前提下,把握神经元的工作过程。这其实是一种自然建模的过程,这种模型不是物理或化学模型,也不是统计学模型,而是一种认知上的模拟,使人能够在一定程度上理解神经元的行为。在抽象过程中,更本质的内容并未被真正消除,而是被隐藏起来,消失在人的视域中。
在教学中,可以采用软件来模拟神经元的“刺激——响应”过程,也可以用硬件如某种电子开发板来进行模拟。例如,可以用掌控板来模拟一个神经元的行为:在屏幕上有一个闪动的圆圈,随着刺激的输入——可以用按键代表刺激,也可以用引脚从外部引入刺激,圆圈慢慢变大,如果短时间刺激消失,则圆圈又会恢复原来的样子,但若圆圈变大到超过某个阈值,则显示一个产生很多同心圆的动画效果,用以向人表示动作电位的发生,同时,还通过引脚向下一级的模拟神经元发送信号,当信号发送后,这个模拟神经元需要一段时间的恢复才能重新回到初始状态。这些掌控板可以相互级联,前一级模拟神经元的信号能传递到下一级,这样就能组成神经网络来实现分类任务,如图1所示,处于中间层的模拟神经元,面向观察者较近的那一个因阈值较低而在刺激下先产生动作电位,并将信号传递至输出层的模拟神经元,在图2中,刚才产生动作电位的模拟神经元进入不应期,输出层的模拟神经元被激发产生动作电位。建立这样一种模型并不是为了了解神经元的底层机理,而是为了方便人的认知,莱奥内利称之为通过智力抽象(intellectual abstracting)的方式构建黑箱式的模型,用以和其他“抽象”区别。[1]
剥离物理因果关系——形式上的简化
在认知过程中,可以利用抽象为神经元的工作过程提供一种便捷的解释。继而需要考虑的是如何借助一个模拟神经元的行为实现分类任务,在实现的过程中,人工的模拟神经元的工作过程不必完全对照真实神经元的工作过程,许多地方可以进一步简化,如输入刺激、动作电位产生、不应期各个阶段的时间都可以极致压缩到无,不用再考虑“刺激——反应”中各个时间阶段的具体变化,而仅仅将神经元的行为再现为一种输入和输出的对应关系,这类似于将数字电路中部分不必要的时序逻辑消除使之简化为组合逻辑。抽象是一种属性消除的过程,对应于前一节所说的认知过程中的属性消除,是一种形式系统构造上的属性消除。这种形式上的属性消除过程可以看作基于因果关系的冗余的压缩。例如,某系统中需要由A传递值到B,由B传递值到C,以此类推一直到Z,但若在形式系统运作过程中,B、C一直到Y并未在本系统中产生作用也未和其他系统产生关联,那么整个值的传输过程就可以简化为A传递给Z。在神经元的例子中,不应期的原因是钠通道的失活,但从人工的模拟神经元实现分类作用的纯粹形式的过程看,钠通道的活性这种属性是一种冗余,因为形式系统中符号的变换不依赖于真实物理实体的钠通道。于是,就可以将神经元的“刺激——反应”行为封装成一个简单的形式化的阈值判断模型,如图3所示。这样一来,“抽象所得的模型并没有表征那个原始系统,它表征的是任何具有那些抽象特征的系统”。[2]
构建计算模型——形式系统的使能
海德格尔在《存在与时间》一书中围绕锤子有这样的阐述:“用锤子来锤,并不是把这个存在者当成摆在那里的物进行专题把握,这种使用也根本不晓得用具的结构本身……对锤子这物越少瞠目凝视,用它用得越起劲,对它的关系也就变得越源始,它也就越发昭然若揭地作为它所是的东西来照面,即作为用具来照面。锤本身揭示了锤子特有的‘称手,我们称用具的这种存在方式为上手状态。”[3]这里的“源始”和时间性有关,是一种自在自为的“出离自身”的本身,对应的是一种自然而然的没有被人刻意意识到的状态。
如果要利用神经元组成的神经网络来解决分类问题,那么封装好的神经元函数就是一种用具,处于“上手”(也翻译成“应手”)的状态,现在,考虑对人工的神经元函数“瞠目凝视”,使得神经元的结构充分显现出来,于是它转化为一种“在手”之物,然后就能有意识地展开研究其中算法的结构和作用(即便仅仅记得函数名和参数的使用,也能够将人工神经元作为用具,对封装好的函数“瞠目凝视”,或者对一个高度集成的电子设备“瞠目凝视”是起不到从上手到在手的转化作用的,这个问题稍后会讨论)。在这里,已有的算法可看成是海德格尔所说的“集置(Ge-stell)”,是一种人们按照自己的要求定制的构架,这种构架支持了技术的实现,但也有重大的危险,就是会将自然的生动涌现给遮蔽掉。
构建计算模型的方法有两种不同的类型,一种是利用定制的架构,另一种是不利用定制架构而首先对规则本身进行架构。在构建计算模型的过程中,这两种类型方法的运用不是非此即彼的。例如,即便不利用当前定制架构,也常常要利用更底层的定制架构;另外,即便利用定制的架构,也可以在已有规则上打破原有规则制订者的目的而产生出德勒兹所说的“萌发出的飘移之线”[4],一个常被提及的例子是,某通俗的音乐作品创造性地使用鼓点来模拟旋律,而鼓点本身的规则是为了产生节拍,于是这种创造首先基于规则但又逃逸出原有规则制订者的预期。笔者在《计算思维中的抽象是一种怎样的抽象》一文中提到的“用以实现形式系统的机械化对象”就是一种定制的架构,这种定制架构可能是一个计算机实体,也可能是一种软件。但当有意识地去除掉已有的计算机实体或软件后,就需要考虑如何使得“物”成为“物”(前者的“物”可能是与人无关的东西如石头或木块),这种使“物”成为“物”的“物性”本身是超越物质材料或运用规则的“非——有条件”的东西[5](这也暗示了当前人工智能的局限,因篇幅限制这里不作展开)。正因为前提条件不存在,才使得“使之成为物”需要一种思维的敞开,赋予物以各种可能的潜力。“一个世界中的特定元素的意义是从更普遍的体验中区分出来的,这些元素总是与它们的上下文处于有意义的关系中。在工作中,木匠会将放在手边的锤子视为‘锤子和‘对钉子有用的东西,但在更具威胁性的情况下,可能会将其视为对付入侵者的武器……属于情境的整体结构使得规则成为可能”。[6]
在计算模型的构建过程中,人们使用物的某些属性或事件,来对抽象的形式系统的运作过程达成一种同构。例如,让学生思考如何借助身边的物来模拟形式上已作简化的神经元的行为,学生举出的例子有:向放置在不平衡支架上的水桶中注水,当超过某个阈值后,水桶以某个角度翻倒,水桶中的部分水顺水槽流向下一级的水桶;某长条木块竖立在斜向放置的木板旁,木块顶部有若干滚珠,同时,斜向放置的木板上滚下滚珠,当滚珠超过一定重量后木块倾倒……还有一些距离学生生活情境较远,不太容易想到的方法,如一篇文章提到用储水的虹吸装置来模拟数字逻辑元件[7],同样的方法完全可以用来构造模拟的神经元,或者使用电压敏感的模拟电路来模拟神经元[8]等。在同构的过程中,需要对物的属性进行物理上的消除,如只需要考虑滚珠是否推倒木块,以及木块被推倒后是否释放出新的滚珠,至于更细节的滚珠滚动的速度、木块倒下的角度等等物理特征并不需要精确地把握。侯世达对“同构”有着详细的论述,他认为同构是两个复杂系统的相互映射,同构能够使得形式系统达成对现实世界中意义的获取[9],至于形式系统能否真正像人那样获取到意义,笔者对此仍然持怀疑的观点(侯世达显然不认同德雷福斯关于形式系统无法产生出如人脑中所产生出的意义的观点),但没有疑问的是形式系统和现实世界的某些属性和事件同构这一事实本身的存在。在计算模型的构建中,形式系统常常用以实现对现实世界的现象的同构,但似乎未见有人特别提出人能够主动利用和改造物使之可以被用于同构,也就是为了形式系统的使能要对物的某些物理属性进行消除,对某些属性加以保留和利用。
这种使能的材料未必一定是在物理现实中存在的,材料本身也可以是一种虚拟物,虚拟物比现实中的材料有着更为理想化的特点,在形式系统的使能过程中,常常不是直接用细节丰富但加工困难的材料来实现复杂系统,而是先用它们实现理想化的简单的虚拟组件,基于这些虚拟组件构建复杂系统。但这些虚拟组件具体的形态生成,却是“非——有条件”的东西,没有预先设置的规则让人遵循,就好像许多人在见到乐高积木时,感觉它如此简单,可能产生出一种自己也能设计出类似东西的感觉,但事实上却很少有人能在乐高积木出现之前真正想到。
封装神经元——形式系统的层次性
当使用函数将人工模拟的神经元进行封装,然后将神经元连接起来构成神经网络的时候,抽象的目标是通过模块化来简化复杂的系统。这时,抽象的人工神经元起到了神经网络基底的作用。有时,抽象的这种作用被称为“聚合(aggregations)”,指的是将对象之间的关系视为更高级别的对象。[10]如果将作为基底的对象暂且视作实在的物,或者将这些底层对象在元宇宙中以某种实体的形式显现出来,那么这种“聚合”的过程就能看成是一种更高层次的形式系统的使能:将底层的“物”的某些“物理”属性加以消除,构造出更高层次的抽象物。这里的“物”和“物理”加上引号的用意是显然的,因为它们多半是一种虚拟物,但也不完全是,如在一个神经网络的演示模型中,借助软件的激活函数来处理信号,但信号的来源和输出部件却可以是不同方向的电磁铁,用以产生加强的刺激信号或减弱的抑制信号。
不过,在使用人工模拟的神经元搭建人工神经网络的例子中,神经元的所有行为特征可能都被用于神经网络的搭建,并没有任何“物理”属性被消除,那么,如果基于封装的模拟神经元在构建神经网络的过程中体现了抽象,到底有什么被消除了呢?这里所消除的,应该是人视域中的被封装对象所有内部的结构和行为,也就是说,内部的结构和行为虽然都事实上存在而未被消除,但都被隐藏起来,达成了一种在人思维过程中的消除。这种思维过程中的消除和先前所说的在形式上的消除的不同之处在于,某些过程被隐藏起来而在底层实际发挥作用,和人面对自然现象时的认知上的抽象非常类似。
结论
从人了解神经元开始,一直到神经网络的搭建完成,在这个过程中思维中的抽象以不同的方式产生作用(如上页表)。
表中列出的第三阶段——用物或虚拟物实现同构的形式系统的自动运行,其关键在于“同构”,也是日常教学的思维培养容易被忽视的环节。诚然,人们可以使用程序代码来模拟神经元的行为,但代码是一种成熟的用具,其自身的独特存在性因其可用性而消失,“器具制作得越好、越凑手,它独特的存在就越不触目。一件器具制造好了,这器具就脱离了创作……相反,艺术品一旦被创造出来,就获得了自己的独立性。这种自存自足更接近于纯粹的物而非器具”。[11]这对于如何在教学中实现创新的培养是一种重要的启发,现成的、功能强大的算法往往缺少一种自在的诗意,如果说创造独特性的算法对普通学生来说要求过高,那么,可以试着将成熟的算法或解决方案先行搁置,引导学生采用各种可能的办法来建立模型,达成对某种形式系统的同构,这可能是能够体现人在特定情境和任务下的作为规则制订者的能动性和独立性的重要环节。
参考文献:
[1]LEONELLI S.Performing abstraction:two ways of model-18ling arabidopsis thaliana[J].Biology & philosophy,2008,23(04):515.
[2]彭文青.从元方法论视角理解计算模型认知效力问题——明知有缺陷的计算模型能供给我们怎样的知识?[J].自然辩证法通讯,2020,42(11):31-36.
[3]海德格尔.存在与时间[M].陈嘉映,王庆节,译.北京:生活·读书·新知三联书店,2006.
[4]吉尔·德勒兹.差异与重复[M].安靖,张子岳,译.上海:华东师范大学出版社,2019.
[5]海德格尔.物的追问:康德关于先验原理的学说[M].赵卫国,译.上海:上海译文出版社,2010.
[6]Philip Brey.”Hubert Dreyfus:Human versus Machine”.American Philosophy of Technology:The Empirical Turn[M].Indiana University Press,2001.
[7]Nicolas Taberlet,Quentin Marsal,Jérémy Ferrand,Nicolas Plihon.Hydraulic logic gates:building a digital water computer[J].European Journal of Physics,2018,39(02).
[8]Mueller, Paul et al.A Programmable Analog Neural Computer and Simulator[J].Neural Information Processing Systems,1988.
[9]侯世达.哥德尔、艾舍尔、巴赫——集异璧之大成[M].北京:商务印书馆,1997.
[10]Sergio Armando Gallegos Ordorica.The explanatory role of abstraction processes in models: the case of aggregations[J].Studies in history and philosophy of science part A,2016(56):163.
[11]郭文成.论海德格尔的创造观[J].湖南人文科技学院学报,2009(06):11-13+31.