基于短时程突触可塑性形成的工作记忆神经元网络模型
2019-02-27周家程何国龙张雪娟
徐 超, 周家程, 何国龙, 张雪娟
(浙江师范大学 数学与计算机科学学院,浙江 金华 321004)
0 引 言
研究发现,人类大脑中存在数千亿个神经元[1],并且人类可以通过学习、记忆,不断获得新的能力和知识.那么,人类是怎样实现学习和记忆功能的呢?为此Hebb[2]提出了著名的Hebbian突触假说,认为一系列的刺激作用在突触前会使突触连接效率发生改变,从而使突触后电位的幅度增加或减少,这种现象称为神经元的突触可塑性,一般认为突触可塑性是学习与记忆的基础.
突触可塑性(synapse plasticity)可以分为短时程突触可塑性(short-term synaptic plasticity)和长时程突触可塑性(long-term synaptic plasticity).一般认为短时程突触可塑性会显著地改变突触的模式选择性和它们之间的信息传递[3],并且还和注意、学习、记忆等高级神经元活动有关[4].
为理解短时程突触可塑性和学习记忆的关系,1974年Baddeley等[5]提出了工作记忆(working memory)这一概念.工作记忆主要用于储存信息,从而用于完成学习、运算、推理和语言理解等许多复杂的认知活动.宏观上讲,工作记忆就是一个刺激作用在动物身上,记忆会保持一段时间直到完成相应的动作.从微观上讲,可以用神经元层面的原理来解释.我们可能想要了解的是外界的刺激是如何储存在工作记忆中的?怎样才能再次激活工作记忆? 因此,1996 年Desimone等[6]提出了工作记忆的储存方式主要为样本-选择的模式(sample-selective),即一种特定的工作记忆只能被一部分相应的选择神经元群体(selective neural population)储存,而这些选择性群体是由长时程突触修正(long-term synaptic modification)形成的[2].可是,对于在如何维持工作记忆的问题上,一些电化学家认为工作记忆要靠动作电位的发放来维持.但是,只靠动作电位来维持工作记忆所需的能量会比较多,现在看来不是很合理[7].所以结合上述模型,2008年Mongillo[8]提出了工作记忆主要是通过兴奋性突触传递(excitatory synaptic transmission)的形式储存在前额叶(PFC)中.
事实上,文献[8]提出的有关工作记忆神经元网络模型主要考虑建立在整合发放(IF)模型的基础上,考虑了相应神经元网络中突触之间连接对网络产生的影响和其他脑区神经元对网络的影响,未考虑通道噪声对工作记忆形成的影响.因此,本文通过文献[9]提出的离子通道随机开放原理,把工作记忆的模型建立在随机的Hodgkin-Huxely神经元模型之上,并通过突触后受体接受到的电流刻画突触连接[10],给出了一个基于短时程突触可塑性的工作记忆神经元网络模型.最后,考虑了在不同膜面积下的离子通道对工作记忆的影响.
在一般情况下,大多数的关于工作记忆的概念都是一些理论的知识,像文献[11-12]只是简单地阐述了什么是工作记忆,工作记忆和哪个脑区有关.但是,不能精确地解释工作记忆是怎么产生的,工作记忆是以怎样的形式保存下来的.本文提出的模型结合了数学建模的思想和生物学原理,可以解释工作记忆产生的原理,以及它的保存形式.模型还可以简单解释一些简单记忆的例子,比如记忆单词.如果模型能描述得更精确且神经元个数足够多,那么它甚至可以解释更加复杂的工作记忆系统,可能对于解释一些关于记忆疾病也有帮助[13-14],当然相关理论还有很长的路要走.
1 模 型
本文主要考虑由N个神经元组成的网络,其中包含NE个兴奋性HH神经元和NI个抑制性HH神经元.同时考虑有p=3个cue需要被记忆,具体记为p1,p2,p3.这里的cue可以理解为特定刺激,每个cue都对应一种选择性群体(seletive population),每种选择性群体包含fNE个神经元,其中f是记忆编码水平,这里假定一个神经元只对应至多一个选择性群体.神经元之间的连接方式如下:每个神经元接受来自其他c(NE+NI)个神经元突触前的信号,这里c表示相关水平.单个神经元接收到的信号具体可以分成3个部分:cfpNE种信号来自选择性群体;c(1-fp)NE种信号来自非选择性群体(non-seletive population),这里的非选择性群体虽然也是兴奋性神经元,但是对这p个cue的记忆是不需要的,所以对于NE个兴奋性HH神经元可以分成两类,一类是对p个cue能产生反应的选择性神经元(seletive neurons),另一类是对于这些cue不会产生相应反应的非选择性神经元(non-seletive neurons);最后还有cNI种信号来自抑制性群体(inhibitory population).本文主要考虑3个cue需要被记忆的情况,神经元分成5个群体.由3个选择性群体、1个非选择性群体和1个抑制性群体所组成的模型如图1所示.
sel 1,sel 2,sel 3分别表示3种选择性群体;non-sel表示非选择性群体;inhib表示抑制性群体;三角形表示兴奋性神经元;圆形表示抑制性神经元图1 5个群体的连接模型
根据Kirchhoff电流守恒律得到每个神经元的膜电位的演化方程,即
(1)
设工作记忆是建立在随机HH神经元模型基础之上.其中Na+通道有8种状态,记为Sl(l=1,2,…,8),相互之间存在20种不同的反应,记为Rk(k=1,2,…,20);K+通道有5种状态,记为Sl(l=9,10,…,13),相互之间存在8种不同的反应Rk(k=21,22,…,28).
(2)
(3)
式(2)和式(3)中:mihj表示Na+通道处于有i个m门(i=0,1,2,3)和j个h门(j=0,1)打开的状态;nk表示K+通道处于有k(k=0,1,2,3,4)个n门打开的状态;αl,βl(l=n,m,h)表示不同状态之间的反应速率[15].
(4)
表1 随机HH神经元参数
(5)
式(5)中:Q为外部输入的电荷量,设特定刺激输入的电荷量为q1,非特定刺激输入的电荷量为q2;{N(t)}t≥0是强度为λ的Poisson过程,特定刺激的强度为λ1,非特定刺激的强度为λ2.
(6)
(7)
(8)
(9)
兴奋性神经元到兴奋性神经元之间的突触连接的一般情况为:当动作电位到达时,轴突末端钙通道打开,Ca2+离子内流,促使突触前端可利用神经递质r(0 (10) (11) (12) 神经元群体突触之间传递的绝对突触效能可以分为6种情况:同种选择性群体(selective to selective)之间神经元连接的绝对突触效能为增强的,记为Jp;选择性群体到非选择性群体或者其他的选择性群体(selective to non-selective or another selective)的绝对突触效能为基础的,记为Jb;非选择性群体到非选择性群体或者选择性群体(non-selective to non-selective or selective)的绝对突触效能为0.025Jp;抑制性群体到兴奋性群体(inhibitory to excitatory)的绝对突触效能为JEI;兴奋性群体到抑制性群体(excitatory to inhibitory)的绝对突触效能为JIE;抑制性群体到抑制性群体(inhibitory to inhibitory)的绝对突触效能为JII.神经元突触连接的具体参数参见表2. 表2 神经元网络连接的参数 综合式(1)~式(12)就构成了描述工作记忆的神经元网络模型. 下面是数值模拟的具体结果,下文的特定刺激均是强度为λ1的Poisson输入,非特定刺激均是强度为λ2的Poisson输入. 图2所示为只考虑1个cue(p2)被记忆的情况.假设这个cue能被第2部分选择性群体(neuron index 20~40)所记忆.给出了在不同膜面积下对工作记忆的影响: 黑点表示神经元的一次发放;粗线和细线分别表示和随t的变化情况;阴影部分表示刺激作用的位置 1)图2(a)表示S=100 μm2时的情况,这时通道噪声进一步加强,在第1次刺激之后出现了选择性群体完全无规律自主发放. 2)图2(b)表示S=270 μm2时的情况,此时通道噪声明显加强,特定刺激作用在相应的选择性群体上持续400 ms.有趣的是,相应的选择性群体在第1次刺激之后出现了多次的同步发放(population spike)[8].但在一段时间之后,u,r曲线趋于基准值,神经元发放也会停止. 3)图2(c)表示S=500 μm2时的情况,此时通道噪声的影响较小,在t=0时,特定刺激作用在相应的选择性群体上持续一段时间,约400 ms.发现特定刺激结束之后,神经元发放随之停止.并且u,r曲线逐渐趋于基准值. 为了进一步考虑一般情况下(外界噪声影响较小)工作记忆形成和维持的原理,着重考虑了S=500 μm2的情况,如图3所示. 1)图3(a)表示在图2(c)的基础上,在t=1 000 ms时,用非特定刺激作用在全部神经元上,持续100 ms.发现:虽然第2次刺激是全局的,但是只有相对应的选择性群体进行了一次明显的同步发放,并且在第2次刺激之后,神经元发放随之减少.同时,u,r曲线回归到基准值. 2)图3(b)表示在t=2 500 ms时,用非特定刺激作用在全局神经元上,持续100 ms,只有少量的神经元进行了发放,并没有像图3(a)一样出现同体发放的现象.当然,最终神经元趋于静态,u,r曲线回归到基准值. 3)图3(c)表示在图3(a)的基础上,每隔一段时间给全局神经元施加一段时间的非特定刺激,总共刺激了4次,分别为1 000,1 800,2 700,3 500 ms,每段持续100 ms.发现:如果在合适的时间里,就可以一直出现同体发放的情况,但是如果后续刺激没有加上的话,最终神经元还是会停止发放,u,r曲线回归到基准值. 黑点表示神经元的一次发放;虚线和实线分别表示和随t的变化情况;阴影部分表示刺激作用的位置 图4表示有2个cue(p1,p2)需要被记忆的情况,假设这2种cue能分别被第1部分选择性群体(neuronindex0~20)和第2部分选择性群体(neuronindex20~40)所记忆.具体可以分成2种情况: 1)图4(a)表示S=270μm2时的情况,当t=0时,特定刺激(p2)作用在相应的选择性群体上持续400ms,发现和图1(b)一样,出现了多次自主的同步发放现象.然后,在t=1 300ms时,用非特定刺激作用在任意15%全局神经元上,持续300ms,只出现了相应神经元的发放现象.接着在t=2 500ms时,另一种特定刺激(p1)作用在相应的选择性群体上持续400ms,会与第1部分选择性群体出现交替的自同步发放现象,同时u,r曲线回归到基准值. 2)图4(b)表示S=500μm2时的情况,当t=0时,特定刺激(p2)作用在相应的选择性群体上持续400ms.然后用一系列非特定刺激作用在全局神经元上,每次持续100ms,从而出现多次同步发放的情况,其中在t=1 300ms时,用非特定刺激作用在任意15%的全局神经元上,只出现了相应神经元的发放现象.接着在t=2 500ms时,另一种特定刺激(p1)作用在相应的选择性群体上持续400ms,最后又用一系列非特定刺激作用在全局神经元上,每次持续100ms,也会出现同步发放的情况,但是与图4(a)相比,交替的现象不是很明显,甚至在有非特定刺激作用的情况下,也没出现相应的同步发放,此时u,r曲线也渐渐回归到基准值. 黑点表示神经元的一次发放;虚线和实线分别表示和随t的变化情况;阴影部分表示刺激作用的位置 很明显,甚至在非特定刺激的作用下,也没有出现相应的同步发放,此时,u,r曲线也渐渐回归到基准值. 本文工作记忆的形成和保持大致可以用下述过程来描述:首先需要把特定刺激作用在相应的神经元(见图2),这时突触能保持易化,然后可以通过非特定外部刺激作用于全局神经元,把记忆再次唤醒(见图3(a)),甚至如图2(b)所示不需要外部的非特定刺激.这里的记忆唤醒(memory reactivation)指的是短时间内的神经元同步发放,这段时间大概持续20 ms.而且当选择性群体同步发放时,其他的群体没有出现明显的发放情况,甚至对其他群体也施加了一定的刺激(见图4(b)).然后发现,群体发放能更新记忆,产生进一步的易化,从而能够使部分记忆再激活,但是再激活的时间是存在上限的,约为2 000 ms,假如超过这个上限,即使在给全局神经元施加刺激时,也不会出现群体发放的情况(见图3(b)).最后,由于再激活的信号逐渐减少,一段时间后记忆就会消失.同时,如果外部刺激过强,就会出现自主发放的情况,这时刺激不能很好地被记忆和激活,会出现像图2(a)的情况.这就能很好地解释工作记忆形成的工作原理:只有在合适的刺激下记忆才能被很好地保存.因此,根据上述假设提出了一个如何有效地维持工作记忆的模型,需要在合理的时间范围内通过不断地刺激从而维持工作记忆(见图3(c)),这也和我们生活中的记忆很接近.例如背单词,在背单词时,我们需要通过不断复习才能把单词记下来,但是,如果再次复习的时间隔得太长,就会像背新单词一样,记忆效果也不佳. 同时考虑了2种不同的特定刺激需要被记忆时的情况.其中,图4中的对全局任意15%神经元刺激的试验进一步解释了群体发放形成的工作原理,需要对全体选择性群体刺激,而不是部分,否则会出现抑制情况.同时,当1种新的特定刺激出现时,先前存在的记忆会被短暂地抑制(见图4),这里的原因可以用图5解释.由于网络是全连接的,所以当新的刺激被记忆时,新的选择性群体(neuron index 0~20)就会通过突触连接把信号传给其他的选择性群体(neuron index 20~40)和抑制性群体(neuron index 80~100),而抑制性群体又通过突触连接把信号传回到其他的选择性群体(neuron index 20~40),其中由于JEI≫0.025Jp,JIE≫0.025Jp,从而导致了选择性群体对另外的选择性群体影响是最小的,也即出现了另外的选择性群体抑制的情况.这也和实际的情况十分贴切,我们在记忆2种不同类型的刺激时,例如背单词和推导数学公式,会把先前的刺激进行短暂的压制以便记忆能顺利地进行. sel表示选择性群体;other-sel表示其他选择性群体;inhib表示抑制性群体;JEI,JIE,0.025Jp对应3种绝对突触效能2 结 论
3 讨 论