APP下载

自旋类脑神经形态计算

2025-01-12张帅陈丽娜刘荣华

关键词:类脑磁矩储备

类脑计算旨在模拟和实现大脑的信息处理和学习能力,以解决复杂的计算问题,其关键思想之一是模拟生物神经元和突触行为来实现信息传输、处理和存储.自旋电子学器件的非易失性、高速低功耗、几乎无限的耐用性及固有非线性等特点,使其在类脑计算上已有广泛尝试和出色表现.基于对自旋电子学中的各类磁电阻效应、自旋转移力矩和自旋轨道力矩效应、电压调控磁各向异性效应以及磁化动力学的非线性效应进行介绍和总结,以各类自旋器件在储备池计算、伊辛机、脉冲神经网络以及真随机数生成器上的应用为实例,展望自旋类脑神经形态计算硬件在未来人工智能芯片领域的发展前景与趋势.

自旋电子学; 神经网络; 神经形态计算; 类脑人工智能芯片

O469 A 0176-16 02.004

0 引言

近半个世纪以来,伴随着生产力需求的转变与计算能力的提升,人工智能(artificial intelligence,AI)走进了大众的视野,逐步发展成为新一代的通用技术.AI技术的发展已经带来了许多重大的进展和变革,利用人工智能技术,可以完成图像识别[1-2]、自动驾驶[3-4]、自然语言处理[5-6]、大数据分析[7]等认知任务.人工智能的进步主要归功于受生物神经网络启发的传统计算硬件和软件技术的进步[8],随着图形处理单元 (GPU) 中低功耗和高度并行计算以及用于监督训练的标记数据的出现,训练和运行人工实现的神经网络的能力随之而来.然而,传统计算机硬件采用的是冯·诺依曼体系结构,其计算方式与AI神经网络模型存在较大差异,在处理复杂的人工智能任务时存在局限性,如计算速度慢、能耗大等问题.为了解决这些问题,类脑计算作为一种新兴的计算模型被提出.类脑计算使用新颖的算法、硬件和架构来模拟计算机层次结构不同级别的神经生物学活动[9-14].类脑计算是一种以生物大脑神经网络为模型的计算模型,需要新的硬件架构和算法,其核心计算单元为神经元,它们之间通过突触连接进行信息传递,从而形成复杂的神经网络,实现更加高效的计算能力,为人工智能的发展提供了新的途径和思路.

近年来,已有诸多使用自旋电子学器件来实现类脑计算的案例[15-26].自旋电子学是一种利用电子自旋自由度来实现信息存储、传输和处理的新型电子信息技术.电子自旋被用作信息的基本单位,通过磁场电场方式实现信息的读写和处理,与以电荷为载体的传统微电子相比,具有许多独特的性能和优势.自旋电子器件具有非易失性、高速、几乎无限的耐用性、CMOS兼容性和非线性,可以为类脑神经形态计算提供一个有前途的平台[27].本综述首先详细介绍自旋电子独具的各类自旋效应和它们的调控方式;随后介绍其能够实现存储、非线性特性和短期记忆效应等能应用于类脑计算的性质;最后以储备池计算、伊辛机、脉冲神经网络和真随机数生成器4类应用场景具体介绍自旋电子器件在类脑神经形态计算方向上的应用案例.

1 各类磁电效应及其相关非线性效应

1.1 磁性材料三类主要的磁电阻效应 磁电阻效应(magnetoresistance,MR)是指材料或器件单元的电阻随着外加磁场的变化而改变的效应.对非磁性导体而言,传导电子在磁场下受到垂直于其路径方向的洛伦兹力作用进而发生偏折,使其行进路径长度增加,受碰撞概率增大,电阻变大.而在磁性材料体系中,其磁电阻大小主要由其磁化方向依赖的散射率和自旋轨道耦合效应决定.例如,铁磁金属薄膜的电阻率随自身磁化强度和电流方向夹角的改变而变化的现象,称为各向异性磁电阻效应(anisotropic magnetoresistance,AMR).如图1(a)所示的AMR,由Thomson[28]于1857年首次发现,是磁性材料中的一种基本自旋相关输运性质,在自旋电子学领域有诸多应用,如磁传感.但是,单层铁磁金属薄膜体现的AMR效应一般都比较小,例如坡莫合金的AMR为2% ~3%.1988年Albert Fert等[29]和1989年Peter Grünberg等[30]在铁磁金属(ferromagnetic metal,FM)和非磁金属(nonmagnetic metal,NM)相间的多层结构(FM/NM/FM)中观察到室温MR是AMR十余倍的巨磁阻效应(giant magnetoresistance,GMR),如图1(b)所示.由于GMR效应使得小型高密度硬盘得到广泛应用,并促进了自旋电子学的飞速发展,Albert Fert和Peter Grünberg分享了2007年诺贝尔物理学奖.如果把自旋阀结构中的间隔层从非磁金属置换为非磁绝缘势垒层(insulating barrier,IB)后,这类“三明治”结构就变成了所熟知的磁性隧道结(magnetic tunnel junction,MTJ) ,如图1(c)所示.其实,Julliere[31]在1975年就首次在低温下观测得到14%的隧道磁电阻效应(tunnel magnetoresistance,TMR),但最初并没有引起学界的广泛关注.目前,Ikeda等[32]在MgO-MTJ中已经实现了室温604%的TMR,垂直磁化的MTJ已被发展成一种低功耗、高速度、高密度、非易失性、抗辐射能力强的存储器——磁随机存储器(magnetoresistive random-access memory,MRAM).MRAM是基于MTJ中双层铁磁层的磁矩平行(P,低阻态)和反平行(AP,高阻态)态来进行“0”和“1”信息储存编码,并利用TMR读取信息.因此,相比于AMR和GMR,MJT拥有更高的TMR,更适合用于高灵敏磁传感器和MRAM.早期的MRAM数据写入是利用2条相互垂直的通电导线——位线(bit line)和数字线(digit line),产生的奥斯特场实现自由层的反转,也被称为Toggle-MRAM.但当存储单元的尺度缩减到100 nm以下时,Toggle-MRAM存在长时间存储方面和高能耗问题.

1.2 自旋转移力矩和自旋轨道力矩效应 自旋转移力矩(spin transfer torque,STT)(图2(a))最早于1996年,由Slonczewski[33]和Berger[34]从理论上预测并提出.在MTJ或自旋阀(spin valve,SV)这类三明治结构中,自旋转移力矩过程是利用固定磁性层产生自旋极化电子传输到自由磁性层调控其磁矩方向,这是由于传导电子与局域磁矩之间的交换作用,导致传导电子从固定磁性层中获得自旋极化(纯动量矩),再转移给自由磁性层.STT效应可以实现电流诱导磁化翻转、磁矩进动以及畴壁位移.基于MTJ中的STT效应,实现电流驱动MTJ的高、低阻态切换,进而设计出高密度、高稳定性、低功耗的STT-MRAM器件.但是,在这类STT-MRAM的读写过程中由于使用了相同的路径,可能会导致意外的写入.

近十几年发展的自旋轨道力矩(spin orbit torque,SOT)(图2(b)),其原理是基于自旋轨道耦合(spin orbit coupling,SOC),利用自旋霍尔效应(spin hall effect,SHE)、Rashba效应或轨道霍尔效应(orbit hall effect,OHE)等,用电荷流诱导的自旋流来产生STT[35],使得在具有强自旋轨道耦合的非磁层或界面中流动的电流转化为自旋流,自旋流向铁磁层中扩散,对铁磁层的磁矩施加力矩使之翻转,基于此可以设计SOT-MRAM.这类三端口的SOT型MTJ元件可以分隔写入和读取路径,减少读取操作期间发生误翻转的可能性,从而提高了读取稳定性和写入速度[36].

但是随着存储面密度提高,MRAM同时保持高热稳定性和写入效率面临挑战.因为随着MTJ单元尺寸减小,需要增大磁各向异性常数Ku以维持热稳定性Eb/kBTgt;60来保证数据的可靠存储.Eb=KuV为MTJ平行态和反平行态的能量势垒,而Ku的增加同样会导致更高的临界翻转电流密度.为了解决MRAM的热稳定与写入效率之间的矛盾难题,科研人员提出电压控磁各向异性、能量辅助或STT与SOT结合的三端MTJ单元等方案.

1.3 电压调控磁各向异性效应 电压调控磁各向异性(voltage-controlled magnetic anisotropy,VCMA)效应是由电场引起电荷在FM/IB界面的积累,诱导界面原子轨道占据的变化,再结合自旋轨道相互作用,最终导致磁各向异性常数Ku的变化[37-39],从而实现高/低阻态之间的切换.图3给出了VCMA-MTJ操作结构和平行态(P)与反平行态(AP)之间能垒Eb=KuV随电压变化的示意图.VCMA-MTJ最小的临界电压Vc[40]可由下式给出:

Vc=Δ(0)kBTtoxξA,

(1)

其中,ξ是衡量Vb下垂直磁各向异性变化(perpendicular magnetic anisotropy,PMA)的VCMA系数,A是MTJ的截面积,Δ(0)是零电压下的热稳系数,kB是玻尔兹曼常数,T是温度,tox是MTJ氧化物层厚度.

根据MTJ能垒Eb高低,其物理特性不同,发展的应用器件也不同.例如,前面所介绍的MRAM,其能垒Eb一般需要大于60kBT(图4(a))[41],才能保证数据写入、存储的可靠性和非易失性.MRAM中数据写入对应的自由层磁矩翻转为确定性翻转(determinant switching).如图4(b)[42]所示,正向电流导致自由层磁矩从AP态到P态的翻转,而负向电流导致相反操作.

然而对于能垒Eb~15kBT较低的情形,如图5(a)所示,AP与P态之间转换需要克服的势垒比较低,其状态极易受外界热噪声干扰,其翻转也称为随机翻转(stochastic switching).利用垂直磁各向异性系数很小(Kult;15kBT/V)的磁性层作为MTJ的自由层,该MTJ的高、低组态具有很强的随机统计特性.如图5(b)所示,在驱动电压Vin=1.95 V下,MTJ的输出Vout在高、低组态之间随时间进行随机翻转[41].这类MTJ体现的高低组态完全随机特性可以作为真随机数生成器(true random number generator,TRNG).目前,计算程序用到的随机数都是由伪随机数生成器(pseudo random number generator,PRNG)产生的.PRNG是利用确定的算法来生成看似随机的数字序列,它们依赖于随机数的种子,并且总是由相同的种子生成相同的随机数序列,故而实际上是可以被预测的,并非真正的随机.除此之外,利用磁矩的随机翻转特性,这类随机MTJ还能用来模拟神经元活动,使得其应用在递归神经网络(recurrent neural networks,RNN)、随机神经网络(stochastic neural networks,SNN)等类脑计算方面.

如图6(a)所示,生物尖峰神经元在接受外来脉冲刺激时的反应是非线性的,且在受到脉冲刺激后,其膜电位急剧升高,随后缓慢下降,又具有一定时间的暂留效果.因此,在时间间隔不长的一系列脉冲序列刺激下,其膜电位会呈非线性的、类阶梯式的上升,直到达到触发神经反应的临界膜电位,触发神经元做出相应的反应.随机翻转MTJ的磁矩翻转概率(即电导率)对输入的时序脉冲电流或电压(STT,SOT,VCMA及热涨落效应)呈类阶梯式的上升和暂留效果,其反应与生物神经元接受刺激的反应极其相似,即具有非线性和短时记忆特性,如图6(b)所示[43].因此,随机翻转的MTJ可作为一类低功耗的人工神经元,用于构建RNN和SNN等类脑计算硬件.

1.4 磁化动力学的非线性效应

1.4.1 自旋纳米振荡器的非线性响应 自旋极化电流(STT)和自旋流(SOT)效应不仅可以实现电流调控MTJ中自由层磁矩翻转,实现STT-MRAM或SOT-MRAM或真随机数生成器,而且可以驱动磁矩进行相干高频进动和铁磁或反铁磁畴壁高速移动.自旋力矩纳米振荡器(STO)是利用STT或SOT产生负阻尼力矩补偿磁性材料本征的阻尼损耗项,实现磁矩自发相干进动.该过程可以通过朗道-利夫希茨-吉尔伯特(Landau-Lifshitz-Gilbert,LLG)方程进行描述[44]

dMdt=-γM×Heff+αM0M×dMdt+βM20M×(M×S)+τFL,

(2)

式中,Heff为有效场,包括外加磁场Happ、退磁场Hd、各向异性场Hk以及电流感生的奥斯特场HOe;γ为旋磁比因子,α为吉尔伯特阻尼因子,β是自旋力矩的强度因子,S为电子自旋单位矢量;τFL是电流诱导的垂直于阻尼项的自旋矩,与磁场对磁矩产生的力矩相类似,也称为类磁场矩(filed-like torque), 如图7(a)所示[45].τFL与吉尔伯特阻尼和类阻尼力矩τDL方向垂直,对磁矩进动的动力学影响较小,仅对其振荡频率有微弱影响.根据式(2)可以看出τDL与吉尔伯特阻尼项的方向存在平行或者反平行关系,主要取决于施加电流的方向.图7(b)[46]给出了磁化矢量M在低电流(较小τDL)情况下的阻尼运动和高电流稳定进动,以及高电流翻转运动的空间轨迹示意图.因此,只要通过调节电流的大小和方向,就可以利用STT或SOT产生的类阻尼项补偿固有阻尼项导致的能量损耗,实现稳定的磁矩进动,即磁矩的自发振荡;或实现磁矩翻转,获得高低2种阻态,实现数据磁存储目的.

根据式(2)表达的LLG微分方程,磁矩进动同样具有非线性和暂时效应.如图8(a)所示,在幅值0.2 mA和脉宽50 ns的脉冲电流方波驱动下,MTJ中自由层磁矩振荡随时间演化的依赖关系表明磁矩振荡在电流切换过程中表现出明显的弛豫过程,且磁矩振幅随驱动电流大小呈现非线性依赖,如图8(b)所示[47].自旋纳米振荡器具备的这种高速的非线性响应和弛豫过程,为其构建非冯诺依曼架构的类脑计算奠定了基础,基于此自旋器件有望开发出高效的神经形态计算硬件系统.

1.4.2 自旋波模式的非线性耦合 在磁有序材料中,自旋扰动以自旋集体运动(即自旋波)的形式发生的.自旋纳米振荡器激发的相干自旋波,其模式大致可以分为图9所示的三大类:1) 线性或准线性传播型自旋波,也称为斯隆切夫斯基(Slonczewski)线性模,其振荡频率fauto通常高于均匀铁磁共振频率fFMR,随驱动电流的增加呈现出蓝移趋势,且是通过发射自旋波向周围传播或耗散能量,其传播方向可以通过外加磁场进行调控,如图9(a)所示[48];2) 非线性局域自旋波,也称为耗散磁孤子(例如,自局域子弹模式、磁滴或气泡模式),其fauto通常低于fFMR,不会向外发射自旋波进一步耗散能量,因此局域模式的临界电流Ith比线性传播模式低[49],如图9(b)所示[50];3) 磁涡旋旋进模,这是由电流诱导的自旋力矩驱动磁涡旋的涡核进行轨道旋进运动,如图9(c)所示[51],其频率远低于均匀铁磁共振频率fFMR,但其相干性和品质因子通常高于前两者.

激发传播型自旋波模的自旋纳米振荡器,它们之间可以通过所发射的自旋波进行模式的非线性耦合.例如,在2个相互间隔r的STO器件中,当其中一个STO的频率f1接近另一个STO频率f2~f1时,以自旋波为媒介磁相互作用会导致这2个STO同步锁定到一起[52],如图10(a)所示.目前,

实验已证明具有非线性特征的STO不仅可以实现多个STO之间的同步锁定,而且可以与外部微波电流或磁场进行同频或分数锁定[53](即注入锁定),如图10(b)所示,其锁相范围由其非线性系数和耦合强度决定[54].

1.4.3 磁畴移动的非线性 磁性材料通常会自发地形成许多具有不同磁化矢量方向的小区域,该区域称为磁畴,每个磁畴内的磁化矢量指向同一方向,相邻磁畴之间的磁化矢量方向不同,而分隔磁畴的区域称为磁畴壁,如图11(a)所示.磁畴壁是一个过渡区,由于磁交换作用,畴壁内的原子磁矩磁化方向是逐步渐变的,因此具有一定的厚度.根据其渐变方向,磁畴壁可分为布洛赫型和奈尔型.另外,在一些具有手性磁交换相互作用(如DMI)体系中,其磁畴壁还具有手性特性.目前研究发现,外加磁场以及电流诱导的STT和SOT效应都可以驱动铁磁或反铁体系中磁畴壁的高速移动.如图11(b)所示,磁畴壁的移动(由反常霍尔电压V(t)测量)随驱动磁场的幅度HAC和作用时间t呈很强的非线性变化关系,甚至出现变号[55].

图12描述了一类重金属与垂直磁化薄膜构成双层薄膜体系中的斯格米子磁畴随驱动电流的非线性响应.如图12(a)[47]所示,哑铃形状的双层薄膜条带会引起电流密度的不均匀分布,这有利于进一步增强斯格米子运动的非线性行为.图12(b)展示了斯格米子在幅度为±16 μA、脉冲宽度为14 ns的方波脉冲电流驱动的运动轨迹数据.结果表明斯格米子的位置与脉冲电流宽度呈现非线性,其运动速度与其当前位置x密切相关,表现出短时记忆效应,符合储备池神经形态计算对实际物理器件或系统的要求.

2 自旋电子在类脑计算方面的应用

2.1 储备池计算 储备池计算(reservoir computing,RC)是一种基于动态系统的机器学习方法,广泛应用于时间序列数据处理和预测任务.它是一种递归神经网络(recurrent neural network,RNN)的变种,以其简单、高效的训练方式而受到关注.如图13[56]所示,储备池计算可以分为3个部分:一个输入层,一个储备池层(随机权重网络)和一个输出层.在传统递归神经网络中,所有神经元之间的连接权重需要进行训练,这将导致复杂的优化问题.而在储备池计算中,只有输入层和输出层之间的连接权重需要进行训练,而储备池的神经元之间的连接权重是固定的,不需要进行训练.这种设计使得储备池计算具有更简单的训练过程和更高的计算效率.储备池通常由一组具有随机连接权重(即实际物理器件的固有动力特征)的神经元组成,这些神经元通过非线性的动力学方程进行演化.输入数据经过输入层后,通过连接权重与储备池中的神经元相互作用,产生一组高维动态状态.这些状态通过输出层的连接权重进行线性组合,最终生成输出结果.储备池的动力学性质和非线性转换能力使其能够捕捉时间序列数据中的关键特征,并用于预测、分类等任务.

储备池计算的主要优点之一是其对于训练数据的依赖性较低.由于储备池的连接权重是随机设置的,并且在训练过程中不发生变化,因此非常适用于非线性动力学物理体系或器件构建储备池硬件.储备池计算在处理大规模时间序列数据或实时应用中具有优势.目前研究发现,在某些时间序列问题上,相对其他机器学习算法,储备池计算具有最优表现[57-58].总体而言,储备池计算作为一种简单高效的机器学习方法,特别适用于时间序列数据的处理和预测.它在各种领域,如语音识别、图像处理、金融预测等方面具有广泛的应用潜力,因此学术界对各类物理储备池硬件展开了广泛探索研究.例如,2017年,Grollier等[59]利用隧道结磁涡旋型纳米振荡器的储备池计算系统,在10个数字语音识别任务中识别率高达80%.2019年,本课题组[47]构建了斯格米子磁畴型忆阻器和24个独立自旋纳米振荡器构成2类自旋型储备池神经网络.如图14所示,该储备池神经网络可划分为3部分:输入层、物理储备池和输出层.待处理数据在输入层中先进行信号预处理.如图14(a)所示,例如28×28像素的手写数字“6”灰度图,在输入层转换为196×4的矩阵,矩阵每一行的灰度被编码成4位“0”与“1”电流脉冲序列后,按时间顺序输给磁畴壁忆阻器(图14(b)).磁畴壁忆阻器接收这4位电流脉冲后,其位置P被记录.由于这样电流脉冲序列有196条,所以对应196个斯格米子位置Pi=1~196,这196个x组成一个向量P.最后该位置向量P在输出层由196×10权重矩阵W196×10线性映射到10个十进制数字结果.该储备池的学习过程是通过梯度下降法对W进行更新训练的.测试结果显示,该物理储备池系统对手写数字的识别正确率高达88%,对二阶及十阶非线性动力学系统的预测方差NMSE小于0.001 3.2019年,Moon等[60]采用基于忆阻器的储备池计算系统,对450 个数字语音样本进行训练后,其语音数字识别分类的准确率高达99.2%.2020年,夏钶团队[61]提出由800个MTJ构建的递归神经网络,可以实现对手写汉字“师”的笔顺这样的复杂时空序列进行识别和重现.2021年,Nakane等[62]采用条状磁畴结构和调幅三角输入波调控自旋波,构建储备池计算系统.通过适度抑制其中的非线性现象,系统在延迟步长为5的时间异或问题中实现了100%的预测精度.

2.2 伊辛机 伊辛(Ising-Lenz)模型,以物理学家Ernst Ising和Wilhelm Lenz命名,是统计力学中铁磁性的数学模型.伊辛模型的基本架构是一个离散格点网络,每个格点上存在一个自旋.自旋可以取2个离散的值,通常表示为“+1”和“-1”,分别对应于自旋向上和向下的方向.这些自旋之间通过相邻格点之间的相互作用进行耦合.这类自旋排列图形,通常为网格状(局部结构在各个方向周期性重复),允许每个自旋与其相邻自旋相互作用.相邻自旋同向时,其能量低于不同向状态.这类自旋物理系统趋向于能量最低状态,但热噪声会扰乱这种趋势,从而产生了不同结构相的可能性.该模型将相变具象化为现实的简化模型,其中二维方格Ising模型是表示相变过程的最简单统计模型之一.

在类脑计算方面,如果将伊辛模型中每个格点的自旋向上和向下状态比作神经元的激活和抑制状态,2个点之间的相互作用比作神经元之间的信号,则这种伊辛模型可以用于构建人工自旋神经网络系统进行自适应、自我学习的机器(Hopfield网络或Boltzmann机).磁性系统的海森堡(Heisenberg)模型为:H=±J∑〈i,j〉SiSj.因此,伊辛模型系统的哈密顿量可表示为:

H=±J∑〈i,j〉σiσj+μB∑iσi,

(3)

其中,〈i,j〉表示近邻相互作用,B表示外场,耦合强度J由材料和温度决定.伊辛模型使用加权来定义伊辛哈密顿量,其中每个顶点与一个二元变量(自旋状态σi)相关联,取值为“±1”.这样伊辛问题就转变为找到使伊辛哈密顿量最小化的自旋分配问题.由于许多经典难解的组合优化问题(例如NP问题)都可以转为伊辛问题[31],因此引起了人们对伊辛机极大兴趣.然而,软件上解决伊辛问题是非常困难的[63],但近年来人们发现使用物理系统或硬件可以快速解决该问题[33-34,64-68].下面将以最大割问题为例,来展现物理伊辛机在NP问题上的应用.

最大割问题是一个与图像相关的组合优化问题,其目标是将一个给定的无向图的节点集合划分为2个互不重叠的子集,使得2个子集之间的边数最大化,如图15(a)所示.最大割问题是一个NP困难问题,在实际中很难找到多项式时间算法的精确解.因此,常常采用启发式算法和近似算法来求解最大割问题,这些算法能够在合理的时间内找到接近最优解的解决方案.伊辛模型的自旋可以被视为神经元的状态,而相互作用能和外部磁场可以表示神经元之间的连接强度和输入信号.因此,通过模拟自旋之间以及与外磁场的相互作用,最终获得系统的自旋基态,解决最大分割问题.2019年,Wang等[69]提出利用8个相互耦合振荡器的相位作为伊辛模型网络的自旋格点,构成伊辛机来解决如图15(b)所示的维数为8的最大分割问题.频率在GHz的自旋力矩纳米振荡器,相比于其他常规的LC振荡器,在能耗、集成度和运算速度上都存在明显优势.2022年,Houshang等[63]利用上述方法,展示了其利用磁耦合的2×2纳米自旋霍尔振荡器(SHNO)阵列构建的伊辛机,使用二次谐波电流注入锁定振荡器阵列,实现其相位二值化来解决最大割问题,最终实现21 μs的采样时间和每个样本0.003 8 J的能耗,其能耗比D-Wave AdvantageTM系统低了约500倍.相对于自旋振荡器之间的磁耦合,电耦合可以更加方便地实现不同节点振荡器之间的连接权重的可调节性.2022年,McGoldrick等[70]基于电耦合的SHNO阵列构建的伊辛机进行了数值分析.

图16(a)为4个耦合的非线性振荡器网络的示意图,其耦合强度Jij可通过振荡器之间的连接电阻值进行调控.图16(b)显示一个拥有16节点(自旋或振荡器)的无向(Jij=Jji)莫比乌斯(Mobius)梯形图,图中的箭头为自旋的2个取向“1”“-1”或振荡器的相位“0”“π”,虚线为一条切割线,分割不同自旋取向或相位,实现最大化连接权重合∑Wij.在图16(c)中对比了LC和SHNO阵列的伊辛机以99%的确定性达到其基态解所需时间tsol随振荡器个数n的函数依赖.结果表明,GHz的SHNO伊辛机比MHz的LC振荡器伊辛机的运算速度快2个量级.

2.3 脉冲神经网络 脉冲神经网络(spiking neural network,SNN)是一种基于神经脉冲传递方式的人工神经网络模型,其神经元之间的信息传递是通过离散的脉冲信号(也称为“尖峰”或“脉冲”)来完成的.每个神经元都有一个膜电位来描述其内部电势的状态,都会根据输入信号的强度和时间来决定是否产生脉冲响应.只有当某个神经元的膜电位超过阈值时,该神经元才会发出一个脉冲信号,传递到与其相连的其他神经元上,从而引起下一层神经元的膜电位变化.SNN模型这种时间依赖的脉冲传递方式类似于生物神经系统的信息处理过程,拥有很低的能耗和很强的时空信息处理能力,在处理动态模式、序列数据和时间序列任务时具有很大的优势,例如语音识别、运动控制和事件预测等.因此,在机器学习、神经形态计算和类脑计算领域具有很好的应用前景.例如,2016年,Srinivasan等[71]提出一种MTJ与重金属层构成异质结三端器,利用其磁矩随机特征来模拟生物二元突触行为,并发现利用2个不同三端器件组合成一个长期-短期杂化突触,来进一步提高突触学习的效率,在训练阶段实现更快的收敛.2022年,张亚军等[72]利用超顺磁隧道结构建群体编码的SNN网络模型,实现了鸢尾花样本的无监督分类,在输出层神经元为20个时,其正确率达90%,当神经元个数增加到30时,其正确率高达92.6%.2023年,本文作者课题组[73]基于自旋轨道力矩调控磁矩翻转概率模拟生物突触的脉冲时序依赖可塑性(STDP),构建了物理SNN网络.该自旋轨道力矩霍尔器件是由多层薄膜Ta(2)/Pt(5)/Co(0.8)/Ta(2)构成,如图17(a)所示.该SNN网络对手写数字的识别的流程图如图17(b)所示,其包含输入层、兴奋层和抑制层.其中,输入层由28×28个神经元的组成,对应于手写数字图像的28×28个像素点;兴奋层和抑制层分别包含100个神经元.研究结果表明,该随机SOT器件构建的物理SNN网络,在无监督手写数字识别和逻辑运算学习方面表现出良好的性能,准确率超过80%.

2.4 真随机数生成器 真随机数生成器(true random number generator,TRNG)是一种利用物理随机事件来生成真正随机数的装置.与伪随机数生成器(pseudo-random number generator,PRNG)不同,TRNG利用物理随机过程或环境噪声源来生成随机数,而不是基于确定性算法生成的PRNG.这些物理随机事件是不可预测和不可复制的,因此生成的随机数是真正随机的.真随机数生成器在许多领域中被广泛应用,特别是需要高度随机性和安全性的应用.首先,在密码学和安全通信领域,TRNG用于生成加密密钥、随机初始化向量和随机种子,以确保密码算法的安全性和随机性.它们在对称密钥加密、公钥加密、数字签名等密码学协议中起着关键作用.其次,在计算物理学与工程领域的研究中,TRNG用于生成模拟和仿真中所需的随机数.这些领域需要随机性来模拟复杂系统、进行蒙特卡洛方法、优化算法等.然后,在抽样和调查研究中,TRNG可以用于生成随机样本和随机分配实验条件,用于统计学、社会科学和市场研究等领域的抽样和实验设计.最后,在物理模拟和天气预测中,TRNG用于生成随机数种子,以初始化模型的起始条件,并引入随机性来模拟现实世界的不确定性.

近年来,已有很多研究人员对基于MTJ的真随机数生成器的实现及其在神经计算的应用展开了深入的研究[74-82].2017年,Vodenicarevic等[83]利用超顺磁性隧道结的随机行为构建了真随机数生成器,并以极低的能耗和空间占用使用随机比特流随机计算实现了电子邮件的分类.2019年,Borders等[41]提出使用MTJ的磁矩随机翻转进行概率计算的试验性实验,并演示了整数分解.为了构建随机神经网络,他们将随机 MTJ与标准n型金属氧化物半导体(NMOS)晶体管连接起来,以获得三端概率比特(p-bit),如图18(a)所示.图18(b)展示了他们的实验架构,其包含8个随机翻转MTJ构成的概率比特、一个微控制器和一个数模转换器(DAC).微控制器负责读取每个p-bit的输出电压,并进行编程以计算给定成本函数E的输入电流Iin;DAC将结果转换为模拟电压.微控制器和DAC一起充当确定Iin的突触权重逻辑,从p-bit读取数字输出并反馈模拟输入.他们利用这8个相连的随机翻转MTJ进行基本异步概率计算,演示对高达945的整数进行因式分解,并预计能够对具有n个p-bit的2n+2大小的整数进行因式分解,为优化和采样等难题提供了一种潜在可扩展的硬件方法.

3 总结

本综述前部分介绍了自旋电子学中各类磁电阻效应、自旋转移力矩和自旋轨道力矩效应、电控磁各向异性效应和磁化动力学的非线性效应,以及它们在高速低功耗磁随机存储器和非冯若依曼架构的人工神经网络类脑计算硬件方面的具体应用.由于类脑智能芯片是人工智能最前沿的发展领域,本文后部分着重介绍利用上述各类自旋效应和自旋器件如何构建自旋型储备池计算、伊辛机、脉冲神经网络以及真随机数生成器,以及它们在图像和语音识别、逻辑运算、非确定性多项式(NP)算法以及整数因式分解等问题上的性能表现.自旋电子学器件能提供高并行、高能效和强容错性的存算一体计算平台,随着与神经形态架构不断融合和发展,自旋类脑芯片将在人工智能领域发挥重要作用,带来计算范式的创新和突破.致谢 南京邮电大学科技基金(NY220164)对本文给予了资助,谨致谢意.

参考文献

[1] KRIZHEVSKY A, SUTSKEVER I, HINTON G. Imagenet classification with deep convolutional neural networks[J]. Advances in neural information processing systems,2012,60(6):84-90.

[2] HNAFF O J, SRINIVAS A, DE FAUW J, et al. Data-efficient image recognition with contrastive predictive coding[EB/OL]. (2020-07-01)[2024-01-11]. https://arxiv.org/abs/1905.09272v3.

[3] KANADE T, THORPE C, WHITTAKER W. Autonomous land vehicle project at CMU[C]//Proceedings of the 1986 ACM fourteenth annual conference on Computer science-CSC’86. Cincinnati:ACM,1986:71-80.

[4] BOJARSKI M, DEL TESTA D, DWORAKOWSKI D, et al. End to end learning for self-driving cars[EB/OL]. (2016-04-25)[2024-01-11]. https://arxiv.org/abs/1604.07316.

[5] NADKARNI P M, OHNO-MACHADO L, CHAPMAN W W. Natural language processing: an introduction[J]. Journal of the American Medical Informatics Association,2011,18(5):544-551.

[6] YI C C, TIAN Y L. Assistive text reading from complex background for blind persons[M]//Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg,2012:15-28.

[7] NAJAFABADI M M, VILLANUSTRE F, KHOSHGOFTAAR T M, et al. Deep learning applications and challenges in big data analytics[J]. Journal of Big Data,2015,2(1):1-21.

[8] STURM B L T, IGLESIAS M, BEN-TAL O, et al. Artificial intelligence and music: open questions of copyright law and engineering praxis[J]. Arts,2019,8(3):115.

[9] CHAKRABORTY I, JAISWAL A, SAHA A K, et al. Pathways to efficient neuromorphic computing with non-volatile memory technologies[J]. Applied Physics Reviews,2020,7(2):021308J.

[10] GROLLIER J, QUERLIOZ D, CAMSARI K Y, et al. Neuromorphic spintronics[J]. Nature Electronics,2020,3:360-370.

[11] ROY K, JAISWAL A, PANDA P. Towards spike-based machine intelligence with neuromorphic computing[J]. Nature,2019,575(7784):607-617.

[12] SENGUPTA A, ROY K. Encoding neural and synaptic functionalities in electron spin: a pathway to efficient neuromorphic computing[J]. Applied Physics Reviews,2017,4(4):041105.

[13] FINOCCHIO G, VENTRA M D, CAMSARI K Y, et al. The promise of spintronics for unconventional computing[J]. Journal of Magnetism and Magnetic Materials,2021,521:167506.

[14] IELMINI D, AMBROGIO S. Emerging neuromorphic devices[J]. Nanotechnology,2020,31:092001

[15] CAMSARI K Y, SUTTON B M, DATTA S. p-Bits for probabilistic spin logic[J]. Applied Physics Reviews,2019,6:011305.

[16] PINNA D, ABREU ARAUJO F, KIM J V, et al. Skyrmion gas manipulation for probabilistic computing[J]. Physical Review Applied,2018,9:064018.

[17] SENGUPTA A, PANDA P, WIJESINGHE P, et al. Magnetic tunnel junction mimics stochastic cortical spiking neurons[J]. Scientific Reports,2016,6:30039.

[18] ROMERA M, TALATCHIAN P, TSUNEGI S, et al. Vowel recognition with four coupled spin-torque nano-oscillators[J]. Nature,2018,563(7730):230-234.

[19] ZAHEDINEJAD M, AWAD A A, MURALIDHAR S, et al. Two-dimensional mutually synchronized spin Hall nano-oscillator arrays for neuromorphic computing[J]. Nature Nanotechnology,2020,15:47-52.

[20] CAI J L, FANG B, ZHANG L K, et al. Voltage-controlled spintronic stochastic neuron based on a magnetic tunnel junction[J]. Physical Review Applied,2019,11:034015.

[21] CAI W, HUANG Y, ZHANG X, et al. Spintronics intelligent devices[J]. Science China: Physics, Mechanics amp; Astronomy,2023,66:117503.

[22] TAN Y, ZHENG J, NIU X. et al. Research progress on 2D ferroelectric and ferrovalley materials and their neuromorphic application[J]. Science China: Physics, Mechanics amp; Astronomy,2023,66:117505.

[23] TORREJON J, RIOU M, ARAUJO F A, et al. Neuromorphic computing with nanoscale spintronic oscillators[J]. Nature,2017,547(7664):428-431.

[24] BAI Y, FAN D, LIN M. Stochastic-based synapse and soft-limiting neuron with spintronic devices for low power and robust artificial neural networks[J]. IEEE Transactions on Multi-Scale Computing Systems,2018,4(3):463-476.

[25] ZHANG Y J, ZHENG Q, ZHU X R, et al. Spintronic devices for neuromorphic computing[J]. Science China: Physics, Mechanics amp; Astronomy,2020,63:277531.

[26] WU X Z, TONG Z H, SHAO Q M. Optimizing reservoir computing based on an alternating input-driven spin-torque oscillator[J]. Physical Review Applied,2023,20:024069.

[27] KURENKOV A, FUKAMI S, OHNO H. Neuromorphic computing with antiferromagnetic spintronics[J]. Journal of Applied Physics,2020,128(1):010902.

[28] THOMSON W. On the electro-dynamic qualities of metals: effects of magnetization on the electric conductivity of nickel and of iron[J]. Proceedings of the Royal Society of London,1857,8:546-550.

[29] BAIBICH M N, BROTO J M, FERT A, et al. Giant magnetoresistance of (001) Fe/(001) Cr magnetic superlattices[J]. Physical Review Letters,1988,61(21):2472.

[30] BINASCH G, GRNBERG P, SAURENBACH, et al. Enhanced magnetoresistance in layered magnetic structures with antiferromagnetic interlayer exchange[J]. Physical Review B: Condensed Matter,1989,39(7):4828-4830.

[31] JULLIERE M.Tunneling between ferromagnetic films[J]. Physics Letters A,1975,54:225-226.

[32] IKEDA S, HAYAKAWA J, ASHIZAWA Y, et al. Tunnel magnetoresistance of 604% at 300 K by suppression of Ta diffusion in CoFeB/MgO/CoFeB pseudo-spin-valves annealed at high temperature[J]. Applied Physics Letters,2008,93(8):082508.

[33] SLONCZEWSKI J C. Current-driven excitation of magnetic multilayers[J]. Journal of Magnetism and Magnetic Materials,1996,159(1/2):1-7.

[34] BERGER L. Emission of spin waves by a magnetic multilayer traversed by a current[J]. Physical Review B: Condensed Matter,1996,54(13):9353.

[35] 王天宇,宋琪,韩伟,等. 自旋轨道转矩[J]. 物理,2017,46:288-298.

[36] SENNI S, TORRES L, SASSATELLI G, et al. Exploring mram technologies for energy efficient systems-on-chip[J]. IEEE Journal on Emerging and Selected Topics in Circuits and Systems,2016,6(3):279-292.

[37] KANG W, RAN Y, ZHANG Y, et al. Modeling and exploration of the voltage-controlled magnetic anisotropy effect for the next-generation low-power and high-speed mram applications[J]. IEEE Transactions on Nanotechnology,2017,16:387-395.

[38] BARNES S E, IEDA J I, MAEKAWA S. Rashba spin-orbit anisotropy and the electric field control of magnetism[J]. Scientific Reports,2014,4:1-5.

[39] VELEV J P, JASWAL S S, TSYMBAL E Y. Multi-ferroic and magnetoelectric materials and interfaces[J]. Philosophical Transactions Series A: Mathematical, Physical, and Engineering Sciences,2011,369(1948):3069-3097.

[40] CAI H, WANG Y, KANG W, et al. Enabling resilient voltage-controlled meram using write assist techniques[C]//2018 IEEE International Symposium on Circuits and Systems (ISCAS). Florence:IEEE,2018:1-5.

[41] BORDERS W A, PERVAIZ A Z, FUKAMI S, et al. Integer factorization using stochastic magnetic tunnel junctions[J]. Nature,2019,573(7774):390-393.

[42] LI Q Y, ZHANG P H, LI H T, et al. Experiments and SPICE simulations of double MgO-based perpendicular magnetic tunnel junction[J]. Chinese Physics B,2021,30(4):047504.

[43] KARI S R. Realization of stochastic neural networks and its potential applications[EB/OL]. (2011-06-27)[2024-02-11]. http://arxiv.org/abs/2011.06427v1.

[44] 刘荣华,李丽媛,陈丽娜,等. 自旋霍尔纳米振荡器的非线性动力学及其应用[J]. 物理学进展,2020,40(6):195-210.

[45] BRATAAS A, KENT A, OHNO H. Current-induced torques in magnetic materials[J]. Nature Materials,2012,11(5):372-381.

[46] RALPH D C, STILES M D. Spin transfer torques[J]. Journal of Magnetism and Magnetic Materials,2008,320(7):1190-1216.

[47] JIANG W C, CHEN L N, ZHOU K Y. Physical reservoir computing using magnetic Skyrmion memristor and spin torque nano-oscillator[J]. Applied Physics Letters,2019,115(19):192403.

[48] MACIA F, HOPPENSTEADT F C, KENT A D. Spin wave excitation patterns generated by spin torque oscillators[J]. Nanotechnology,2014,25:045303.

[49] LI L Y, CHEN L N, LIU R H, et al, Recent progress on excitation and manipulation of spin-waves in spin Hall nano-oscillators[J]. Chinese Physics B,2020,29(11):117102.

[50] CLERC M G, COULIBALY S, LAROZE D, et al. Alternating spin-polarized current induces parametric resonance in spin valves[J]. Physical Review B,2015,91(22):224426.

[51] CHOI Y S, YOO M W, LEE K S, et al. Out-of-plane current controlled switching of the fourfold degenerate state of a magnetic vortex in soft magnetic nanodots[J]. Applied Physics Letters,2010,96(7):072507.

[52] KAKA S, PUFALL M R, RIPPARD W H, et al. Mutual phase-locking of microwave spin torque nano-oscillators[J]. Nature,2005,437:389-392.

[53] URAZHDIN S, TABOR P, TIBERKEVICH V, et al. Fractional synchronization of spin-torque nano-oscillators[J]. Physical Review Letters,2010,105(10):104101.

[54] SLONCZEWSKI J. C. Excitation of spin waves by an electric current[J]. Journal of Magnetism and Magnetic Materials,1999,195(2):L261-L268.

[55] YOKOUCHI T, SUGIMOTO S, RANA B, et al. Pattern recognition with neuromorphic computing using magnetic field-induced dynamics of Skyrmions[J].Science Advances,2022,8(39):5652.

[56] APPELTANT L, SORIANO M, VAN DER SANDE G, et al. Information processing using a single dynamical node as complex system[J]. Nature Communications,2011,2:468.

[57] JAEGER H, HAAS H. Harnessing nonlinearity: predicting chaoticsystems and saving energy in wireless communication[J]. Science,2004,304(5667):78-80.

[58] PUSKORIUS G, FELDKAMP L. Neurocontrol of nonlinear dynamical systems with Kalman filter trained recurrent networks[J]. IEEE Transactions on Neural Networks,1994,5(2):279-297.

[59] GROLLIER J, QUERLIOZ D, STILES M D. Spintronic nanodevices for bioinspired computing[J]. Proceedings of the IEEE,2016,104(10):2024-2039.

[60] MOON J, MA W, SHIN J H, et al. Temporal data classification and forecasting using a memristor-based reservoir computing system[J]. Nature Electronics,2019,2:480-487.

[61] ZHENG Q, ZHU X R, MI Y Y, et al. Recurrent neural networks made of magnetic tunnel junctions[J]. AIP Advances,2020,10(2):025116.

[62] NAKANE R, HIROSE A, TANAKA G. Spin waves propagating through a stripe magnetic domain structure and their applications to reservoir computing[J]. Physical Review Research,2021,3(3):033243.

[63] HOUSHANG A, ZAHEDINEJAD M, MURALIDHAR S, et al, Phase-binarized spin hall nano-oscillator arrays: towards spin hall ising machines[J]. Physical Review Applied,2022,17:014003.

[64] SLAVIN A, TIBERKEVICH V. Nonlinear auto-oscillator theory of microwave generation by spin-polarized current[J]. IEEE Transactions on Magnetics,2009,45(4):1875-1918.

[65] UCHIDA K, TAKAHASHI S, HARII K, et al. Observation of the spin Seebeck effect[J]. Nature,2008,455(7214):778-781.

[66] LITVINENKO A, KHYMYN R, GONZLEZ V H, et al. A spinwave Ising machine[J]. Communications Physics,2023,6(1):227.

[67] MOY W, AHMED I, CHIU P W, et al. A1,968-node coupled ring oscillator circuit for combinatorial optimization problem solving[J]. Nature Electronics,2022,5:310-317.

[68] ALBERTSSON D I, RUSU A N. Highly reconfigurable oscillator-based Ising Machine through quasiperiodic modulation of coupling strength[J]. Scientific Reports,2023,13:4005.

[69] WANG T S, ROYCHOWDHURY J. OIM: oscillator-based ising machines for solving combinatorial optimisation problems[C]//MCQUILLAN I, SEKI S. Lecture Notes in Computer Science. Cham: Springer International Publishing,2019:232-256.

[70] MCGOLDRICK B C, SUN J Z, LIU L Q. Ising machine based on electrically coupled spin hall nano-oscillators[J]. Physical Review Applied,2022,17:014006.

[71] SRINIVASAN G, SENGUPTA A, ROY K. Magnetic tunnel junction based long-term short-term stochastic synapse for a spiking neural network with on-chip STDP learning[J]. Sci Rep,2016,6:29545.

[72] 张亚君,蔡佳林,乔亚,等. 基于磁性隧道结的群体编码实现无监督聚类[J]. 物理学报,2022,71(14):148506.

[73] LI H T, LI L L, ZHOU K Y, et al. Stochastic spin-orbit-torque device as the STDP synapse for spiking neural networks[J]. Science China: Physics, Mechanics amp; Astronomy,2023,66(5):257512.

[74] DEBASHIS P, CHEN Z H. Tunable random number generation using single superparamagnet with perpendicular magnetic anisotropy[C]//2018 76th Device Research Conference (DRC). Santa Barbara:IEEE,2018:1-2.

[75] KIM Y, FONG X, ROY K. Spin-orbit-torque-based spin-dice: a true random-number generator[J]. IEEE Magnetics Letters,2015,6:3001004.

[76] FUKUSHIMA A, SEKI T, YAKUSHIJI K, et al. Spin dice: a scalable truly random number generator based on spintronics[J]. Applied Physics Express,2014,7(8):083001.

[77] CHOI W H, L Y, KIM J, et al. A magnetic tunnel junction based true random number generator with conditional perturb and real-time output probability tracking[C]//2014 IEEE International Electron Devices Meeting. San Francisco:IEEE,2014.

[78] FU S Q, LI T J, ZHANG C Y, et al. RHS-TRNG: a resilient high-speed true random number generator based on STT-MTJ device[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems,2023,31(10):1578-1591.

[79] VATAJELU E I, DI NATALE G. High-entropy STT-MTJ-based TRNG[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems,2019,27(2):491-495.

[80] PERACH B, KVATINSKY S. An asynchronous and low-power true random number generator using STT-MTJ[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems,2019,27(11):2473-2484.

[81] VATAJELU E I, DI NATALE G, PRINETTO P. STT-MTJ-based TRNG with on-the-fly temperature/current variation compensation[C]//2016 IEEE 22nd International Symposium on On-Line Testing and Robust System Design (IOLTS). Sant Feliu de Guixols:IEEE,2016:179-184.

[82] PARKS B, BAPNA M, IGBOKWE J, et al. Superparamagnetic perpendicular magnetic tunnel junctions for true random number generators[J]. AIP Advances,2018,8(5):055903.

[83] VODENICAREVIC D, LOCATELLI N, MIZRAHI A, et al. Low-energy truly random number generation with superparamagnetic tunnel junctions for unconventional computing[J]. Physical Review Applied,2017,8(5):054045.

Spin-based Brain-like Neuromorphic Computing

ZHANG Shuai1, CHEN Lina2, LIU Ronghua1

(1. School of Physics, Nanjing University, Nanjing 210093, Jiangsu;

2. School of Science, Nanjing University of Posts and Telecommunications, Nanjing 210023, Jiangsu)

Brain-like neuromorphic computing aims to simulate and implement the brain's information processing and learning capabilities to address complex computational problems. One of the key ideas is to mimic the behavior of biological neurons and synapses to achieve information transmission, processing, and storage. With their non-volatile nature, high speed, low power consumption, near-infinite durability, and inherent nonlinearity, spintronic devices have been widely explored and shown remarkable performance in neuromorphic computing. Based on various magnetoresistance effects, spin-transfer and spin-orbit torques, voltage-controlled magnetic anisotropy, and nonlinear magnetization dynamics, this review provides an overview of the application of different spintronic devices in reservoir computing, Ising machines, spiking neural networks, and true random number generators. These examples are just the tip of the iceberg, but they demonstrate the promising potential of spin-based brain-like neuromorphic computing hardware in artificial intelligence chips.

spintronics; neural network; neuromorphic computing; brain-inspired artificial intelligence chip

(编辑 陶志宁)

猜你喜欢

类脑磁矩储备
世界首款类脑互补视觉芯片研制成功
释放钾肥储备正当时
基于多尺度网格细胞模型的无人机类脑矢量导航方法
国家储备林:为未来储备绿色宝藏
中国成立“类脑国家实验室”“借鉴人脑”攻关人工智能
外汇储备去哪儿了
CoFeB/MgO磁隧道结的低电流密度磁矩翻转特性
两种计算带电轻子磁矩的尝试
用微元法讨论旋转均匀带电球的磁矩
同轴带电刚体转动惯量与磁矩的大小比较