类脑智能研究热点及趋势
2021-04-25刘洁吴慧
刘 洁 吴 慧
(上海交通大学医学院,上海 200025)
引言
人脑是自然界中最复杂的系统之一,由上千亿神经细胞(神经元)通过百万亿突触组成巨大网络,实现感知、运动、思维、智力等各种功能。理解大脑的结构与功能,是21世纪最具挑战性的前沿科学问题,是人类认识自然与自身的终极挑战[1]。脑科学对各种脑功能神经基础的解析对有效诊断和治疗脑疾病有重要的临床意义,脑科学所启发的类脑智能研究可推动新一代人工智能技术和新型信息产业的发展。类脑智能是受大脑神经运行机制和认知行为机制启发,以计算建模为手段,通过软硬件协同实现的机器智能[2]。类脑智能具备信息处理机制上类脑、认知行为表现上类人、智能水平上达到或超越人的特点[3]。类脑智能作为人工智能的另一条发展路径,也是实现通用人工智能的最可能路径,成为各国关注的焦点。近年来全球发达国家积极布局类脑智能研发,取得了一定的进展。
本文以Web of Science数据库为检索对象,以“类脑智能研究”为主题,以Article为文献检索类型,对时间跨度为2010—2019年的文献进行检索,检索日期为2020年1月31日。利用CiteSpace软件[4](JAVA环境下运行)对检索结果进行可视化分析,并绘制成知识图谱呈现,探讨全球类脑智能发文的代表文献及研究热点、前沿,对全球类脑智能研究趋势进行分析,并对类脑智能的前沿热点进行综述。
图1 2010—2019年全球类脑智能研究发文情况Fig.1 Analysis of publications on brain-inspired intelligence during 2010-2019
1 类脑智能全球发文趋势
全球类脑智能研究发文数量随时间的变化如图1所示,其SCI(Science Citation Index)论文产出在2010—2019年间持续增长,共发文6 351篇。但在2016年之前增长较为缓慢,2016年发文量652篇,占比10.27%,2017—2018年、2018—2019年连续出现较大的增长,增幅达到35.46%和28.95%。2019年达到1 394篇,占比21.95%。
2 类脑智能研究热点
研究热点可以理解为是在某个领域中学者共同关注的一个或者多个话题。利用CiteSpace软件分析研究主题的词频以及词汇的突发性,可以反映其所代表的研究主题的热点及热点的演变[5]。
图2中节点大小代表关键词出现的频次,出现频次越高,节点越大,之间的连线代表共现强度[5](为了显示简洁性,图中仅为频次top 20的关键词进行了标注),“brain-computer interface” “EEG” “classification” “brain” “machine learning”是类脑智能研究领域被引频次最高的关键词。在CiteSpace图谱中,中介中心性(betweenness centrality)是指一个节点担任其他两个节点之间最短路的桥梁的次数,既是与其他节点高度相连的枢纽节点,又是连接不同聚类的纽带,是测度节点在网络结构中重要性的指标。同时,具备高频和高中介中心性高的节点在该研究领域有重大学术价值[5]。“brain-computer interface”作为类脑智能研究中被引频次最高的关键词,其中介中心性高达0.65(中介中心性大于等于0.1的节点视为关键节点)。对类脑智能研究的关键词进行聚类分析(见表1),各聚类的轮廓值均大于0.7,说明聚类令人信服,聚类内部的研究主题明确。由图2和表1可以看出,基于大脑认知的脑机接口(brain-computer interface,BCI)研究是类脑智能研究的热点。
图2 2010—2019年类脑智能研究关键词的共现情况Fig.2 Keyword network of brain-inspired intelligence during 2010—2019
具有突发性的关键词,是指在某个时间段内频次变化率高的词[6]。在CiteSpace中,一个聚类所包含的突发节点越多,那么该领域就越活跃。图3所示为2010—2019年间类脑智能研究领域突现强度最高的20个关键词。由图3和表1分析得知,聚类#4、#7和#8包含“perception”“area”“human brain”等突现值和中介中心性均较高的关键词,聚焦于大脑神经解码,说明2014年前的研究热点集中在解码大脑神经细胞的信息处理,了解脑区及其功能的关系,即理解脑。2014—2016年间致力于特定的脑功能神经连接通路和网络结构的解析以及模拟,这一时期“arm”“language”“decision making”等相关研究急剧增长,并且产生较大影响。“organization” “schizophrenia” “rehabilitation” “mild cognitive impairment”等关键词在2016年之后活跃度增加,突现值较高,说明类脑智能的研究热点演化趋势从认识脑发展至模拟脑,从而保护脑,利用已知的脑功能工作原理,发展人工智能研究,保护大脑,维持大脑的正常功能,延缓大脑退化,防治脑疾病和创伤,促进智力发展。
表1 2010—2019年类脑智能研究关键词的聚类信息Tab.1 Cluster table of keywords on brain-inspired intelligence during 2010-2019
图3 2010—2019年类脑智能研究关键词突变图(蓝色—时间区间;红色加粗线条—突变度发生显著变化的时间区间)Fig.3 Burst keywords of brain-inspired intelligence during 2010-2019 (The blue line—time; the thick red line—duration of a great burst)
大脑中上千亿的神经细胞发出众多轴突,与其他细胞联接形成一个复杂的网络,是人体内外环境信息获得、存储、处理、加工及整合的中枢。虽然目前脑科学领域取得一些进展,但对神经环路及整个大脑复杂的网络结构的工作原理了解不多,对各种感知觉、情绪,高级认知功能的思维、意识理解尚为粗浅。因此,大脑认知研究存在两个关键点:首先,从宏观、介观、微观上深度理解大脑的功能和结构,利用MRI等技术了解神经束在脑区之间的走向,以及神经活动的产生原理;其次,解决观测电信号以及电信号在网络中的处理模式等问题[7]。只有充分了解大脑认知功能的神经基础和工作原理,才能在此基础上实现类脑智能发展。
传统人工智能系统的思路是基于模型学习驱动的数据智能,以待解决问题相关数据的特点与问题为目标,从计算的视角设计算法,因此所实现的智能系统过于单一,存在一定的局限性,但是类脑智能可以解决数据智能的局限性和不足。类脑智能研究的目标是构建高度协同视觉、听觉、触觉、语言处理、知识推理等认知能力的多模态认知机器[8],也就是借鉴脑科学神经计算的研究结果,研究类脑神经机制,发展出性能更好、效能更高的新一代人工神经网络模型,使机器在与人及环境自主交互的基础上实现智能水平的不断提升,让机器人以类脑方式实现对外界的感知及自身控制一体化,真正具备高度协同、多模态感知、类人思维、自主学习与决策能力等特征[9-10]。
计算神经科学在类脑计算、人工智能和BCI的发展中起关键作用。脑科学的神经计算和类脑智能研究是指针对包括遗传、神经元、脑影像、大规模认知功能等在内的海量数据,通过定量分析、计算模型和创建受脑启发的随机计算方法,深入研究神经系统的原理,解码大脑工作原理,模拟大脑高级认知功能机理,发展类脑智能算法[2,11]。因此,通过与脑科学的紧密联系和深度交叉,构建更加类脑的神经网络计算模型和学习方法,是类脑智能的研究热点。
3 类脑智能研究前沿
文献共被引分析是通过同时被其他文献所引用的频率来分析文献之间的关系,可以使研究者更深入、客观地理解学科的结构及发展趋势等[5]。结合引证分析和共引分析,创建从“知识基础”映射到“研究前沿”的理论模型,通过多种阈值选择形成独特的由多个文献共被引网络组合而成的知识网络,并提供部分自动生成的信息,利用这些信息可以解读网络体现的指标信息[6,12]。因此,可以通过对某一研究领域的演进路径进行分析,把握研究发展动态,预测未来研究动向。
图4 2010—2019年类脑智能文献共被引聚类时间线图(紫色外圈代表节点的高中介中心性;大红色圈层表示节点具有突现性,一定程度上代表研究方向的转变;黄色代表距今时间较近。节点大小代表文献的被引频次,被引频次越高,节点越大,之间的连线代表共现强度)Fig.4 Timeline view of co-citation on brain-inspired intelligence during 2010-2019(The purple circle represents the high betweenness centrality of the node; the red circle represents the burstness of the node, which means the change of research direction to a certain extent; the yellow represents closer time. The size of the node represents the citation frequency of the document. The higher the citation frequency, the larger the node, and the connection between them represents the strength of co-occurrence)
利用CiteSpace导入前述检索文献后,共产生27个聚类,通过对数似然算法,从所引文献的关键词中提取术语为聚类命名,并以时间线视图呈现(见图4)。时间线视图将同一聚类排布在同一水平线上,可以直接表达聚类之间的关系和文献的历史跨度。由于聚类较多,仅显示前15个较大聚类。同时,表2中与此对应的轮廓值均接近1,说明各聚类内部的研究主题明确。如图4所示,聚类中的突发节点越多,表示该领域越活跃,是研究的新兴趋势。同时具备高中介中心性和突现性的节点,就是本领域内的关键文献,也是这段时期内的关键文献,代表着研究主题的发展趋势。整体看来,2010—2019年间产生了数量多、影响力高的研究文献。由图4和表2可以看出,“脑机接口”是类脑智能研究中最大的聚类(编号越小,聚类越大),包含聚类#0、#1、#3、#4、#5、#9、#10、#12以及#14(brain-machine interface和brain-computer interface均指脑机接口,不同作者表述方式不同),表明在未来一段时间内仍是类脑智能研究的发展趋势。
BCI技术是指在人或动物脑(或者脑细胞的培养物)与外部设备间建立直接连接通路,使计算机从大脑神经活动获知人的行为意向,通过神经解码,将大脑的神经信号转化为对外部设备的控制信号[20, 26]。
#0呈现最大的聚类,围绕使用BCI来分析各种感觉运动和学习过程,2000年后热度持续增加,于2008年达到高峰。Velliste 等[13]通过展示猕猴利用运动皮层活动来控制自我喂养任务中的机械手臂复制品,实现了一种可以实现假体控制的系统,将BCI研究上升到物理交互层面,为开发灵活的假肢设备奠定了基础;该文献中介中心性高达0.83,突现值为30.26,是连接整个聚类的重要节点,有里程碑式的影响。2009年,Ganguly等[7]进一步提出运动皮质在存在恒定解码器的情况下可以巩固人工控制的神经表示,推动了类脑智能研究的进展;该文献中介中心性0.37,突现值10.33,是该领域的重要文献。2012年,Gilja等[23]提出了一种新的控制算法,重新校正反馈意图训练卡尔曼滤波器,在植入运动皮层电极阵列的恒河猴身上进行测试,该算法的性能及可重复性均优于原有的神经假体算法,提高了神经假体的临床适应能力(#12)。
表2 2010—2019年类脑智能文献共被引的聚类信息Tab.2 Clusters of co-citation on brain-inspired intelligence during 2010—2019
#14聚焦于解码大脑神经信息及其在神经影像领域的应用,2008—2016年处于繁荣期。2014年,Haufe等[25]针对从数据驱动模型的参数解读神经过程起源容易导致错误结论的问题,提出将后向模型转换为正向模型,进而对线性后向模型的参数进行神经生理学解释,为更好的多元神经影像分析提供了理论保障。
根据信号采集方式的不同,BCI分为侵入式和非侵入式(#10)。Oostenveld[21]等在2011年提出FieldTrip工具箱概念,用于分析非侵入式和侵入式电生理数据,极大地促进了BCI的发展。
#1脑磁图(magnetoencephalography,MEG)和#4功能核磁共振成像(functional magnetic resonance imaging,fMRI)等是常用的非侵入式技术,2003年开始应用于BCI研究,于2015年热度逐渐降低。非侵入式BCI无需侵入大脑,只需通过附着在头皮上的穿戴设备来对大脑信息进行记录和解读[27]。典型的非入侵式BCI包括MEG、fMRI以及脑电图(electroencephalogram,EEG),成本较低,对人体创伤最小,采集方法最为简单,因此2015年之前受到了极大关注。2008年,Moritz等[14]利用猕猴实验,首次证明了皮层细胞和肌肉之间的直接人工连接可以补偿被中断的生理途径,并可以恢复对瘫痪肢体运动的意志控制,这一发现大大扩展了BCI的控制信号源;该文献中介中心性为0.28,突现值为20.34,是该领域内的关键文献。2009年,Pereira等[17]详细介绍了fMRI数据分类器的使用,并指出未来基于机器学习的分类器技术将发生巨大变化,不仅对医学图像分析处理起到了巨大的推动作用,而且在之后的研究中,用深度学习方法进行数据分析呈现快速增长趋势,成为2013年的10项突破性技术之一。随着深度学习研究的深入,Qamar等[28]于2018年提出了一种3D超密集连接的卷积神经网络(convolutional neural networks,CNN),用于婴儿大脑图像分割,可以提高分割的参数效率和分割精度,推动了医学图像的自动准确分割技术的发展。
EEG因其易用性、便携性和相对较低的技术价格,已得到广泛和深入的研究,成为非侵入式BCI主要的研究方向,但是由于信号信息量有限, 空间分辨率不足, 在控制的实时性和复杂度方面存在制约[16]。2008年,Blankertz 等[16]介绍了一种基于EEG的功能强大的信号处理技术——公共空间模式(common spatial pattern,CSP),有效提高了信噪比,推动了BCI信号处理技术的发展(#3)。2018年,Vyas等[29]证明在没有身体动作的情况下,“隐蔽学习”可以转变为明显行为,二者源自共同的神经基质,该神经基质由运动皮层的准备活动组成,有助于学习的转移。Amin等[30]于2019年使用EEG运动图像数据来揭示从不同CNN层提取和融合多级卷积特征,证明这种多级特征融合优于仅使用最后一层特征的模型,促进了EEG解码和分类技术的发展。
侵入式BCI通过手术等方式,直接将电极植入到大脑皮层,可以记录到神经元水平的电信号,主要用于对特殊感觉的重建以及恢复瘫痪患者的运动功能。作为典型的部分侵入式BCI,皮质脑电图(electrocorticography,ECoG)(#5)是将信号采集电极植入到颅腔内,但在灰质外能够获取更高空间分辨率(约1 cm)和时间分辨率(5 ms)的信息且不会破坏脑组织,对于研究大脑皮层的认知功能是较为理想的选择。ECoG技术开始于2003年,研究热度逐年增加,于2012年—2014年达到研究高潮,出现较多影响力较高的文献。Hochberg等[18]于2012年利用人体进行实验,证明四肢瘫痪的人在中枢神经系统受伤数年后,可以直接从复杂的装置中重建有用的多维控制的小部分神经信号,该文献中介中心性0.15,突现值13.15,是该领域的重要文献。近年来,侵入式BCI技术因其记录的信号空间分辨率高、信息量大,能够实现对复杂任务的实时、精确控制,在治疗癫痫、瘫痪、小儿麻痹症、帕金森症等疾病方面展开了较为广泛的应用[18]。
#7“深度学习”概念出现于2010年,热度持续上升,于2017年达到高潮,出现较多高影响力的文献。#7和#9侧重针对深度卷积神经网络(deep convolutional neural network,DCNN)研究展开。Lecun 等[20]在2015年提出深度学习允许由多个处理层组成的计算模型学习,具有多个抽象级别的数据表示,通过使用反向传播算法来指示机器应如何更改其内部参数,从而发现大数据集中的复杂结构。DCNN在处理图像、视频、语音和音频等方面取得了突破,而递归网络则对诸如文本和语音之类的顺序数据有所启发。该文献中介中心性为0.29,是该聚类中的重要文献。2017年,Krizhevsky等[9]的研究结果表明,大型DCNN能够在纯粹使用监督学习的情况下,在极具挑战性的数据集上实现破纪录的结果。移除任何一个卷积层则会导致网络的性能下降,证实了网络的深度对于结果实现至关重要,该文献中介中心性高达0.56,突现值为35.85,是该领域的重要文献。2018年,Acharya等[31]提出一种计算机辅助诊断癫痫的系统,使用机器学习技术自动区分EEG信号的类别,首次使用CNN分析脑电信号。2018年,Alban等[32]揭示了深度卷积神经网络中色度信息的处理机制,发现了AlexNet中的颜色处理与灵长类视觉系统之间的相似之处。受到DCNN在计算机视觉领域的最新成功的启发,Chen 等[33]开发了一种3D深度残差网络,该网络可以将真实的微出血与以前基于传统算法开发的技术的假阳性模仿物区分开,大大提高了检测精度。
#13侧重于训练DCNN应用于医学图像处理,2015年后研究数量增多,热度持续增加。Ronneberger等[24]提出了一种网络结构的训练策略,依赖于充分利用数据增强技术来更高效地使用带有标签的数据,这种方法可以使用非常少的数据完成端到端的训练,并获得最好的效果。2019年,Bi等[34]提出,人工智能(artificial intelligence,AI)有望在专业临床医生对癌症影像的定性解释方面取得重大进展,包括随着时间的推移对肿瘤的体积描绘,从肿瘤的放射表型推断肿瘤基因型和生物学过程,预测临床结果,以及疾病和治疗对邻近器官的影响评估。
目前,神经发育疾病(如自闭症)、精神疾病(如抑郁症)和神经退行性疾病(如阿尔茨海默症)在社会重大疾病中占比最高,尚无法确定致病机理,且未发现特异的药物靶点,给社会造成沉重负担。早期诊断和早期干预将是对脑疾病最有效的医疗方式。继续探索这些脑重大疾病的致病机理有赖于阐明脑认知功能的神经基础,研发出有效的脑重大疾病预警和早期诊断的各种指标,研发早期干预的药理、生理和物理新技术和新仪器,是当前类脑智能研究趋势之一。2017年,Arbabshirani等[22]较为全面地介绍了有关精神分裂症、抑郁症和阿尔茨海默氏病等大量基于MRI的脑部疾病诊断/预后研究,并讨论了多模式神经影像学、深度学习在神经影像学中的应用,指出神经影像数据对于各种疾病的单个受试者预测具有巨大潜力,推动了脑疾病治疗进展。Ramos-Murguialday等[15]通过实验证明BCI训练可诱导慢性中风患者运动功能的改善;Nijboer等[19]的研究评估了基于P300的BCI通信设备对晚期肌萎缩侧索硬化(amyotrophic lateral sclerosis,ALS)患者具有良好的治疗效果,提出BCI可以为ALS严重残障人士的日常生活提供另一种通信和控制技术(#2)。
“神经形态工程学”出现于2008年,Merolla等[10]于2014年开发了新一代灵活可扩展的具有54亿个晶体管的芯片,该芯片集成了100万个可编程的尖峰神经元和2.56亿个可配置的突触,适用于实时使用复杂神经网络的应用程序,且能耗较小。中介中心性0.19,突现值12.54,是该领域的代表文献。
4 总结与展望
2010年—2019年全球类脑智能研究发文数量呈现逐年上涨的趋势,尤其是2014年以后,各国呈现出爆发式增长,说明类脑智能研究在近5年来日益得到重视,且影响力不断提高。
2018年,Lu等[35]提出“超越AI”的BI(Brain Intelligence)概念,旨在通过开发一种新的通用智能学习模型,使用具有想象功能的人工生命来产生新的想法,应用于精密医疗保健等领域。2020年,Yao等[36]进一步提出囊括BCI技术的“脑器接口(bacomics,BAC)”概念,将BCI研究提升到另一个高度。BAC进一步加深了脑机对话层次,不仅将脑机接口中机器的范围扩大,包含人类其他器官、外部仪器及环境,而且加深了“交互”概念,强调大脑与设备/环境间的双向通信,促进脑机协调发展。BAC涵盖3种层次:①大脑正常,但对话通道被禁用,BAC在这种情况下的任务是重建或者打开新的通道以激活大脑功能;②大脑处于疾病状态,BAC可以利用现有的或开辟新渠道(如药物)进行干预,修复和调节大脑;③大脑和通道都正常,BAC的目标是增强大脑及设备/环境协调发展。BAC的提出不仅促进了传统神经工程领域的发展,而且成为干预和治疗脑疾病的强大工具,有助于针对各种功能障碍的神经机制研究。
作为类脑智能与神经科学的桥梁,计算神经科学近年来在国际迅猛发展,已经从实验室基础研究进入信息科技领域的实际应用;同时,类脑人工智能的发展,也为脑科学研究提供了新的思路。加快二者的交叉和深度融合,将极大地推动脑科学基础研究的进步和类脑智能研究的突破,改变社会生产和消费方式。目前,以深度学习为代表的人工智能技术对社会发展的影响不断加深,改变了包含互联网业务在内的多个领域的现有模式[20]。包括美国、中国以及欧洲在内的多个国家和机构均致力于该领域的发展。其中,突出代表为德国的“工业4.0”,通过智能算法和智能芯片推动生产制造业的巨大发展,使得生产制造过程具备自我感知、自我学习和自我优化等特点[37]。德勤发布的一项最新人工智能报告称:到 2025 年,全球人工智能市场规模将达到6万亿美元[38]。以上表明以“类脑智能引领人工智能发展”为标志的新一代人工智能通用模型与算法、类脑芯片器件和类脑智能各类工程技术应用等新型研究领域正在不断形成,其中蕴含着重大机遇,可能会颠覆传统产业模式,产生巨大效益。
神经科学和类脑智能科技的进步不仅有助于人类理解和认识自我,而且可以有效增进精神卫生和防治神经疾病、护航健康社会。美国科学院《新兴认知神经科学及相关技术》报告指出,未来20年,与神经科学和类脑人工智能有关的科技进步很可能对人类健康、认知、国家安全等多个领域产生深远影响[39]。
综上,类脑智能的年发文量及学术影响力不断趋于增长。认识脑、模拟脑和保护脑是目前类脑研究的聚焦点,BCI不仅是目前的研究热点,其与深度学习的深入交叉也是类脑智能领域的研究前沿和发展趋势。类脑智能研究是人工智能、计算机科学、脑科学等研究领域的融合,实现具有通用认知能力和自主学习能力的智能机器。大脑认知的研究进展将为揭示人类智能本质提供更多线索,为实现类脑智能提供更深层次的启发。