论“深度学习”及其翻译问题
2021-11-21李婧萍
李婧萍
摘 要:近些年来,“深度学习”频现于教育界和计算机科学领域,出现了指称同一但内涵相殊的问题,因此,有必要对这一概念按语境加以区分,并提出贴切的名称翻译方案。经追溯分析可以看出,机器的“深度学习”得名于人类学习,它是一种概念隐喻,其本质是算法及算法规定下的运算过程,最终的“学习”结果可以预测;人类的深度学习则涉及情感、环境等因素,是诸多变量共同作用下的复杂心智活动,其结果因人而异。由此可见,译名不能简单混用,故提出新的译名建议,以避免因译名不当而出现混淆概念的现象。
关键词:深度学习;深层学习;机器学习;术语翻译
在教育界,深度学习的理念由来已久,从中国的孔子到英国的培根,都多次谈到这一问题。美国教育家布卢姆从认知视角归纳出教育目标的六个层级,深度学习又进入了教學法设计。随着我国2017年最新版课程标准提出培养“核心素养”的育人理念,国内对深度学习的关注度再次上升。核心素养是培养目标,而深度学习是落实途径。同时,在计算机科学领域,人工智能取得了长足的发展,“深度学习”的概念亦频频出现,有时难免会引起与教育界同名概念的混淆和误解。基于此,本文聚焦“深度学习”在上述两个领域的概念实指,深入分析其区别与联系,进而提出区分译名的具体方案。
一、教育教学领域的“深度学习”
(一)教育界“深度学习”概念溯源
“学而不思则罔,思而不学则殆”凝聚着先哲孔子的教育思想,一味地读书学习而不加以思考会陷入迷茫;相反,只思索而不阅读学习则会充满疑惑。孔子既否定读死书的学习方式,也不赞同脱离知识基础凭空思考,这体现了阅读输入加内化反思的深入学习思想。英国著名哲学家弗朗西斯·培根则主张从提出问题、观察分析到逐一验证并得出结论的探究式学习方法,这种层层递进的逻辑分析,也属于深度学习。两者都主张深入分析以至内化的学习方式。
当代美国著名心理学家、教育家布卢姆谈到学习有深浅层次之分,基于认知学相关理论,布卢姆将教育目标划分为记忆、理解、应用、分析、评价和创造六个层级。其中,记忆与理解属于浅层次学习,而应用、分析、评价和创造则属于深层次学习。各个层级之间相互联系、层层递进,但并无严格界限[1](P76)。换言之,浅层学习尚停留在对现有知识信息的消化与吸收层面,而深层学习则蕴含高阶思维,意指学习者基于已掌握的知识在遇到问题时能够发生知识迁移从而解决实际问题。
教育目标分类学在教育教学领域影响深远,深度学习(deep Learning)便是在这样的理论背景下由美国学者Marton & S?lji?于1976年首先倡导的,它是关于学习层次的一个概念,作者基于学生阅读的实验,针对孤立记忆和非批判性接受知识的浅层学习(surface Learning)而提出这一观点[2](P57)。随后,美国教育改革专家Jensen & Nickelsen詹森阐释了“深度学习”的过程,作者认为,深度学习是学生基于已有微知识,在教师的指导下,通过自主学习、合作学习或探究学习,将它与其他微知识联结起来,并借助相关的训练来获得一个完整的、综合的新知识的过程[3](P12)。
国内教学领域明确使用“深度学习”概念的时间则相对较晚。2005年,随着教育改革的不断推进,翻转课堂、慕课等概念一同被引入中国;2014年,教育部基础教育课程教材发展中心在全国多地开展深度学习教学改进项目,这个概念逐渐为教育界特别是基础教育领域所熟知。
自“深度学习”的名称被明确提出以后,国内研究特别是中学阶段各学科的教育研究,从教学研讨到论文撰写,大都会关涉到这一概念,颇有将其奉为圭臬之势。同时,深度学习的自然归宿与2017年最新修订的普通高中课程标准中的“核心素养”育人目标暗合。于是,以深度学习为主题的发文量便出现井喷式增长现象。中国知网数据库该主题下的发文量,1994年之前每年均在10篇以内,2005年为101篇,至2019年已多达27231篇。需要指出的是,另一个重要驱动力是得益于深度学习在计算机领域的飞速发展,这一点将在后文详述。
(二)教育界“深度学习”内涵解读
有别于重在“传递”知识的、以记忆为主的表层学习,亦非流于形式的探究学习,郭华指出,“所谓深度学习,就是指在教师引领下,学生围绕着具有挑战性的学习主题,全身心积极参与、体验成功、获得发展的有意义的学习过程。”[4]
尽管教育界对深度学习的阐释角度不尽相同且各有侧重,但仍可发现深度学习在教育界的概念界定有以下共同点:深度学习是一种蕴含高阶思维的、批判性的学习,经常与浅度学习相比较,深度学习之“深”主要体现在学习者对信息的深入加工和对复杂概念的透彻理解层面,其最终目标指向学习者将内化的知识迁移到新环境中解决问题[5]。基于对国内外相关文献的梳理分析,我们将教育教学领域深度学习和浅度学习的区别与联系进行了总结,具体如表1所示:
值得注意的是,从学习者角度来衡量,深度和浅度学习之间不存在绝对的边界,学习者对信息的加工只是在程度上有浅层处理(surfuce-level processing)或深层处理(deep-level processing)之别[6]。从教师教学角度来看,深度学习是一种教育价值观而并非可供直接套用的具体方法,与之相关的理论多是描述性的,而非规定性的。其内在原因是学生的学情存在不容忽视的个性差异,教师需要分析不同学生的具体学情,再制定适宜的教学策略,从而促成不同个体进行深度学习[7]。
二、计算机科学领域的“深度学习”
(一)计算机领域“深度学习”概念溯源
在计算机领域,深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等[8]。在大数据时代背景下,机器学习领域广泛研究和开发机器深度学习,旨在建立、模拟人脑来分析学习的神经网络,用以解释数据,如图像、声音和文本等。深度学习的便利之处是在于,能够运用非监督式或半监督式的特征学习提取高效算法来替代手工获取特征的过程。
二十世纪四十年代,神经科学研究模仿生物神经网络,开始构建具有识别和记忆功能的模型与算法。二十世纪六十年代,机器学习尚处于萌芽状态,从单层感知器逐步发展到多层感知器。机器学习在二十世纪末进入瓶颈期,原因是当时用于机器训练的数据量相对较小,难于从少量样本中提取有价值的特征,反向传播算法逐渐被放弃。直至2006年,Hinton & Salakhutdinov提出了一种无人监督的机器学习方法,主要采取逐层预训练的方式而成功训练了深度网络,重新推动了神经网络研究[9]。之后,各种深度神经网络模型应运而生,其中,影响最为深远的当属深度卷积神经网络(Convolutional Neural Network,简称“CNN”),它广泛应用于图像、音乐、音频等推荐系统中。从用户生成的显性或隐性数据开始,机器通过深度学习模型(如RBM、AE、CNN、RNN、DNN等)对数据加以分析,从而形成用户隐表示及项目隐表示,进而生成可视化的推荐列表。
由此可以看出,人工智能是为机器赋予类似人的智能,机器学习是一种实现人工智能的方法,而该领域的“深度学习”则是一种实现机器学习的技术。
(二)计算机领域“深度学习”内涵解读
从技术原理角度来看,所谓机器的“学习”,是指机器通过现有数据对未知条件作出预测和判断的过程。这种让计算机自行推理、自主学习的方式,即机器学习[10]。它本质上是计算机运算的过程,是一系列电子信号,既不具备生物神经网络的化学信号,也不具备人的思维和心理过程。所谓“机器的深度学习”,则是指机器对海量的不同类别的底层数据进行逐级自动分析,能够从多个隐藏层次中获取用户和项目的高层次特征,并最终表示出来。这一过程较少需要或不需要人工干预,大大提升了运算效率。
从应用情况来看,机器的深度学习技术应用范围广泛,目前的研究热点有图像处理、人脸识别、语音识别、自然语言理解、内容推荐系统的设计等[11]。在图像处理方面,自动驾驶领域的应用十分普遍,汽车、无人机要实现自动驾驶,摄像头所记录的数据就必须能夠迅速被解析成相应的物体,从而成功避开障碍物。监控设备则需要人脸识别技术,特别是像素不够清晰时仍然能有效辨别。基于机器深度学习技术,2014年,Facebook提出了DeepFace人脸识别算法;2015年,Google提出了FaceNet人脸识别算法;2018年,腾讯则提出了CosFace人脸识别算法并不断优化。在语音识别技术领域,中国科大讯飞处于世界领先水平,它推出的语音转录系统甚至可以识别部分方言。此外,各种内容推荐系统的设计也离不开深度学习技术的应用,日常生活中的种种智能推送就是最常见的情形。比如,音乐播放软件可以根据个人平时喜欢的音乐风格,推送类似的音乐作品;再如,假若用户经常关注某种商品,其购物车里就会塞满相应的商品信息,微博、微信平台也会根据用户兴趣投放相关广告等。这类网站实现自动推送的原理就是计算机通过复杂运算对大数据进行降级,找到逻辑上并非因果关系、但现象上共现的消费习惯,从而实现广告的定向投放,以达到盈利目的。
三、深度学习跨领域的互通性
(一)人的学习先于机器学习
可以说,“深度学习”概念在不同领域广泛使用的现象,已经引起相关领域研究人员的关注。李小涛等从计算机科学的角度,抨击教育学界误读“深度学习”概念,作者指出,深度学习仅指机器学习而不可用以讨论人的学习,并称其原因是缘于教育界盲目求新,受到盲目崇外的功利主义影响而套用概念[12]。对这一观点,笔者不敢苟同。第一,从哲学角度讲,非此即彼的思维方式仍局限在二元论的樊囿之中,很容易使研究者只关注到事物的对立面和矛盾面,却看不到它们潜在的联系,因而所得结论也往往是非此即彼,易流于偏狭。第二,从概念缘起讲,机器学习的研究兴起于人工智能时代大背景,而人工智能(AI)的全称为“Artificial Intelligence”,剑桥英语词典对其定义如下:“the study of how to produce machines that have some of the qualities that the human mind has, such as the ability to understand language, recognize pictures, solve problems, and learn”。由该定义即可清晰看出,人工智能是研究如何制造具有人类某些思维特性的机器,如理解语言、识别图像、解决问题和学习的能力。反观剑桥英语词典对“深度学习(deep Learning)”的定义,则包括两个义项:一是隶属教育界的义项:“a complete way of learning something that means you fully understand it and will not forget it”,译成中文为:“深度学习是一种彻底的学习方式,它意味着学习者能够完全理解所学知识且不会遗忘”。二是由此衍生出计算机领域义项:“a type of artificial intelligence that uses algorithms (=sets of mathematical instructions or rules) based on the way the human brain operates”,译成中文为:“深度学习是人工智能的一种,它使用基于人脑运作方式的算法(数学指令或规则集)”。从词源角度来看,孰先孰后已不言自明。正如我们不能因为火星被命名为“火星”之后才要承认它的真实存在,我们也不能因为计算机领域“率先”使用了“深度学习”的名称而否认“深度学习”首先发生于人的学习这一事实。同时,就其概念本身而言,人工智能(包括机器学习这一子领域)也始于对人脑的模仿。
(二)大数据时代深度学习的双重迫切性
二十一世纪最显著的时代特征之一便是信息过载。以往人们获取信息的方式相对单一,主要来自于纸媒、电视、广播等传统媒体。如今人人都可以是一个自媒体,人的社会属性中增添了网络用户的身份。人们每天都在主动获取或被动接收大量信息,与此同时,又有意或无意地产生着大量数据。现代观念认为,信息不等于知识。信息不仅数量庞大,而且有时还真伪难辨,即便对同一事件的描述和报道都难以做到一致,甚至会出现媒体观点截然相反的情况。在上述形势之下,如何去伪存真便成为当今人们认知世界的必备素养,这就需要对信息进行逻辑加工和深入分析。人们不能依赖机器告知自己哪条消息属实乃至哪个观点正确,毕竟企业的本质是以盈利为目的的,它们往往更在乎用户的关注度和访问量。因此,内容投放算法通常会按用户兴趣投其所好,推送的内容自然倾向于单一化、片面化。由此可见,信息接受者若想从中去伪存真,就需要借助深度学习。换言之,只有全方位获取信息并综合分析,才能避免自己的观点被算法塑造的局面。因此,在人机交互加剧的时代,人们比以往更需具备深度学习的能力。
另一方面,从企业发展角度来看,在大数据时代,谁能够率先准确地把握用户的数据规律和兴趣爱好,谁就可以率先完成定制化服务,也就能率先占领市场。中国是世界上网民数量最多的国家,拥有全球最庞大的用户数据,这无疑是一大优势。就目前而言,中国的电子商务平台、电子支付和云计算等已领先于世界其他国家。如何进一步利用好大数据,无疑是技术领域迫切需要关注的课题,从促进国家经济发展的角度是如此,从服务世界的角度亦是如此。简言之,在大数据时代背景下,机器的深度学习目标是在于发现用户偏好,发现用户共性;而人的深度学习目标则是在于去伪存真,发展个性。
四、概念译名的相关思考
从某种意义上来说,对“深度学习”进行深入剖析,也是反思人类自身学习与训练机器学习的过程。深度学习(deep learning)这一概念同时存在于教育教学和计算机科学领域,并非如某些研究者所说的那样是由盲目求新而导致的概念混用。我们认为,两个领域同时存在“深度学习”的根本原因是在于:技术革新让机器更加智能化,让人工智能逐渐接近人类智能,包括对信息的分析和加工。尽管如此,机器学习毕竟不同于人的学习,机器处理数据的过程严格遵照编程逻辑,没有情感因素和环境变量,但人脑对信息进行加工的每一个环节都是综合因素共同作用的结果,因此,在翻译时仍然有必要对其加以区分。或者退而求其次,同名概念词义扩充后有必要区分各个义项。
为了探求恰切的译名,基于前文论述,可进一步归纳出机器深度学习与人的深度学习具有以下联系与区别:1.人的学习先于机器学习,机器学习的本质是对人脑学习的模仿,机器学习是带有修辞性的说法,是将机器运算比作人脑思考的隐喻。2.机器学习是计算机程序的数据运算过程,具有稳定性,可准确预测运算结果;人的学习则是蕴含心智和情感变化的综合信息加工过程,受多重因素影响,具有偶然性和不确定性。3.所谓机器的深度学习实际上是深层次递推的数据处理过程,可以拆解为具体的层次,且每个层级运算中的变量是确知的;人的深度学习则是指基于学习者现有知识获取新知识的逻辑性思维过程,无法绝对区分深浅层次,只能以“度”来模糊化描述。
进一步分析,机器学习中的深度学习可以由具体的算法模型来呈现,其“深度”集中体现在机器通过训练达成了中间过程可以不受人干预而完成运算。也就是说,原始数据经过多个层次的处理,最终以直观的方式表示出规律来,纵使层次再多,各层次间也有清晰的边界。基于对Web of Science数据库该主题下高引文献的分析,可以看出,Hinton[13]、LeCun[8]、Young[14]等代表性学者均将机器学习模型称为“Multilayer generative models(多层的生成模型)”,而将机器的多个处理层表述为“Multiple Processing Layers”,这是因为“Layer”更能揭示其原理与本质。至于这些学术论文标题中出现的“Deep Learning”,则是为了让标题更为简洁以及起到隐喻的修辞效果。换言之,机器学习中的深度实际上是“深层”。因此,我们建议,将计算机科学领域的“深度学习”更改为“深层学习”,对应的英文亦更改为“Deep-layered Learning”。实际上,与其说“更改”这个术语的名称,倒不如说只是将它的表达还原为完整的形式。相应的,正如Mnih等学者所言,人脑对信息的处理是综合感知“High-dimensional Sensory Inputs”和高层级运算“Hierarchical Sensory Processing Systems”[15]。也就是说,对于人的深入学习,我们既无法将之层级化,也无法严格地量化描述其过程。因此,就人的学习而言,继续沿用“深度学习”这一概念无疑是贴切妥当的,它也与英文“Deep Learning”完全对应。上述建议或许能为学界提供一定参考,以避免概念误读与混同。
五、结语
著名翻译家严复曾对术语的翻译大加感慨:“一名之立,旬月踟蹰。”辜正坤先生亦指出:“一名误立,可造成相当严重的学术后果”[16]。特别是科技术语的翻译,如果直接按照字面翻译而不去仔细推敲其概念范畴,则很可能会放大或缩小其本义,甚至会掩盖词汇的真正意义,从而导致读者对这一概念的误解、误用。从这个角度来说,如果将计算机科学领域的“deep learning”不假思索、不加限定地直译为“深度学习”,就会在术语名称的默许之下“拔高”机器的智能化程度。
厘清概念进而确立译名只是第一步,学界跨领域合作才是取得突破的必由之路。机器的智能化日益提升,科技的脚步不会就此停歇,那么,机器可以在何种程度上取代人类呢?当下比较主流的观点认为,目前机器可以代替人们进行具有重复性、规律性的工作。人区别于机器的根本特性是在于人类具有创造性,毕竟机器也是由人创造的。不过,这种观点越来越受到挑战,人工智能已经能够创作出美妙的音乐,绘制出美丽的风景画,甚至可以翻译、作诗等。也正如此,有人已经开始考虑机器创作作品的产权归属问题了,它应该是属于制造机器的人,还是属于机器或机器赖以分析加工的大数据?既然机器可以把人们从重复、机械的劳动中解脱出来,那么人们就更应该投入更多的精力去关注审美和创造、和平与发展。从前文的论述可以看出,至少在现阶段,所谓的“机器创作”,主要仍是基于对已有数据的拆解与重组,还不能算真正意义上的创造。如果有朝一日机器真的具备了感情,那大概要基于某种特定算法。即使如此,它仍具有规定性,可以预设、可以运算、可以预测、可以反复验证,这样一来,也就丧失了审美意味和自然偶发的特性。我们认为,除非生物神经网络和人工神经网络的边界进一步模糊,人工智能才有可能實现真正意义上的“创造”,不过,这一假设尚待今后科学发展的验证。
参考文献:
[1][美]洛林·W.安德森等.布卢姆教育目标分类学:分类学视野下的学与教及其测评(修订本)[M].蒋小平,张琴美,罗晶晶译.北京:外语教学与研究出版社,2009.
[2]安富海.促進深度学习的课堂教学策略研究[J].课程·教材·教法,2014,(11).
[3][美]Jensen,E. & Nickelsen,L.深度学习的7种有力策略[M].温暖译.上海:华东师范大学出版社,2010.
[4]郭华.深度学习及其意义[J].课程·教材·教法, 2016,(11).
[5]张浩,吴秀娟.深度学习的内涵及认知理论基础探析[J].中国电化教育,2012,(10).
[6]Marton,F. & S?lji?,R.On Qualitative Difference in Learning:Ⅰ——Outcome and Process[J].British Journal of Educational Psychology,1976,(1).
[7]严燕.人工智能时代英语教学促进学生深度学习路径探究[J].教学与管理,2019,(27).
[8]LeCun,Y.,Bengio,Y. & Hinton,G.Deep learning[J].Nature,2015,(521).
[9]Hinton,G.E. & Salakhutdinov,R.R.Reducing the dimensionality of data with neural networks[J].Science,2006,(313).
[10]王连柱.机器学习应用于语言智能的研究综述[J].现代教育技术,2018,(9).
[11]黄立威,江碧涛,吕守业,刘艳博,李德毅.基于深度学习的推荐系统研究综述[J].计算机学报,2018,(7).
[12]李小涛,陈川,吴新全,王海文.关于深度学习的误解与澄清[J].电化教育研究,2019,(10).
[13]Hinton,G.E.Learning multiple layers of representation[J].Trends in Cognitive Sciences,2007,(10).
[14]Young,T.,Hazarika,D.,Poria,S. & Cambria,E.Recent Trends in Deep Learning Based Natural Language Processing[J].Ieee Computational Intelligence Magazine,2018,(3).
[15]Mnih,V.,Kavukcuoglu,K.,Silver,D.,et al.Human-level control through deep reinforcement learning[J].Nature,2015,(518).
[16]辜正坤.外来术语翻译与中国学术问题[J].中国翻译, 1998,(6).
On “Deep Learning” and Its Translation
Li Jingping
(School of English and International Studies, Beijing Foreign Studies University, Beijing 100089, China)
Abstract:Starting from the phenomenon that “deep learning” is frequently confused in the fields of education and computer science, this paper first traces the concept of “deep learning” in these two fields respectively, and points out that machine learning derives its name from human learning, and is a conceptual metaphor. The article then compares the similarities and differences of the two concepts and concludes that human deep learning involves complex factors such as emotional and environmental factors and is a complex mental activity with many variables, thus its results vary from person to person. Machine deep learning, however, is an operation process based on multi-layered algorithm, in other words, it is controllable and predictable. Finally, the paper puts forward new translated names for this term in order to avoid further confusion between the two concepts.
Key words:deep learning;deep-layered learning;machine learning;term translation