近十年我国深度学习研究的文献计量与知识图谱分析
2016-06-21王全亮张月芬左继蓉
王全亮,张月芬;左继蓉
(云南大学 网络与信息中心,云南 昆明 650000)
近十年我国深度学习研究的文献计量与知识图谱分析
王全亮,张月芬;左继蓉
(云南大学 网络与信息中心,云南 昆明 650000)
[摘要]本研究从文献年代分布、文献来源期刊分布、主要研究力量分布及研究主题分布4个维度,针对我国深度学习研究展开了文献计量分析和知识图谱分析。在深入了解了我国深度学习研究的基本现状后,利用SATI软件进行关键词的共词矩阵生成,再通过SPSS软件的聚类分析以及多维尺度分析功能绘制出了当下我国深度学习研究热点的知识图谱,进而获知其未来的研究趋势。本研究旨在为我国深度学习的后续研究提供一定的借鉴和指导,为推动我国教育事业的发展贡献力量。
[关键词]深度学习文献计量分析SATI共词矩阵SPSS聚类分析知识图谱
[DOI]10.13980/j.cnki.xdjykx.2016.05.004
从2015地平线报告基础教育版中可以得知,在驱动学校应用教育技术的6大重要趋势中,探索深度学习策略已经成为在未来5年乃至更长时间驱动基础教育应用技术的关键要素[1]。世界各地的学校都在有条不紊地制订鼓励深度学习的各项政策,国内外关于深度学习研究的热情日益高涨。为对该主题研究的概况和规模以及发展速度等有更加具体的认识,发现问题和不足,继而为我国深度学习研究提供正确的思路与经验,故开展了此项研究。
一、数据来源与研究方法
(一)数据来源
为了科学全面地把握有关我国深度学习研究的历史、现状和未来发展趋势,本研究采用了文献计量的分析方法,对有关深度学习的相关文献进行定量和定性分析,以目前国内最大的中文学术期刊库——中国知网(CNKI)为主要数据来源,以“深度学习”为关键词,进行题名检索,时间跨度设置为从2005年至2015年(2005年国内首次提出深度学习概念,因此初始时间设置为2005年)。一共检索到相关文献364篇,其中包括中国学术期刊库226篇,优秀硕士论文全文数据库83篇,博士论文9篇,特色期刊库40篇,重要会议论文全文数据库5篇,中国学术辑刊全文数据库1篇。
(二)研究方法
本研究采用了文献计量分析方法,对相关文献从文献年代分布、文献来源期刊分布、主要研究力量分布、研究主题分布等4个维度展开分析(文献计量分析是运用文献计量学的相关知识和理论,借助文献各种特征的数量,采用数学与统计学方法来描述和评价某学科领域现状的文献研究方法)[2]。
二、深度学习研究的基本现状
深度学习是指在理解性学习的基础之上,学习者能够批判性地学习新的思想,并将其融入到原有的认知结构中,能够将已有的知识迁移到新的情境中并做出决策和解决问题的学习。学术界普遍认同深度学习[4]是以“促进有效学习”为目的的特殊研究领域,是在学习者强烈内在动机指引下的积极学习,通过与原有认知结构进行迁移和融合,引发以概念转变、整合理解与创造性认知重组为特征的“意义生成”性学习。深度学习是衡量学习者能否达到“学会学习”以及“有效学习”的关键因素,其体现出来的重要作用不言而喻,因此了解和掌握深度学习研究的基本现状显得格外重要。以下将从相关文献的各个特征进行统计分析,以便清晰地呈现出我国深度学习研究的基本现状。
(一)文献年代分布
某领域期刊论文数量在一定意义上说明了该领域学术研究的理论水平和发展速度,对其进行分析不仅可以了解该研究领域过去和现在的发展状况,而且可以预测其今后的发展趋势[5]。有关深度学习相关文献按年代分布及趋势变化如图1所示,图中横轴代表年份,纵轴代表每年论文数量,4条折线分别代表了论文总量、会议论文数量、硕博士论文数量以及期刊论文数量随年度变化情况。
图1 深度学习相关文献年度分布
由图1可以得知,我国深度学习研究的发展,整体呈上升趋势。但2010年以前发展速度较为缓慢,之后文献的数量开始明显增长。分析其原因,这与国家宏观的教育政策有密切联系。2010年颁发的《国家中长期教育改革和发展规划纲要(2010-2020年)》中明确指出,要注重学思结合,倡导启发式、探究式、讨论式、参与式教学,帮助学生学会学习。激发学生的好奇心,培养学生的兴趣爱好,营造独立思考、自由探索、勇于创新的良好环境[6]。这些都体现着深度学习的相关特征,也突出体现了我国教育部门对深度学习的足够重视。在此背景下,我国深度学习的相关研究逐渐受到了更多的关注。
从图1中还可以得知,我国深度学习研究可以分为3个研究阶段。第1阶段是2005年至2010年的起始萌芽阶段。这个阶段相关研究的论文数量较少,主要是为后续相关研究奠定基础。第2阶段是2010年至2014年的深入发展阶段。这个阶段深度学习研究领域的相关文献数量明显得到大幅度提升,说明深度学习研究已经引起了我国研究者和相关部门的足够重视,2010年颁布的《国家中长期教育改革和发展规划纲要(2010-2020年)》更是促进了我国深度学习领域进一步的深入研究。第3阶段是2014年至今的成熟分化阶段。这个阶段的我国深度学习相关研究已经逐步开始走向成熟,相关研究者已经开始选择从不同角度进一步深入展开深度学习研究而步入分化期。这个时期的研究文献总数量呈现下降趋势。按照普赖斯(D.Price)的逻辑曲线增长理论,现阶段国内对深度学习研究正处于全面发展与分化时期[7]。
从各个曲线走势上来看,期刊论文数量与论文总数量的变化趋势大致相同,说明期刊论文在一定程度上决定着我国深度学习研究的发展。硕博论文以及会议论文曲线图显得比较平稳,说明高校研究生以及相关科研机构部门对我国深度学习研究的关注度还不够,在教学科研中对深度学习研究的力度还有待加强。
(二)文献来源期刊分布
与T0时点相比,C组在T2和T3时点BP、HR均明显增高,术中及术后各时点VAS评分均升高(P<0.05);与 T0时点相比,D组患者BP、HR在各时点差异无统计学意义(P>0.05),在T1~T5时点VAS评分升高(P<0.05)。在 T2和 T3时点,D组BP均明显低于C组(P<0.05);在T2时点,D组患者HR明显低于C组(P<0.05)。两组患者各时点VAS评分变化趋势基本相同,但T1~T5时点C组VAS评分明显高于D组,差异有统计学意义(P<0.05)。见表1。两组术后各时点SpO2变化曲线基本重合,差异无统计学意义(P>0.05)。
对某领域论文的期刊结构分布情况分析可确定该领域的核心期刊成员,为后续进一步深入研究提供依据,为相关研究者和研究机构提供一定指导[8]。期刊来源分析主要针对期刊论文而言,除去硕博论文92篇,会议论文5篇,近10年间一共有169种期刊刊载深度学习研究相关论文267篇,说明了深度学习研究广泛分布于各种类型期刊中。发文量在4篇以上的期刊如表1所示:
表1 期刊发文量分布
11种期刊共发文61篇,占文献总数量的22.85%。通过现有数据可知它们是深度学习研究领域的核心期刊,囊括了较多的有关深度学习的期刊论文。表1中全国中文核心(北大)期刊或CSSCI源期刊共8种(带*期刊),均能反映有关深度学习研究领域最新研究成果及前沿研究状况和发展趋势。其中《中国电化教育》、《电化教育研究》、《远程教育杂志》是教育学CSSCI源期刊,这说明深度学习相关研究已经开始进入了我们教育界专家学者的视野。其中《软件导刊》在2005年首次刊发了有关深度学习研究的论文,论文《杜威的教育思想与深度学习》的作者王珏主要论述了杜威的教育思想对开展深度学习的指导意义[9]。整体来看,以上3种CSSCI源期刊对我国深度学习研究的关注度还不够,需要进一步认识其重要性并加大对深度学习研究的力度。其他158种期刊,载文量共计206篇,平均载文量为1.30篇,说明更多的期刊开始关注深度学习的研究,但是关注程度仍不高。
(三)主要研究力量分布
由于发文量是衡量作者及机构学术水平和科研能力的重要指标,而核心作者及机构则是特定学科领域的重要研究力量,因此对主要研究力量的核心作者及机构的分布研究将具有重要意义[10]。本文将从高产作者分布和高产机构分布两个方面来展开对我国深度学习研究的主要研究力量分布进行分析。
1.高产作者分布
对364篇相关文献的第1作者进行统计分析,2005年至今发表深度学习相关论文的作者共315人,其中出产率较高的作者发文量高达3篇,最少为1篇,人均发文量为1.16篇。其中发文3篇的7人,2篇的作者35人,1篇的作者273人。现将深度学习研究作者发文频数为3篇的信息统计如表2所示:
表2 近10年深度学习研究作者发文频数
由表2可知,以上数据显示了我国深度学习研究领域核心作者群还未形成,业余研究人员多而持续研究人员少的特征,该领域的研究发展尚待成熟。可以看出,闽江学院的邱立达和南京师范大学的王婷作者是近年崛起的深度学习领域研究者,期待其对该领域持续的关注和研究。整体上看,我国深度学习研究的高产作者对该领域的持续关注和研究仍有欠缺,希望有更多的研究学者和专家能够对深度学习研究给予关注,加速推进我国深度学习的研究。
2.高产机构分布
高产机构分布分析可以侧面反映出社会相关组织或机构对深度学习研究的关注度及研究概况。深度学习研究的高产机构发文量在5篇以上的排名分布如图2所示:
图2 研究高产机构排名分布
根据图2可知,我国深度学习研究的高产机构主要在高校,综合性大学是我国深度学习研究的主要阵地和主力军,而师范大学次之。尚未出现专门的研究机构和管理机构,说明深度学习研究还没有得到相关部门的足够重视。比较突出的研究高产机构是哈尔滨工业大学,以15篇文章的优势位居榜首,北京邮电大学以9篇发文量位居第2,而厦门大学和上海师范大学以8篇发文量位居第3。这些高产机构对深度学习进行了大量的深入研究,其在研究团队建设、科研项目及论文数量等方面成果突出,表现出较强的优势。从高产机构的作者来看,各研究机构内部之间合作研究较少,作者多来自同一个研究机构的不同院系和部门,没有形成合力。如何加强合作研究并推广普及相关研究成果是目前我国深度学习研究面临的一个难题。
(四)研究主题分布
本研究对相关论文研究主题进行统计分析,以便认清现有研究的优势和不足,从而更好地掌握该领域研究的前沿及发展趋势。通过对364篇相关文献进行统计梳理,可以得出在不同的研究方向上深度学习相关文献研究的数量。结合文献的摘要和内容对每1篇文献进行归类和统计,可将深度学习研究的主题分为以下几个方面:理论研究(基本概念、特征内涵、理论探讨、综述研究、算法研究等)、方法研究(策略研究、教学模式、环境设计、模型设计等)、应用研究(学科教学领域、计算机领域等)、资源建设(平台构建、学习资源建设等)、相关技术研究(游戏沉浸式学习、反思学习、自主学习、终身学习等)、评价研究(评价指标体系、课程评价、及时性评价等)及其他等7大类[11]。相关论文研究主题分布及百分比如表3所示。
由表3可知,我国深度学习研究主题中,其理论研究和应用研究所占比例较大,百分比分别是33.79%和39.84%,两者所占总比例是73.63%,这说明深度学习理论研究以及应用研究是两个研究重点。国内研究者对深度学习的基本概念、内涵特征、综述研究与理论探讨等基础研究较多。因为基础性研究对于我国深度学习的实践、应用研究具有指导作用,这为深度学习的应用研究奠定了基础。深度学习的方法研究中包括了策略研究、教学模式、环境设计以及模型设计等,相关技术研究涉及到游戏沉浸式学习、反思学习和自主学习等,其百分比分别是10.99%和7.69%。另外还有深度学习的资源建设研究、评价研究和其他,以上数据显示出我国深度学习资源建设研究和评价研究方面仍需加强,这充分体现了我国深度学习研究目前处于一个分化期,关于促进深度学习的平台构建、学习资源建设以及深度学习评价指标和体系的构建均需要进一步加强研究。其他方面的研究中涉及到深度学习影响因素方面内容的极少,而影响深度学习的因素对有效开展深度学习具有重要作用,因此这个方面的研究亟待加强,希望能够引起相关研究者的足够重视。
表3 论文研究主题分布及百分比
三、深度学习研究热点分析
研究热点是一定时期某一类研究发文量大和重点关注的领域[12]。科学文献计量学一般通过知识图谱的分析方法来确定热点,通过直观图像展现出该学科知识领域的研究前沿和研究热点等重要信息。关键词是论文内容的提示符,也是作者学术观点的凝练,通过关键词共现分析,描述关键词间的关联与结合以便揭示出学科领域的内在结构及热点演化。本文通过SATI软件进行关键词提取和共词矩阵提取,利用SPSS19.0软件对共词矩阵进行相关分析和多维度分析,最终绘制出关键词共现知识图谱并揭示出我国深度学习研究的热点。
(一)关键词及其矩阵的提取
利用SATI软件进行关键词的提取,提取出词频大于3的66个高频关键词,这66个高频关键词基本代表了我国近10年间深度学习的研究热点。近10年我国深度学习研究高频关键词如表4所示:
表4 近10年我国深度学习研究高频关键词表
仅仅通过词频统计还不足以充分说明深度学习的研究前沿和研究热点等重要信息,故在提取了高频关键词后,本研究利用SATI的矩阵生成功能得到高频关键词的共词矩阵。然后利用SPSS软件对共词矩阵进行相关分析,最终得到高频关键词的相似矩阵,而相似矩阵是进行多维尺度分析的基础。将SATI生成的共词矩阵导入SPSS中进行相关分析,得到我国深度学习研究高频关键词的相似矩阵(部分)如表5所示:
表5 我国深度学习研究高频关键词的相似矩阵(部分)
(二)聚类分析与多维尺度分析
关键词聚类分析的原理是以关键词两两在同一篇文章中出现的频率(共词)为分析对象,利用聚类的统计学方法,把关联密切的关键词聚集成类。分析关键词时,利用相关矩阵来进行聚类分析。运用SPSS软件的多维尺度分析图示功能,可以在关键词聚类分析得出的4个研究热点分类的基础上,进一步绘制出我国深度学习时下的研究热点知识图谱,为分析我国深度学习未来的研究趋势提供一定的参考依据,研究热点知识图谱如图3所示:
图3 近10年我国深度学习研究热点知识图谱
根据近10年我国深度学习研究热点知识图谱可知,我国深度学习研究热点可以大致分为以下4个领域:热点领域1主要是深度学习策略方法的研究,包括了教学模式、学习策略、反思及特征学习等关键词。在有关深度学习方法策略的研究中,具有代表性的是胡丹在其硕士论文《促进深度学习的教学策略研究》中提到的,深度学习更加强调和关注学习者积极主动地学习和批判性地学习,建立已有知识与新知识的联系,将已有的知识迁移到新的情境中并做出决策和解决问题。通过促进学生深度学习的课堂实践来改变学生低效学习的现象,最终实现提升学生的思维品质和学习素养以促进学生全面而又富有个性的发展[13]。整体上看,真正从实践出发,提出深度学习策略方法的研究较少,需要加强更多的实证研究。热点领域2主要是深度学习的应用研究,包括了语音识别、人脸识别、特征提取及自动编码器等关键词。在深度学习应用研究热点领域中,深度学习所涉及到的应用面比较广泛。目前在人脸识别、图像识别、语音识别等人工智能领域应用比较热门。人工智能方面的研究本身就是一个比较具有现实意义和创新意义的研究热点,将其与深度学习的研究进行融合将会是一个长期的研究热点,期待这方面能出现更多的具有创新意义的研究。热点领域3主要是深度学习的理论研究,包括了神经网络、移动学习、反思性学习、浅层学习、机器学习以及学习科学等关键词。关于深度学习的理论研究,主要涉及到深度学习的基本概念和内涵特征等,是在一定的理论基础上展开的对深度学习的理论探讨。其中吴秀娟在《基于反思的深度学习:内涵与过程》[14]及其硕士论文《基于反思的深度学习研究》[15]中均对深度学习和反思性学习的概念内涵及实现过程进行了概述,通过分析深度学习和反思性学习之间的内在联系,进而对“反思是否能促进深度学习”进行了理论探讨。有关深度学习的理论研究为深度学习的应用和实践研究奠定了深厚基础。热点领域4主要是深度学习的综合实践研究,包括了人工智能、e-Learning、模式、特征融合以及高阶思维等关键词。我国深度学习综合实践类研究尽管比较少,但是将深度学习理念运用到现实学习过程中将会是一个趋势,由此而引发的深度学习策略研究将会成为未来深度学习研究的一个重点。在我国深度学习的综合实践研究中,段金菊[16]在《学习科学视域下的e-Learning深度学习研究》一文中做了较多实证研究,对e-Learning深度学习的研究现状进行了实地调查,构建了e-Learning环境下深度学习分析模型,为深度学习的实践研究奠定了一定的基础。
四、深度学习研究的展望
通过对我国深度学习研究的文献计量分析,可以得知我国深度学习研究的基本现状。现阶段我国深度学习研究处于一个全面发展并走向分化的时期。从发文年代分布上看,我国一些高校研究生以及相关科研机构部门对深度学习研究的关注度还不够,在教学科研中对深度学习研究的力度还有待加强。从文献来源期刊分布上看,深度学习相关研究已经开始进入了我国教育界专家学者的视野,但是关注程度仍不高。从主要研究力量分布上看,我国深度学习研究领域核心作者群还未形成,并且持续研究人员较少,研究的高产机构主要分布在我国高校,但各研究机构内部之间的合作研究较少,尚没有形成合力。从研究主题分布上来看,关于深度学习的影响因素以及深度学习评价指标和体系的构建等方面研究涉及较少,而影响深度学习的因素及其评价指标体系对有效开展深度学习具有重要作用,这些方面的研究亟待加强和引起足够重视。通过科学知识图谱分析的方法,可以直观地了解到我国深度学习研究的前沿热点信息。主要包括4大研究热点领域:深度学习的策略方法研究、应用研究、理论研究以及综合实践研究。透过这些研究热点,可以科学合理地预测我国深度学习研究的未来发展趋势。
通过对相关文献计量和知识图谱的分析,接下来我国深度学习研究应该注重实践应用研究,将其理论融入到现实课堂教学中以达到改善现有教学质量和教学效果的目的。加强有关促进深度学习的教学策略研究,需要对深度学习的影响因素进行深入挖掘,以便科学全面地了解深度学习的发生机制,从而为制定科学合理的深度学习策略和深度学习方法提供有力依据。另外,还需要加强深度学习的资源建设研究以及评价指标体系的研究,有了资源和评价指标体系的支撑,我国深度学习研究的开展才会更加深入。
参考文献:
[1]L·约翰逊,S·亚当斯贝克尔,V·埃斯特拉达,A·弗里曼.新媒体联盟地平线报告:2015基础教育版[EB/OL]. 张铁道,白晓晶,李国云,季瑞芳,吴莎莎译.http://cdn.nmc.org/media/2015-nmc-horizon-report-k12-CN.pdf.
[2]黄维,陈勇.中国教育经济学发展轨迹的知识图谱研究[J].教育与经济,2010(3):68-69.
[3]王佑镁,陈慧斌.近10年我国电子书包研究热点与发展趋势——基于共词矩阵的知识图谱分析[J].中国电化教育,2014(5):4-10.
[4]张琪. e-Learning环境中大学生自我效能感与深度学习的相关性研究[J].电化教育研究,2015(4):55-61.
[5]宋马林,张琳玲,李超.基于CSSCI的双语教学研究的文献计量与知识图谱分析[J]. 科学决策,2012(5):48-59.
[6]中共中央,国务院.国家中长期教育改革与发展规划纲要(2010-2020年)[EB/OL].http://www.moe.gov.cn/srcsite/A01/s7048/201007/t20100729_171904.html.
[7]李超.我国居民收入代际流动研究的科学计量学解读[J].科学决策,2012(1):27-41.
[8]王全亮,祁志卫,杨文妍等. 基于文献计量分析的我国智慧教育研究[J]. 软件导刊(教育技术),2015(5):70-72.
[9]王珏.杜威的教育思想与深度学习[J].软件导刊,2005(9):6-8.
[10]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:193.
[11]樊雅琴,王炳皓,王伟,唐烨伟.深度学习国内研究综述[J]. 中国远程教育,2015(6):27-33.
[12]宋马林,张琳玲,李超. 基于CSSCI的双语教学研究的文献计量与知识图谱分析[J]. 科学决策,2012(5):48-59.
[13]胡丹. 促进深度学习的教学策略研究[D].大连:辽宁师范大学,2011.
[14]吴秀娟,张浩,倪厂清. 基于反思的深度学习:内涵与过程[J]. 电化教育研究,2014(12):23-28+33.
[15]吴秀娟. 基于反思的深度学习研究[D].扬州:扬州大学,2013.
[16]段金菊,余胜泉. 学习科学视域下的e-Learning深度学习研究[J]. 远程教育杂志,2013(4):43-51.
(责任编辑:刘爽)
Bibliometric Analysis and Knowledge Map Analysis on Chinese Deep Learning Research in Recent 10 Years
WANG Quanliang,ZHANG Yuefen,ZUO Jirong
(NetworkandInformationCenter,YunnanUniversity,Kunming,Yunnan650000,China)
Abstract:This study carry out the bibliometric analysis and knowledge map analysis on the Chinese deep learning research from four dimensions of literature distribution, literature source journals distribution, the main research strength distribution and the distribution of research topics. Then this study forms the Co word matrix using the SATI and draw out the hotspots in the knowledge map through the software SPSS cluster analysis and multidimensional scaling analysis function in depth understanding of the basic research situation of our deep study to inform the research tendency in the future. The purpose of this study is to provide some reference and guidance for the follow-up study of deep study in China, and to promote the development of China's education.
Key words:deep learning; bibliometric analysis; co-word matrix of SATI; cluster analysis of SPSS; knowledge map
[收稿日期]2015-10-14
[基金项目]云南大学研究生科研创新项目(ynuy201488)。
[作者简介]王全亮(1989-),男,河南新县人,云南大学网络与信息中心硕士研究生;研究方向:教育技术理论与应用。张月芬(1972-),女,云南昌宁人,云南大学网络与信息中心副研究员、硕士生导师;研究方向:教育技术理论与应用。左继蓉(1972-),女,云南巍山人,助理研究员,研究方向:教育技术理论与应用研究。
[中图分类号]G443
[文献标识码]A
[文章编号]1005-5843(2016)05-0017-08