国内人文社会科学视野下大数据研究力量布局与研究前沿识别
2017-04-07吕红
〔摘要〕大数据时代为人文社会科学研究及其自身的变革迎来了新的发展机遇,人文社会科学领域对大数据相关问题的研究正处于快速上升期。以中文社会科学引文索引数据库为数据来源,从期刊、作者、研究机构、学科属性4个层面对国内人文社会科学视野下大数据的主要研究力量进行了分析。通过信息计量与可视化识别出国内人文社会科学视野下大数据研究的六大研究前沿:面向大数据的企业竞争情报研究、大数据时代社会治理与公共服务创新、基于网络大数据的企业生态系统建模、大数据时代公共图书馆的服务创新与发展、数据新闻、教育大数据及其应用。
〔关键词〕人文社会科学;大数据;研究前沿;信息计量;信息可视化
DOI:10.3969/j.issn.1008-0821.2017.03.024
〔中图分类号〕G250252〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0132-09
〔Abstract〕In the age of big data,humanities and social sciences research and their changes with new opportunities.Research on big data is in the fast rising period in the field of humanities and social sciences.Distribution of researchers of big data in the field of humanities and social science were analyzed from journals,authors,research institutions,subject property amounts to four levels based on Chinese social sciences citation index.In addition,identify six research frontiers of big data in the field of humanities and social science through the use of analysis method of information visualization and informetrics.These research frontiers included study on enterprise competitive intelligence based on big data,innovation of social administration and public services in the age of big data,enterprise eco-system model based on network data,innovation and development of public library services in the age of big data,data news,and education big data and its applications.
〔Key words〕humanities and social sciences;big data;research frontiers;informetrics;information visualization
大數据作为新兴产业,其产业链条涉及与数据和信息有关的一系列信息技术,可谓是新一代信息技术与信息管理的大变革。伴随着国家及各省市层面有关大数据发展行动纲要与计划的陆续出台,大数据逐渐成为国内外政府管理部门、学术研究机构、工业企业单位的热门议题。大数据及其技术在人类社会管理、政府治理、经济文化、教育科学等领域的广泛应用,使得这一信息技术变成与人文社会科学研究息息相关的一种思维方式,并促使越来越多的人文社会科学研究者开始积极关注和研究与大数据有关的问题。人文社会科学量化研究方法的长期探索为大数据与人文社科研究两者的结合奠定了较好基础[1]。方兴未艾的大数据已给人文社会科学研究提出了很多问题和挑战,同时也提供了许多人文社会科学研究变革与创新的机会,人文社会科学研究应自觉融入大数据时代[2]。有研究指出人文社会科学领域与大数据息息相关,人文社会科学领域也高度重视大数据的相关研究[3]。那么目前国内人文社会科学领域对大数据问题进行研究的主要力量分布情况怎么样?该视野下的大数据研究前沿又是什么?回答这些问题对人文社会科学视野下的大数据研究有一定的参考与借鉴作用。为更好地推动国内人文社会科学领域对大数据相关问题的研究,本文基于中文社会科学引文索引(Chinese Social Sciences Citation Index,以下简称CSSCI)对我国人文社会科学领域大数据研究的力量分布及其研究前沿进行识别。
1数据来源说明
鉴于本文是要客观地反映国内人文社会科学领域的大数据研究现状及其动向问题,加之考虑到CSSCI在收录国内人文社会科学期刊数据方面的针对性、权威性、典型性和代表性[4-7],因此,笔者选择CSSCI数据库作为数据检索来源。通过限定篇名和文献类型双重条件进行高级检索,即检索表达式如下:篇名(词)=大数据 and 文献类型=论文,不限定文献发表时间共计检索出1 216篇文献,检索时间为2017年1月14日。通过进一步的数据清洗工作剔除1篇重复文献以及与大数据研究内容无关的7篇文献(主要涉及各大数据库网站间的对比研究),最后剩余1 208篇论文数据作为分析对象。
根据1208篇文献在各年度的数量分布数据绘制其年度文献量及其累计文献量分布,如表1所示。表1显示基于CSSCI数据库来看,国内人文社会科学领域对大数据相关问题的研究始于2012年,并呈现出逐年快速增加的研究态势,表现为2012年的11篇增长至2013年的115篇,2014年309篇,2015年的474篇,需要说明的是由于检索时间的原因导致2016年的文献量收录更新不全。文献年度分布情况从数量上反映出人文社会科学领域对大数据的研究关注度在逐年增加,且持续受到人文社会科学学者的高度关注。同时,结合表1的年度文献量累积分布情况来看,大数据问题研究已成为我国人文社会科学研究领域的研究热点主题。对大数据年度累计文献量进行趋势线模拟,发现其呈现出指数分布,趋势线公式为:y=76263e11374x,R2=0883。根据拟合值R2可判断出该趋势线模拟效果和精度具有较高的可靠性,趋势线模拟分析表明目前国内人文社会科学领域对大数据相关主题的研究正处于快速上升期,且该领域研究文献累积量呈现出明显的指数型变化增长趋势,笔者相信人文社会科学领域对大数据相关问题的研究热度还会持续,并从研究数量层面的增加逐步转向研究内容层面的深入探索,从而不断推动人文社会科学领域大数据研究的逐步发展与成熟。
从期刊载文量、作者与研究机构发文量可识别出某研究领域的重要情报源和主要研究力量[8]。同时,基于论文学科归属的视角也能对某研究领域的主要力量分布情况进行学科层面的宏观分析。统计分析发现,1 208篇文献共刊载于267种期刊上,刊均载文约45篇。从期刊来源分布来看,国内人文社会科学领域刊发大数据研究的期刊有209种期刊(占总期刊数量的7828%)载文量在平均值以下,其中包括115种期刊(占总期刊数量的4307%)仅刊发了1篇文献,49种期刊(占总期刊数量的1835%)刊发了2篇文献,28种期刊(占总期刊数量的1049%)刊发了3篇文献,17种期刊(占总期刊数量的637%)刊发了4篇文献。进一步分析发现,58种期刊(占总期刊数量的2172%)刊发了国内人文社会科学领域大数据研究的843篇文献(占总文献量的6978%)。表2统计出载文量大于10篇以上的期刊列表,共载文665篇,其载文量超过总文献的一半(占总文献量的5505%),可见这些期刊是目前国内人文社会科学领域大数据研究的重要期刊情报源。表2中前4种期刊均是图书情报学领域核心期刊,这在一定程度上显示目前国内人文社会科学领域大数据研究的核心力量来源于图书情报学学科。
数据显示,1 208篇文献共涉及1 036位第一署名作者,占第一署名作者总数约7575%的915位作者仅发表了1篇文献,97位作者仅发表了2篇文献,发文量≥3篇的共有24位作者(占第一署名作者总数的232%),高产作者合计发文99篇(占总文献量的82%)。同时,1 208篇文献共涉及439所第一署名研究机构,占第一署名机构总数约6059%的266所研究机构仅发表了1篇文献,66所研究机构仅发表了2篇文献,发表4篇文献以上的有80所研究机构(占第一署名研究机构总数的1822),合计发文720篇(占总文献量的596%)。可见目前国内人文社会科学领域大数据研究者平均发文量很低,高产量的作者数量偏少,
而高产研究机构群正在逐渐形成。基于CSSCI文献发表数量来分析目前国内人文社会科学领域大数据研究的高产作者(发文量≥3)与高产研究机构(发文量≥10),见表3。表3仅统计以第一署名作者与机构的发文情况,结果显示中国人民大学新闻学院的喻国明、兰州财经大学(兰州商学院2015年改名)信息工程学院的马晓亭、江西财经大学管理哲学研究中心的黄欣荣、桂林理工大学图书馆的张兴旺等学者是目前国内人文社会科学领域对大数据有关问题进行研究的高产作者。而中国人民大学、武汉大学、南京大学、清华大学、北京大学、兰州财经大学、北京师范大学等研究机构是目前该领域研究的高产机构。
数据处理过程中发现,1 208篇文献中有72篇文献没有标注学科分类,其中有51篇文献没有标注中图分类号,首先笔者根据中国知网CNKI数据库对这51篇文献的分类号标注结果进行数据补充,然后再根据文献内容以及中图分类号对学科分类信息进行修正完善,最后对学科分类及中图分类号信息进行统计分析。需要说明的是,对于某些同时具有两个中图类号和学科类别的文献,仅取第一个中图类号及其所对应的学科类别加以分析。表4是基于CSSCI数据库的国内人文社会科学领域大数据研究主要学科力量分布列表。表4显示,目前国内人文社会科学领域大数据研究主要涉及25个学科,其中按文献量排名的前10门学科分别图书馆、情报与文献学、新闻学与传播学、教育学、管理学、经济学、政治学、统计学、哲学、法学、艺术学。图书馆、情报与文献学(占总文献量3005%)是目前国内人文社会科学领域开展大数据研究最活跃的学科力量之一,其次是新闻学与传播学(占总文献量1316%),以及教育学(占总文献量1151%)。为进一步从学科层面显示人文社会科学领域对大数据有关问题关注的变化情况,笔者将表4中排名前10位学科及其文献量按照年度进行展示,见图1。
图2显示,从CSSCI来源数据来看,图书情报学是国内人文社会科学领域最早对大数据相关问题开展研究的主要学科,同时其在文献数量及增长方面基本领域于其他主要学科,这进一步反映出图书情报学学科在大数据研究领域的重要地位。进一步分析发现,除新闻学与传播学、艺术学两大学科从2015年开始对大数据有关问题的学科关注度有所下降外,目前国内人文社会科学领域大数据研究的其他8门主要学科基本呈现出逐年增加的态势(由于检索时间原因导致2016年数据不全)。从图1可知,教育学对大数据的研究表现出很高的研究热情,其是在主要学科门类中惟一在2016年数据不全的情况下还表现出增长态势的学科,教育学在国内人文社会科学领域大数据研究所占比重逐年增加,一定程度上反映出教育学领域对大数据相关问题的研究已经为教育学的研究热点主题。此外结果还显示出经济学对大数据有关问题的研究文献增长幅度也较快。教育大数据以及大数据环境下的教育问题,以及经济大数据以及大数据环境下的经济问题是国内人文社会科学研究领域对大数据有关问题研究的新视角和新拓展。
3研究前沿主题识别分析
研究前沿分析可为科研人员提供某研究领域的发展动态,并能发现具有价值的研究方向或潜在研究领域[9]。同样,对人文社会科学领域内大数据研究前沿的探测也能识别出人文社会科学视野下大数据领域研究中正受到关注的研究主题或涌现出的具有发展潜力的研究领域,从而有利于更好地推动该领域的科学研究工作。有文献资料指出,“研究前沿”的概念最早由普赖斯于1965年提出,其被用来描述研究领域的动态本质[10-12]。之后国内外学者对科学研究前沿的探讨一直持续,有研究者在总结国内外众多学者对研究前沿所下的各种定义与概念的基础上,指出研究前沿就是在科学研究中最近出现、正在兴起的研究主题或者研究领域[13]。对于科学研究前沿的有效探测方法而言,其要么根据领域专家的经验知识进行判断,要么进行科学计量与文本内容挖掘,而前者相较于后者来看,前一种方法较为费时并带有较为浓厚的专家主观色彩,因而科学计量与文本内容挖掘方法是当前快速高效進行科学研究前沿识别的重要辅助手段。目前,基于文献计量的研究前沿识别基本方法主要有同被引分析、文献耦合分析、共词分析等[14]。有研究指出,研究前沿与知识基础具有密切的对应关系,分析知识基础有利于对研究前沿本质的认识和理解[15]。同时,从文献引用关系的方法来看,研究前沿与其对应的知识基础是不可分割的整体,因而对研究前沿的探测离不开对其在文献中引用轨迹网络的分析。国际著名信息可视化专家陈超美教授开发的基于引文分析理论的信息可视化应用程序CiteSpace把研究领域概念化为从知识基础映射到研究前沿的概念模型,即研究领域被概念化为研究前沿和知识基础两者之间的时变映射,而研究前沿是时间变量映射的定义域,其知识基础是映射的值域[16]。在CiteSpace中,知识基础是共引文献网络,研究前沿由引用这些知识基础的施引文献集合组成,而研究前沿领域是从施引文献中提取的与新趋势和突变密切相关的专业名词术语,且共被引文章和引用这些文章的术语的复合网络中可用研究前沿专业术语概念来作为共引聚类的标签[17-20]。目前,CiteSpace以绘制知识图谱的方式常被作为探测学科或领域研究前沿的工具之一[21-25]。
根据研究需要,在CiteSpace功能与参数设置区域中进行相应设置:数据分析时间从2012-2016年,以1年为时区切割;节点类型选择Cited Reference,数据阈值设定前中后3个时间段的最低被引频次、本时间切片中共被引频次、共被引率的参数值为(2,2,20)、(4,3,20)、(3,3,20);同时网络节点的关联强度计算方法、可视化结果视图等选择默认。经过数据运行和可视化处理生成对应的可视化网络,并在文献共引网络结果可视化界面中进行聚类处理,聚类的标签大小按照聚类规模进行显示。为进一步实现聚类的命名处理,从施引文献的关键词中提取名词性术语进行聚类命名,这些聚类命名可反映出国内人文社会科学领域的大数据研究前沿,本文的名词术语提取方法采用对数似然率算法(Log-likelihood Ratio,简称LLR)。图2是基于CSSCI的大数据研究文献共被引网络及其聚类可视化图谱,网络节点数量163,网络连线数量431,网络密度为(2×431)/(163×162)=003264。图2中网络模块化数值Modularity Q=06499,表明网络聚类效果较好,其社团结构表现显著,反映聚类内部网络同质性的平均Silhouette数值=03831。
图2中节点及其对应标签字体大小反映出文献的被引频次,即文献被引频次越高,表现为节点及其对应标签字体越大。选取被引频次≥20的共计6篇文献作为国内人文社会科学大数据研究的高被引文献。基于CSSCI数据库来看,按照被引频次高低,这些重要文献依次如下:第一篇是2013年孟小峰和慈祥发表的《大数据管理:概念、技术与挑战》,被引频次高达66,该文基于对国内外大数据研究成果的梳理和总结,首先探讨了大数据的基本概念与应用问题,然后从大数据处理的模式与基本流程两个方面分析了大数据处理框架问题,并从云计算、大数据处理工具两个层面分析了大数据管理的关键技术,最后从大数据集成、大数据分析、大数据隐私问题、大数据能耗问题、大数据处理与硬件的协同、大数据管理易用性问题、性能的测试基准7个方面探讨了目前大数据研究面临的新挑战[26]。第二篇是李国杰和程学旗发表的《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》一文,被引频次高达62,该文分析了何谓大数据的问题,阐述了开展大数据研究的重要意义,从“数据科学”研究对象、数据关系网络、大数据研究中的关联关系与因果关系、社会科学的大数据研究、数据处理的复杂性研究、科学第四范式等六大方面探索了大数据的科学问题,并从大数据的表示方法、存储与融合、处理与分析工具等方面讨论了大数据面临的挑战,最后提出了对大数据发展战略四大建议:优先支持网络大数据研究、大数据科学的基础研究、大数据研究的组织方式、大数据研究的资源支持[27]。第三篇是2013年冯芷艳等发表的《大数据背景下商务管理研究若干前沿课题》,被引39次,该文从管理学的角度探讨大数据对于现代企业生产管理和商务运营决策等方面带来的变革与冲击的研究,提出了3个重要研究视角,分别是社会化的价值创造、网络化的企业运作、实时化的市场洞察,并讨论了四大重要的研究方向与课题,分别是社会化网络环境中的行为机理与社会资本结构、企业网络生态系统及其协同共生机制、大数据环境下的顾客洞察与市场营销策略、基于大数据的商业模式创新[28]。第四篇是2013年邬贺铨发表的《大数据时代的机遇与挑战》,被引25次,该文从宏观经济、制造业、农业领域、医疗保健领域等方面探讨了大数据应用领域,并从大数据挖据的数据收集、数据存储、数据处理、可视化呈现四大环节探讨了大数据技术应用的挑战[29]。第五篇是王珊等发表的《架构大数据:挑战、现状与展望》,被引20次,该文讨论了大数据分析平台需具备的特性,并评价、归纳与对比分析了大数据分析的主流实现平台:并行数据库、MapReduce及两者的混合架构[30]。第六篇是2012年樊伟红等发表的《图书馆需要怎样的“大数据”》,被引20次,该文研究了大数据给图书馆带来的挑战与机遇,并提出大数据技术及服务可能给图书馆新型知识服务带来的帮助包括:建立知识服务及业务建设的风险模型、用户流失分析及价值分析、新型知识服务引擎建设、预测可能的资源故障、网络化信息资源智能组合方式、对图书馆自然环境、人文环境及技术环境数据多维度大数据的智能分析及智能辅助决策等[31]。除通过文献被引频次来识别重要性节点外,还可通过节点的中介中心性来对衡量文献重要性,进而发现领域内重要的知识基础文献[32-33]。节点中介中心性高低可表征对应文献在学科领域的研究桥梁作用,具有高中介中心性的文献是某时间段内该学科领域知识演化网络中的转折点。在CiteSpace中,中介中心性数值Centrality≥01的节点为高中介中心性关键点,节点在图谱中表现为具有紫色外圈。表5是基于CSSCI的大数据关键节点文献(Centrality≥01)。
图2中为突出显示规模较大的一些主要聚类结果,过滤相对较小规模的聚类,在设置图谱的最小可见的聚类规模大小数值=10。从图2的聚类命名结果(LLR算法)来看,基于CSSCI的人文社會科学领域的大数据研究前沿主要包括六大聚类,按照聚类规模大小依次是:#0 企业(25)(Silhouette=0788)、#1公共治理(24)(Silhouette=0725)、#2企业生态系统(23)(Silhouette=0802)、#3公共图书馆(22)(Silhouette=0873)、#4程式化(17)(Silhouette=0716)、#5教育大数据(16)(Silhouette=0854)。从各聚类的Silhouette数值来看,聚类成员的相似性较高。本文以LLR算法的命名结果为基础,并通过进一步分析各聚类对应的施引文献列表中引用该聚类的文献比例较高(引用比例≥10%)的施引文献标题与摘要等信息进一步对六大聚类反映的研究前沿进行解释命名,分别是面向大数据的企业竞争情报研究、大数据时代社会治理与公共服务创新、基于网络大数据的企业生态系统建模、大数据时代公共图书馆的服务创新与发展、数据新闻——大数据时代新闻内容生产的新模式、教育大数据及其应用。
31面向大数据的企业竞争情报研究
大数据本身具有的各种特性,以及大数据处理技术给以数据挖掘与分析为基础的企业竞争情报带来新的发展机遇与创新路径。大数据分析在对象、运用的方法和目标等方面都与企业竞争情报研究存在交集,大数据及其技术所带来的信息生态环境的新变化必然会对企业竞争情报带来深刻的影响[34]。从数据全面、社会化和及时传播等特性来看,大数据有利于提高竞争情报的真实性、精准性以及实时性[35]。大数据时代的竞争情报发展动向将更加重视动态竞争情报的分析,即如何从高速动态变化的大数据中获得动态竞争情报[36]。大数据环境下的企业竞争情报工作需围绕结构化、半结构化和非结构化大数据三方面进行动态信息全生命周期中各个环节等管理。有学者指出,企业只有不断基于获取的动态数据转化为可供决策的动态情报,才能适应大数据时代的竞争,并探讨了面向大数据的企业竞争情报动态运行模式MDD,即以面向大数据的企业竞争情报监控机制、面向大数据的企业竞争情报发现机制、面向大数据的企业竞争情报决策支持机制三者为核心,三者相互配合,并与情报价值链条和情报目标链条各个环节结合的新模式[37]。同时,基于大数据的企业竞争情报动态信息处理体系具有参与资源的多维异构性、参与资源的跨域关联性、情报处理过程的多维自组织性、竞争情报服务的多模态性、竞争情报服务模式的颠覆性、体系的可持续发展性[38]。总之,面向大数据的企业竞争情报相关研究,特别是面向大数据的企业竞争情报动态信息处理与分析的理论、模式、体系、方法、技术平台等研究内容理应成为学界研究者关注和亟待解决的焦点。
32大数据时代社会治理与公共服务创新
基于数据化的政府管理理念与机制,并科学化推动社会治理模式与公共服务方式的创新是大数据时代对智慧政府及其管理的现实要求。大数据技术为政府公共服务改善与创新工作带来的发展机遇,使政府能以创新的方式和形式提供公共服务,并可助力实现公共治理在服务效率、管理效能与公众满意度等方面的不断提升[39]。大数据时代所带来数据和信息生态环境的改变给政府社会治理和公共服务领域带来了重大应用价值。基于大数据技术能够解决的政府公共治理难题包括诸如公共安全、公共危机管理、食品安全监管、智能交通、公共卫生与医疗、工作就业等[40]。从构成内容来看,大数据公共治理主要包括政府云服务平台、移动电子政务、数据开放运动以及制度保障4个方面[41]。基于多元化大数据的社会治理与公共服务创新是智慧政府的重要治理特点和方式。大数据时代所带来的社会治理创新路径转向方式包括:从经验治理导向到精准治理导向、从封闭到开放、从碎片化到整体化、从政府主导走向政社合作治理[42]。大数据时代的新型数据处理技术与国家公共治理过程的精密融合,为实现基于大数据的高效率、高智能、高精准国家社会治理与公共服务创新模式提供了重要突破口,并进而为打造智慧政府提供重要支撑。基于大数据的社会治理与公共服务创新研究前景广阔,是大数据时代人文社会科学视野下开展社会公共管理研究的重要热点领域。
33基于网络大数据的企业生态系统建模
大数据及其技术应用正以各种方式对现代企业管理决策活动产生影响,对企业生存至关重要的企业生态系统也面临着大数据时代的新变革和新挑战。大数据时代企业生态系统的产业运行环境、运营模式、合作方式、客户市场等方面出现了新的特征与变化,基于大数据的企业生态系统演化与构建是迫切需要研究的现实问题[43]。该研究主题可研究大数据环境下基于社会媒体的企业生态系统微观个体建模、行为规律与交互模式及其宏观组织结构、共生协同演化及其系统稳定性等关键问题,构建可持续发展的企业网络生态链[28]。如何实现基于网络大数据驱动的具有可持续发展特性的企业生态系统是大数据对于现代企业管理领域的新变革,对于现代企业的科学化管理与决策具有十分重要的作用。因此,基于网络大数据的企业生态系统建模研究将是大数据时代下学术界和企业界所关心的重要焦点问题。
34大数据时代公共图书馆的服务创新与发展
一方面,大数据与信息、知识之间存在十分重要的关联;另一方面,大数据技术及其应用不可避免地对图书馆及其服务产生影响。因而图书情报学成为国内人文社会科学领域较早对大数据相关问题开展研究的主要学科,目前该学科已成为推动大数据研究领域的一股重要发展力量。公共图书馆掌握着巨大的数据资源和信息资源,大数据技术在公共图书馆的应用是业务和时代双重发展的需要。大数据环境下,以信息处理与信息服务作为优势的图书馆所开展的服务范围和业务领域将有更大的扩展和延伸,数据分析服务、数据挖掘服务将成为图书馆知识服务体系创新的制高点[44]。大数据为公共图书馆带来的发展契机与影响主要表现在三方面:大数据帮助公共图书馆建立和完善新的知识服务、大数据为公共图书馆拓展公共服务提供强有力的技术支撑、大数据对公共图书馆的数据存储能力和计算能力提出新的挑战[45]。如何实现基于大数据驱动的新型公共图书馆服务模式、业务内容、技术平台、应用前景及其绩效评价等问题,还亟待图书情报學等研究人员的积极探讨。
35数据新闻——大数据时代新闻内容生产的新模式数据新闻又称之为数据驱动新闻,是指对基于可以公开获取的数据进行分析与过滤进而创作出新闻报道的方式,数据新闻有助于实践“开放新闻”的理念,同时数据可视化是数据新闻的重要组成部分之一[46]。数据新闻作为大数据时代新闻内容生产的新模式,作为基于数据驱动的新闻制作新理念对传统新闻内容生产的思路与流程产生了一定的影响。大数据对新闻生产的影响表现为新闻生产主体从单一到多元的转变、新闻生产内容从事实报道到探求规律的转变、新闻生产方式从专业生产到技术生产[47]。同时在数据新闻的理念逐渐被接受的同时,也有学者指出,大数据技术应用到传媒行业时,要深刻反思大数据技术的两面性并予以警醒,并针对大数据对新闻内容生产方面的局限也进行了深入探讨[48]。如何通过在新闻传媒领域科学合理地运用大数据及其技术,通过数据新闻的扬长避短从而实现新闻内容生产创新模式将是大数据时代下新闻传播学界的重要话题。
36教育大数据及其应用
教育大数据对教育领域改革与创新发展具有重要作用。从战略层面来看,教育大数据应定位为推动教育变革的新型战略资产、推进教育领域综合改革的科学力量以及发展智慧教育的基石[49]。大数据及其技术应用有利于促使教育机构的绩效提升和科学过程管理。目前基于教育大数据的应用服务包括:实现在线学习预警[50]、个性化和自适应学习系统[51]、MOOC的资源开发范式[52]、常态化教学及其管理[53]。大数据及其技术的快速发展和在各行业的广泛应用,引起了教育行业领域的高度重视,如何基于大数据技术将教育领域所积累的海量数据转变为教育领域的科学管理决策方案已成为大数据环境下教育领域的新热点和新趋势。
参考文献
[1]陈泓茹,赵宁,汪伟.大数据融入人文社科研究的基本问题[J].学术论坛,2015,38(12):106-110.
[2]欧阳康.大数据与人文社会科学研究的变革与创新[N].光明日报,2016-11-10,(16).
[3]赵蓉英,魏绪秋.计量视角下的我国人文社会科学领域大数据研究热点挖掘与分析[J].情报杂志,2016,35(2):93-98.
[4]湯建民.中国人文社会科学各学科研究论文特征的计量分析[J].科学学研究,2011,29(7):991-998.
[5]谭春辉.高校哲学社会科学创新能力评价指标体系构建研究[J].重庆大学学报:社会科学版,2010,16(2):70-75.
[6]王富国.基于CSSCI的图书情报学互引分析[J].图书馆,2015,(6):52-59.
[7]马费成,陈柏彤.我国人文社会科学学科多样性研究[J].情报科学,2015,33(1):3-8.
[8]吕红,马海群.国内政府信息公开研究现状与展望——迈向政府数据开放[J].现代情报,2016,36(5):158-164.
[9]杨良选,李自力,王浩.基于CiteSpace Ⅱ的研究前沿可视化分析[J].情报学报,2011,30(8):883-889.
[10]Price D J D S.Networks of scientific papers:The pattern of bibliographic references indicates the nature of the scientific research front[J].Science,1965,149(3683):510-515.
[11]Morris S A,Yen G,Wu Z,et al.Time line visualization of research fronts[J].Journal of the Association for Information Science and Technology,2003,54(5):413-422.
[12]陈超美,陈悦,侯剑华,等.CiteSpace Ⅱ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,28(3):401-421.
[13]许晓阳,郑彦宁,赵筱媛,等.研究前沿识别方法的研究进展[J].情报理论与实践,2014,37(6):139-144.
[14]王立学,冷伏海.简论研究前沿及其文献计量识别方法[J].情报理论与实践,2010,33(3):54-58.
[15]Persson O.The intellectual base and research fronts of JASIS 1986-1990[J].Journal of the Association for Information Science and Technology,1994,45(1):31-38.
[16]Chen C.CiteSpace Ⅱ:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the Association for Information Science and Technology,2006,57(3):359-377.
[17]Chen C.Searching for intellectual turning points:progressive knowledge domain visualization[J].Proceedings of the National Academy of Sciences,2004,101(suppl):5303-5310.
[18]Chen C,Leydesdorff L.Patterns of connections and movements in dual-map overlays:A new method of publication portfolio analysis[J].Journal of the Association for Information Science and Technology,2014,65(2):334-351.
[19]Chen C.Predictive effects of structural variation on citation counts[J].Journal of the Association for Information Science and Technology,2012,63(3):431-449.
[20]Chen C,Ibekwe-Sanjuan F,Hou J.The structure and dynamics of cocitation clusters:A multiple-perspective cocitation analysis[J].Journal of the Association for Information Science and Technology,2010,61(7):1386-1409.
[21]侯剑华,胡志刚.CiteSpace软件应用研究的回顾与展望[J].现代情报,2013,33(4):99-103.
[22]葛莉,刘则渊.国际创业教育研究前沿的可视化分析[J].教育科学,2011,27(2):8-14.
[23]许振亮,郭晓川.50年来国际技术创新研究前沿的演进历程——基于科学知识图谱视角[J].科学学研究,2012,30(1):44-59.
[24]Chen C,Dubin R,Kim M C.Emerging trends and new developments in regenerative medicine:a scientometric update(2000-2014)[J].Expert Opinion on Biological Therapy,2014,14(9):1295-1317.
[25]Kim M C,Chen C.A scientometric review of emerging trends and new developments in recommendation systems[J].Scientometrics,2015,104(1):239-263.
[26]孟小峰,慈祥.大數据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.
[27]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):5-15.
[28]冯芷艳,郭迅华,曾大军,等.大数据背景下商务管理研究若干前沿课题[J].管理科学学报,2013,16(1):1-9.
[29]邬贺铨.大数据时代的机遇与挑战[J].求是,2013,(4):47-49.
[30]王珊,王会举,覃雄派,等.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752.
[31]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,(11):63-68,77.
[32]赵蓉英,王菊.图书馆学知识图谱分析[J].中国图书馆学报,2011,37(2):40-50.
[33]邱均平,吕红.近五年国际图书情报学研究热点、前沿及其知识基础——基于17种外文期刊知识图谱的可视化分析[J].图书情报知识,2013,(3):4-15.
[34]黄晓斌,钟辉新.大数据时代企业竞争情报研究的创新与发展[J].图书与情报,2012,(6):9-14.
[35]吴金红,张飞,鞠秀芳.大数据:企业竞争情报的机遇、挑战及对策研究[J].情报杂志,2013,(1):5-9.
[36]刘高勇,汪会玲,吴金红.大数据时代的竞争情报发展动向探析[J].图书情报知识,2013,(2):105-111.
[37]钟辉新,张兴旺,黄晓斌.面向大数据的企业竞争情报动态运行模式MDD:监控、发现、决策的互动[J].情报理论与实践,2014,37(3):6-11.
[38]张兴旺,麦范金,李晨晖.基于大数据的企业竞争情报动态信息处理的内涵及共性技术体系研究[J].情报理论与实践,2014,37(3):121-128.
[39]马亮.大数据技术何以创新公共治理?——新加坡智慧国案例研究[J].电子政务,2015,(5):2-9.
[40]赵强,单炜.大数据政府创新:基于数据流的公共价值创造[J].中国科技论坛,2014,(12):23-27.
[41]高奇琦,陈建林.大数据公共治理:思维、构成与操作化[J].人文杂志,2016,(6):103-111.
[42]陶希东.大数据时代中国社会治理创新的路径与战略选择[J].南京社会科学,2016,(6):85-90.
[43]资武成.“大数据”时代企业生态系统的演化与建构[J].社会科学,2013,(12):55-62.
[44]程莲娟.美国推进大数据的应用实践及其有益借鉴——基于图书馆视角的分析[J].情报资料工作,2013,34(5):110-112.
[45]容春琳.公共图书馆应用大数据的策略研究[J].图书馆建设,2013,(7):91-95.
[46]章戈浩.作为开放新闻的数据新闻——英国《卫报》的数据新闻实践[J].新闻记者,2013,(6):7-13.
[47]黄俊华.大数据时代新闻生产的挑战及其应对策略[J].新闻传播,2014,(12):75-76.
[48]左艳红.大数据对新闻内容生产的局限[J].编辑之友,2014,(8):63-65.
[49]杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016,(1):50-61.
[50]王林丽,叶洋,杨现民.基于大数据的在线学习预警模型设计——“教育大数据研究与实践专栏”之学习预警篇[J].现代教育技术,2016,26(7):5-11.
[51]万海鹏,汪丹.基于大数据的牛顿平台自适应学习机制分析——“教育大数据研究与实践专栏”之关键技术篇[J].现代教育技术,2016,26(5):5-11.
[52]吴南中.教育大数据应用于MOOC的资源开发范式研究[J].中国远程教育,2015(8):23-29.
[53]孙众,宋洁,姚夏晶,等.教育大数据的课堂应用新形态——“教育大数据研究与实践专栏”之教学应用篇[J].现代教育技术,2016,26(9):5-10.
(本文责任编辑:郭沫含)