“互联网+”研究现状与前沿分析
2018-01-07李琰
李琰
摘 要:采用文献计量法对“互联网+”的研究现状进行梳理与剖析,在统计相关文献量、期刊、作者和研究机构的基础上,绘制研究热点和前沿的知识图谱。结果表明该领域论文数量呈现高速增长趋势,但尚未形成主流作者和机构合作群体;研究热点多集中在大数据、电子政务和图书馆学等领域;今后的研究方向应侧重在绿色生态、智慧能源等领域。
关键词:“互联网+”;文献计量;聚类分析;知识图谱
中图分类号:F27 文献标识码:A doi:10.19311/j.cnki.1672-3198.2018.36.029
1 引言
在2015年的《政府工作报告》中,李克强总理正式提出要制定“互联网+”行动计划,推动云计算、物联网、大数据、移动互联网等先进技術相结合。随后在学术界和业界不断有人对“互联网+”进行概念界定,张伯旭等指出,“互联网+”就是新一代信息技术对互联网及其以外的经济各部门的渗透、融合。欧阳日辉认为信息的获取、开发和利用是“ 互联网+”的核心或本质。阿里研究院提出,所谓“互联网+”即以互联网为主的一整套信息技术在经济、社会生活各部门的扩散、应用过程。目前“互联网+”已上升为国家战略,正逐渐成为新环境下的强有力支撑。
与此同时学术界的研究也层出不穷,目前在CNKI数据库中能够检索到与“互联网+”相关的文献高达近六万篇,足以说明学术界对该领域的广泛关注。然而作为新兴的研究领域,有关“互联网+”的研究内容较为分散,难以把握“互联网+”的发展趋向,为此需要进行文献梳理,明确研究热点和未来发展趋势。本文首先对国内“互联网+”的相关文献进行梳理,统计发文量、期刊、作者和机构的分布情况,在此基础上通过文献计量软件展现该理论的研究热点与前沿领域,旨在为国内“互联网+”的研究与实践工作提供一定的借鉴作用。
2 数据来源与方法
2.1 数据搜集
以中国知网(CNKI)数据库中的文献作为数据来源,以“互联网+”为主题进行文献检索,检索日期截至2018年5月20日。考虑到在国内人文社会科学期刊中,南京大学中国社会科学研究评价中心编制的《中文社会科学引文索引》(CSSCI)影响最大,是高校研究机构科研评价的最重要标准,因此将来源期刊类别限定为CSSCI。初步检索得到2116篇文献,经过逐一筛选,排除会议通知、综述类文章、访谈、书评等不相关记录,最终共获取1785篇文献。
2.2 研究方法
文献计量法以分析文献外部特征量为手段,探讨科学技术的演变、结构、特征和发展规律。学者可以利用该方法研究科学文献,揭示文献的数量增长、分布特征及其变化,也可用于研究某一作者的影响或某领域多个作者的研究差异、作者或机构之间的合作关系等。首先通过Excel软件,对文献的发表年份、作者、机构等进行详细分类。随后利用文献计量软件对“互联网+”领域的作者、机构和关键词网络进行分析,绘制网络图谱;通过聚类分析厘清该领域目前的研究热点和未来的演化趋势;将本文的研究问题以形象的图形和直观的表格展示出来,把握最新进展,为后续研究提供依据。
3 研究现状分析
3.1 总体发文量
文献发表数量的年度分布反映某领域在一定时间段内的研究水平和进展情况。自2015年“互联网+”的相关概念提出以来,研究论文数量呈现井喷式增长;从总体数量来看,该领域累积共发文1785篇;近几年的发文量一直保持持续增长,从2015年的243篇增长至2017年的723篇,增长率高达197.53%。由于本文的统计数据截止到2018年5月20日,故2018年的发文量数据并不显著。可以预见在未来的一段时间,相关研究将会持续保持高速增长。
3.2 期刊分布
对“互联网+”领域的发布期刊进行研究可以了解该研究领域的核心期刊群,是研究人员的重要情报源。鉴于本文的统计数据较多,仅统计载文量在20篇及以上的期刊,得出如图2所示结果。
根据统计结果,发文量在20篇及以上的期刊有15个,这些期刊的总载文量共计496篇,占论文总数的28%,表明国内“互联网+”的研究已基本形成了稳定的核心期刊群。这些期刊的研究领域主要集中在政治学、新闻与传播学、教育学等,而与经管类学科相关的期刊仅有2个;且1785篇文献仅分布在359个不同期刊,这也在一定程度上反映了“互联网+”领域并未形成纵深研究,并不是所有研究主题都得到了充分展开。
3.3 作者分布
统计分析文献作者可以了解研究领域作者的发文情况,有利于确定核心作者,以便于进行跟踪研究。根据普赖斯定律,核心作者群发文阈值Mp=0.749×Npmax(其中Npmax为最高产作者发文数)。经统计邓仲华共发表相关论文9篇,是最高产作者,核心作者最低发文量为2.25,按照取上限整数的原则为3篇,根据发表论文的数量排序,得出核心作者群共有26人。
由表1可知,核心作者的累积发文量为115篇,仅占总体发文数量的6.44%。综合来看,“互联网+”领域的研究成果还较为分散,大部分研究者仅发表了少数几篇文献。作为一个新兴领域,从事该领域研究的核心作者群仍处于形成阶段。随着“互联网+”的研究日益受到重视,未来核心作者群的发表数量和范围将进一步扩大,对“互联网+”的研究发挥导向作用,并能够有效地指导实践活动。
通过Netdraw软件绘制作者合作网络,得出如图3的作者合作网络。由图3可知,“互联网+”领域的合作群体较少,较为显著的是以谢微、张锐昕为代表和以林拓为代表的合作网络,其余的合作团体分布较为零散。
3.4 机构分布
已有研究在分析机构分布时,为避免因二级单位间合作造成的机构统计虚高的问题,大多将同属某一机构下设的多个单位进行合并统计。出于以下两点考虑本文并未进行合并:为详尽分析不同机构的发文量,且与下文中的机构合作网络进行对比分析;“互联网+”领域内高发文量机构间的合作并不显著。
根据表2可知,发文量排名靠前的机构大多是知名院校的信息管理学院、人文传播学院、教育学院、经管学院,这与高发文期刊的统计结果相一致;高校是“互联网+”研究的主力军,科研院所稍显落后,在表2的统计结果中没有一所科研院所上榜。发文量最多的两个机构同属武汉大学,但两者从未进行合作。通过Netdraw软件绘制机构合作网络,将单一节点设置为不显示,结果见图4。
由图4可知,“互联网+”领域的研究机构间的合作联系相对较弱,在主要的两个合作团体中,相互之间的网络通达性也很差,合作程度不高;与高产机构均为高等院校的情况不同,国家统计局等研究机构也处于合作网络中;在高产研究机构中,仅武汉大学信息管理学院处于主要的合作网络节点中,而其他高产研究机构多数并未出现在机构合作网络图中。
4 研究内容分析
4.1 词频分析
通过对文献关键词出现频次进行统计分析,可以了解某个学科领域研究的主题分布及重点内容,掌握发展趋势。通过Excel软件统计关键词的出现频次,对分析结果进行整理,如将供给侧、供给侧改革等整合为一个关键词;删去无意义关键词,如对策、挑战等;根据统计结果,仅出现过一次的关键词共有720个,以齐普夫第二定律为基础的高低频词界定公式为T=12-1+ 1+8×I1(其中I1为仅出现过一次的关键词的个数),计算得出T=37.45;根据计算结果,截取词频大于10次的关键词进行研究分析,得出共有37个高频关键词。
从表3可以看出,在近4年的文献中,“互联网+”、“大数据”、“图书馆”、“创新”、“政务服务”、“共享经济”、“供给侧改革”等是相关的研究热点问题;除了“互联网+”之外,其他关键词都代表了这个领域的相关热点话题;关于“互联网+”的热点研究大多集中在教育、政务、媒体等方面。高频关键词从各个方面揭示出了目前与“互联网+”的研究热点,但仅从关键词表并不能看出各个关键词之间的关系。为此需要对关键词进行共现分析,并以可视化的方式进行呈现。
4.2 关键词共现分析
将1785条数据导入CiteSpace软件中,时间跨度为 2015-2018年,时间切片设置为1年,阈值选择Top30。在关键词共现图谱中,关键词出现的次数越多,这个词显示得越大,和各个关键词的关系也越密切。由于“互联网+”这个关键词的出现频次远高于其他关键词,展示在图形上将弱化其他关键词之间的区分与关联,故将其隐藏。
根据图5,“互联网+”各领域的研究热点均紧紧围绕“大数据”、“创新”、“互联网思维”、“新常态”等关键性术语展开,尤以“大数据”为主,其中心度为0.33,虽不及“互联网+”的中心度1.22,但远高于其他关键词的中心度。研究热点主要有以下几方面:电子政务、图书馆、新媒体、高等教育、商业模式转型升级、供给侧改革等;而与经济、制造业、农业、能源等国家重点提倡的“互联網+”领域相关的内容稍显薄弱。为进一步细分该领域的研究热点内容,下节进行关键词聚类内容分析。
4.3 聚类内容分析
将1785条数据导入Citespace软件中,时间跨度为 2015-2018年,时间切片设置为1年,阈值选择为Top40,聚类算法选择LLR,得出结果如图6所示。CiteSpace依据网络结构和聚类的清晰度,提供了模块值( Q值)和平均轮廓值( S值) 两个指标,可作为评判图谱绘制效果的依据。一般而言,Q值>0.3就意味着划分出来的社团结构是显著的;S值>0.5则聚类一般认为是合理的,S值>0.7时聚类是高效且令人信服的。根据结果可知,本次聚类的Q=0.50,S=0.65,符合聚类要求。
由图6可知,“互联网+”领域的研究共形成9大聚类主题。根据关键词所属含义、相互之间的联系及各自的Log-likelihood Ratio值,将9个聚类分别命名为“互联网+电子政务”“互联网+大数据”“互联网+图书馆”“互联网+新兴媒体”“互联网+知识服务”“互联网+教育转型”“互联网+电子商务”“互联网+新兴产业”。当前“互联网+”研究的主题内容呈现出层次多样的特点,最热的研究领域还是与大数据技术、电子政务、新兴传媒和教育行业有关。与《“互联网+”行动指导意见》中国家大力提倡的11项重点行动领域的对比发现,在绿色生态、便捷交通和智慧能源等方面的研究整体还较为匮乏,这也是未来急需改善之处。
5 结论
本文利用文献计量方法,通过对国内CSSCI收录的“互联网+”领域内的文献信息进行相关统计和可视化分析。研究发现自“互联网+”概念被正式提出以来,该领域的发文量持续保持高速增长,但发文质量需进一步提升,且尚未形成主流合作群体。“互联网+”领域的研究热点多集中在公共服务、传媒、教育、制造等行业,而对金融、农业、物流等行业的研究关注度不足,更为欠缺的是在绿色生态和智慧能源等方面,这也是未来的重点研究方向。
参考文献
[1]张伯旭,李辉. 推动互联网与制造业深度融合——基于“互联网+”创新的机制和路径[J]. 经济与管理研究,2017,38(2):87-96.
[2]欧阳日辉. 从“+互联网”到“互联网+”——技术革命如何孕育新型经济社会形态[J]. 学术前沿,2015,(10):25-38.
[3]阿里研究院. “互联网+” 研究报告[EB/OL]. [2018-03-08]. http://i.aliresearch.com/img/20150312/20150312160447.pdf.
[4]刘仲翔. 评价,创新——2017年国内社科学术期刊动态盘点[J]. 北京:科技与出版,2018,(03):39-46.
[5]朱亮,孟宪学. 文献计量法与内容分析法比较研究[J]. 图书馆工作与研究,2013,(06):64-66.
[6]Moed HF,Bruin RED,Van Leeuwen TNV. New Bibliometric Tools for the Assessment of National Research Performance: Database Description,Overview of Indicators and First Applications[J]. Scientometrics,1995,(3):381-422.
[7]Tsai H H. Knowledge Management VS. Data mining: Research Trend,Forecast and Citation Approach[J].Expert System with Applications,2013,(8):3160-3173.
[8]陈超美.Citespace Ⅱ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,(6):401-421.
[9]李雪蓉,张晓旭,李政阳等. 商业模式的文献计量分析[J]. 系统工程理论与实践,2016,36(2):273-287.
[10]胡德華,种乐熹. 国内外学科馆员研究的可视化分析与比较[J]. 图书馆理论与实践,2015,(06):36-41.
[11]员立亭. 我国图书馆界微信研究述评[J]. 图书馆工作与研究,2018(4):25-30,58.
[12]张春博,丁堃,曲昭,等. 基于文献计量的我国创新驱动研究述评[J]. 科技进步与对策,2015,32(9):152-160.
[13]唐恒,孙莹琳. 2011-2015 年国内情报学领域专利研究现状—基于 9 种情报学 CSSCI 期刊论文的分析[J].图书情报研究,2018,11(1):54-62.
[14]杜坤,陈兰杰,李继存.2012-2016年国内外政府信息研究对比分析[J].图书馆工作与研究,2018,(4):64-72,77.
[15]储节旺,孙晓宁. 国内图书馆知识管理研究现状的文献计量分析[J].图书馆理论与实践,2012,(9):21-26.
[16]陈悦,陈超美,刘则渊,等. CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253.