云计算技术在我国数字图书馆领域应用的现状
2016-11-21东莞理工学院
兰 瑛(东莞理工学院)
云计算技术在我国数字图书馆领域应用的现状
兰瑛
(东莞理工学院)
以CNKI中国知网为对象,检出数字图书馆云计算论文736篇,按照检出文献类型、发表时间、期刊、作者、机构、基金和
等项目进行统计分析,探讨我国数字图书馆领域云计算技术应用的主要现状、基本特点与一般规律,剖析存在的问题和不足,促进图书馆云计算技术的快速应用。
云计算;数字图书馆;文献计量学
云计算(Cloud Computing)的定义有数十种甚至上百种,现阶段广为接受的是美国国家标准与技术研究院(NIST)的定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池。[1]我国学者刘鹏教授指出:云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。[2]云计算具有超大规模、虚拟化、高可靠性、通用性、高可扩展性、按需服务、极其廉价等特点,现已广泛应用于云物联、云存储、云游戏、云安全等相关领域。云计算技术在数字图书馆的应用也成为当前国内外图书情报领域的研究热点。笔者以云计算技术在国内数字图书馆领域研究与应用的文献为基础,采用文献计量学方法统计分析中文期刊上发表的数字图书馆云计算论文,通过高频关键词的统计分析和共词聚类发现当前国内数字图书馆云计算研究和应用的热点,剖析存在的问题和不足,为云计算技术在数字图书馆领域的应用提供第一手资料,促进云计算在图书馆的快速应用。
1 数据来源与方法
利用CNKI的跨库检索、高级检索功能和“主题”字段,检索出包含“云计算”、“数字图书馆”或“数字化图书馆”三个关键词的论文736篇,检索时间为2016年1月10日。同时,采用文献计量学方法,对736篇相关论文从文献种类、发表时间、期刊、作者、机构、基金和关键词等项目进行聚类和文献计量学分析,厘清我国数字图书馆云计算技术研究与应用的主要现状、基本特点与一般规律。
2 结果
2.1文献类型与论文年代分布
736篇论文的文献类型包括期刊(686篇)、博硕士学位论文(32篇)、国内外会议论文(11篇)、报纸论文(1篇)、专利文献(1篇)、科技成果(5篇),论文的年代分布见表1。
2.2期刊
736篇论文中有686篇发表在中文期刊上,其中,发表论文在4篇以上(含4篇)的40种期刊见表2。表中百分比为某种期刊或某些期刊(载文量相同的期刊种数)刊发论文占期刊论文总数686篇的比例,如:《科技情报开发与经济》杂志发文28篇,占比4.08(28/686);《图书馆理论与实践》《图书馆学研究》2种期刊合计发表论文42篇,占比为6.12%(42/686)。
表1 736篇数字图书馆云计算论文的发表时间(单位:篇)
表2 我国数字图书馆领域云计算论文的期刊分布(单位:篇)
2.3作者与机构
通过利用CNKI的分组浏览功能,选取了发表文章最多的前40位作者进行统计,其中,最高发文为52篇,有1人;1人发表37篇、1人发文6篇、3人各发表论文5篇、3人各发表论文4篇、15人各发文3篇、16人各发文2篇(详见表3)。这40人中有3人来自公共图书馆,其余37人均来自全国普通高等院校。高校37位高产作者累积发文191篇,占论文总数的26%,说明高校是数字图书馆云计算研究与应用的重要基地,也说明高校图书馆丰富的数字化资源需要通过云计算和后台资源调度实现资源共享,提高数字化资源的利用效率。
按照CNKI的分组浏览功能聚类,40所机构(活跃机构)累积发文263篇,占论文总数736篇的35.7%。其中34所高校发文238篇;公共图书馆5所发文22篇;CALIS管理中心发文3篇。按机构进行聚类,情况如下:兰州商学院(70)、渤海大学(10)、南京大学(9)、武汉大学(9)、华中师范大学(7)、南通大学(7)、黑龙江大学(6)、吉林大学(6)、山东大学(6)、北京邮电大学(6)、信阳师范学院(6)、西安电子科技大学(6)、齐齐哈尔大学(5)、浙江工业大学(5)、黄冈师范学院(5)、中国矿业大学(5)、华东师范大学(5)、福建省图书馆(5)、云南省图书馆(5)、湖南师范大学(4)、辽宁师范大学(4)、安徽大学(4)、南阳师范学院(4)、中山大学(4)、桂林理工大学(4)、上海大学(4)、西安科技大学(4)、漯河医学高等专科学校(4)、福州大学(4)、南昌大学(4)、辽宁行政学院(4)、湖北工业大学(4)、燕山大学(4)、中国国家图书馆(4)、黑龙江省图书馆(4)、南京图书馆(4)、南京信息工程大学(3)、江苏师范大学(3)、云南大学(3)、CALIS管理中心(3)。
表3 高产作者发文情况(单位:篇)
2.4基金资助
据不完全统计,包括国家社会科学基金、国家自然科学基金在内的至少23种基金资助了我国数字图书馆云计算研究与应用项目,合共产出52篇基金资助论文,基金论文比约为7%(52/736)。其中,国家社会科学基金、国家自然科学基金、国家重点基础研究发展计划等三种国家级基金资助论文24篇,教育部跨世纪优秀人才培养计划、江苏省教育厅人文社会科学研究基金等20种省部级基金项目资助论文28篇。按基金分组:国家社会科学基金(13)、国家自然科学基金(10)、江苏省教育厅人文社会科学研究基金(5)、湖南省教委科研基金(3)、湖南省社会科学基金(2)、山东省软科学研究计划(2)、黑龙江省博士后科研启动基金(1)、海南省自然科学基金(1)、河南省软科学研究计划(1)、浙江省教委科研基金(1)、河南省教委自然科学基金(1)广东省自然科学基金(1)、湖北省自然科学基金(1)、江西省自然科学基金(1)、甘肃省教委科研基金(1)、江苏省科委社会发展基金(1)、福建省教委科研基金(1)、跨世纪优秀人才培养计划(1)、山东省科委基金(1)、陕西省教委基金(1)、上海科技发展基金(1)、河南省科技攻关计划(1)、国家重点基础研究发展计划(1)。
2.5
是论文中有实质意义的词,某个词出现的频率越高,有关这个
的研究越热门。按照
出现频次进行排序,得到了论文数量靠前的30个
云计算(536)、数字图书馆(406)、图书馆(72)、云服务(47)、高校图书馆(35)、云存储(33)、虚拟化(30)、服务模式(26)、信息资源(25)、信息服务(24)、云图书馆(24)、云服务模式(22)、资源共享(22)、信息安全(21)、云计算技术(19)、大数据(19)、移动图书馆(16)、个人数字图书馆(12)、应用(11)、云计算机(11)、数据中心(11)、云计算架构(10)、策略(9)、虚拟机(9)、数据存储(9)、智慧图书馆(9)、高校数字图书馆(8)、数字资源(8)、安全(8)、云计算技术应用(8)、图书馆联盟(8)、物联网(7)、数据挖掘(7)、基础设施即服务(7)、数据安全(7)、对策(7)、共建共享(7)、三网融合(6)、SOA(6)、图书馆建设(6)。
3 讨论与建议
3.1文献品种多样化提示要多途径多渠道获取数字图书馆云计算文献
736篇数字化图书馆云计算研究论文中,期刊论文686篇居第一,占93%,是获取相关文献的重要信息来源。会议论文、博士学位论文、硕士学位论文、专利文献、科技成果、报纸等文献仅占论文总数736篇的7%,是获取数字图书馆云计算论文的补充。
3.2数字图书馆云计算研究经历了快速发展和稳定两个阶段
云计算概念于2006年8月9日由GOOGLE首席执行官埃里克·施密特首次提出,次年GOOGLE与IBM开始在美国大学校园推广云计算计划,取得巨大成功,由此引起了社会的广泛关注。[3]2008年汤帜在“新观点新学说学术沙龙系列活动之二十四:数字时代图书馆的创新与共享”中探讨了云计算与图书馆共享合作的问题,[4]这是国内最早就云计算在图书馆资源共享领域应用进行的探索与思考。同年,陈洋[5]指出云计算能为数字化图书馆提供技术支撑,最大程度地降低数字化图书馆的运维成本,实现全球级资源共享。2009~2015年,国内发表了736篇数字图书馆云计算研究论文,显示了云计算技术在数字图书馆的应用正在成为热点。基于文献计量学的研究,发现我国数字图书馆云计算研究经历了两个阶段:快速发展阶段和稳定阶段。2008~2012年为快速发展阶段,这一阶段的论文增长速度虽不均匀,但数量稳定增长,2008年1篇(来自万方数字化资源系统,中国知网未收录)、2009年11篇、2012年167篇,显示出国内同行在国外新技术新理念的吸收应用上比以往更加敏感和积极,加速了云计算技术在我国的应用进程,促使数字图书馆领域云计算研究成为图书馆学情报学界的热点。2013~2015为稳定阶段,每年论文产出呈现出逐步回落态势,但幅度不大,说明云计算技术从引进和应用热转换为人们对云计算技术应用后的冷静思索和全方位评估,人们较以往更为客观全面地权衡云计算技术应用于数字图书馆的信息安全问题和信息资源共享问题等。[3]
3.3核心期刊尚未形成
从分组浏览的结果来看,40种学术期刊累积发文占比为60%(410/686),按照二八定律,只有当数量占20%的期刊发表80%论文时,核心期刊才算形成。[6]据此推断,数字图书馆云计算研究的核心期刊尚未形成。40种期刊的学科分布情况为:图书情报档案学期刊29种发文666篇,其中15种为核心期刊,发文150篇;其他5种期刊发文35篇,论文产出呈现出较为明显的集中—离散分布规律,说明我国数字图书馆云计算研究以图书馆学情报学档案学人员为主体,该选题引起了图书情报档案学核心期刊编辑的高度关注。
3.4核心作者群和活跃机构群正在形成,高校成为重要的研究场所
发表论文最多的40位核心作者累积发表论文199篇,仅占论文总数的27%;发表论文最多的40所机构发表论文263篇,仅占论文总数的35.7%。依据核心作者和核心机构形成的二八定律,可知我国数字图书馆云计算研究与应用方面的核心作者不多,核心作者群和活跃机构群正在形成的过程中。37位核心作者来自高校、34所机构为普通高校,说明高等院校作为一支举足轻重的力量引领着数字图书馆云计算研究。
3.5高级别基金的资助推动了我国数字图书馆云计算研究与应用
国家级别基金和省部级基金的资助使我国数字图书馆云计算研究与应用风生水起,在不到8年的时间里已经取得了较为丰硕的研究成果。全国和省部级基金的较广泛支持、全国图书情报档案界和计算机界同仁领域的重视,促进了我国数字图书馆云计算研究与应用的兴起,也催生了高质量高水平论文。100%的省部级以上基金论文、约50%的国家级基金论文显示了数字图书馆云计算研究论文质量和水平均较高,这一点可从15种图书馆学情报学档案核心期刊发文占期刊论文总数686篇的20%(150/686)得到印证。
3.6热点不热,创新乏力
根据词语共现规则,排除数字图书馆、云计算两个的同义词和近义词,合并部分
的下位词,合并同义词和近义词,去除涉及范围大但没有实质意义的高频词如应用、策略、对策等,同时去除含图书馆或云计算的词,得到的高频
有11个:服务(119)、资源(55)、存储(42)、虚拟(39)、数据(37)、安全(36)、物联网(7)、基础设施即服务(7)、共建共享(7)、三网融合(6)、SOA(6)。其中服务、资源、存储、虚拟、数据、安全等
的文献都在30篇以上,可以称为数字图书馆云计算研究的热点;物联网、基础设施即服务、共建共享、三网融合、SOA等
的文献均不到10篇,有可能在今后一段时间里成为研究热点。从国内发表的数字图书馆云计算论文来看,涉及资源与服务的文章相对较多,涉及云计算技术的文章较少,说明当前数字图书馆云计算研究技术含量不高,热点不热,创新乏力,须进一步提高研究水平。
4 结语
云计算概念从提出到研究与应用尚不足10年时间,在我国数字图书馆的研究与应用不到8年。从总体上看,我国数字图书馆云计算研究经历了快速发展和稳定发展两个阶段,图书情报档案领域期刊是主要发文场所,核心期刊发表论文占比高,高校成为数字图书馆云计算研究的重要阵地,高级别基金论文比例高。但文献计量学分析显示出的问题不容忽视:多样化文献的集成搜索,核心作者和活跃机构不多,研究应用的技术含量不高,研究热点分散等。可以这么说,2008年对云计算与数字图书馆创新与共享的思考促使人们将眼光瞄准了云计算技术在数字图书馆的应用,数字图书馆资源调度、整合、检索与数据挖掘也给了云计算技术应运而生的机遇。从总体上看,数字图书馆云计算论文的产出并非易事,在经过快速增长的几年之后逐步趋于稳定,且有逐年下降的势头,这不能不让人担忧数字图书馆领域云计算技术应用瓶颈的问题——来自不同数据库商的异构多样化书目数据库集成搜索和知识产权保护。如果数字图书馆领域云计算技术仅在一个图书馆或一所重点高校的多校区图书馆应用,这难免不让人产生“杀鸡用牛刀”的感觉。如果不能从根本上消除数据库商一家独大、野蛮涨价的势头,不能让资源共建共享成为数字图书馆的主流目标,那云计算技术在数字图书馆的应用就真成了一句空话。综合国内的研究现状和进展,可以发现数字图书馆云计算研究与应用还存在以下一些问题与不足:认知程度较低,研究核心力量缺乏;研究内容单一,存在低水平重复;研究力量分散,缺少合作沟通;研究层次不高,忽视研究质量和水平。这些主要问题,需要在今后的研究和应用中逐步解决。
[1]十种方法保持云中数据安全[EB/OL].[2015-12-27].http://netsecurity.51cto.com/art/201308/4079 75.htm.
[2]百度百科.云计算[EB/OL].[2015-12-20].http: //baike.baidu.com/link?url=7c37t1AIHxocF.
[3]钟辉新.国内近5年云计算研究文献统计与可视化分析——兼论基于“云”的数字图书馆研究热点[J].情报探索,2012(5):5-8.
[4]汤帜.云计算与共享合作[C]//中国科学技术协会学会学术部.新观点新学说学术沙龙文集24:数字时代图书馆的创新与共享.中国科学技术协会学会学术部,2008.
[5]陈洋.云计算与数字化图书馆技术发展[J].现代图书情报技术,2008(z1):7-11.
[6]佟矿.计算机辅助教学的现状与发展[J].中国医学教育技术,2013,27(3):255-257.
Application Status and Development of Cloud Computing Technology in Domestic Digital Library
Lan Ying
With the keywords of“cloud computing”and“digital library”in CNKI,this article makes a statistical analysis on the 736 articles of retrieved according to article type,post time,issued journals,author,organization,keywords,etc,to reveals status,characteristics and general rules of cloud computing application in domestic digital libraries.Meanwhile,it analyzes the existing problems so as to promote the application of cloud computing in libraries.
Cloud Computing;Digital Library;Literature Metrology
G250.76
B
1005-8214(2016)10-0083-04
兰瑛(1978-),男,计算机应用硕士,电子工程师,研究方向:信息技术管理与研究。
2016-01-20[责任编辑]王岗