APP下载

基于h指数和知识图谱的学科研究热点分析

2012-04-29韩曾丽

现代情报 2012年9期
关键词:图情馆员图谱

韩曾丽

〔摘 要〕文章以h指数的定义,来界定高被引论文,然后以CiteSpaceⅡ软件作为分析工具,以文献关键词作为节点。通过对关键词的频次和关键词之间的连接的分析,从而体现图情领域研究的热点和发展方向。

〔关键词〕h指数;知识图谱;CiteSpaceⅡ;研究热点

〔中图分类号〕G250 〔文献标识码〕A 〔文章编号〕1008-0821(2012)09-0163-05

h指数代表“高引用次数(High Citations)”,是在2005年由美国Jorge E Hirsch教授首次提出,它将数量指标(发文量)和质量指标(被引量)结合起来,更好地显示了科学工作者的科研成果。Hirsch将h指数定义为:一位作者的h指数等于其发表了h篇至少被引h次的论文,即一个作者的h指数表明其至多有h篇论文被引用了至少h次[1]。之后,Braun等将h指数用于评价期刊的质量,提出一种期刊的h指数等于该期刊发表了h篇每篇至少被引h次的论文,或者说一种期刊的h指数是该期刊所发表的全部论文中最多有h篇至少被引用了h次[2]。本文中,我们借鉴h指数的定义,认为某一学科领域某一年的h指数等于该领域在该年发表了h篇每篇至少被引h次的论文,或者说该学科领域该年所发表的全部论文中至多有h篇被引用了h次。然后以h值作为界定高被引论文的阈值。

知识图谱(Mapping Knowledge Domain),是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源极其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关联[3]。CiteSpaceⅡ是信息可视化领域的权威专家陈超美博士开发的可视化软件,属于多元、分时、动态的第二代信息可视化技术。它能够绘制科学知识图谱,显示一个学科或知识域在一定时期发展的趋势与动向,形成若干研究前沿领域的演进历程[4]。

为了准确地分析本世纪以来我国图情领域的研究热点,本文引用h指数的定义,来界定高被引论文,然后以CiteSpaceⅡ软件作为分析工具,以文献关键词作为节点,通过对关键词的频次和关键词之间的连接的分析,从而体现图情领域研究的热点和发展方向。

1 数据收集及方法选择

本文利用CNKI数据库中的中国学术期刊网络出版总库,选取“图书情报与数字图书馆”分类,分别检索发表于2000-2011年的核心期刊研究论文,按照被引频次降序排列,根据前文中对h指数的定义,统计出图情领域2000-2011年各年的论文的h指数,统计结果见表1。检索时间为2012年6月11日。

将统计出来的528篇文献记录输出保存,转换成CiteSpaceⅡ可以识别的格式导入CiteSpaceⅡ,然后对需要的参数进行设置,选择时间跨度为2000-2011年,时间切片为1年,主题来源为标题(Title)、摘要(Abstract)、主题词(Descriptors)、标识符(Identifiers),主题词类型为爆发词(Burst Terms),以关键词作为节点,选取每一时区被引频次最高的前30个关键词,以最小生成树的方式对记录进行分析,绘制出聚类的图谱。2 结果分析

2.1 聚类图谱分析

根据网络节点的组配,绘制出图情领域高被引论文中文关键词的分析图谱,图谱由220个节点、225条连线组成。即分析文献中有220个关键词通过225条连线进行组配。如图1所示。

图1 图情领域高被引文献中文关键词聚类视图

(1)根据关键词的词频统计,出现频次较高的有图书馆、数字图书馆、信息服务、高校图书馆、学科馆员、知识管理、图书馆服务、网络环境、云计算、大学图书馆、公共图书馆、服务模式、知识服务、创新等,这和聚类视图中显示出的各个节点相对应。每个节点代表一个关键词,节点的大小表示这个关键词出现的频次的高低,节点的年轮颜色和宽度代表关键词在时间维度上出现与发展的序列和频次,节点之间的连线代表关键词在文章中出现的频次以及与其他关键词的联系。

(2)在图1上面没有显示出来的,还有一些散落在四周的小节点,它们与图谱的中心没有直接的关联,如语义网、知识自由、h指数、期刊学科分类、期刊评价等,但反映出我国近12年来图情领域的新兴研究以及与其他领域相结合的尚不成熟的研究。

2.2 时间线分析

对关键词聚类进行时间线分析,绘制出图情领域高被引文献中文关键词时间线图谱,如图2所示。在图2中可以看出,Modularity Q=0.5708,Mean Silhouette=0.7798。Modularity Q的取值范围介于0~1之间,越接近1,说明这个网络越具有模块性,可以很好的进行聚类,聚类内的联系越紧密,聚类间的联系越松散。Mean Silhouette的取值范围介于-1~1之间,越接近于1,说明这个聚类的主题越明确。这个聚类结果的Modularity Q和Mean Silhouette值说明这次聚类是合适的[5]。

通过图2,我们可以清晰地看到各主要关键词出现的时间分布及其中心性。在2000-2002年,数字图书馆、信息服务、高校图书馆、学科馆员等关键词都已经存在,并且在十几年间一直是研究的重点;而服务模式在2003年开始出现,说明相关方向的研究是从这时被重点关注的,而对云计算的

图2 图情领域高被引文献中文关键词时间线图谱

研究是从2009年才开始,这与计算机技术的发展密不可分,图书馆与计算机技术的结合成为图书馆发展的趋势。

2.3 时区图谱分析

对关键词聚类进行时区分析,绘制出图情领域高被引文献中文关键词时区图谱,如图3所示。时区图谱是由一系列表示时区的条形区域组成,时区按时间顺序从左向右排列,因而研究前沿指向知识基础[6]。

图3 图情领域高被引文献中文关键词时区图谱

通过图3,我们可以看到右上角显示的是最新热点研究的关键词构成的研究前沿,并可以看出研究前沿与知识基础之间的千丝万缕的联系。这些研究前沿的主题有职业资格、微博客、语义网、共建共享、期刊学科分类等。

3 节点分析

3.1 学科热点分析

由图1可以看出,网络中有7个关键节点(关键节点是共引网络中连接2个以上聚类群组且具有中介作用的节点[7]),分别是图书馆、数字图书馆、信息服务、高校图书馆、学科馆员、云计算和服务模式。关键节点反映了当前的研究热点。这7个关键节点,除了云计算意外,都是围绕着图书馆这一主题在图情领域的基础性研究,反映出一直以来的主流研究主题。

数字图书馆的研究始于信息技术的快速崛起,使数字图书馆成为研究最热、持续时间最久的主研究题。并且由于图书馆数字资源的建设而催生的一系列现象和问题的出现,数字版权问题、数字图书馆服务模式等问题始终悬而未决,使数字图书馆的研究历久弥新,始终是图情领域的热点问题。

信息服务和服务模式的研究都是针对图书馆的服务,服务一直是图书馆工作的主题,也成为图情领域学者研究的主题,无论过去、现在还是未来,都存在并将一直存在于图情领域的研究之中。

高校图书馆是图书馆的一种存在形态,它成为研究的主题与高校的研究氛围密不可分。而学科馆员的研究是图书馆从业者对自身所处环境和问题的认识,有利于提高自身的职业素养,与信息服务、服务模式的研究都紧密相连,成为图情领域的研究热点。

而云计算,是关键节点中研究开始最晚的,作为图情领域的新兴主题和研究前沿,我们对其重点分析。云计算始于2006年亚马逊推出弹性计算云服务,而它在图情领域的应用,是从2009年4月OCLC宣布向它的会员图书馆提供 “基于云的”、Web规模的协作式的图书馆管理服务[8]开始的。在分析的高被引文献中有20篇关于云计算的文章。其中被引频次最高也是研究最早的是胡小菁和范并思的《云计算给图书馆管理带来的挑战》、刘炜的《图书馆需要一朵怎样的“云”?》以及王文清和陈凌的《CALIS数字图书馆云服务平台模型》,这3篇都是《大学图书馆学报》云计算与图书馆的专稿文章,前者讨论为应对云计算给图书馆管理带来的挑战图书馆理论界应当研究的问题[9],中间重点阐述了云计算将会对图书馆行业的IT应用产生的影响[10],后者提出了CALIS云战略和相应的数字图书馆云服务平台模型,都是关于云计算应用于图书馆中的基础性研究。其后的研究大多都是针对图书馆云计算中出现的问题或模式的研究。而秦晓珠、张兴旺和李晨辉的《移动云计算环境下的数字图书馆云服务模式构建研究》作为2010年广西教育厅科研项目“基于云计算的数字化信息资源建设模型及服务体系的研究”的成果之一,开始分析移动云计算环境下数字图书馆的云服务模式,提出利用移动云计算解决传统移动图书馆计算能力弱、存储能力差等问题的思路和模型,使云计算在图书馆中的应用有了突破性的进展[11]。总之,云计算在图书馆的应用才刚刚起步,它给图书馆带来巨大的好处,但也使图书馆面临形形色色的问题,它在图情领域的实践还有很长一段路要走,也势必成为图情领域现在和未来的研究热点和发展方向。

3.2 学科前沿分析

在图3的时区图谱中,我们可以看到当前的研究前沿,有云计算、微博客和职业资格。我们对后两个进行重点分析。

在分析的高被引文献中有4篇关于微博客的文章,其中被引频次最高也是研究最早的是2009年李华和赵文伟的《微博客:图书馆的下一个网络新贵》,通过对微博客在其他领域的应用分析,提出其在图书馆领域应用的可行性[12]。其后,随着越来越多的图书馆开通微博服务,利用微博发布信息、共享信息与读者交流,对微博客在图书馆中应用的研究逐步发展,但大部分停留在对图书馆微博服务的现状的分析,也有学者提出微博客在图书馆中应用的服务模式、信息交流模式,以及图书馆的微博营销等问题,把图书馆微博服务的研究推进一步。目前,越来越多的图书馆开通微博服务,但作为机构专业机构的服务平台,林林总总的信息,参差不齐的服务,以及服务机制等,使图书馆使用微博的过程中遇到接二连三的问题。而作为图书馆的新兴个性化服务,微博服务的研究依然成为图书馆服务研究的一个方向,并在未来与微博的发展同步,解决图书馆微博服务的理论和实践性问题。

职业资格是和学科馆员密切相连的。在分析的高被引文献中的2篇关于职业资格的文章,分别是刘波涛的《建立和完善高校图书馆“学科馆员”制度的几项措施》和陈传夫、王云娣、盛钊和丁宁的《图书馆员去职业化问题、原因及对策研究》,前者提出建立和完善高校图书馆学科馆员的5项措施:建立学科馆员岗位责任制,明确学科馆员的岗位要求和职责;对学科馆员实行资格认证;建立以用户为主的学科馆员考核办法;建立一支合格的学科馆员队伍;确实提高学科馆员的待遇[13],后者根据图书馆员去职业化的现象,指出造成这种现象的原因和应对方式[14]。由于在我国,始终没有建立图书馆员的职业资格认证制度,造成图书馆员的技术素质参差不齐,因此,在图情领域,建立图书馆员的职业资格认证制度是一个长久讨论但至今未果的问题,对它的研究,是图情学者对自身领域的责任感和使命感的体现,历久弥新。

4 问题及结论

本文以我国图情领域的高被引论文为研究对象,借鉴h指数的评价指标,通过最新的信息可视化技术CiteSpaceⅡ软件的分析和处理,绘制知识图谱,展示我国图情领域的研究热点,并且分析了当前图情领域发展所依赖的知识基础以及前沿的发展趋势[6]。

但是,本文的研究还存在有很多不足之处。第一,借鉴h指数的定义,以h值作为界定高被引论文的阈值,不能涵盖所有的高被引文献。特别是在选取最近两年的文献时,由于阈值的限定,选取的文献较少,而使一些当前的研究热点,但被引频次较低的文献成为漏网之鱼,这就使得对研究前沿的分析不能准确地反映当前的实际情况。第二,对学科热点分析时只对云计算这个既是研究热点又是学科前沿的节点进行分析,而对其他的关键节点的分析不够全面。第三,对研究前沿进行分析时,只对微博和职业资格两个前沿主题进行分析,没能对所有反映学科前沿的主题进行分析。

但通过研究我们依然可以发现,围绕着图书馆这个主题,一直备受关注的是数字图书馆、信息服务、高校图书馆、学科馆员以及服务模式的研究,并且这几个热点的研究已经相对成熟。而对云计算的研究在最近三年成为图情领域的研究热点,并有持续发展的趋势,成为研究的前沿。职业资格、微博客、语义网、共建共享、期刊学科分类等主题,以图情领域的基础知识和当前的信息技术为依托,成为目前的研究前沿。

参考文献

[1]Hirsch,J.E.An index to quantify an individual,s scientific research output[J].Proceedings of the National Academy of Sciences of the USA,2005,102(46):16569-16572.

[2]叶鹰.h指数和类h指数的机理分析与实证研究导引[J].大学图书馆学报,2007,(5):2.

[3]秦长江,侯汉清.知识图谱——信息管理和知识管理的新领域[J].大学图书馆学报,2009,(1):30.

[4]陈超美.Citespace科学文献中新趋势与新动态的识别与可视化[J].陈悦,侯剑华,梁永霞,译.情报学报,2009,28(5):401-421.

[5]卫军朝,蔚海燕.基于CiteSpaceⅡ的数字图书馆研究热点分析[J].图书馆杂志,2011,(4):70-77.

[6]赵蓉英,王菊.图书馆学知识图谱分析[J].中国图书馆学报,2011,(2):40-49.

[7]周金侠.基于CiteSpaceⅡ的信息可视化文献的量化分析[J].情报科学,2011,(29):98-101.

[8]OCLC News releases.OCLC announces strategy to move library management services to Web scale[EB].http:∥worldcat.org/arcviewer/1/OCC/2011/11/08/H1320767091756/viewer/file4063.htm,2012-06-12.

[9]胡小菁,范并思.云计算给图书馆管理带来挑战[J].大学图书馆学报,2009,(4):7-12.

[10]刘炜.图书馆需要一朵怎样的“云”?[J].大学图书馆学报,2009,(4):2-6.

[11]秦晓珠,张兴旺,李晨辉.移动云计算环境下的数字图书馆云服务模式构建研究[J].情报理论与实践,2012,(5):90-93.

[12]李华,赵文伟.微博客:图书馆的下一个网络新贵[J].图书与情报,2009,(4):78-82.

[13]刘波涛.建立和完善高校图书馆“学科馆员”制度的几项措施[J].图书馆论坛,2004,(1):47-48.

[14]陈传夫,王云娣,盛钊,等.图书馆员去职业化问题、原因及对策研究[J].中国图书馆学报,2012,(1):5-18.

(本文责任编辑:孙国雷)

猜你喜欢

图情馆员图谱
数字时代图情档学科教育的数据化创新
绘一张成长图谱
新文科建设背景下的图情档学科建设(笔谈)“新文科”呼唤图情档成为“硬”学科
聚青年学者之睿智 窥图情档学科之未来
——写在《图书与情报》“图情档青年学者专辑”出版之前
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
中国盲人数字图书馆服务情况及展望
浅谈图书馆青年馆员职业生涯规划