APP下载

基于知识图谱的国际图情领域研究现状与前沿分析

2012-04-29黎九平

现代情报 2012年9期
关键词:知识图谱研究现状

黎九平

〔摘 要〕运用知识图谱方法对国际图情领域2001-2011年的相关文献进行多角度的定量定性分析,描绘该领域近年来的研究现状与前沿。结果表明,目前该领域的文献量稳步增长,核心著者和高产机构主要来自欧美国家。目前的研究前沿主要集中在信息系统、信息服务、信息计量和知识管理等领域,研究方法注重学科和社会人文的融合。

〔关键词〕知识图谱;研究现状;前沿分析;图情领域

〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2012)09-0020-05

随着社会信息化和知识化的迅速发展以及iSchool(The School of Information Studies,iSchool)联盟的不断推进和壮大,推动了图书情报领域的研究范围从传统的图书情报领域拓展到信息科技领域、研究对象从实体的图书情报机构延伸到虚拟数字空间。这些变化使得图书情报学的研究受到前所未有的关注与重视,众多专家学者对图书情报学在社会变革和日常工作中发挥的理论价值和实践意义有着更深层次的认识和理解,对于图书情报学知识结构及其演化规律的探索也在不断向前推进[1-2]。本文在此背景下,为了更加全面的了解和把握国际图书情报学领域的研究现状和热点,运用知识图谱方法[3]对该领域的相关文献进行以定量分析为主、定性分析为辅的研究,分析和探索国际图书情报领域研究现状和前沿,把握国际图书情报学领域的研究脉络,明确图书情报学研究领域的发展趋势,为我国图书情报学领域的研究重点和方向提供一定的参考依据,为推动我国图书情报学的发展和繁荣提供活力和契机,使其更好地适用于我国信息化社会的建设。

1 数据来源

本文研究的数据来源于美国科学情报研究所建立的全球著名的综合性社科类文献数据库——社会科学引文索引(SSCI)。该数据库是目前世界上可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具,内容覆盖社会学、法律经济、管理系、信息科学等55个领域,具备很高的学术影响力,所收录的文献能够在一定程度上展示国际图书情报学研究领域的进展和前沿。由于图书情报学领域的研究呈现多方位、全面性、多学科渗透的交叉发展的趋势,在实际研究中很难将所有数据采集完全。因此,在数据采集的过程中结合《期刊引证报告》中2006-2011年间图书情报领域平均影响因子排名前十的期刊作为来数据采集的来源期刊,如表1所示。

确定来源期刊后,在Web of Science数据库中选择ISI和SSCI数据库以2001-2011作为检索时间段进行检索,共获取包含Article、Review、Proceedings Paper等多种类型的文献8 975篇,选取占文献总量70.23%的Article和Review作为分析的样本,总计6 303条。

2 研究现状描述

2.1 文献信息量统计

发表文献的数量在一定程度上代表着某个领域的研究水平和发展趋势。图1展示的是所选择的数据来源期刊10年间的发文数量。

图1 按所选择的数据来源期刊进行文献信息量统计

从图1可以,图书情报领域的研究成果主要发表在JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION和SCIENTOMETRICS期刊上。JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION是美国情报科学与技术学会的会刊,主要发表权威专家的精辟论述,是情报学界的标志性刊物;SCIENTOMETRICS是科学计量学和情报学领域的前沿期刊,主要运用定量方法进行图书情报领域的计量分析,反映学科的发展趋势和典型模式。

2.2 论文著者统计分析

著者发文量和被引频次可以识别某领域的核心作者及其学术影响力[4]。本文选择发文量和被引频次排名前十的作者视为该领域的核心作者和高被引作者,统计分析结果如表2和表3所示。

从表2和表3可以看出,EGGHE L以发文量65篇排在发文量榜首,SALTON G以被引频次453次成为该领域中被引频次最高的著者。EGGHE L主要从事科学计量学领域的研究,所发表的学术论文大多是关于g-指数、h-指数等相关文献学文献,SALTON G主要从事信息检索、现代搜索技术的研究与应用开发工作,所提出的向量空间模型、逆文档频率、术语频率、术语偏离值等概念和检索过程中的相关反馈机制,极大地促进了信息检索领域的发展,被誉为现代搜索技术之父。更引人瞩目的是LEYDESDORFF L、GLANZEL W和SPINK A等3位作者在发文量和被引频次列表中均进入了前十名。LEYDESDORFF L主要从事系统理论、社会网络分析和社会学创新等学科的研究,有着较高的发文量和被引频次;GLANZEL W在被引频次数量上超过LEYDESDORFF L和SPINK A,足见其在图情领域中的影响力和核心地位;SPINK A曾就职著名的搜索引擎公司InfoSpace和Vivisimo,主要从事用户行为和搜索引擎技术的研究[5]。

2.3 高产机构分析

统计表明这些文献数据来自937个不同的研究机构,表4列出的是发表论文排名前十的高产机构。

从论文数量来看,发文量排名前三的是印第安纳大学、华盛顿大学和哈佛大学,其发文量所占比例分别为2.03%、1.79%和1.70%,表明这3个机构在图书情报领域研究中较为活跃,有较高的学术成果发表。其它排名比较靠前的机构还有北卡罗来纳大学、马里兰大学、匹兹堡大学、亚利桑那大学等。

从地区上看,排名前十的高产机构中,美国占据90%的席位,显示出美国在该领域有着强大的学术影响力,支持和推动着图书情报学的发展和前进。排名第八的比利时天主教鲁汶大学是唯一一所非美国的高等院校,该校是欧洲国家的重要高等学府,为图书情报学在欧洲的发展和普及起到不可磨灭的贡献和力量。

3 知识基础与前沿分析

3.1 研究热点与前沿

关键词是作者对论文主题的高度提炼和概括,能够准确地反映文本内容的核心和精髓,通过高频关键词来考察一个学科领域的研究热点和前沿就具备很强的代表性[6-7]。本文将下载的数据导入CitespaceII中,网络节点类型选择Keyword,时区分割选择为1,即10年的数据以年为单位切为10片,阀值选为出现频次最高的top50,运行软件得到关键词共现图谱,通过点击图谱中节点,获取高频关键词的出现频次,如表5所示。

从表5可以看出,关键词频次最高的是Science,出现频次为475次,反映出图书情报领域的研究必须借助科学的方法、工具和软件才能取得更好的研究成果;其次是Model,表明在实际应用过程中,需借助一定的模型来更好的解决现实问题,借助数据模型是促使图书情报研究从简单的定性描述向高级的定量分析的必由之路。排在第三位的是Systems,表明图书情报领域的研究比较重视理论联系实际,注重应用系统的开发和应用。其它高频关键词如Technology、Performance、Behavior等代表图书情报学科的不同发展趋势和研究倾向。

为了更好地了解高频关键词所反映的研究主题,通过聚类将这些关键词按其联系的紧密程度进行聚类,获取4个聚类主题,如图2所示。

通过图2可以看出,高频关键词反映的研究主题主要分为4个方面:

3.1.1 信息系统

该主题的高频关键词主要有system、information-systems、retrieval、information technology、business value等。该主题反映图书情报学的研究比较注重信息技术的开发和应用,通过利用现代计算机和网络通讯技术平台,加强和提高企业的信息化水平,辅助企业决策,体现出国际图书情报学的研究比较注重将技术、社会和人文进行有机的结合,强调理论研究为应用服务,将学科价值应用到实际生活中去,也是图书情报学发展的最终目的和自我价值的实现。

3.1.2 知识管理

该主题的高频关键词主要有knowledge management、information retrieval、networks、www等。该主题反映图书情报学的研究更多的是挖掘和发现组织中的隐形知识,并对其进行有效地管理和利用。当前,企业获取知识的途径由传统的文献资料向网络空间进行过渡,企业更多地通过网络获取其所需要的知识和信息。

3.1.3 信息计量

该主题的高频关键词主要有bibliometrics、journals、citation analysis、collaboration、indicators等。该主题反映出随着信息资源数字化的迅速发展和普及,通过定量方法来描述和研究信息的动态特征和内在规律,更好地帮助用户进行信息的筛选和评价,提高信息的利用效率和用户的满意度。

3.1.4 信息服务

该主题的高频关键词主要有behavior、user acceptance、E-commerce、trust、relevance等。该主题反映出随着社会信息化得发展,从用户的角度进行信息服务的研究和开展,有助于提供用户信息服务的满意度,能够将有价值的信息传递给特定的用户,实现信息增值和信息资源的优化配置。

为了确定该领域目前的研究前沿,本文选用突变检测算法来挖掘和发现该领域的突变专业术语,同时选择时间线索聚类视图,得到图3所示的聚类知识图谱。

图3 图情领域关键词聚类图谱

通过图3可以看出,通过词频变化较高的突变专业术语有information technology、journals、h-index,这些都是目前的研究前沿。此外,生成的关键词聚类图谱所反映的八大聚类中与高频关键词聚类得到的四大主题十分相似,都是围绕信息系统、信息服务、信息计量等方面进行展开。

3.2 知识基础

通过对知识基础的共被引分析,有利于进一步明确相关研究热点的本质属性和规律,把握学科的发展方向和趋势[8]。利用CitespaceII提供的共被引分析功能能够对所采集的文献数据进行共被引知识图谱的绘制,运行结果如图4所示。表6列出的是被引频次100次以上的高被人文献,括号中给出的是相应文献在谷歌学术中检索到的被引频次(截止2011-11-25)这些高被引文献构成了图书情报学领域的知识基础,具备很高的学术价值。

猜你喜欢

知识图谱研究现状
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
试井法分析井间注采关系的研究现状
人民检察院量刑建议制度构建与完善
我国环境会计研究回顾与展望
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
浅析电力系统谐波及其研究现状