基于关键词的情报学硕士论文研究内容分析——以《中国优秀硕士学位论文全文数据库》为例
2013-10-13栾旭伦
栾旭伦
(淮阴师范学院国有资产管理办公室,江苏 淮安 223300)
硕士学位论文的发表状况常被认作是衡量学科发展水平和科技产出的一项重要指标[1]。笔者通过词频统计方法和关键词共现聚类方法,对近五年的情报学硕士学位论文进行了词频分析,得出了情报学近年来的研究热点,揭示了情报学的研究现状。
1 数据处理、数据来源及研究方法
文章所采用的研究数据来源于中国知网的《中国优秀硕士学位论文全文数据库》。以“学科专业名称”等于“情报学”、毕业时间为“2008年至2012年”为检索条件,共检索到情报学硕士学位论文1,503篇。其中2008年 284篇、2009年 299篇、2010年346篇、2011年280篇、2012年244篇。检索到的论文单位包含了中国知网上收录的全部情报学硕士点的院校和科研机构。从检索到的硕士学位论文中提取作者、学位论文标题、授予学位年代、导师、关键词、摘要等信息,建立文章研究的题录信息数据库。
文章采用关键词词频方法、关键词共现方法和内容分析法进行研究。通过对5年间各关键词出现的频次和总频次的统计,得出高频关键词。再利用词频共现的方法对高频关键词进行聚类研究,通过聚类结果内容分析来揭示情报学的研究现状。
2 关键词年度频次分析
词频统计(Word Frequency Count)是通过统计一定长度的语言材料中每个词出现的次数,分析统计结果,来确定某领域研究热点和发展动向的文献计量方法[2]。笔者使用武汉大学POST统计软件中的中文词统计功能对获得的情报学硕士论文关键词进行统计分析,选取出现频次为12次以上的关键词作为分析对象,得到的统计结果如下:
2008年~2012年情报学硕士论文关键词出现次数最多的是“知识管理”“竞争情报”“本体”“高校图书馆”“图书馆”“指标体系”和“数字图书馆”。其中“知识管理”“竞争情报”和“指标体系”是情报学自己独有的研究领域,特别是指标体系中与情报计量有关的指标体系和信息经济学中的宏观指标体系,情报学中的“本体”研究则是对信息检索方法的深化。“高校图书馆”“图书馆”和“数字图书馆”反映了情报学与图书馆学的联系,情报学也将图书馆及图书馆服务作为自己研究的一个方向,促进了文献信息服务水平的不断提高。从关键词出现频次由高到低的趋势,可以看出情报学的研究内容逐步走向宽泛。具体词频情况见表1。
表1 2008年~2012年情报学硕士论文关键词词频排名分布表
2008年词频最高的关键词依次为:本体、知识管理、图书馆、对策、指标体系、数字图书馆、电子商务、电子政务、知识服务、高校图书馆。
2009年词频最高的关键词依次为:知识管理、图书馆、竞争情报、高校图书馆、数字图书馆、本体、信息服务、指标体系、实证研究、知识转移。
2010年词频最高的关键词依次为:竞争情报、本体、高校图书馆、指标体系、知识管理、数据挖掘、绩效评价、信息服务、专利分析、企业、数字图书馆、竞争情报系统。
2011年词频最高的关键词依次为:电子商务、层次分析法、数字图书馆、本体、电子政务、竞争情报、指标体系、知识管理、数据挖掘、高校图书馆。
2012年词频最高的关键词依次为:图书馆、知识管理、信息组织、电子商务、竞争情报、云计算、信息服务、本体、知识共享、高校图书馆、层次分析法、网络环境、评价。
3 关键词共现聚类分析
通过对高频关键词进行共现聚类分析可以对情报学的研究热点进行整体的揭示。如果两个关键词在一篇学位论文中共同出现则共现次数为“1”,若它们在n篇学位论文中共同出现则共现次数为“n”。笔者将频率大于11的67个高频关键词在学位论文中的共现情况进行记录,转换为关键词词篇矩阵。笔者用SPSS统计分析软件对数据进行层次聚类,选择“类内连接法”(Within-groups linkage),利用二值方法进行聚类,取用Ochiia系数得到聚类分析图,通过聚类分析图,可以把近五年来情报学的研究热点概括为8大类,每个大类表示一个研究热点。
3.1 文献计量学与数据挖掘
文献计量学一直是情报学的一个重要的研究方向,特别是各类文献数据库的出现,在数据挖掘方法的带动下,不少论文开始用文献计量学的方法分析情报等各个学科的学科结构,比如:中南大学的魏海燕用引文分析的方法对情报学与相关学科进行了研究,得出了它们之间知识的相互转移、知识吸收、知识扩散和主题交叉情况[3];重庆大学的侯筱蓉将新的引文分析方法应用到专利分析中,通过引文路径分析来勾勒专利技术演进图,将得到的结果利用到具体的医用内窥镜技术中,并成功预测了其发展趋势[4]。
3.2 知识管理与竞争情报
知识管理和竞争情报研究是情报学研究的两个固有领域。如何在知识管理中促进隐形知识的发现与转移成为知识管理的一个重要内容,社会网络分析则在知识共享研究中发挥了越来越重要的作用。安徽大学的黄谛用社会网络分析方法分析研究团体中的知识共享,发现知识共享网络的核心人物、边缘点和孤立点[5]。天津师范大学的唐超从本体论、认识论、方法论三个方面探讨了国家竞争情报系统构建的基础性理论框架[6]。
3.3 危机管理、绩效评价和知识转移作用
情报学中的危机管理研究不仅用在图书馆运作中,而且已应用到企业中,无论应用到哪一方面其实质都是从信息的角度对具体情况进行分析[7-8]。知识转移研究是宏观层面上的技术流动,特别应用于国家与国家之间,但也包括机构内部人员的知识转移,比如:吉林大学的吴艳玲探讨了高校科研团队内部知识转移情况[9]。
3.4 公共图书馆、政府与企业
政府自身的信息管理问题,企业的电子商务问题也是情报学研究生选题的一个重要方面。政府如何利用信息共享,信息公开来提高自己的服务水平;公共图书馆如何为政府、企业提供具有特色的信息服务都已成为研究生的研究内容。如:华东师范大学的黄晓曼就解决信息的公开和保密之间的矛盾进行了探讨[10]。
3.5 各种评价方法下的指标体系
这一部分主要包括两个方面的研究内容,一方面是评价指标及体系研究,一方面是知识产权的对策问题研究。包括对绩效的评价研究、对危机预警的评价研究,对大学生信息素养的评价研究。这其中层次分析法以其简单及有效性得到了广泛的应用,比如:西南大学的何晓阳通过层次分析法构建了《医学本科生信息素养评价指标体系》的基本框架,并通过问卷调查证明了在实际应用环境中的有效性[11]。
3.6 数字图书馆和云计算
云计算是信息技术的一种新型形式,通过这种方式可以实现资源的合理共享,山西财经大学的郝雪梅针对煤炭企业信息网络的信息孤岛问题,提出了基于云计算技术的煤炭企业信息化解决方案[12]。数字图书馆的安全问题也是情报学研究的一个持续热点,北京师范大学的石勇提出了基于Web服务的数字图书馆最佳安全实践方案,其中的分布式计算,也就是云计算的根本理念问题[13]。
3.7 本体、信息检索与开放存取
随着网络信息的不断增多,更多的研究者将本体引入到语义网中,构建互联网信息存取方式的检索方法。其中的领域本体应用比较广泛,这使信息中存在了一种概念间的整体关系,对更好地认识领域知识,在领域知识的前提下,更好地检索到想要的信息创造了条件。这些论文对本体理论进行了深入的研究,并且将本体概念引入到各个学科领域,构建了化工文献本体、医学领域本体等[14-15]。
3.8 高校图书馆的知识服务
大学生的信息行为、信息需求的研究具有现实的意义,高校图书馆能开设相关的信息素养课程,培养大学生的信息素养水平;能提供更人性化的信息服务,强化大学生的学习能力。华中师范大学的孙丹探讨了个人用户、企业用户、政府部门用户的信息行为特点,根据用户的信息行为构建了一个个性化知识服务模式[16]。
4 结论
笔者利用词频分析法揭示出2008年~2012年情报学硕士学位论文的高词频关键词,并利用聚类分析将这些高频关键词分为8个大类,分别是文献计量学与数据挖掘;知识管理与竞争情报;危机管理、绩效评价和知识转移;公共图书馆、政府与企业;各种评价方法下的指标体系;数字图书馆和云计算;本体、信息检索与开放存取;高校图书馆的知识服务。研究存在的不足是:受论文发表到数据库收录时间延迟的限制,所选取的中国知网的《中国优秀硕士学位论文全文数据库》,其数据具有一定的滞后性,如:受部分院校学位论文对外公开时限的限制,2012年所检索到的硕士论文数量有所减少;此外,数据库收录的情报学学位论文也不是很全面,北京大学、中山大学等情报学学位论文中国知网未能收录。如何获取更齐全的情报学硕士论文,并与其他相关学科的研究内容进行比较,是需要进一步研究的方向。
[1]张浩,成施充,崔雷.我国情报学硕士学位论文研究热点分析[J].医学信息学杂志,2012(2):44-47.
[2]贡金涛,杨帅,魏晓峰.基于专利词频和信息可视化的特定竞争对手分析——以通用风力发电技术为例[J].现代情报,2013(3):109-114.
[3]魏海燕.基于引文分析的情报学与相关学科的研究[D].长沙:中南大学,2009.
[4]侯筱蓉.基于引文路径分析的专利技术演进图研究[D].重庆:重庆大学,2009.
[5]黄谛.基于社会网络的知识生态系统中的知识共享研究[D].合肥:安徽大学,2012.
[6]唐超.国家竞争情报系统构架的基础性理论框架研究[D].天津:天津师范大学,2008.
[7]孟玲.基于核心竞争力的企业危机信息管理研究[D].郑州:郑州大学,2012.
[8]韩双梅.图书馆危机管理的沟通机制研究[D].哈尔滨:黑龙江大学,2011.
[9]吴艳玲.高校科研团队内部的知识转移模式与机理研究[D].长春:吉林大学,2011.
[10]黄晓曼.政府信息公开下的信息获取权研究[D].上海:华东师范大学,2009.
[11]何晓阳.医学本科生信息素养评价指标体系的构建[D].重庆:西南大学,2011.
[12]郝雪梅.基于云计算的煤炭企业信息化研究[D].太原:山西财经大学,2011.
[13]石勇.Web服务安全问题及其对策研究[D].北京:北京师范大学,2008.
[14]刘卓燕.化学化工文献本体的构建与实现研究[D].上海:上海交通大学,2008.
[15]吕爽.基于叙词表的医学领域本体的构建研究[D].长春:吉林大学,2011.
[16]孙丹.基于用户信息行为的个性化知识服务研究[D].上海:华中师范大学,2012.