基于参考文献出版年图谱的知识管理演化研究
2018-08-22杨冬敏武汉大学信息管理学院
杨冬敏,李 信 (武汉大学信息管理学院)
学科演化是指特定学科或研究领域在时间维度上的发展变化过程,展示了某一学科或研究领域的发展态势和未来趋势,是研究学科发展规律的重要手段。[1]知识管理领域作为一交叉研究领域,也有着丰富的发展演化历程,知识管理领域的学科演化研究在帮助研究者梳理特定领域发展脉络,找出研究领域的经典文献,以及为学科未来发展和战略决策提供情报支持等方面具有重要意义。
目前,进行学科演化分析的方法主要有基于引文的分析方法、基于主题词分析方法、引文和主题词分析结合的分析方法,这三种方法虽然在学科演化研究中得到了比较广泛的应用,但在应用过程中也凸显了其局限。① 基于引文分析的方法一般是根据同领域文献之间的引用关系进行演化分析,无法反映所研究领域之外的文献对当前学科的演化产生的影响,并且在高被引文献基础上进行的演化分析,会丢失绝对引用频次不高但对学科演化具有重要影响的文献。②基于主题词的学科演化分析,对词的选择非常敏感,文献著者的取词习惯和不规范的关键词都会对分析结果产生影响,而且研究者在运用关键词进行演化分析时,一般需要根据词频对关键词集进行一轮筛选,高频关键词的标准设定由研究者主观决定,这也会影响分析结果的可信性。③ 两种方法结合的混合方法,考虑了引文和主题词两个方面,这也使其应用过程太过复杂,而且在整合两种方法时权值的设定上存在一定的主观性,不同的学科领域或者研究主题没有普遍适用的标准权值。
基于此,本文尝试使用一种新兴的科学计量方法——参考文献出版年图谱,对知识管理领域的发展演化进行探究,识别知识管理领域的重要年份、重要文献,揭示知识管理领域的演化历程,并与传统学科演化分析的结果进行对比,以期为学科演化分析在方法选择上提供一个新的思路。
1 相关研究
参考文献出版年知识图谱(Reference Publication Year Spectroscopy,RPYS)方法从参考文献的角度出发,通过文献集参考文献出版年份的总被引频次随时间的分布,识别出特定领域发展进程中出现的引文出版年的峰值年份,揭示峰值年份的出版文献对该领域演化的贡献,探究该领域的理论基础和历史根源。[2]RPYS方法提出之后,已经有多位学者将其应用于相关领域的历史根源探索,如,Barth等[3]对粒子物理学中希格斯玻色子研究的经典历史根源文献进行探寻,Leydesdorff等[4]对石墨烯和太阳能电池领域的历史根源文献进行探索,Elango等[5]用RPYS探测摩擦学的历史根源,国内学者李信等[6]对RPYS的概念和原理进行了详细介绍,并利用 RPYS对健康信息素养领域的历史起源问题进行了研究。
与传统引文分析方法所考虑的文献绝对被引频次不同,该方法从参考文献的角度出发,使得每篇参考文献的被引频次均来自被分析领域文献的引用,代表了每篇参考文献与被分析领域的关联程度,而且根据图谱波动确定重要年份,进而确定被分析领域的起源发展中的重要文献,使得在学科演化发展进程中每个阶段的相对重要年份得以凸显;另一方面从参考文献的角度探寻根源文献,使得文献范围不再限制于被研究领域,文献集所引用的其他领域的文献也能被追踪到,这对于学科的早期发展尤其是交叉性领域的历史根源研究尤为重要。但是目前,RPYS的相关研究主要聚焦于学科或研究领域产生之前,运用RPYS分析对各个领域的历史根源进行探索,关于RPYS分析在学科领域产生之后的作用缺乏相关研究。因此,本研究尝试将RPYS方法应用于知识管理领域产生之后的演化研究,从参考文献出版年的角度获取领域产生之后的重要文献进行分析,并从多个角度与传统学科演化分析方法进行比较分析,探讨RPYS方法应用于学科领域演化分析的可行性。
2 研究方法和数据来源
2.1 数据来源
本研究实验数据来源于WOS核心合集,检索策略为:主题=("knowledge management");时间跨度为“所有年份”,引文索引=SCI-EXPANDED(1979年至今),SSCI(1900年至今),CPCI-S(1996年至今),CPCI-SSH(1996年至今)其中括号内的年份为武汉大学图书馆购买引文索引数据的起始年份;数据下载的记录内容选择“全记录和引用的参考文献”,文件格式选择“纯文本”,最终得到与知识管理相关的18,426篇文献的308,975条题录信息(检索时间为2017年4月18日)。
2.2 研究方法
(1)RPYS分析。运用RPYS方法绘制知识管理领域的参考文献出版年图谱,并在此基础上对知识管理领域的演化发展进行分析。目前进行RPYS分析的工具有Leydesdoff等最先开发的RPYS软件包,Comins等[7]开发的 Multi—RPY,以及其网络版 RPYSi/o。[8]本文选取Thor等人[9]开发的可视化工具CRExplorer进行实验,它不仅能够用可视化界面绘制参考文献出版年图谱,还能对参考文献信息进行深入分析,并且内置了平衡算法对噪声进行控制。
(2)比较分析。本研究在运用RPYS方法对知识管理领域进行演化分析之外,还采用了基于HistCite软件的引文编年图分析,从引文时序结构识别知识管理领域的重要文献,并从文献主题、文献来源等多个角度进行对比,分析RPYS方法与传统的演化分析方法的异同和优缺,说明RPYS方法作为一种新方法应用于学科演化分析的效果和可行性。
3 结果与分析
3.1 1900-2016年参考文献出版年图谱分析
为了解知识管理领域的长期发展概况,设置时间区域为1900-2016年,得到图1(A)所示的参考文献出版年图谱。从图谱中可以看出,1900-1970年,知识管理领域参考文献总被引频次较低,曲线趋于水平,说明这段时期为知识管理领域的萌芽期,相关研究著作较少,但在六十年代已经有少量对知识管理领域具有启发性的文献;1970-1990年,曲线呈上升趋势,但斜率较小,说明这段时间为知识管理领域的发展初期,已经有学者进行该领域相关的研究,但发展较为缓慢;1990-2005年这十多年期间,知识管理领域参考文献总被引频次开始高速增长,曲线上升趋势显著,说明这段时期为知识管理的快速发展时期,知识管理得到了学术界的广泛关注和研究。2005年之后,曲线呈下降趋势,说明该领域经过快速发展之后,进入一个稳定发展的成熟阶段。其中在知识管理领域的演化进程中,2001、2003、2005年的参考文献被引总频次处在较高水平,表明这段时间是知识管理领域研究的重要年份,较多重要的、高质量的领域相关文献在这几年发表。
学术界关于知识管理一词的具体提出时间存在分歧,但普遍认为对于知识管理的系统研究开始于20世纪七八十年代,[10]因此本研究以1970年作为起点,分析知识管理领域的演化,并将1970年之后参考文献出版年均分为两段:1970-1993年、1994-2016年,分别绘制这两个时间段的参考文献出版年图谱,进而识别重要年份和重要著作,以研究该领域的发展演化。
图1 知识管理领域参考文献出版年图谱
3.2 1970-1993年参考文献出版年图谱分析
1970-1993年期间,知识管理领域的参考文献出版年图谱如图1(B)所示,可以看出,图谱出现了3个较为明显的峰值点1973年、1986年和1991年,以及两个平缓的峰值点,1978年和1982年。结合峰值点和题录数据,发现在1973年和1982年,参考文献出版年图谱的峰值都由单一文献引起,而1978年、1986年和1991年的RPYS峰值的形成原因呈现多元化。综合年参考文献总被引频次和对应该年被引频次百分比较大的著作,可以确定出在对应年份较为重要的多篇文献。重要文献的信息进一步总结归纳为表1。
表1 1970-1993年重要年份高被引文献信息表
第一个峰值指向1973年美国著名社会学家 Granovetter发表在美国社会学杂志上的一篇经典的论文,作者在文中阐述了他的社会网络信息传播理论。[11]第二个峰值指向1978年出版的书籍
(第二版)[12]和 Argyris等[13]人合著的,前者是介绍心理学理论的书籍,后者则从行为学的角度讨论了组织中的学习。第三个峰值指向1982年Nelson和Winter共同撰写的书籍,[14]两位作者都是演化经济学的代表人物,他们认为企业就在组织管理的不断搜寻和更新过程中不断演化成长。第四个峰值指向1986年的两篇文献,一篇讨论了组织中自我报告的重要性,[15]另一篇则为关于社会心理学的文献。[16]第五个峰值点指向1991年发表的与企业中的知识有关的两篇文献,[17,18]这也说明知识是企业实现可持续发展的重要资源,开始得到研究者的重视。
通过以上5个峰值点的8篇文献的相关信息可以发现,其中涉及1本心理学书籍和1本经济学书籍,2篇文献发表在了心理学相关期刊上,说明知识管理是一个社会学、心理学、组织行为学等多个学科交叉的领域,在早期的发展进程中借鉴了多个学科领域的学术成果。
3.3 1994-2016年参考文献出版年图谱分析
1994-2016年期间的参考文献出版年图谱如图1(C)所示,可以发现1996年、1998年、2001年、2003年和2005年5个峰值年份,这一时期重要文献的相关信息总结归纳为表2。
表2 1994-2016年重要年份高被引文献信息表
1996年的峰值点指向Grant[19]发表的一篇文献,该文将公司看作是整合知识的机构,探讨了企业整合其成员专业知识的协调机制。1998年的峰值指向知识管理领域过程学派的代表人物Davenport和Prusak[20]合作的名著,其认为知识是快速发展的公司取得竞争优势的唯一的可持续资源。从1996年和1998年的这两篇高被引文献中可以看出,在知识管理快速发展的20世纪90年代,企业组织中的知识管理成为研究热点,知识是企业发展的一种可持续资源得到了广泛认同。
2001年,Alavi等[21]发表了一篇知识管理领域的综述性文章,该文发表在国际管理学顶级期刊MIS Quarterly上,引用频次高达1,397次。2003年,Lee H等[22]和Argote L等[23]发表的两篇高被引文献都与组织中知识管理有关,Podsakoff等[24]在2003年发表的一篇高被引文献,则批判性回顾了行为研究中的常见方法。2005年的峰值指向的三篇高被引文献[25-27],都运用相关理论,分析了在电子知识库中的知识共享,说明随着技术的发展,电子网络中的知识共享成为新的研究热点。
1994-2016年间的峰值年份的总被引频次和对应年份文献的单篇被引频次都较高,且大多发表在了具有影响力的管理学期刊上,说明这一时期知识管理领域得到了学术界的广泛关注,产生了多篇影响显著的文献。从研究内容来看,知识管理领域的研究进一步细化,组织中知识管理的具体过程以及知识管理效果的影响因素得到了学者的关注。
通过RPYS图谱分析得到了知识管理领域产生之后的10个峰值年份的17篇高被引文献,可以发现:① 知识管理领域经历了萌芽、快速发展和相对成熟几个发展阶段,早期文献的类型涉及到相关学科的经典书籍,在进入快速发展期以后则以期刊论文为主,并且随着知识管理领域的发展,重要论文由心理学、社会学等领域期刊到主要发表于管理学核心期刊,其中在2001年和2005年两个重要年份识别的文献都来自于管理学重要期刊MIS Quarterly,说明在2001至2005年这一时期,知识管理作为信息管理的一个重要阶段得到了较多关注;② 通过阅读知识管理领域专家撰写的书籍和综述文献,可以发现RPYS识别的结果是较为准确的。
3.4 引文编年图分析
引文图谱分析软件HistCite是尤金·加菲尔德推出的可视化引文分析软件,它可以迅速了解某一领域的文献发展脉络,定位该领域重要的研究文献和重要学者等信息,按时间顺序绘制出该领域文献的引文编年图,是应用较为广泛的演化分析工具。本文以HistCite对知识管理领域的发展轨迹进行绘制,并与RPYS演化分析结果进行对比分析。以每篇文献在所在分析文献集中的被引频次统计(Local Citation Score Count,LCS Count)为条件,设定引文编年图中出现的节点上限数目(Nodes Limit)为30,得到该领域的引文编年图(见图2)。
图2 知识管理领域引文编年图
从引文编年图中可以看出,文献 71、1,220、238、406、1,148、2,388是引文关系网络中的关键节点,是知识管理领域演化发展的关键文献,重要节点的文献相关信息归纳如表3。通过阅读原文发现,在文献71中Spender[28]对Nelson和Nonaka等人提出的知识理论进行了概述,并在其基础上提出了以知识为基础的企业动态理论;1998年,知识管理专家Davenport等[29]通过分析多个成功知识管理项目的异同,进而归纳出成功知识管理项目的八个因素(文献238)。1999年,Hansen等[30]提出了编码化策略和个人化策略两种知识管理策略(文献406)。从引文编年图中可以看出,文献2,388引用了图中的多篇文献,是一个关键节点,是Lee H等[22]2003年发表的一篇综述性文章,在知识管理相关研究总结归纳的基础上,提出了从过程导向角度构建的综合模型。
表3 引文网络重要节点文献信息表
引文编年图反映出了高被引文献承上启下的关系,从1994年的文献46到2005年的文献3,822等,说明这一时期是知识管理领域的快速发展时期,产生了该领域的多篇高被引文献。从关键节点的文献信息来看,引文网络中的关键文献都发表在管理学相关的重要期刊上,其中有四篇文献为综述性文章,这也说明在该领域的快速发展期,综述性文章对学者了解研究现状进行相关研究具有较大的参考价值。文献238、文献1,148和文献2,388三篇与RPYS方法识别的相同,其中重要文献的出版年份1996年、1998年、2001年和2003年都是RPYS识别的峰值点年份,说明引文编年图分析与RPYS分析都在识别重要文献方面取得不错效果,引文编年图也识别出了峰值年份之外年份的重要文献,说明在进行学科领域的演化分析过程中,在非峰值年份发表的重要文献能够通过引文编年图发现。
4 比较分析
RPYS方法与HistCite的引文编年图分析在原理上的差别可以概括为两点:① 引文编年图是从文献的绝对被引频次识别重要文献,RPYS方法通过年被引频次的五年中值偏差识别重要年份、重要文献,这使得短期内的重要年份也能得以凸显,从整个领域的发展历史看,引用频次不高的文献也能够识别,所以RPYS方法在识别学科领域的重要文献时考虑了引用频次和时间两方面的因素;② 引文编年图可以识别本领域内的高被引文献,但其他领域中对本领域的发展具有重要影响的文献则无法在图谱中展示,RPYS方法是从参考文献的角度出发,可以追溯本领域之外的文献。
笔者将从文献出版时间、文献类型等角度比较分析在知识管理领域,RPYS分析和引文编年图分析结果的异同,为学科领域演化分析时方法选择提供参考。
(1)从识别出的重要文献的发表年份来看。本文运用RPYS分析识别出了知识管理领域1970-2016年间10个峰值年份共17篇重要文献,涵盖的时间范围较长。引文编年图中的文献发表年份为1994-2005年,识别出了知识管理领域快速发展时期的文献,但不够全面。两种方法对知识管理领域发展的顶峰年份,如2001年、2003年,都较好地识别了重要文献。
(2)从识别的文献类型来看。RPYS方法识别出的文献除了期刊论文之外,还有早期影响力较为显著的书籍,而引文编年图却因为只能反映LCS高于阈值的文献,所以无法识别出引用量相对不高但对知识管理领域发展具有重要影响的书籍。
(3)从文献所属的学科领域和发表的期刊类型来看。RPYS分析识别的文献涉及管理学、心理学、社会学和经济学等学科领域,这也与知识管理领域多学科交叉的学科背景较为符合;引文编年图分析只能对知识管理领域的文献进行分析,而不能反映其他学科对知识管理领域发展演化的影响。
(4)从研究主题来看。两种方法识别的文献都涉及到了企业组织中的知识管理,但引文编年图识别的文献主题主要从管理的角度探讨知识管理,而RPYS分析识别的文献主题则包括了知识服务、知识管理系统、知识经济和知识共享等多个方面,对知识管理领域研究主题的反映更加合理全面。