档案学合著网络研究
2009-11-30程齐凯
程齐凯
摘要:笔者收集了包含CNKI定义的13种档案学核心期刊在內的17种档案学期刊从1998年到2007年间的发文数据,并在此基础上对档案学领域的合著网络进行研究:测度档案学合著网络的一般指数。总结档案学科研团体的分布情况,分析档案学学者的合著规律,并对档囊学学者分居化的现象进行了简单探讨。
关键词:合著网络;社会网络;科研合作;信息计量;UCINET
1引言
随着档案学的发展。学科专业化程度越来越高。许多问题的解决都需要学者通过科研合作共同完成,日益增多的科研合作,反映到论文发表上便是合著现象的增多,而学者间科研合作的发展,则体现为合著网络参数的变化。为了对档案学科研现状、科研合作规律进行揭示,研究档案学合著网络无疑便有了必要。
合著网络是因学者合著论文而形成的社会网络,本质上它考虑的是学者间的关系,反映到图形上则表现为由多个节点及节点间连线组成的网络图。作为社会网络的一种,合著网络可以被理解为合著者及其合著关系的集合。国外对合著网络的研究已经有了一定的成果,G.MELIN、O.PEBSSON、M.E.J.Newman、YasminH.Said、Edward J.Wegman、A.L.Barabasia等基于不同的学科数据对科研合著网络进行了研究。国内也出现了一些研究成果,朱庆华在他的文章中对合著网络分析的一般方法进行了介绍,梁立明等则基于CSCD的数据论述了省际合著网络中的马太效应现象和地域趋向,另外,刘蓓、刘则渊、尹丽春等也对科研合著网络做了一定的探讨。综观已有的研究,研究点集中于图书情报领域。且所做的工作主要集中于理论方法的探讨上。对于档案学科合著网络的研究,目前国内外都还没有出现相关的研究文章,为了揭示档案学科研合作的现状、分析档案学科研团体的分布情况、总结档案学者的合著规律,本文拟对我国档案学合著网络进行研究。
2数据与研究方法
2.1数据来源及关系定义。笔者获取了CNKI(中国期刊网)定义的13种档案学核心期刊1998年到2007年间的文献数据(见表1)。以构建研究数据集,数据集包括38018篇文献的题名、作者、作者单位、关键词、摘要、发表时间等数据。除了文献数据,我们还对全国各高校的档案学者以及知名档案工作人员的资料进行了收集。
合著关系定义为作者间合作发表至少一篇文章,如ABC三个人共同发表了一篇文章,则存在AB、AC、BC三个合作关系。数据集中存在着18825位作者,以及18831个合著关系。但为了数据处理方便,本研究仅对发文数量在4篇以上的作者的合著关系进行分析,由此构建合著网络。合著网络以矩阵的形式描述,以备进一步分析。
2.2研究方法及研究工兵。社会网络分析是利用图论理论分析网络中的节点和节点关系的量化分析方法。合著网络作为社会网络的一种形式,社会网络分析法对其也适用。本文利用社会网络分析法,从不同的角度对档案学科合著网络进行分析研究,包括中心性分析、凝聚子群分析、核心一边缘结构分析等。
社会网络分析软件已经出现了多种,知名的有STRUCTURE、GEGOPY、Pa5ck、NetDraw、UCINET等,C9)本研究采用UCINETtin3和Paiek软件作为分析工具。UCINET是Borgatti等开发的一款社会网络分析软件,可以对至多32767个节点的网络数据进行处理,它提供了强大的社会网络分析功能,如凝聚性分析、成分分析、中心性分析、子群分析,等等,是社会网络分析领域目前功能最为强大的软件之一。PaJek是一个专门用来处理超大型网络的可视化社会网络分析工具。在数据的收集和处理方面,笔者使用了武汉大学信息资源中心开发的VChuSpider作为数据收集和加工工具,它能够生成适合各种社会网络分析软件使用的数据格式文件。
3研究结果
3.1档案学合著网络的中心度分析。中心度是社会网络分析中的一个重要指标,它探讨的是节点或者子群在整个网络中处于怎样的中心地位,根据测算标准的不同,还可以细分为局部中心度、中间中心度和接近中心度。
3.1.1档案学合著网络的局部中心度。局部中心度描述的是作者在局部环境中是如何被连接的,在社会网络分析中,有着绝对局部中心度和相对局部中心度两个概念,一个节点的绝对局部中心度等于与它连接的节点的个数,相对局部中心度则等于绝对局部中心度与网络内点最大可能度数的比值。利用UCINET对档案学合著网络的局部中心度进行计算,所得结果见表2(由于篇幅关系,仅列出排名前二十位学者的数据,下同)。
从表中可以看到,档案学合著网络中局部中心度排名最高的学者为刘维荣,其绝对局部中心度为26,也即意味着他曾与26位不同的学者合作发表过文章。排名前20位的学者多为知名学者,如冯惠玲、陈智为、傅荣校等,这说明知名学者往往有着较多的合作关系。另外,相比其他学科,档案学合著网络中节点的局部中心度普遍较低,这一现象与档案学界科研合作项目少、稳定科研团体少的事实也吻合。
3.1.2档案学合著网络的中间中心度和接近中心度。局部中心度考虑的是单个点的度,并没有考虑节点在整个网络中的地位,因此从网络整体来看,局部中心度并没有太大的意义,为了反映点在整个网络中的中心性,社会网络分析法引入了中间中心度和接近中心度两个概念。中间中心度测量的是一个点在多大的程度上位于图中其他点的“中间”,在图中起到多大的连接作用。这一个指标的具体意义及计算公式,可以参见弗里曼(Freeman,1979,1980)的相关文献。利用UCINET得到档案学合著网络的中间中心度数据,表3是排名前二十位学者的数据。
从表3可以看出,中间中心度高的学者分为三种类型:何嘉荪、陈智为等老学者构成第一种类型,他们有着较高的学术地位,联系着较多的学者,其中间中心度值相对高:郭莉珠、荆秀昆等人构成第二种类型,这些学者主要研究方向是文献保护等技术性课题,由于研究内容专业性较强,学者间科研合作较为密切,这说明技术性研究课题需要较多的合著联系,其可替代性和逃逸性要低于理论研究课题。黄霄羽等青年学者属于第三种类型,他们在档案学科研领域表现活跃,也联系着较多的合作者,有着较高的中间中心度。
中间中心度反映的是学者在网络中的连接作用,分析显示:近86%的档案学者中间中心度为0,同时,高中间中心度学者数量也很少,这说明在档案学科研领域,科研网络是由少数核心学者连接起来的。
3.2档案学合著网络的子群研究及研究团队分析。学者进行科研合作,会组成各种科研团队。档案学研究领域有着多个科研合作团队。如按一般的理解,中
国人民大学的学者与武汉大学的学者会归为不同的研究团队。档案学科研领域存在着多少科研合作团队?各科研团队的凝聚力怎样?这些都可以通过分析档案学合著网络数据得到解答。
3.2.1档案学合著网络中的K-丛分析。K-丛是社会计量学中的概念,由赛德曼提出。K-丛是一个最大联通子图,其中每个点都与其他K个点连接,K-丛是整个网络中一个凝聚力相对较高的区域,通过K-丛分析,可以发现具有较高凝聚力的子群(如果存在这样的群)。
利用UCINET软件对档案学合著网络数据进行计算,设定K为2,对档案学合著网络进行2K-丛分析,共得到2450个2K-丛。
根据2K-丛的定义,如果2K-丛规模为n,丛中每一个节点与其他n-k个节点都有着直接连接关系,如果一个2K-丛规模为3,则其中每个节点都要与至少一个其他节点相连。计算结果显示,档案学合著网络2450个2K-丛中,规模为3的丛有2217个,规模为4的丛有232个。规模在4以上的仅31个(见表4)。档案学合著网络中大部分2K-丛规模都很小,说明多数档案学者的合作广泛度都很低,仅与很少的学者有过合作关系。
进一步对规模相对较大的丛进行分析,我们发现组成各子群的成员绝大多数来自同一学校或同一研究机构,这反映地域联系是影响科研合作关系形成的最重要原因。某些子群的成员合作发文时已不在同一学校或同一研究机构,但他们之间往往有着师承关系,说明师承关系也是促成科研合作的重要因素。
K-丛分析得到的另一个发现是不同学校的学者有着不同的合作趋向,中国人民大学、浙江大学等学校的学者都有着较多的科研合作经历,如在表中标号为1和2的两个科研团体都主要是由中国人民大学档案学系的学者组成的;相比之下,武汉大学等学校的档案学系学者则很少合著文章,以武汉大学档案学系为例,该系学者中合著文章数量较多、形成合著网络的仅刘家真教授一人,其余的学者都以独立发文为主。
3.2.2档案学合著网络的凝聚子群密度分析。凝聚子群密度(Extemal Internal Index,简写为E-I index)用来衡量网络中小团体现象是否十分严重,常用于网络中组织紧密程度的测度。凝聚子群的密度等于子群密度与整个网络的密度之比,取值为[-1,1]。当值趋近1时,表明合作关系多发生于不同群体之间,派系分立的情况较为严重;而值靠近一1,则说明绝大多数合作关系都发生于群体内部,派系分离的情况较少;值为0时,说明合作关系的发生是非常平均的。利用E-I index,可以对档案学合著网络中的派系林立的程度进行测度。
在UCINET对构建的合著网络数据进行了测算,得到档案学合著网络的凝聚子群密度为0.825。0.825的凝聚子群密度说明在档案学领域存在着众多的派系,大量的合著关系都发生在派系之外,由于不同科研团体间科研合作、信息交流的不便,这种派系林立的情况并不利于档案学的发展。
3.3档案学领域学者群体的可视化分析。为了对档案学合著网络进行可视化的分析,我们将档案学期刊中发文数量在四篇以上的作者的名单及合著关系数据抽取出来,利用Paick绘制出合著关系网络图(见图1)。
图1中,每一个点代表一位作者。点之间的连线表示两位作者存在合著关系。通过网络图可以清楚看到档案学科研群体分布情况:图被分成互不联系的三块,左上角有着大量密集的节点,这些节点之间存在着非常复杂的合著关系,他们构成了档案学研究的核心力量,中国人民大学、武汉大学等大学档案学专业的学者多处于这一群体中:沿图像上边是一个条形的节点群,这些节点合作广泛度不高,但数量较多,构成了一个重要的科研合作群体。图片的下边是数量庞大的伹相对孤立的众多节点,这些节点所代表的作者之间没有合作关系,而实际上,这些作者绝大多数都没有很高的学术影响力。
为了更好地层示档案学科研群体的分布,我们将图l中的孤立节点以及度数为一的节点去除,利用UCINETSE具包的三维图像绘制功能绘制出图2。在图2中,可以清楚看到档案学科研网络呈现出两层分离的结构,合著网络内外两层间仅有很少的科研合作联系,这在学术合著网络中是非常少见的。出现这种情况的原因是由于档案学研究领域存在着两种不同的研究力量:高校档案学者以及档案工作人员,他们分别开展档案学学术研究,在群体内相互合作,而群体间则较少合作联系,而这也从一个侧面反映出档案学研究理论研究和实践工作脱离的问题。
4总结
本文利用UCINET、Palek等社会网络分析工具,对采集到的档案学合著网络数据进行分析。通过分析,我们得到以下四个结论:
一是就合著网络而言,档案学合著网络仍然是一个不成熟的合著网络,合著关系数量少,合作层次低,这也反映了档案学领域科研项目较少、科研队伍发展时间相对较短的现实。
二是仅仅从合著关系来看,档案学科研团体发育程度较低,科研团体数量虽多,但是大部分团体规模都很小,存在时间也相对较短,除了中国人民大学、浙江大学两校以外,其他高校、研究机构很少有非常成熟的档案学研究团体(仅仅从合著关系看)。科研团体规模过小、合作深度过低。对档案学发展是很不利的。
三是档案学科研团体存在着明显的分层现象。在3.2、3.3的分析中,我们可以清楚地看到档案学科研人员被分成了几个联系极少的群体,这显示了当前档案学研究人员的分化现象非常严重。
四是不同高校、研究机构的学者有着不同的合作趋向。中国人民大学、浙江大学等高校档案学学者有着较多的合著文章情况,而另外一些高校档案学专业,如武汉大学档案学系,其学者合著文章数量则相对较少,以独立发文为主。
目前我国档案学科的发展尚不成熟。本文对档案学合著网络从中心度和子群两方面进行了研究,揭示了档案学者之间的合作紧密度和广泛度,分析了档案学科研团体的特点,深入阐述了现阶段档案学科存在的问题。针对这一系列的问题。档案学者应该壮大科研团体,加深合作,以提高我国档案学研究的整体水平,有利于档案学科的长远发展。
(作者单位:武汉大学信息管理学院来稿日期:2009-04-24)