APP下载

基于文献计量学的我国著名大学图书馆学术水平比较*

2011-06-28金贞燕齐慧彬单向群

大学图书馆学报 2011年5期
关键词:次数学术论文

□金贞燕 王 新 齐慧彬 单向群

1 引言

教育部2002年2月颁发的《普通高等学校图书馆规程(修订)》中明确指出“高等学校图书馆是学校的文献信息中心,是为教学和科学研究服务的学术性机构,是学校信息化和社会信息化的重要基地。高等学校图书馆的工作是学校教学和科学研究工作的重要组成部分。高等学校图书馆的建设和发展应与学校的建设和发展相适应,其水平是学校总体水平的重要标志。”同时又指出“高等学校图书馆应结合实际有计划地开展学术研究和交流活动,积极申报各级各类科研课题。有条件的还可根据需要,自行设立科研项目。高等学校图书馆应积极开展国内外学术交流。有条件的可按国家有关规定申请加入国际学术组织。”[1]这一规定确立了大学图书馆作为为教学科研服务的文献信息中心地位和进行科学研究的学术研究机构地位。大学图书馆的学术研究水平不仅标志着图书馆自身的建设水平,也标志着大学的总体发展水平。创建世界一流大学,必须要有一流的大学图书馆与之相匹配。本研究选择了“985工程”建设的39所大学图书馆,从定量的角度,用文献计量学和科学计量学的理论与方法分析比较了他们近10年来体现在学术论文中的科研产出各要素,以期从一个侧面总结这些著名大学图书馆的学术水平状况,并为提高大学图书馆的学术水平提供建议。

2 学校选择与数据来源

2.1 大学图书馆样本

本研究选择受到“985工程”重点支持的39所大学的图书馆作为分析样本,原因在于教育部在实施“面向21世纪教育振兴行动计划”中,重点支持这些大学创建世界一流大学和高水平大学[2]。这39所大学,纷纷提出了建设国际化、研究型、高水平、综合性世界一流大学的奋斗目标。我们认为这39所大学图书馆的学术水平可以代表我国大学图书馆的较高学术水平。

2.2 数据源

本研究计算的科学计量学指标以这39所大学图书馆2000-2009年来发表的学术论文在2000年1月—2010年8月间的被引频次为基础,数据来源是中国知网(CNKI)的中国期刊全文数据库和中国引文数据库以及中文社会科学引文索引(CSSCI)两大数据库,它们是国内科学计量学研究中最常用的数据源。39所大学图书馆的论文量和被引用量是根据各校图书馆的名称关键词检索以上两个数据库收录论文的作者单位获得的,只检索类型为“期刊论文”的文献,并基于此计算了篇均被引次数和h指数。数据采集时间为2010年8月20—23日。

2.3 h指数计算

获取大学图书馆h指数的方法是,根据h指数的定义,在中国知网(CNKI)的中国引文数据库中,通过“作者单位”途径检索之后,将所得结果按被引次数降序排列,确定排序序号小于或等于被引次数的最大整数就是所限定时间跨度内的h指数。

3 基于传统文献计量指标的比较

3.1 论文量与被引用量分析

论文量和被引用量是用于科研评价的两个核心指标,对于一个机构来说,其发表学术论文的多少是其科研产出水平的直接度量指标之一,而这些论文被同行或其他领域科学家所引用的次数和范围又是对这些科研论文被同行认同水平的最好评价[3]。

发表论文的数量可以表征机构的科研产出力的情况。表1给出了39所大学图书馆2000-2009年在CNKI全文数据库收录的期刊上发表论文的情况。10年来,39所大学图书馆共发表了8289篇论文,平均约212篇,19所大学图书馆的论文数超过平均值。其中浙江大学图书馆发表的论文最多,达461篇;武汉大学图书馆紧随其后,为425篇,受到“985工程”第一批重点支持的清华大学和北京大学图书馆也名列前茅,分别排第三和第五,达413篇和355篇。最少的国防科技大学图书馆发表了21篇,与排名第一的图书馆相比差距很大,相差20多倍。论文数超过300篇的大学图书馆有6所,他们是浙江大学图书馆、武汉大学图书馆、清华大学图书馆、南开大学图书馆、北京大学图书馆和山东大学图书馆,反映了这6所大学图书馆的科研活动在国内图书界有比较大的优势。

从论文量和被引用量看,馆际差距较大,清华大学图书馆、武汉大学图书馆和北京大学图书馆三所大学图书馆发表的论文数量和论文的被引用次数都领先于其他36所大学图书馆。

表1 “985工程”大学图书馆2000-2009年发表论文统计数据

序 号 大学图书馆名称 CNKI论文数被引总数篇均被引次数CSSCI论文数CSSCI/CNKI(%)14 吉林大学图书馆242 393 1.62 86 3615 天津大学图书馆234 729 3.12 127 5416 华中科技大学图书馆228 392 1.72 47 2117 西安交通大学图书馆225 785 3.49 91 4018 大连理工大学图书馆222 412 1.86 60 2719 厦门大学图书馆213 710 3.33 92 4320 上海交通大学图书馆205 1352 6.60 112 5521 中国农业大学图书馆205 390 1.90 35 1722 西北农林科技大学图书馆197 467 2.37 66 3423 哈尔滨工业大学图书馆185 303 1.64 57 3124 中南大学图书馆170 546 3.21 70 4125 华南理工大学图书馆162 418 2.58 74 4626 南京大学图书馆161 706 4.39 83 5227 东南大学图书馆160 356 2.23 52 3328 中央民族大学图书馆157 118 0.75 34 2229 中国人民大学图书馆137 1246 9.09 68 5030 兰州大学图书馆135 269 1.99 42 3131 西北工业大学图书馆129 195 1.51 37 2932 东北大学图书馆128 215 1.68 15 1233 重庆大学图书馆112 323 2.88 32 2934 同济大学图书馆100 163 1.63 30 3035 中国科学技术大学98 275 2.81 32 3336 北京理工大学69 152 2.20 32 4637 北京航空航天大学图书馆59 87 1.47 13 2238 中国海洋大学图书馆42 116 2.76 11 2639 国防科技大学图书馆21 73 3.47 1 4.8

少数大学图书馆论文数量和被引总数不相称,如山东大学图书馆论文数量达352篇,排名第5,但被引总数只有472次,排名第21。一个机构科研体系的有效性必定体现在其科研产出的数量和质量上,产生的论文越多,论文被引证的频次越多,就表明该机构的科研活动越有效,科研水平越高,科研地位也就更难以被取代。论文量和被引用次数说明了清华、武大与北大三所大学图书馆的科研活动和科研水平的有效性。

3.2 论文平均质量分析

仅从论文量和被引用量进行比较时,很容易抹杀样本中影响力大小不同的那些论文对于一个机构科研产出贡献的不同,因而本研究引入篇均被引用量这个指标,用以测度各个图书馆科研论文的平均影响力。篇均被引次数是把被引用总数除以文献篇数得到的。表1给出了39所大学图书馆的篇均被引用量。篇均被引次数中国人民大学图书馆最高,达9.09次;北京大学图书馆和上海交通大学图书馆分别排第二和第三,为7.22和6.60次;清华大学图书馆排第四,为6.44;最少的中央民族大学图书馆,为0.75次。总被引频次相近,篇均被引次数却相差很大,中国人民大学论文量少排第29,但因其论文被引用量高,因此篇均被引次数高,说明虽然论文量少,但平均论文质量较高。篇均被引次数一定程度上反映了论文的质量,但不能单用篇均被引次数一个指标评价一个机构的科研水平,必须与论文量、被引用量等其他计量指标结合使用。

3.3 高水平论文比例分析

刊载论文的期刊有质量高低之分,从文献分布的规律来看,核心期刊集中了大多数重要的科学论文。统计发表在核心刊物上的论文数能够一定程度上代表该学科内的高水平研究情况,本文选择CSSCI收录的期刊,用发表在这些刊物上的论文占论文总数的比例去反映一个单位科研活动的水平结构。表1给出了39所大学图书馆近10年来发表的论文中发表在CSSCI收录的期刊上的论文所占比例的情况。从表1可以看出,总论文量中核心期刊论文比例范围是12%-73%,比例最高的是清华大学图书馆,达73%;北京大学排名第二,为69%。比例超过50%的图书馆只有7所。他们是清华大学图书馆、北京大学图书馆、浙江大学图书馆、南开大学图书馆、上海交通大学图书馆、天津大学图书馆和中山大学图书馆。39所图书馆发表的所有论文中CSSCI收录的核心期刊上的论文比例只有14%。核心期刊上论文比例非常低,大部分为非核心期刊论文,说明我国大学图书馆的论文的整体水平普遍较低,要提高论文的质量还需要一定的时间,需要做非常艰苦的努力。

3.4 著名大学图书馆CSSCI论文量变化趋势分析

近10年来,我国名牌大学的整体学术水平逐年提高,无论是论文产出量还是论文质量都呈现出了显著增长的趋势,那么这些名牌大学图书馆近10年来的学术论文变化趋势如何?我们利用CSSCI数据库统计了论文量排名前20所的重点大学图书馆从2000年到2009年各年度中在CSSCI期刊上发表论文总数,进行10年间的趋势分析。图1给出了论文量排名前20所大学图书馆2000-2009年间在CSSCI期刊发表论文总数变化情况。从中可以看出,在CSSCI期刊上,20所大学图书馆发表论文总数从2000年至2004年呈现逐步上升趋势,从2000年的215篇上升到2004年的352篇,增长了近64%。但近5年呈现逐步下降趋势,而且下降趋势明显,从2004年的352篇下降到2009年的217篇,下降幅度近38%,又回落到10年前的水平,这一趋势与情报机构学术水平的发展趋势背道而驰。安美荣等统计了情报机构1998-2007年间在图书情报核心期刊上的发文量后认为,10年间总体趋势是上升的,各情报机构的科研产出逐年增多[4]。这一趋势也与这些大学整体学术水平的发展趋势背道而驰。

图1 20所大学图书馆2000-2009年间在CSSCI期刊发表论文总数变化情况

4 基于新的文献计量指标h指数的分析

4.1 h指数的比较

论文量、被引用量、篇均被引频次等传统文献计量指标均有其独特优势,但也有其不可避免的缺点,为克服这些评价指标的缺点,2005年美国物理学家Hirsch J.E提出了新的评价指标h指数。Hirsch将它定义为:一位科学家的分值为h,如果他/她发表的N篇论文中有h篇论文,其中每篇论文获得了不少于h次的引文数,其他的(N-h)篇论文中每篇论文的引文数都小于h次[5]。该指数突破了以往一个数值只能评价一种数量指标的缺点,巧妙地将数量指标(发表的论文数量)和质量指标(被引次数)结合在一起,既能反映学术论文影响力,又能反映重要学术论文数量。因此在它发表后,立即引起了全世界文献计量学研究者的广泛兴趣和高度关注,并展示了良好的发展前景。因而本研究引入h指数这一新的计量指标,从新的角度来考察39所重点大学图书馆的学术水平。

按照h指数的定义,我们对39所大学图书馆进行了h指数统计,如表2所示。从表中可以看出,39所大学图书馆h指数的跨度范围是4—28,共19个数值,h为10的图书馆数量最多,为5所。h指数集中在7—16之间,共计26所,占67%。h指数最高的图书馆为清华大学图书馆,达28;北京大学图书馆h指数为27,排名第二。随着h指数的变化,大学图书馆的分布如图2所示。

表2 “985工程”大学图书馆h指数一览表

图2 39所“985工程”大学图书馆h指数分布

h指数作为反映论文数量基础上的论文质量的指标,与论文量、被引用量等传统文献计量指标有着密切的关系。我们从表1和表2可以观察到,发表论文总数大,但论文被引频次不高的图书馆,相应的h指数一定不高,例如山东大学与电子科技大学,虽然论文量排第6和第7,但因其被引次数较低,h指数只有11和10,分别排第19和22名。通常要想拥有比较大的h指数,必须要有一定论文数量的支撑。但总论文数目多,h指数不一定大,因为h指数体现的是论文数量变化基础上的质量变化,因而只有当论文总数大,而且这些论文被较多引用时,才能获得较高的h指数。h指数能够克服总论文只反映产出数量而不考虑产出质量的不足。从表1还可以看出,h指数相同,篇均被引次数却相差很大,h指数则可以克服这个缺陷,那些被引次数较低甚至为零的论文永远也不会对h指数产生影响。

h指数给我们提供了新的视角,仅用一个单一指标值达到了描述产出力和影响力两方面的效果,以此可以在客观数据的基础上理性地评价一个机构的学术水平和影响力。

4.2 h指数与传统计量指标的关联性分析

在h指数的发展过程中,一些学者用实证方法研究了h指数与传统学术评价指标的相关性,以期进一步揭示h指数的本质。荷兰文献计量学家Van Raan以荷兰147所大学的化学研究团体为对象,探索h指数与标准文献计量指标之间以及和同行评议结果之间的相关性,其结论是:h指数与论文总数、被引用量和同行评议之间存在显著相关关系[6]。Cronin B和Meho L比较了以h指数排名和以原始引文统计为基础的排名,发现这两套排名之间存在非常强烈的正面关系,且h指数在学者历时科学产出的广泛影响上比直接的引文统计表现更为细致[7]。还有一些学者为了使h指数得到科学的证明和更好的应用,构建了一系列的反映h指数与传统文献计量指标之间关系的数学模型。Hirsh在提出h指数的同时便指出,被引次数和h指数的关系将取决于特定分布的具体形式,并发现两者之间具有如下关系[8]:

上式中Nc,tot表示被引次数,a为常数。

Glanzel建立了基于论文量和篇均被引次数的h指数数学模型[9]:

上式中Np是论文数量,nc是篇均被引次数,c为常数。

这些数学模型提出后,引起了领域内学者的广泛兴趣,但是由于这些模型诞生时间较短,客观上还没有在实践中得到充分的检验,因此本研究以39所大学图书馆学术论文h指数为基础,考查上述二个数学模型对h指数的适用性。

图3给出了运用数学模型(1)绘出的39所大学图书馆h指数与被引总数开平方之间的关系图,h指数与被引总数开平方之间呈现出了很好的线性相关关系(R=0.98797),比例常数a=1.95。Hirsch认为,对科学家个人而言,a的取值范围是3—5,而作为本研究对象的大学图书馆是机构,是对机构的测评,因此比例常数a不在3—5范围。

图3 39所“985工程”大学图书馆h指数与被引总数开平方之间的关系

图4给出了运用数学模型(2)绘出的39所大学图书馆 h 指数与())之间的关系图,可见两者之间呈现出了很好的线性正相关性(R=0.96996),比例常数c=1.03。

图4 39所“985工程”大学图书馆h指数与()之间的关系

总的来说,Hisch和Glanzel提出的二个数学模型的一元回归模型的统计结果显示,相关系数R都比较高,说明二个模型与现实数据的分布情况差异不大,方程具有较好的数据解释能力,h指数确实和论文量与被引用量存在一定的依赖关系。显然h指数的绝妙之处就在于,它具有对被引频次和论文数量两个指标的制衡的特点。

5 结语

通过以上的数据分析,可以从一定程度上反映出我国一流大学图书馆的学术水平。总体看,我国一流大学图书馆之间学术水平不均衡,馆际差距很大,知名度越高的大学,其图书馆的学术水平也越高;科研产出的总体质量不高,表现为相对于论文总数,在核心期刊上发表的论文比例太低;大部分大学图书馆的学术水平停止不前或逐步下降,表现在近几年科研产出量呈下降趋势。

大学图书馆主要为学校教学科研服务,我们的馆员有一整套文献信息检索的方法、手段,用于本身的科研可谓驾轻就熟,有着得天独厚的优势,又身处大学这一良好的学术氛围和研究环境中。据此笔者认为,要实现大学图书馆“科研质量跃升”,其突破的基点应是:首先从思想上高度重视图书馆学术研究工作;其次把科研工作纳入图书馆工作的一部分,而且作为一个重要的组成部分;三是培养和造就一支科研、学术带头人队伍,对科研人才给予重视、加以关心、委以重任。

1 普通高等学校图书馆规程(修订).中华人民共和国教育部.[2002-20-21].http://calis.nju.edu.cn/pinggu-wenjian

2 入选“985工程”高校名单.[2008-11-02].http://www.eol.cn/article/20050508/3136460.shtml

3 蒋国华.科研评价与指标.北京:红旗出版社,2000:186-187

4 安美荣等.近十年我国情报机构的科研产出实证研究.情报科学,2010(6):888-891

5 Hirsch,J.E.An index to quantify an individual’s scientific research output.Proceedings of the National Academy of Sciences of the United States of America,2005,102(46):16569–16572

6 Van Raan A.Comparison of the Hirsch-index With Standard Bib2liometric Indicators And With Peer Judgement for 147Chemistry Research Groups.Scientometrics,2005,67(1):491–502

7 Crnin B,Meho L.Using the h-index to rank influential information scientists.Journal of the American Society for Information Science and Technology,2006,57(9):1275-1278

8 同5

9 W.Gl?nzel,On the h-index– A mathematical approach to new measure of publication cativity and citation impact.Scientometrics,2006,67(2):315-321

猜你喜欢

次数学术论文
机场航站楼年雷击次数计算
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
一类无界算子的二次数值域和谱
如何理解“Curator”:一个由翻译引发的学术思考
对学术造假重拳出击
依据“次数”求概率
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文