使用引文分析法考察图书馆文献保障情况
2011-06-28□李峰
□李 峰
1 引言
博士学位论文具有较高的科研水平,在一定程度上代表着该学科的前沿和创新。博士生在撰写学位论文时,需要多方面搜集支撑其研究的文献资料,而他们获取资料的主要来源之一就是所在学校的图书馆。图书馆作为为本校教学科研服务的机构,其文献保障水平是图书馆文献资源建设的重要评价指标。对某学科博士学位论文进行引文分析,可以发现该学科科研信息需求的一般规律和特点,能够反映图书馆现阶段的文献保障能力,为图书馆文献资源建设提供参考。
对学位论文进行引文分析,国内外已经开展了一些研究。国内的如马建华[1]对北京大学化学系有机化学专业1995-1999年博士论文进行引文模式分析,并对引用量最大的外文期刊进行了排序;祁思妍、谈琼和糜凯[2]选择北京师范大学发展与教育心理学2001届博士论文作为引文分析的对象,获知该校的期刊文献保障率;李曦峰和赵炜霞[3]对济南大学应用化学专业2001-2004年硕士学位论文引文进行统计分析,对引文量大的外文期刊进行排序并考察其在该校的收藏情况,从而掌握该校的期刊保障率;鲍世琪[4]以台湾阳明大学2005年度73篇博士论文为研究对象,了解读者图书资源使用情况,并配合当时经费状况,调整图书馆馆藏发展政策。
国外研究包括Joel Sam和S.Nii Bekoe Tackie[5]对加纳大学情报学专业1998-2004年的67篇硕士论文进行引文分析,以便图书馆改善信息管理专业文献的保障情况;Núria Vallmitjana和 L.G.Sabaté[6]以拉蒙尤依大学IQS研究所1995-2003年的博士论文为研究对象,统计结果可以作为图书馆馆藏发展的依据;Pali U.Kuruppu和 Debra C.Moore[7]对爱荷华州立大学1997-2006年农业和生物学专业9个领域的博士论文进行分析,研究不同学科的文献保障情况。
本文选取北京大学物理学院理论物理专业2003-2009年42篇博士学位论文的引文作为研究对象。理论物理专业是北京大学的国家重点学科之一,作为基础理论研究,所需文献数量多、时间跨度大、学术性强,对其进行引文分析具有较好的代表性。
2 统计分析
2.1 引文处理
经过浏览查阅理论物理专业42篇博士论文的引文,在以下的分析过程中,采取了几个处理原则:
(1)某期刊文献被收录到专著或论文集中,以最初发表该文献的期刊题名和年份为准。例如编号为004/D2003(04)的博士论文中有一参考文献的标注为“J.Wess and B.Zumino,Nucl.Phys.B 70,39(1974);Phys.Lett.B 49,52(1974).The two articles are reprinted in Supersymmetry,S.Ferrara,ed.(North Holland/World Scientific,Amsterdam/Singapore,1987).”对于这样的引文,按照两篇文献分别发表于Nucl.Phys.B 70,39(1974)和Phys.Lett.B 49,52(1974)来看待。
(2)物理学专业引文来源比较特殊,部分文献在OA系统中预先发表(比如http://arxiv.org/),对于只标注了arxiv号的引文,将此文献视为网络来源,并以该文献第一版本的发表时间为准;如果发表在arxiv上的文献注明是博士论文,将其作为博士论文类型;如果作者将引文同时标注了期刊来源和网络来源,则按照期刊来源处理。
(3)将期刊的会议录副刊作为会议录类型分析。
(4)作者在引文中注明“and references therein”,如“M.Carena and H.E.Haber,hep-ph/0208209,and references therein.”此references信息忽略。
(5)同一文献发表在不同期刊上,以作者注明的第一期刊为准,如有勘误情况,发表勘误的期刊信息不予考虑。
2.2 引文量分析
引文数量反映出作者收集材料的多少及吸收他人研究成果的情况,也在一定程度上反映图书馆的文献保障水平。理论物理专业2003-2009年42篇博士论文,各篇论文的引文量从29篇到515篇不等,引文总量为6795篇,平均每篇论文引用161.8篇。可见,理论物理专业博士对文献的查阅量是相当大的,为他们提供丰富的文献资源是提高科研水平和增加学术成果的重要保证。
2.3 引文类型分析
理论物理专业博士论文引文的类型有图书、期刊、会议录、学位论文、网络资源以及其他资源,其他资源是指讲义、某些内部文献以及没有公开发表的文献等。42篇博士论文的6795条引文的类型分布为:期刊5817条,图书229条,网络资源563条,会议录133条,学位论文25条,其他资源28条(见图1)。
图1 博士论文引文类型分布
从图1可以看出,该专业的信息获取来源主要是期刊,期刊被引量占总引文量的比例高达85.61%。造成这种现象的原因可能是:
(1)期刊反映了当时最有创新性和前瞻性的研究成果,期刊信息量大、更新快,对于博士论文的学术研究支撑作用最大;
(2)图书馆的纸本馆藏和数据库资源比较丰富,相对于其他类型文献,作者较容易在图书馆查阅到所需的期刊学术论文;
(3)不少期刊在网络上有电子版,易于搜索和查阅。
相对而言,会议录和学位论文类型的文献,资料收集比较困难,且很多不公开发表,这方面的馆藏纸本资源或数据库也比较少,因此会议录和学位论文的被引量不高。
学位论文引文的第二大类型是网络资源,占总引文数量的8.28%。而在563条引文中至少有504条可以在http://arxiv.org/网站上查到。这部分引文是非正式的出版物,同时又是很重要的学术资料。所以,网络资源虽然不是图书馆的馆藏资源,但在科研中发挥着重要的作用。
由此看出,期刊文献是图书馆需要重点建设的资源,同时要将网络上开放式获取的资源作为自己的有益补充。
2.4 引文年代分析
除去无法查证年代的36篇文献,其余6759篇文献中,年代跨度从1912年到2010年,整体跨度近100年,其中外文资料年代跨度从1912年到2010年,中文资料年代跨度从1963年到2007年。
表1反映了理论物理专业的特点,作为基础理论研究,不仅需要最新的前沿研究的支持,也需要有价值的经典理论的支撑。虽然博士论文引文的年代跨度较大,但是年代相对集中,最主要的文献仍然集中于最近几年,1990年以后的文献涵盖了所需文献的74.02%。因此,在馆藏文献资源建设中,既要保持文献资源的持续性,又要考虑文献资源的广泛性。
2.5 引文语种分析
博士论文引文的最主要语种类型为英文,尽管有其他国家出版的期刊,例如德国、意大利、墨西哥等,但使用语种仍然为英文。将所有的外文文献看作一个整体,有外文引文6729条,占总引文量的99.03%,其中外文图书228条,外文期刊5817条,外文会议录133条,外文学位论文25条,外文网络资源563条,外文其他资源26条;中文引文共66条,占总引文量的0.97%,其中中文图书32条,中文期刊10条,中文学位论文9条,中文其他资源15条。
表1 被引文献年代分析
表2 引文类型的语种分布及比例
从表2可以看出,外文资料的总数量占了相当大的比例,而且在期刊和图书类型中,外文资料的比例分别占各自类型的99.83%和87.69%;在会议录及网络资源类型中,中文资料为0;在学位论文和其他资源类型中,外文资料也远高于中文资料。由此可见,外文期刊的需求比较大,仍然应是馆藏建设的重点。
3 引用期刊频次及馆藏情况
以上分析表明,外文期刊是博士生撰写学位论文过程中需要大量参考和收集的资料,因此将外文期刊的纸本馆藏和数据库情况作一统计分析。
经过统计发现,5817条外文期刊的引文分布于146种外文刊中,其中被引文献数量最多的期刊是Physical Review D,达到1477条,占外文期刊引文总量的25.4%,其次是Physics Letters B、Nuclear Physics B和Physical Review Letters,其被引量都达到500条以上。被引量超过100条的期刊名称及馆藏和数据库情况如表3。
表3 被引量超过100条的外文期刊的馆藏和数据库情况
表3所列的11种外文刊,其被引量总数达到4958条,占所有外文期刊总被引量的85.2%,说明少数很有价值的期刊即可满足科研的大部分需要。
从数据库资源情况来看,表3中的11种期刊全部能在北京大学图书馆购买的数据库中查到电子版。
从纸本馆藏情况来看,因为Journal of High Energy Physics是网络期刊,所以没有纸本馆藏,其他10种期刊,北京大学图书馆中心馆都有大部分卷期的纸本馆藏。另外,作为物理学院的学生,物理学院分馆也是他们比较方便获取文献的机构,物理学院图书室作为北京大学图书馆的分馆,其馆藏资源可看作北京大学图书馆资源的一部分,以上11种期刊除Journal of High Energy Physics外,在物理学院图书室也有绝大部分馆藏,甚至从期刊创刊号到最新的卷期都有收藏,其中有7种期刊(Physical Review D、Nuclear Physics B、Physical Review Letters、Physical Review C、Nuclear Physics A、Physical Review B、European Physical Journal C)还在继续订阅。
综上所述,北京大学图书馆在数据库和纸本馆藏方面至少有一种方式(多数两种方式都提供)能对博士生撰写学位论文提供文献资源,因此北京大学图书馆对于物理学院理论物理专业的科学研究有着很好的文献保障。进一步的工作需要将数据库与馆藏资源结合起来,既要能够提供全面的期刊文献全文服务,又要避免重复建设。
4 OA资源
OA资源也是理论物理专业博士生在撰写学位论文过程中使用较多的文献来源。在本文中,OA资源不同于网络资源,OA资源指来源于arxiv的所有文献(包括在arxiv中注明发表于期刊等出版物的文献);而网络资源指只能在arxiv中查到(没有公开发表于出版物)以及在某些网站中得到的资料。
42篇博士论文中,有39篇其参考文献包含OA资源,占博士论文总数的92.9%。将这些博士论文中OA来源的引文数量与其总引文数量(简称为OA引文率)进行比较,发现OA引文率最高达到88.33%,其中有约1/4的博士论文(10篇)的 OA引文率达到60%以上,有一半的博士论文(21篇)的OA引文率超过10%(见表4)。这说明随着OA资源的发展,博士生在科研过程中会逐渐依赖网络上的OA资源,对图书馆资源的使用可能会减少,这对图书馆资源建设的方向将会产生一定的影响。如何将OA资源与图书馆现有资源整合,将其纳入图书馆资源建设,作为现有馆藏资源的补充,更好地向教师、学生提供文献资源服务,或者如何根据教师、学生科研利用文献来源的转变调整图书馆的资源建设策略是值得我们考虑的问题。
表4 部分博士论文OA来源引文数量与总引文量比较(按OA引文率排序)
004/D2006(05)92 149 61.74004/D2005(05)81 166 48.79004/D2003(05)36 74 48.65004/D2009(35)13 29 44.83004/D2007(32)72 163 44.17004/D2007(03)58 136 42.65004/D2009(38)31 86 36.05004/D2005(04)31 110 28.18004/D2006(04)70 463 15.12004/D2007(30)24 185 12.97004/D2006(03)19 169 11.24004/D2004(01)14 128 10.94
5 小结
本文通过对北京大学物理学院理论物理专业2003-2009年42篇博士论文引文的数量、文献类型、出版年代、语种等情况进行统计分析,并进一步讨论了外文期刊馆藏的文献保障情况,探讨了网络OA资源对图书馆资源建设的影响,得出以下结论:
(1)博士生学位论文的完成过程,也是进行科学研究的过程。理论物理专业学位论文平均引文数量较高,这对图书馆的文献保障水平提出了很高的要求,图书馆需要提供更好的服务,来支撑学校的科研工作。
(2)理论物理专业学位论文引文类型最多的是期刊,尤其是外文期刊,这需要图书馆加强外文期刊资源的保障。目前,图书馆的文献资源水平能够保障该专业科研的需要,但要注意保证文献资源的持续性和广泛性。另外,还需要科学合理地确定各类型文献的馆藏比例。
(3)网络资源,尤其是可免费获取的学术资源增多,对图书馆的文献资源建设产生影响。需要将有价值的网络资源进行搜集和整合,通过图书馆的信息发布平台揭示出来,使其成为图书馆馆藏资源和数据库文献之外的有益补充,并且根据网络免费学术资源的情况调整图书馆文献资源建设的策略。
1 马建华.引文分析在图书馆文献采集中的作用——北京大学有机化学专业博士论文的文献计量研究.大学图书馆学报,2003,21(3):70-73
2 祁思妍等.从心理学博士论文引文看我馆的期刊保障率.新世纪图书馆,2003(3):14-16
3 李曦峰,赵炜霞.引文分析在图书馆期刊馆藏资源建设中的作用——济南大学应用化学专业硕士论文引文分析研究.新世纪图书馆,2005(3):12-14
4 鲍世琪.由引文分析探讨阳明大学图书馆馆藏发展政策之制定[硕士学位论文].台北:世新大学,2008
5 Joel Sam,S.Nii Bekoe Tackie.Citation Analysis of Dissertations Accepted by the Department of Information Studies,University of Ghana,Legon.Afr.J.Lib &Inf.Sc.2007,17(2):117-124
6 Núria Vallmitjana,L.G.Sabaté.Citation Analysis of Ph.D.Dissertation References as a Toolfor Collection Management in an Academic Chemistry Library.College & Research Libraries,2008(1):72-81
7 Pali U.Kuruppu,Debra C.Moore.Information Use by PhD Students in Agriculture and Biology:A Dissertation Citation A-nalysis.Libraries and the Academy,2008,8(4):387–405