华东师大图书馆传统文科中文图书保障统计分析
——基于“联合保障”的数据
2016-05-18段双喜华东师范大学图书馆上海200241
段双喜(华东师范大学图书馆 上海 200241)
华东师大图书馆传统文科中文图书保障统计分析
——基于“联合保障”的数据
段双喜
(华东师范大学图书馆上海200241)
〔摘要〕文章对华东师范大学人文学院2011-2014年发表论文所引用的中文文献进行统计,计算出华东师大各图书馆的中文资源对传统文科研究的联合支持力度。比较了校馆与学院图书馆各自的文献保障状况,认为它们之间存在着严重的资源重复,提出院系图书馆应该发挥专业关联度优势,加强对译著的搜求。
〔关键词〕传统文科联合保障征引文献
〔分类号〕G253
〔引用本文格式〕段双喜.华东师大图书馆传统文科中文图书保障统计分析——基于“联合保障”的数据[J].图书馆,2016(3):45-50
1 引言
华东师范大学图书馆致力于研究性馆藏建设,以支撑学校各学科研究。华东师范大学的专业以文科见长,图书经费的重点在文科。因此,对传统文科图书保障率的统计能评估文献资源建设的得失,为图书采选工作提供借鉴和支持。
“总/分馆”模型是目前许多高校文献保障的模式,华东师范大学还在实行校图书馆指导下的校馆和院系馆、资料室的联合保障模式。学校大部分院系馆、室的书目信息已经进入图书馆管理系统,故将院系资料室保障率一并统筹,以就教于方家。
2 统计对象、方法和过程
2.1对象的确定与获取
统计以华东师范大学人文学院三系一所(中文、历史、哲学、古籍所)研究人员在2011-2014年公开发表的所有论文为对象,以CNKI数据库中的期刊和部分会议论文为基础,不包括学位论文。
登录本馆数据库进行检索。以“作者”为检索点,以系名为“单位”名称检索信息,检索词必须包括单位全称和所有可能的简称,简称要考虑使用者的习惯。具体而言,校名使用“华东师范大学”、“华东师大”两个信息点检索,二级单位名称一般至少有两个点,分别是“中国语言文学系”、“中文系”、“汉语言文学系”,“历史系”、“历史学系”,“哲学系”,“古籍整理研究所”、“古籍研究所”、“古籍所”。其他研究中心和研究院作者的关系在实体系所,不另作检索点。将校名和各个单位名称组合后,进行检索,登陆时段为2015年2月25日至27日。
2.2实施思路和过程
从数据库中检索、下载论文的PDF文档,请相关人士编制程序,对文档进行批处理,提取出征引文献,按字段整理成Excel表单,再将表单数据与馆藏文献信息进行匹配分析。
在程序编制方面,要求提取论文“题名”、“第一作者单位”、“第一作者姓名”、“关键词”、“引用文献”、“中图分类号”字段。现在人文类期刊的引文主要有两种体例:一是社科院期刊的自由化模式,以页下注、脚注的方式进行说明;一是学报模式,以国际通行标准要求引文字段标准化、格式化,便于信息检索。后种模式比较统一,提取起来比较易行,也比较准确。前种模式个性化强,提取的难度大。除正文外,论文各部分位置的排列、字段信息的标准都可能不同。对差异要有预判并提出解决办法。编制程序时,要考虑:①引文在不同期刊中的字段名,除去列于正文后的“尾注”部分外,还有列于页下的“脚注”部分;②两种注释都有单列出现和分栏出现的形式;③“尾注”的名称不一,除“参考文献”、还有“引用书目”、“Cited Works”、“引用作品”、“注释”、“参考书目”、“注解(Notes)”、“Notes”、“注释”、“注”、“参引文献”等;④尾注出现的形式,即上述第三条中各种名称的排列与附加符号问题。主要包括:空格、括号、下划线、序号及其形式等等。
预估和设计考虑了以上问题后,大部分引文字段都能够提取。但分栏出现的参考文献与脚注信息难以提取,需手动提取。
2.3数据的归类与匹配
对提取的数据进行核对、整理,将每篇论文PDF文档的脚注和尾注与Excel表单内容比较,据原档修正。然后将所有脚注与尾注归并到一个总表中。
批量导出的Excel表单中的“引用文献”只有一栏,其中包括“题名”、“主要责任者”、“出版时间”、“出版社”、“文献类型”、“文献种类”等多项信息。必须将其中信息进行分离,再与馆藏信息进行比较,对信息的匹配情况进行统计。这项工作涉及到以下几个问题。
2.3.1匹配的对象
本文的“图书”概念指以纸质图书形式出版、在本馆以“图书经费”形式购得或以“图书”形式处理的各种文献。其外延不仅包括传统意义上的专著,还包括会议论文集、部分连续出版物和各种机构的内部文件。如民国期刊报纸,现在影印出版[1-3];有些机关单位档案、政府公文,现在整理刊布[4-5]。同时,国内出版社出版的外文书,如果是影印原文,不纳入中文图书范畴,但若编、译本在国内出版,则算中文图书。这样可更切合采购工作的实际。
2.3.2匹配要求
征引文献与馆藏文献的题名、主要责任者、出版社、出版时间信息一致,就算是能够匹配。实际上,由于图书出版的情况比较复杂,各个字段信息形式有差别,应考虑这些情况,以免核对时出现错误。这主要包括以下几点:①题名,主题名、副题名都存在,尽量考察双方是否一致;②主要责任者,引文作者与馆藏文献信息作者不一致时,应考虑主要责任者是否集体作者、丛书主编者、多作者中的第一作者、翻译者,或者是图书序、跋、前言、后记的作者;③出版社,有些出版社社址迁移、归并或改制,地点产生了变化,应在出版社前冠以城市名(如北京、上海、台湾),以示区别;④出版时间,出版时间与版本之间存在复杂的情况如重印本、修正版;⑤版本,古籍流传中的不同版本体系,电子图书中的扫描本等。
2.4匹配结果的处理
除少数特藏外,采访人员不可能搜全所有图书版本,很多版本间正文内容一样,若不涉及序、跋、前言、后记、丛编等附加部分,一般可以相互替代,属于近似版本。引文版本与馆藏版本之间孰优孰劣很难一语判别。不可因为出版社、出版年代稍有不同而认定馆藏没有支持科研。所以本文使用“完全保障”、“近似保障”两级概念,来处理匹配结果。
若征引文献四项信息与馆藏书目情况完全相符,就是版本完全相同,电子扫描版亦同此类。若主题名、撰著(编)人相同,而出版信息不同,只能算作“近似保障”,情况也包括纸质(含影印)和电子本。“完全保障”、“近似保障”两种保障率相加,可以算是“总体保障率”。
计算时,若馆藏中并存几种不同级别的保障情况,无论资源种类与次数,只按照高级别计算一次。若共存“完全保障”级别的纸本与电子书数据,也只算一次“完全保障”。馆藏地的排列顺序是校图书馆、电子图书、思勉图书馆(属于人文学院)、其他院系图书馆。若某书在校内几个馆藏地都有馆藏,也只统计排在前面图书馆一次。
3 保障数据
3.1总体情况
共收集到人文学院739名作者发表的论文2131篇。具体情况如表1:
表1 各单位论文与作者数量
2131篇论文计有共获取不重复的征引文献42106条。具体如表2:
表2 各单位征引文献数量
42106条征引文献中各种类型所占比例如图1:
图1 各类文献条数与比例
图1中文献类型中的“其他”包括:报告、会议论文、艺术展品与文物、访谈记录、电影、电视剧、戏剧、内部资料、未刊稿、信札、光盘、地图、文物、自印本、手稿、手抄件、演讲稿、复印件、手刻油印本、调查资料、族谱、手校本等。在征引数据中,中文图书共24817条,占征引文献量的58.94%,是被引最多的文献种类。
3.2图书的保障情况
对被引用的24817条中文图书数据进行整理归并,得到12847种不重复的图书信息。将这些图书信息与馆藏系统信息进行核对,校图书馆与思勉图书馆各自的保障情况如表3:
表3 图书保障情况
可以看出,校图书馆对传统文科的文献保障率远远高于院系馆室,仍然是文献保障的最主要力量,但院系文献也是校馆的有益补充。进一步统计发现,学校图书馆、思勉图书馆和其他院系资料室三者联合,能够提供10663条与征引书目大体匹配的种类,总体保障率为82.99%。非人文学院的图书馆,提供了0.35%的文献资料。在学校图书馆完全匹配的8647条图书信息中,只有74条为单独电子图书数据的匹配,比例为0.87%;有347条同时实现了电子图书与纸本的匹配,比例为4.01%。二者加起来的比例不到5%。这表明传统纸本图书仍然是我馆传统文科研究的主要支撑。
3.3详细保障情况
3.3.1所涉及的出版社
对能够保障的10663条图书书目的出版机构进行分类,得到1202个出版机构,其中有520个近代出版机构出现2次。现将比例靠前出版机构情况列表如下。(合作出版只计入第一个出版社,出版社有变更的以版权页记载为准,下同) 。
表4 比例靠前的出版社提供图书一览
8 289 人民文学出版社 2.71 58 35中国戏剧出版社 0.33 9 274中国社会科学出版社 2.57 59 34浙江古籍出版社 0.32 10 173华东师范大学出版社 1.62 60 33 北京师范大学出版社 0.31 11 150 上海书店 1.41 61 33四川人民出版社 0.31 12 143 江苏人民出版社 1.34 62 33浙江大学出版社 0.31 13 140中国人民大学出版社 1.31 63 32 台北新文丰出版公司 0.30 14 118社会科学文献出版社 1.11 64 32中州古籍出版社 0.30 15 117广西师范大学出版社 1.10 65 31湖北人民出版社 0.29 16 105 复旦大学出版社 0.98 66 30 中国书店 0.28 17 96 齐鲁书社 0.90 67 29百花文艺出版社 0.27 18 96 上海译文出版社 0.90 68 29台北文海出版社 0.27 19 96 台北商务印书馆 0.90 69 29 新华出版社 0.27 20 94 岳麓书社 0.88 70 28 凤凰出版社 0.26 21 80 文物出版社 0.75 71 28福建人民出版社 0.26 22 79 上海文艺出版社 0.74 72 28吉林人民出版社 0.26 23 74 河北教育出版社 0.69 73 28江苏教育出版社 0.26 24 70 上海三联书店 0.66 74 27 海南出版社 0.25 25 69 上海商务印书馆 0.65 75 27 中研院史语所 0.25 26 67 东方出版社 0.63 76 27 线装书局 0.25 27 66 江苏古籍出版社 0.62 77 26 花城出版社 0.24 28 65 译林出版社 0.61 78 26书目文献出版社 0.24 29 64 巴蜀书社 0.60 79 25人民教育出版社 0.23 30 63 华夏出版社 0.59 80 24 东方出版中心 0.23 31 63 辽宁教育出版社 0.59 81 24贵州人民出版社 0.23 32 63 辽宁教育出版社 0.59 82 24河南大学出版社 0.23 33 63 辽宁教育出版社 0.59 83 24湖北教育出版社 0.23 34 63 上海辞书出版社 0.59 84 24湖南教育出版社 0.23 35 60 黄山书社 0.56 85 24 九州出版社 0.23 36 59 上海社会科学院出版社 0.55 86 24 九州岛出版社 0.23 37 56 中央编译出版社 0.53 87 23 华中师范大学出版社 0.22 38 54 上海教育出版社 0.51 88 23江苏文艺出版社 0.22 39 53 学林出版社 0.50 89 23山东教育出版社 0.22 40 52 南京大学出版社 0.49 90 23文化艺术出版社 0.22
41 51 世界知识出版社 0.48 91 23 学苑出版社 0.22 42 48 北京出版社 0.45 92 22 法律出版社 0.21 43 47 作家出版社 0.44 93 22 黑龙江人民出版社 0.21 44 44 科学出版社 0.41 94 22清华大学出版社 0.21 45 43 安徽教育出版社 0.40 95 22山东大学出版社 0.21 46 43 北京图书馆出版社 0.40 96 21甘肃人民出版社 0.20 47 43 武汉大学出版社 0.40 97 21河南人民出版社 0.20 48 40 高等教育出版社 0.38 98 21江西人民出版社 0.20 49 39 新星出版社 0.37 99 21辽宁人民出版社 0.20 50 38 中央文献出版社 0.36 100 21中国藏学出版社 0.20
以上出版社供应了9103种图书,占征引图书总量的85.36%。根据二八定律,这些出版社应是我校图书馆中文图书采访应该重点关注的对象。
图2 各个时段图书的征引比例
3.3.2出版时段分布
对有出版时间记录的12847条书目的出版时间进行统计,得出各时段图书数量比较(见图2):
可以看出,2011-2014年的传统文科研究对近30年来出版图书的使用比例最大,1981-2010年出版物占据了总量的72.77%, 2001年以后出版的图书约占总量三分之一。
4 对“联合保障”问题的一些分析
目前华东师范大学文献资源保障体系由校馆和院系图书馆(资料室)组成。文史哲是该校的传统优势学科,文、史、哲系三系资料室历史悠久,已形成一定规模和馆藏特色。三系一所资料室合并为思勉人文图书馆后,学校加大了投入,每年下拨的购书经费数量不菲。这种形势下,思勉图书馆如何更好地利用经费,与校馆联合,更好地满足研究者的文献需求,值得仔细分析。
4.1目前两馆的保障配合情况
在学校图书馆完全保障的8467条书目中,思勉馆能够保障4259条。而在4200条校馆不能提供完全保障的书目中,思勉馆能够保障124条,占2.95%。校馆与其他院系图书馆大致保障了10607条数据,余下的2240条数据,思勉馆能够提供87条数据,占3.88%。
同时,数据还显示,在能够提供完全保障的图书中,思勉图书馆与校馆重复4135条,占所有保障书目条数的48.83%。在思勉馆与征引书目完全匹配的4259条数据中,有3549条可以同时实现电子图书目的匹配,比例为83.32%,而本校所有院系图书馆都并未订阅电子图书。可以看出,校馆和思勉馆之间资源存在严重的重复现象,“联合保障”实际上是“重复保障”。确实需要认真分析两馆的资源优势,实现互补。
4.2人文馆对出版社的选择
对思勉馆藏与征引书目信息能够大致匹配的5377条书目的出版社情况进行统计,列出各个出版社占思勉保障总数的百分比,从中观察人文图书馆历来的采选重点和优势,如表5:
表5 思勉图书馆大致匹配图书出版社书目与百分比
22 32 齐鲁书社 0.60 47 13吉林人民出版社 0.24 23 32 辽宁教育出版社 0.60 48 13 国家图书馆 0.24 24 31 华夏出版社 0.58 49 12 作家出版社 0.22 25 30 文物出版社 0.56 50 12四川人民出版社 0.22
将思勉馆与校馆出版社供应比例(表4、表5)进行比较,发现两者前十几位出版社的排名顺序大致相同,但思勉馆出版社供应百分比要高于校馆,而排名靠后的出版社,其比例就低下去了,大致如表6:
表6 人文馆与校馆部分出版社保障比例
排名在前的出版社是属于专业关联程度高的核心出版社,思勉人文馆和校馆这些图书保障比例都比较高,说明两者的馆藏具有较高学术性和专业性,但思勉馆更加明显。随着出版社专业度的下降,思勉馆的供应比例就降到校馆的供应比例之下。可见这种趋势下,人文学院保障的重点与优势不在规模与广度上,而在专业关联程度方面。
4.3对思勉馆部分馆藏的分析
4.3.1大套书
笔者对征引文献中的套书、丛书进行统计,得到210种大套图书,其中162种大套存在两种以上的版本。现将其部分套书、丛书在人文馆和校馆的收藏与保障情况列如表下(因篇幅原因,略去出版情况与责任者)。
表7 部分大套图书的保障情况
在所列60种大套丛书中,校馆保障了60套,思勉图书馆保障了34套,重复率为56.67%。显然,在经费不足的情况下,这些图书应该成为协调采购的重点。
4.3.2译著
对征引信息的作者来源进行分析,可以发现原著者的国别信息。将两馆书目中的译著数量列出,可以得到表8。
表8 两馆译著比例比较表
在思勉人文馆完全保障率低于校馆的情况下,思勉对翻译图书两个级别的保障率都高于校馆。这说明院系图书馆对国际同行著作的关注比较高。院系馆靠近研究者,的确是可以发挥近水楼台的优势。
表9 出版译著较多的机构
An Investigation on Safeguard Statistical of Chinese Books to t he Traditional Liberal Arts——Based on Joint Support from the Libraries in the East China N ormal University
对出版译著的机构进行统计,将其情况列如表9。这些出版社应该也是思勉馆关注的重点。
5 结语
通过对征引文献的分析,发现华东师范大学图书馆的馆藏能够完全满足6成左右、总体满足8成左右的传统人文学科中文文献的需要。这些保障率通过纸质文本、电子文本两种类型和校馆、人文馆等多个馆藏地实现的。华东师大思勉人文馆馆藏有深厚的积累,有《四库全书》、《续修四库全书》、《丛书集成》、《四部丛刊》等这样的大型文献,能够大体满足四成左右的中文文献需要,其中三成以上文献资源需求能够在馆内得到完全满足。但校馆与人文馆馆藏重复现象比较严重,五至八成的文献种类是重复的。重复配置造成“联合保障”的效果是“重复保障”,影响保障水平的进一步提高。在文献购置经费紧张的趋势下,两馆应该分工合作,让人文馆发挥原有优势,努力购置专业关联度大的出版机构的图书,加强译著的搜求力度。
本文仅仅是基于书目品种的分析。从图书使用来看,文献类型、复本数量、馆藏分配也是影响图书保障水平的重要因素,这些讨论还有待于今后进一步展开。
(来稿时间:2015年12月)
参考文献:
1.林乐知.万国公报[N].上海:上海书店,2014
2.陈灨一.青鹤[J].北京:全国图书馆文献缩微复制中心,2004
3.良友图书公司.良友画报[M].上海:上海书店,1986
4.上海市档案馆.工部局董事会会议录[Z].上海:上海古籍出版社,2001
5.民国时期高等教育史料汇编[Z].北京:国家图书馆,2014
Duan Shuangxi
( East China Normal University Library )
Abstract〔〕Based on the Chinese quotations in the articles from the Faculty of Humanities published in the period from 2011 to 2015, this paper assesses the joint documental support to traditional liberal arts from libraries, including the Library of East China Normal University, the library of Faculty of Humanities and the others.The comparison of ECNU library and its faculties’ fellows told us there were so many duplications of document resources in these libraries that the library of the Faculty of Humanities should pay more attention to translations and resources with high level of Professionalization.
Keywords〔〕Traditional liberal artsJoint supportQuotation
〔作者简介〕段双喜(1974-),男,博士,华东师范大学图书馆采编部副研究馆员,发表论文多篇,出版专著1部,研究方向:唐宋文学与文献资源建设。