高校图书馆自建数据库的模式与学术资源整合实证研究*
2014-02-28刘阳
刘阳
(河南科技大学图书馆,河南 洛阳 471003)
高校图书馆自建数据库的模式与学术资源整合实证研究*
刘阳
(河南科技大学图书馆,河南 洛阳 471003)
对37所高校图书馆自建数据库的软件平台来源、类型、数据来源、加工方式、项目来源方式、合作单位情况、检索方式、机构与人员情况、知识产权风险防范、数据量、困难及建议等进行问卷调查的基础上,提出了加强和改进高校自建库质量的4项建议:一是CALIS和高校应加大专题特色数据库的立项资助力度;二是要配备一套架构合理、功能强大、性能稳定的数据库平台;三是把好选题关,组织好文献资源;四是要成立专门的自建库机构、配备专业专职工作人员、制定相关的管理工作制度。
高校图书馆 自建数据库 专题特色数据库 学术资源 模式
自从中国高等教育文献保障系统(CALIS)将引进数据库、全国高校学位论文全文数据库、全国高校专题特色数据库、全国高校重点学科网络资源导航库等作为其子项目进行立项建设以来,许多高校图书馆结合本校的学科专业特色、馆藏文献特色、区域文化特色开展了自建特色数据库的实践。不少高校图书馆从建库伊始就面临着平台、设备、技术、资金、人员、资源组织、标准、维护等系列困难,除了部分自建库不得不中途停建外,大部分勉强建设起来的数据库,起点低、规模小、更新少、宣传不力、利用率不高,也没能实现校外共知、共享[1-4]。然而,当前学术界对高校图书馆自建数据库的研究大多采用文献法、网络观察等研究方法,采用问卷调查方法的还不多。
为此,本课题运用定量与定性研究相结合的方法,具体采用经验总结、实地观察、个别访谈、问卷调查等方式,了解情况、查找问题、寻求对策,以期促进我国高校图书馆自建数据库的健康发展,同时为机构自建库建设理论提供参考。
1 研究方法
①经验总结。本课题成员均参与了河南科技大学图书馆自建数据库的建设工作,该馆2011年3月~2012年4月已经初步建成了5个自建数据库。本课题的大部分研究思路、问卷设计、相关建议等是对其自身工作的总结与反思。
②实地观察、个别访谈。本课题成员曾于2011年3月到解放军外国语学院、洛阳师范学院进行实地调研,并对该馆馆长、自建库负责人和工作人员进行个别访谈,汲取经验。
③问卷调查。本调查采用的主要工具是由课题组自行设计的《高校自建数据库的模式与学术资源整合策略研究调查问卷》,该问卷是在自我反思、文献调研、课题组成员共同研讨、对部分有自建库的高校图书馆进行前测等基础上修订而成的。问卷共计由14道小题组成,其中,第1题为填空题,第2~8题为选择题(可多选),第9~14题为开放或半开放问题。
调查时间、方式与对象:本次调查由本课题组成员于2013年5月16日~6月18日通过“中国高等教育文献保障系统”馆际互借系统QQ群(该群工作人员主要由图书馆技术部、文献建设部和信息服务部等部门的工作人员组成)和2012~2013年教育部科技查新站查新员与审核员培训会议工作通讯录等中发出调查请求,在征得回应后,有针对性地发放电子版调查问卷51份。截至2013年7月12日,回收问卷37份,有效问卷37份,问卷回收率为72.5%。
从问卷回收情况看,本次调查涉及了华中科技大学、西北大学、天津大学、郑州大学、湖南大学、江南大学、北京邮电大学、中央音乐学院、中北大学、闽江学院、杭州师范学院等37所高校图书馆。
2 调查结果与分析
2.1 高校图书馆自建数据库的数量
37所高校图书馆共计建设了156个自建数据库,平均每所高校图书馆建设2.4个数据库。其中,广州外语外贸大学图书馆建设了17个特色数据库,是自建库数量最多的高校;安徽师范大学图书馆、广州大学图书馆等仅有1个自建库。
专题特色数据库、学位论文全文数据库、重点学科网络资源导航库、虚拟参考咨询系统、教学参考信息管理与服务系统分别为121个(含两个馆藏书目库、7个随书光盘库)、23个、3个、4个、5个,分别占到调查自建库总数的77.6%、14.7%、1.9%、2.5%、3.2%。
由此可见,专题特色数据库是高校图书馆自建库的最主要类型,“本校学位论文数据库”(或硕博论文库、毕业生论文库)也占有一定比例。
2.2 高校图书馆自建数据库的软件平台来源和数据库类型
表1 高校图书馆自建数据库的软件平台来源和类型
由表1可知,高校图书馆自建数据库软件平台的四大主要来源依次是“向软件供应商或者数据库供应商购置”“图书馆组织力量自行开发”“与软件供商共同开发”和“由与本校图书馆有合作关系的供应商免费提供”,分别占到调查高校总数的43.2%、37.8%、29.7%、16.2%;3所高校图书馆(郑州大学、华中科技大学、解放军外国语学院)从上级主管部门或行业协会获得了免费配置的软件。
高校图书馆自建数据库类型前三名是“全文数据库”“超文本型数据库”“事实型数据库”,建设最少的是“数值数据库”。
2.3 高校图书馆自建数据库的主要数据来源和加工方式
表2 高校图书馆自建数据库的主要数据来源和加工方式
由表2可知,高校图书馆自建数据库数据的5个主要来源依次是“自有馆藏资源”“学校相关学术资源”“自有资源和向供应商购买相结合”“其他”“向相关数据供应商直接采购”,分别占到调查高校总数的73%、64.9%、35.1%、24.3%、5.4%。
自建数据库的三大主要加工方式依次是“本馆自行加工”“向供应商购买和自行加工相结合”“委托第三方加工”,分别占到调查高校总数的75.6%、32.4%、16.2%。
2.4 高校图书馆自建数据库的项目来源方式和合作单位
表3 高校图书馆自建数据库的项目来源方式和合作单位
由表3可知,高校图书馆自建数据库的项目来源方式依次是“由本馆自行立项建设”“由行业协会立项资助共建”“由学校立项建设”“由学校的上级主管部门立项资助建设”“由行业协会立项但不资助共建”,分别占到调查高校总数的67.6%、37.8%、32.4%、18.9%、10.8%。
22所高校图书馆自建数据库没有合作单位,占到调查高校总数的59.5%;8所与企业合作,5所与其他高校图书馆合作,3所与政府有关部门合作,分别占到调查高校总数的21.6%、13.5%、8.1%。
2.5 高校图书馆自建数据库的检索方式
调查显示,有32所高校图书馆自建库的检索方式为“单库检索”,占到调查高校总数的86.5%;能够实现“跨库检索”的图书馆仅有7所,占到调查高校总数的18.9%;另外有3所图书馆自建库可以同时进行“单库检索”“跨库检索”,占到调查高校总数的8.1%。
2.6 高校图书馆开展自建数据库的机构设置与人员配置情况
有12所高校有自建数据库专职机构,占到调查高校总数的32.4%;其中专职工作人员情况是:6所高校有两人,4人、6人、9人各两所高校。19所高校图书馆没有自建库专职机构,占到调查高校总数的51.4%;但分别由1~12人数量不等的其他部门工作人员兼职在进行自建库建设。4所高校建库期间有3~5人专门工作人员从事自建库建设,待数据库建成后解散,占到调查高校总数的10.8%。
2.7 知识产权风险意识与防范
有26所高校图书馆意识到自建特色数据库可能面临知识产权风险,占到调查总数的72.2%。并通过“使用本校、本馆的原生资源”“作者授权”“购买或协议取得版权,限制使用范围和使用目的”“使用公开免费资源”“仅限校园网内下载”“不提供全文”“和出版商协商解决”“限定打印页数等”等方式进行化解。还有单位认为,“不担心知识产权风险,一切资源都在合理利用的范围内。同时国内的牵头单位如CALIS中心和CADAL中心都在深入地研究这一问题”。没有意识到知识产权风险的高校有7所,占到调查总数的19.4%。
2.8 各馆自建数据库的数据量(条数)
对该问题有效答案涉及22所高校图书馆所建设的62个自建特色数据库,高校数占到调查高校总数的59.5%,自建库数占到调查总自建库数量的39.7%。其中,9所高校的15个自建库数据量超过4万条,占到62个自建库数的24.2%;10所高校的13个自建库数据量在14万条,占到62个自建库数的20.9%;14所高校的34个自建库数据量在1万条以下,占到62个自建库数的54.8%。数据量最大的是河南理工大学图书馆“随书光盘库”,有626402条;最少的是中北大学“教师专著库”,有14条。
CALIS“十五”全国高校专题特色数据库立项项目的结项要求是:凡是立项资助的专题特色库,在验收时,其数据量应不少于4万条,其中全文数据不少于20%。也就是说,在本调查中仅有少数高校的少数自建库能够达到CALIS结项的数量要求。
总体建库数量多且数据量大是华中科技大学图书馆,所建设的5个自建库中有4个数据量超过4万条。其情况是:①机械与自动化特色库:30万条,100GB,持续更新(CALIS特色库一二期重点支持);②学位论文全文库:7万条,500GB,持续更新(CALIS学位论文项目参建单位);③缩微胶片文摘库:48万条,一次性;④缩微胶片全文库:10万条,2TB,持续更新(CADAL项目二期资源建设项目)。
2.9 自建库建设中遇到的困难
通过对调查问卷结果的梳理发现,被调查者反映的困难概括起来有:
①相关领导重视度不够、没有专人专项负责、没有专门的工作电脑、时间紧、建设的经费有限等。
②人员不足。只有少数馆有少量专职人员从事自建库建设,多数馆是兼职人员在进行自建库建设,有些馆自建库建成后随即解散人员。
③缺少专门自建库建设机构。大多数通过抽调相关业务处室人员组成临时性专门机构从事该项工作,进行一次性建库。
④经费不足。经费投入少或缺少持续经费投入,导致无法购置高质量的软件平台、停建部分需要经费投入的数据库、无法持续更新数据等。
⑤文献资源组织困难,数据来源不足。自建库的数据往往来自多个单位或部门,这就需要跟多个部门保持联系沟通,但其他部门对这项工作不够重视、不配合。将分散的地方文献进行征集、整理、归类,形成较为完整的地方文献收藏体系,并面向社会开放,有一定困难。
⑥缺乏符合标准的适用平台。大部分自建数据库软件平台都来自CALIS推荐或者认证的厂商,这些平台各有特色,但是不太适应特色库的建设;数据库平台不能实现跨库检索,平台操作不方便;商业系统软件平台价格高,二次开发难;自行开发的系统通用性差。
⑦技术问题。自建库(专职人员少,缺乏培训)技术力量不强,数据加工质量和标引质量都受到一定影响;部分图书馆馆内人员技术水平无法达到,自建库只好外包给数据库商来做。
⑧时间问题。一是专职人员少或者没有,导致时间不够用;二是许多高校自建库是临时性任务,突击建设,时间紧。
3 结论与建议
3.1 CALIS和高校应加大专题特色数据库的立项资助力度
本调查结果显示,专题特色数据库是高校图书馆自建库的主要类型。然而,作为CALIS建设的重要子项目的全国高校专题特色数据库,截至目前,仅仅进行了三期立项建设。其前三期立项资助数量分别约为25项[5]、5项[6]和42项[7](不含立项不资助项目),其中一期、二期结项19项和58项。在本次调查的37所高校中,仅有12所高校图书馆的自建库获得了学校立项,有25所高校图书馆自建数据库的项目来源方式是“由本馆自行立项建设”。
自建库建设是一项需要人力、物力、财力、时间、空间、信息等投入的事业,高校图书馆是高校的一个部门,自身财力有限,如果没有所在高校、行业协会或上级主管部门的支持,自建库建设势必难以持续,更不用说建成高质量的数据库了。
3.2 完善、强大的数据库平台是自建特色数据库质量的保证
配备一套架构合理、功能强大、性能稳定的数据库平台是高质量、高效率、高水平完成自建特色数据库建设工作的必要条件。各个高校自建库平台来源庞杂,许多自建数据库软件平台存在操作不便、对接难、二次开发难、不能实现跨库检索等诸多问题,组织开发或推广适合专题特色自建库建设的专用软件是自建库必须首先解决的问题。
3.3 把好选题关,组织好文献资源
特色是专题自建库的立身之本。CALIS专题特色数据库三期建设的总体原则是挖掘整理未开发利用的资源,补充CALIS资源体系,重点资助独有或稀缺资源的数字化建设,网络原生数字资源的挖掘和整理;继续支持具有良好前期成果、学科特色、地方特色或民族特色鲜明的专题库建设[4]。资料收集是特色数据库建设中的重点工作之一,尤其是针对校内其他部门所掌握的资料和教职工的科研成果收集,如果能够形成一套约定俗成的成果提交渠道,就可以确保相关特色数据库文献资源的持续获得。
另外,成立专门的自建库机构、配备专业专职工作人员、制定相关的管理工作制度,是自建特色数据库工作连续性、质量稳定性的根本保障。
[1]范亚芳,郭太敏.特色数据库建设若干问题研究[J].情报理论与实践,2008(4):550-553.
[2]喻志娟.关于高校图书馆特色数据库建设与服务的思考[J].图书馆,2012(4):113.
[3]李曦.我国高校图书馆特色数据库建设研究——以CALIS和CASHL中心馆为例[J].四川图书馆学报,2013(4):61-66.
[4]黄立新,桂慕梅.高校图书馆地方文化专题数据库规划建设探析——以天津商业大学图书馆“近代天津商业文化”数据库为例[J].图书馆工作与研究,2013(3):40-43.
[5]CALIS特色库和导航库项目验收专家评审会议纪要[EB/OL].(2000-12-15)[2014-01-11].http://project.calis.edu.cn/ calisnew/news.asp.
[6]CALIS“十五”全国高校专题特色库参建馆子项目结项评审结果通知[EB/OL].(2007-09-17)[2014-01-11].http:// project.calis.edu.cn/calisnew/news.asp.
[7]CALIS三期专题特色数据库建设项目的通知[EB/OL].(2011-01-24)[2014-01-11].http://project.calis.edu.cn/ calisnew/subnews.asp?id=884.
刘 阳女,1969年生,馆员。研究方向:图书馆管理。
G253
2014-03-11;责编:姚雪梅。)
*本文系2012年度河南省教育厅人文社会科学规划研究项目“高校自建数据库的模式与学术资源整合的策略研究”(项目批准号:2012-GH-073)成果之一。