图书馆自建数据库共建共享问题探讨
2015-04-02邓国平
邓国平
摘 要:对于共建共享的自建数据库,发展虽然迅速,但是也存在不少的问题,要发挥出应有的作用,还需要进一步努力解决相关问题。
关键词:自建数据库;共建共享
项目基金:2012年广西高等学校重点资助科研项目“河池少数民族文献信息资源共建共享研究”(项目编号:201202ZD082)的研究成果之一
目前,建设各类数据库很热门,也很普遍,以“自建数据库图书馆”为检索词在Google上就有约720000条结果(时间截止至2014年6月),基本每个图书馆都会有自己的自建(特色)数据库,数据库的建设方式也各有千秋,比较好的建库方式应该是共建共享方式,也因为这个缘故,自建数据库的数量越来越多,对于各种学术研究提供了不少便利。
但是对于数量上很美观的自建数据库,利用率却不是很高,甚至有些数据库内容存在重复建设的现象,大部分读者依旧依赖常用的商业数据库,对于自建数据库并无多大的兴趣,本应该给读者提供研究便利的数据库很少有人问津,有些读者对某些数据库感兴趣,但是却无法有效利用,这些问题广泛的存在于数据库的共建共享过程。
本文论述数据库的共建共享过程中可能出现的问题,分别加以分析并试图给出解决方案。
1 数据库选型问题
对于自建数据库,为了减短数据库的建设时间,绝大部分的数据库都是文档型数据库,因为文档数据便于查找和归档,也有比较成熟的范例可以借鉴,对于文档的分类也比较方便,但是数据库主要是为了方便相关学士研究,而对于学术研究,视频、图片、声音类的资料也是难能可贵的,很多资料如果借助视频、图片、声音能够更好的进行诠释,但是目前能快速收集到的绝大部分都是文献资料,视频类资料比较难收集,或根本没有进行相关搜寻,视频类资料在数据库中的保存、整理、索引以及分享都还有不少技术问题无法完美解决,所以绝大部分数据库都没有视频类(包括声音)资料,综上所述,数据库的选型基本就只剩下文档类型数据库了,这个问题对于自建数据库的多样性以及利用率都有很大关系,数据库的选型问题极大限制了自建数据库的发展与利用。
对于数据库选型问题,并不是数据库建设者没有注意到,也不是现有的技术手段无法解决,主要的问题出在几个方面,一是视频类资料搜集不容易,短时间内很难达到数据库建设目标,而很多自建数据库都是以立项科研项目的形式而搭建,科研项目有研究期限,为了在期限内完成数据库的建设而放弃视频类资料的收集。二是视频类、声音类等资料的加入,数据库会变成混合型数据库,必须选择新型数据库系统,这样一来没有多少范例可以借鉴,还要解决一些技术问题,放弃成熟技术会面临压力。三是视频、声音类资料的版权问题比文献文档类资料更难解决,因此目前自建数据库轻易不会选择混合数据库模式,而更愿意选择单一类型模式的数据库。
但是,混合类型数据库最贴近研究对象的原貌,对于学术研究的价值也是最高的,因此对于自建数据库发展方向基本可以肯定是向混合类型数据库发展,所以目前一些问题就需要开始解决,数据库系统需要进一步发展以适合数据库建设的需求,对于科研项目的管理应该更注重灵活引导,而不是仅仅局限在管理上面,毕竟科研项目不该只是作为衡量指标来管理,而是应该将项目真正引导到可利用的状态。对于资料的版权问题,还需要有更详细更能实际操作的相关法规来引导,只有多管齐下,共同努力,数据库选型问题才能更好的解决。
2 数据库索引字段的设置问题
一个自建数据库,能不能让人们便捷、高效的使用,能够方便的进行检索是必须的前提条件,文献资料的检索需要将相关关键词进行索引,汉语关键词虽然有汉语主题词表等类标准的指导,但是并没有相关正式标准,而且汉语主题词表并不能免费使用,因而很多自建数据库都没有统一的使用关键词,其次检索需要的索引字段也没有相关的标准颁布,对于数据库的标引字段每个自建数据库基本都不一致,检索方式更是各自为政,使得不少内容相似的数据库相互之间无法互检,也无法实现异构数据库的统一检索,给相关科研工作带来了一定的不便,也使得数据库的利用率不高,从而使数据库的价值无法最大化利用。
因此,汉语主题词表应该开放并鼓励或引导大家尽可能的使用,毕竟有统一的规范也使得数据库的相关性能更容易的被使用者发现,数据库能够方便检索也使数据库的利用率大大提高,方便研究工作进行。在这点上外文数据库就要优于中文数据库,索引字段应该有相关参照标准,这样才能使各个自建数据库能在内容上互补,以利于人们能更便捷的使用数据库。
3 数据库建设缺乏整体的相关标准
数据库的建设是为了方便相关问题的研究,决不是为了玩耍,从搜索引擎搜索的结果来看,自建数据库的数量已经不是小数目,而且会越来越多,但是众多的数据库并没有给问题研究者带来太多的便利,而且不少研究者对很多自建数据库视而不见,这方面固然有数据库共享的问题,可是数据库建设本身的问题也是一大原因,由于数据库的建设并没有相关的强制标准,大部分是一些数据库平台提供商制订的,比如很多图书馆都使用的TPI自建数据库平台软件,这些软件平台提供的数据库建构都是采用自定的标准,没有统一标准,如果没有采用这些平台,数据库系统的选择更是五花八门,导致自建数据库基本成为一个个的异构数据库,数据库之间很难构建统一检索入口,导致各个自建数据库之间形成各自为战的场面,在搜索引擎里搜索出来的数据库基本结构都有不同程度的差异,即使是相似内容的数据库,使用方法和搜索手段都有所不同,这样的结果是不同数据库很难相互整合,不能形成更有效的数据使用效率,另外由于不能统一检索出来,会导致相同或差异不大的数据库重复建设出来,浪费人力物力,另外标准或许还能为解决数据库共享问题提供一条可行的出路,应该为数据库制订一种统一的标识、内容格式等标准,有了统一标准的数据库在检索和使用上就有统一的解决方法,这样对于数据库的建设也是一种促进作用,能最大限度的发挥数据库的作用,也能保证使用者能得到最便捷的帮助,使读者能在信息爆炸的今天迅速得到自己需要的信息资料。同时也能最大限度的保证同类数据库不会重复建设,有利于公共资源的节省。endprint
4 数据库共享问题
数据库的共建问题虽然可以列出几点,但是总体上来说共建问题比共享问题解决起来要容易很多,因为共建问题只要解决标准问题,剩下的问题就比较容易解决了,但是共享问题牵涉到利益问题,解决起来就比较麻烦,数据库共享问题分为有限共享和无限共享问题,所谓的有限共享意味着数据库仅在一定范围内共享,要么按地域共享要么按用户共享,为了实现这个功能就需要对数据库的访问进行技术限制,无形中就形成新的安全问题,有限制的共享也导致数据库成为屋内的花瓶,大多数沦为观赏项目,并不是为实现数据库的功能而存在,因为不能为尽可能多的用户服务,数据库的作用和存在就没有得到最大化的实现,但是无限共享也会容易出问题,因为数据库收录的部分资料数据或许有版权问题,本来共享是互联网的精髓,但是知识产权却成了一道绕不过去的门槛,目前自建数据库收录的大多是期刊论文,与其他文学作品不同,论文的产生并不是为了欣赏,而是为了解决问题,而解决问题的方法和手段本来就是为了告诉阅读论文的读者,但是为了所谓的知识产权保护,不能最大范围的共享,国外早就有了“开放存取”的模式,就是发表付费,阅读免费。可是在目前的国内,发表虽然是付费的,但是阅读还是需要付费,显然不利于自建数据库的发展,而且自建数据库的需求者或使用者范围是有一定数量限制的,并不是每个人都需要查阅或利用各类数据库,因而对于数据库的共享应该少一点限制,再者图书馆的各类自建数据库基本上都不涉及商业应用,没有牟取商业利益的动机和作为,明显与盗版行为不符,对于自建数据库建议应该全面共享,共享过程中如有其它异议,可以商议解决,只做局部共享或干脆作为私有产品内部使用的行为应该终结了,唯有全面共享,图书馆各类自建数据库才能最大限度的发挥自己的作用,才能使各类自建数据库充分得到利用,对于促进科学发展做出最大的贡献。
综上所述,目前图书馆各类自建数据库虽然数量庞大,但是能够得以利用的并不太多,有些问题靠各图书馆并不能得到真正的解决,不少问题还需要政府组织的协调,但是首先要明确问题的解决方法,唯有解决了拦在数据库面前的问题,才能使自建数据库得到良性的发展,也才能保证自建数据库得到充分的合理利用,才能最大限度的发挥自建数据库的作用,进而使图书馆的建设得到长足进步。
参考文献
[1]张苗苗.我国图书馆信息资源共建共享模式比较探究[J].图书馆建设,2010,02:21-24+27.
[2]白新勤.高校信息资源共建共享的新态势[J].情报科学,2013,03:62-67.
[3]孔志军.国外信息资源共建共享研究现状及发展趋势[J].图书馆建设,2008,05:33-36.
[4]陈兰杰.文献信息资源共建共享的利益平衡机制研究[D].河北大学,2005.endprint