开放源码软件及开源软件DSpace在图书馆的应用
2009-07-15都平平蔡莉娴黄敏穆亚凤李苏丰
都平平 蔡莉娴 黄 敏 穆亚凤 李苏丰
〔摘 要〕本文介绍了开放源码软件Dspace及在图书馆的应用,并介绍了DSpace的功能特征及在图书馆操作中的流程,并谈了开源软件DSpace使用的利与弊。
〔关键词〕开源软件;Dspace;机构仓储
〔中图分类号〕G250.7 〔文献标识码〕B 〔文章编号〕1008-0821(2009)03-0150-02
“开放源码”(open source)用于描述那些源码可以被公众使用的软件,并且此软件的使用、修改和发行也不受许可证的限制。由于Internet发展的推动,开放源码软件正在许多日常工作的幕后扮演着日益重要的角色,比如Web浏览和E-mail。软件开发者开始携手支持linux这种开放源码操作系统,使用者也开始认识开放源码软件,这些意味着你将会看到越来越多的开放源码软件。
开源软件同时涉及源码本身和开发过程,涵盖了3个方面的意义:免费分发的源代码、模块化的体系和集市式的开发——在这种开发方式中,任何地方的任何人都可以参与最终产品的制造;另一方面,任何人都可以复用和发行开源软件的代码这一事实又支持了公众利益,因为创新的观念被所有用户所共享。
目前在图书馆数字化的流程中许多图书馆采用了不同的开源软件,使用最多的是数据库底层 软件和一些数图的应用软件。如:我的图书馆软件、门户软件、DSpace开放获取数据库的设 置等。本文重点介绍DSpace软件在图书馆机构仓储中的应用。DSpace已被学术机构广泛使用 ,以达到学术资源的有效管理与再利用的工具软件,DSpace不仅实用与单一的图书馆数据库 的建设,也适用于跨组织的机构存储。
机构仓储(Institutional Repository(简称IR)又称机构库是收集、存放由某个或多个学术机构(例如大学、研究所、图书馆、博物馆等)专家、教授、学生创造的、可供机构内外用户共享的学术文献的数据库[1]。机构仓储可以由一个机构或联合许多机构组成联盟一起创建。它随着计算机的普及、学术出版的电子化以及网络技术的快速发展、为实现科学信息资料开放获取而产生。国外用于机构存储的创建工具已比较成熟,代表性的工具有DSpace和Greenstone。DSpace是美国麻省理工学院图书馆与惠普科技公司共同合作,遵循Mozilla协议基于BSD开放原代码(open source)许可的DSpace源码方式开发的。其他使用者,可以直接利用或改写软件的方式,便可利用DSpace来创建自己的机构存储知识库。
1 DSpace系统功能特点
1.1 存储内容格式类型不限
DSpace系统主要用于长期保存机构的各种数字化资源,包括期刊论文、图书、图书章节、数据集、学习资源、图像、3D图像、地图、乐谱、设计图、预印本、录音记录、音乐录音、软件、技术报告、论著、视频、工作文档等等。DSpace系统可以存储几乎所有格式的数字化的文字、图像、音频和视频资源。
1.2 DSpace的支撑软件
DSpace的安装和正常运行需要如下的软件来配套:①操作系统安装:RedHat Enterprise 4.0,作为裸机的支撑系统;②DSpace:安装之前先下载DSpace安装源代码和上述PostgreSQL数据库版本相对应版本的PostgreSQL JDBC驱动程序;③DNS服务器安装与配置;④Jakarta Tomcat安装与配置:安装之前先下载2个安装包,分别是jakarta tomcat和jdk;⑤E-mail 服务器安装与配置:若需要E-mail进行注册验证时,服务器在操作系统安装时就安装好E-mail服务器了,可以下载最新的Sendmail或Postfix源代码安装包(现在最新版本分别是8.13 .5和2.2.5);⑥数据库安装与配置:使用PostgreSQL数据库配置或者Oracle数据库配置 作为底层数据库。
1.3 数据组织模型
DSpace系统中有5种数据模型,分别是社区(community)、合集(collection)、条目(item)、数字包(bundle)和比特流(bitstream)。
1.4 规范的元数据标引
DSpace系统采用DC元数据来标引上述各种数据模型。在创建上述数字对象或者提交学术资源时,系统将要求提交人员同时提供该学术资源的元数据信息,或者由专门负责标引审核的人员对提交的学术资源的元数据进行编辑或修改。运用DC元数据对这些学术资源进行充分的标引,对这些资源的保存、揭示、检索和利用提供了良好的基础。
1.5 支持OAI协议和OpenURL协议
通过OAI接口,有关机构(如Google Scholar和OAIster)可以定期或不定期对DSpace系统的元数据进行收割(DSpace系统中DC元数据默认是公开的,并允许其他系统对其收割)。通过对元数据的收割利用,无疑加快和提高了相关资源的传播与利用,促进了学术成果的交流和 科研的发展。
另外,由于DSpace系统支持OpenURL协议,对于拥有SFX服务器的机构,通过设置DSpace系统,系统将在每个条目页面上显示一个OpenURL链接,同时能够响应外来的OpenURL请求,这些都有利于相关信息的被检索与利用。
1.6 良好人机界面与管理功能
在Web界面下,可以方便地按不同的方式浏览DSpace资料库中的条目。管理员可以在DSpace系统管理界面中创建或删除相关的数字对象,对数字对象的权限进行控制管理,对用户与群组进行控制管理,对数字对象的相关元数据进行编辑,以及DSpace系统一些相关设置等。
1.7 统计分析
DSpace系统有一个强大的日志记录功能,对系统的安装、运行和使用情况都有详细的日志记录。使用DSpace系统自带的日志分析工具自动对系统使用情况部分进行统计分析,可以得到对管理员或用户有帮助意义的统计报表。
2 DSpace在机构存储系统的应用
DSpace是用于自行存储开放获取资源的软件,目前DSpace1.3a已经发布,可访问http:∥sourceforge.net/projects/dspace/目前版本有日志分析、可翻译用户界面等。全球的科研机构都可以免费获取该软件,可以用它来构建机构存储、学习对象库、电子论文库、电子记录管理、数字保存、数字出版及其他更多领域。
DSpace实现主要步骤:
3 DSpace系统目前存在的不足与展望
安装DSpace系统并使之正常运行,需要比较熟练操作Linux操作系统、各种服务器的安装与配置、软件编程,以及相关数据库应用与管理等。
用户注册信息少。新用户注册后,若事先不知道用户,或没有其他方式通知管理员,则管理员无法判断新用户身份,也就不能给新用户授予相应的权限。
DSpace系统虽然具有条目导入导出功能,但是只能在操作系统的文本模式下操作,而不能在Web界面下操作,操作比较复杂。
不能对某些类型的数字资源提供存储,例如动态类型的网页。
DSpace底层是3层架构,但只适应中等或少量的数据存储,对于大数据量的运算会产生数据的冗余。
系统设置字段很难增加和更改,如增加字段库结构和发布达不到一致。
DSpace系统是开源软件,与商业软件相对比,MIT和HP没有义务对该系统的一些问题承担责任,但是承诺继续提供一些技术方面的支持,另外,基于DSpace系统的开源社区也日趋活跃,他们不断对DSpace的一些功能进行改进,修复已知bug等等。
DSpace的优势:系统结构合理、具有较为完善的功能、遵从相关标准、支持任意类型的的内容存储、在国外学术机构中的得到最为广泛的应用。目前,新版本正在出台。
由于DSpace系统支持OAI-PMH协议,一些大型的目录服务机构(如Google Scholar和OAIster)可以定期或不定期对收割DSpace系统的元数据,为DSpace系统中的数字资源的传播与利用提供了便利。
4 选择开源软件的问题与利弊
选择软件时,是选择商业软件还是开源软件进行图书馆数字化建设,应考虑多方面的因素:
图书馆的资金投入;
使用单位的技术力量,是否有能力开发开源软件;
开源软件的开放性,权威性,可用性,标准性和规范性;
开源软件被用到的用户是那些(大用户),使用的背景;
开源软件要使用的对象;
是否有一个技术支撑体系支持,是松散的组织,还是有后续的服务和支撑。
参考文献
[1]黄凯文,刘芳.网络科学信息资源“公开获取运动”的模式与方法[J].大学图书馆学报,2005,(2):38-41.
[2]http:∥archives.eprints.org/eprints.php?action=browse[EB].2005-07-15.
[3]http:∥dspace.xmu.edu.cn/dspace/register[EB].
[4]李爱国,陆美.学术图书馆机构知识库的创建[J].图书情报工作,2006,(6):119-121.
[5]叶鹰,黄晨.基于DSpace的Lib2.0[J].大学图书馆学报,2006,(3):2-5.
[6]图1:Paul Gandel.Technology——Converging Changes.The 4th Annual Library Leadership Institute:The 21st Century Digital/Print Hybrid Research Library:Challenges for Leadership.
[7]范并思,胡小青.图书馆2.0:构建新的图书馆服务[J].大学图书馆学报,2006,(1):2-7.
[8]Web2.0技术探源.
[9]任树怀.Web2.0与信息服务,2006-05-25.上海:构建以dSpace为核心的校内学术信息存储仓库.
[10]孙卫.2006年数字图书馆前沿问题高级研讨班讲话.国家图书馆二期工程暨国家数字图书馆工程介绍.
[11]陈和.2006年数字图书馆前沿问题高级研讨班讲话.厦门大学机构存储系统.