基于Dspace机构知识库系统的安装及相关问题的分析
2009-11-19黄纯艳曾为众
黄纯艳 曾为众
〔摘 要〕简要的介绍Dspace系统,详细描述Dspace系统具体的安装过程及在安装过程中碰到的相关问题,对其 原因进行分析,提出了解决的方法。
〔关键词〕开源软件;Dspace;开放获取
〔中图分类号〕G202 〔文献标识码〕C 〔文章编号〕1008-0821(2009)09-0059-03
The System Installation of Dspace and Analysis of QuestionsHuang Chunyan Zeng Weizhong
(Library,Wenzhou Medical College,Wenzhou 325000,China)
〔Abstract〕This article discussed about the DSpace system,a detailed description of DSpace software installation process and the encountered questions during the installation process,then analyzed the causes and proposed solutions.
〔Key words〕open-source software;Dspace;open access
随着教师教育教学工作的反思、积累以及科学研究的进步和深入,每个高校都产生了很多具有价值的学术成果和科研资料,许多学校都有将这些资料进行整合、共享的想法,但如何降低收集、整理、保存这些资料的成本,实现资料的共享一直是困扰很多大学的难题。美国麻省理工学院的图书馆提出建立数字机构存储的思路来解决这一问题,并产生了DSpace系统。开发者就把它定位为开放源代码系统,有需要这种服务的教育或科研机构都可以免费获取并自由使用DSpace系统。随着DSpace数字仓储技术的出现,构建一种强化信息交流、开放存取和内容管理的机构知识库系统成为可能。
1 Dspace系统简介
DSpace系统是由美国麻省理工学院图书馆(MIT Libraries) 和美国惠普公司实验室(Hewlett-Packard Labs)合作经过2年多的努力于2002年10月开始投入使用的,以内容管理发布为设 计目标,遵循BSD协议的开放源代码数字存储系统。该系统可以收集、存储、索引、保存和 重新发布任何数字格式、层次结构的永久标志符研究数据。它是一个专门的数字资产(Digit al assets)管理系统,它管理和发布由数字文件或“位流”(bitstreams)组成的数字条目(i tem),并且允许创建、索引和搜索相关的元数据以便定位和存取该条目。
Dspace系统是一个开放源代码的软件平台,该软件可以帮助用户划分各个工作流模块、各种内容模型及数字资源,并通过在线检索和浏览系统来发布数字资产,同时实现了对研究机构学术信息的收集、存档和分享,用一种分布式的方法让任何获得授权的机构都能够分享到海量的学术信息资源,在某种程度上为研究机构提供了一个学术交流的平台。
2 Dspace系统安装
由于Dspace系统本身是建立在开源软件的标准工具集之上的,所以可能会有许多种安装方式。而这里所描述的只是一种推荐安装,基于Windows操作系统下,发布于2008年9月10的Dspace1.5版本安装。
2.1 Dspace系统运行环境配置
本节所描述的是成功安装Dspace系统所要用到的第三方组件和工具的配置。
(1)Java SDK 1.5或更高版本,只需要J2SE就可以了,不必安装J2EE。Java SDK可从以下位置下载:http:∥java.sun.com/javase/downloads/index.jsp。首先安装Java SDK1.5,然后设置JAVAzHOME环境变量指定到JDK安装目录,并且把JDK的bin目录加入到PATH路径中。
例如:JAVAzHOME=D:java sdk 1.5
PATH=%JAVAzHOME%in;%PATH%
(2)Apache Maven 2或更高版本。Maven可以从以下位置下载http:∥maven.apache.org/download.html。解压软件包在指定的Apache Maven 2目录并把Apache Maven 2in目录添加到PATH环境变量。
例如:Maven=d:Apache Maven 2in
PATH=%MAVENzHOME%in;%PATH%
(3)Apache Ant 1.5或者是更高版本。Ant可以从以下位置下载:http:∥ant.apache.org。解压软件包在指定的目录Apache ant 1.6.2下,并把Apache ant 1.6.2in目录添加到PATH环境变量。您应该确保JAVAzHOME设置正确才能是Ant正常工作。
例如:ANT=d:Apache ant 1.6.2
PATH=%ANTzHOME%in;%PATH%
(4)PostgreSQL 8.3 for Windows(安装PostgreSQL时推荐安装pgAdmin Ⅲ工具),开放源码的关系数据库器。PostgreSQL数据库可从以下位置:http:∥www.postgresql.org/下载,强烈建议您尝试与Postgres 8.x或更高,因为在7.x版本中,一定要编译选项的“配置”脚本,才能支持UTF-8编码。
(5)Apache Tomcat 6.0或更高版本,可以从以下位置http:∥tomcat.apache.org。
2.2 Dspace系统安装步骤
首先,我们要了解一下“目录名称”:DSpace使用3个不同的目录树。虽然在安装过程中不需要了解它们的细节,但是应该知道有它们存在,并且知道在本文档中如何表示它们:
源文件目录,用[dspace-source]来表示;
安装目录,用[dspace]来表示;
web配置目录,用Tomcat,这个目录是[tomcat]/webapps/dspace;[tomcat]是 Tomcat的安装目录。
(1)下载最新的DSpace源码并解压缩:http:∥sourceforge.net/projects/dspace/;Dspace软件两种版本,一是默认的版本,还有一种是源代码版本。默认版本的功能较少,建议大家下载使用源代码版本。
(2)启动PostgreSQL服务,运行pgAdmin Ⅲ(Start→PostgreSQL 8.3→pgAdmin Ⅲ)。用postgres账户连接本地数据库,①建立一个“Login Role”用户,用户名和密码都为“dspa ce”。②建立一个属于dspace用户,名字为“dspace”,编码格式为“UTF-8”的数据库。
(3)修改dspace.cfg配置文件,路径为:[dspace-source]dspaceconfigdspace.cfg,根据业务需求修改以下属性即,
dspace.dir=d:/dspace(注意:使用正斜杠/的路径分隔符)
db.username
db.password
config.template.log4j.properties
config.template.log4j-handle-plugin.properties
config.template.oaicat.properties
assetstore.dir
log.dir
upload.temp.dir
report.dir
handle.dir
(4)建立一个Dspace安装目录(例如:D:dspace)。
(5)在[dspace-source]/dspace/目录下,用命令行窗口(CMD)运行mvn package命令,生成DSpace安装包。①安装包生成在[dspace-source]/dsp ace/target/dspace-[version]-build.dir/目录下。②DSpace默认的安装包是 用PostgreSQL的数据库。
(6)初始化DSpace数据库并将DSpace安装到[dspace](D:DSpace),在您的[dspace-source]/dspace/target/dspace-[version]-build.dir/目录下,用命令行窗口(CMD)运行ant freshzinstall命令。
(7)建立一个管理员账号,在您的[dspace]in(D:DSpacein)目录下,用命令行窗口(CMD)运行dsrun org.dspace.administer.CreateAdministrator命令,根据提示输入信息管理员账号,密码,邮箱等信息。
(8)将[dspace]目录下的webapps工程复制到[tomcat]/webapps目录下,同时,为Tomcat配置Dspace的web应用程序的路径,在[tomcat]/conf/server.xml文件中,找到
<!--DEFINE A CONTEXT PATH FOR DSpace JSP User Interface-->
<Context path=″/jspui″docBase=″[dspace]webappsjspui″debug=″0″
reloadable=″true″cachingAllowed=″false″
allowLinking=″true″/>
<!--DEFINE A CONTEXT PATH FOR DSpace OAI User Interface-->
<Context path=″/oai″docBase=″[dspace]webappsoai″debug=″0″
reloadable=″true″cachingAllowed=″false″
allowLinking=″true″/>
Server.xml文件中的一个<CONTEXT>元素用于将本地文件系统中的一个目录映射成一个可供Web浏览器访问的虚拟Web目录。其中,path属性指定虚拟Web目录的路径,当其设置为空字符串时,则表示的是整个Web站点的根目录;docBase属性指定该虚拟Web目录所映射到的本地文件系统目录,可以使用绝对路径或相对<Tomcat主目录>/Webapps的相对目录。
(9)启动Tomcat服务。
(10)在浏览器里输入http:∥localhost:8080/jspui或者http:∥localhost:8080/xmlui
3 常见问题
3.1 环境变量配置
安装过程中,用命令行执行程序,经常会碰到该命令不是内部或外部命令,也不是可运行的程序或批处理文件,如图1、图2、图3所示执行结果,类似这种情况的出现,是由于环境 变量的配置不正确导致,需重新检查环境变量的配置。
解决方法:在配置环境变量是,需注意是使用的斜杆均是反斜杆“”。斜杆的错误也是导致,环境变量配置错误的一种原因。在PATH环境变量中,注意把%PATH%放在后面,因为系统有个执行的先后顺序,也将可能导致命令运行是失效。例如:PATH=%MAVENzHOME%in;%PATH%;需把%MAVENzHOME%in;放在前面。
3.2 数据库连接
尝试数据库连接失败,数据库文件路径没找到。如图4、图5所示。类似这种情况的出现,是由于数据库设置不正确。
解决方法:Dspace系统安装过程中的第二步,PostgreSQL安装过程中,必须是先建立一个用户,用户名和密码都为“dspace”;然后再建立一个名字为“dspace”数据库,选择编码格式为“UTF-8”,并且这个数据库建立是属于dspace用户。建立数据库时,先后执行顺序非常关键,及数据库的编码格式选择,均是导致数据库连接出错的原因之一,常常出现如图4所示的运行错误。按照安装步骤中第三步,dspaceconfigdspace.cfg配置文件,确认db.username字段中的数据库名是否跟第二步中建立的数据库 名称一致,且大小写必须一致。数据库名称如果不一致,将导致如图5所示的结果。
4 总 结
DSpace系统发展至今,已经发布了十几个版本,目前最稳定且功能最完善的版本是1.5源代码版本,截至2008年12月在DSpace官方网站上注册并使用DSpace系统的教育科研机构已经有300多家,分布在48个国家,在短时间内,DSpace系统得到了广泛的应用和普及,其强大的功能和使用的简单性得到了普遍认可。
参考文献
[1]DSpace官方网站[EB].http:∥www.dspace.org[2]谢静,王军.DSpace数字仓储简介及其应用分析[J].数字图书馆论坛,2007,(9):18-25.
[3]刘君.基于DSpace的机构知识库建设研究[J].科技广场,2007,12:223-224.